فتحت شركة جوجل إمكانية الوصول إلى Imagen 3، أحدث مولد صور بالذكاء الاصطناعي القادر على إنشاء صور أكثر تفصيلاً من خلال الرسائل النصية، للجميع في الولايات المتحدة.
تستفيد الأداة المحدثة من نموذج الانتشار الكامن وتقدم تحسينات على Imagen 2 مثل التفاصيل الدقيقة والإضاءة الأفضل والقطع الأثرية الأقل. هذه هي أداة إنشاء الصور الأعلى جودة من Google حتى الآن، ويمكنك تجربتها من خلال زيارة موقع اختبار الذكاء الاصطناعي من جوجلانقر فوق “تسجيل الدخول باستخدام Google” واستخدم بيانات اعتماد حساب Google لتسجيل الدخول. يمكن للأشخاص الذين يعيشون خارج الولايات المتحدة تجاوز القيود الجغرافية باستخدام VPN.
لقد تحسنت قدرة Imagen 3 على الفهم السريع. تم إنشاء الصورة أعلاه باستخدام مثال قدمته Google: “صورة لمشهد ديوراما لدمية من اللباد لمشهد طبيعي هادئ في غابة منعزلة مع روبوت كبير ودود ومستدير تم تقديمه بأسلوب ريسوجراف. تجلس بومة على كتفي الروبوت وثعلب عند قدميه. تخلق الغسلات الناعمة من الألوان وخمسة ألوان ولوحة مملوءة بالضوء شعورًا بالسلام والسكينة، وتدعو إلى التأمل وتقدير الجمال الطبيعي.”
في المستقبل، ستوفر الشركة إصدارات Imagen 3 المخصصة لمهام محددة مثل إنشاء رسومات سريعة وإخراج صور عالية الدقة وما إلى ذلك. كما نشرت الشركة أيضًا ورقة بحثية تفصيل التكنولوجيا. ومع ذلك، نشر الناس ردود فعل متباينة حول ريديتوقد أثار هذا الأمر انتقادات كثيرة. فلا تحاول مطالبة Imagen 3 بإنشاء صور تضم تايلور سويفت أو سوبر ماريو، لأنها تتجاهل طلبات الشخصيات العامة والأسلحة والشخصيات المحمية بحقوق الطبع والنشر. واعترفت Google باستغلال “التصفية المكثفة ووضع العلامات على البيانات لتقليل المحتوى الضار في مجموعات البيانات وتقليل احتمالية النتائج الضارة”.
أعلنت Google عن Imagen خلال مؤتمر I/O في مايو، ولكن يمكن لعدد قليل من الأشخاص استخدام الأداة في معاينة خاصة مقتصرة على أعضاء محددين من منصة Vertex AI. كانت Google تمتلك سابقًا نموذجًا لتوليد الصور داخل Gemini، لكنها أزالته بسبب ضعف الاستقبال. على الرغم من أن Imagen 3 يستخدم أحدث وأفضل نماذج الذكاء الاصطناعي من Google لتوليد مقاطع فيديو واقعية من المطالبات النصية، إلا أنه لا يقارن بـ Sora الأكثر إثارة للإعجاب من OpenAI.
لتخفيف المخاوف بشأن التزييف العميق، تستخدم Imagen تقنية SynthID من Google لتطبيق علامات مائية مشفرة. وهناك قلق آخر بين مجتمع المبدعين، حيث يرى الأشخاص الذين يصنعون الصور لكسب العيش بشكل متزايد أن مولدي الصور يسرقون عملهم الشاق لتدريب خوارزمياتهم. نظرًا لأن سياسة تعويض الذكاء الاصطناعي التوليدي من Google لا تغطي الصور النصية الحية، فأنت بحاجة حقًا إلى التفكير مرتين قبل استخدام صور Imagen 3 في العمل التجاري لأن القيام بذلك قد يعرضك لمطالبات حقوق الطبع والنشر المحتملة.
مصدر: وجه العناق عبر فينتشر بيت