لقد كنا نعيش مع الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي لفترة من الوقت الآن، ولكن هذا الأسبوع، اتخذ بعض اللاعبين الرئيسيين بعض الخطوات الكبيرة إلى الأمام. على وجه الخصوص، أتحدث عن التحديثات المهمة لـ Midjourney، النموذج الجديد من Google، و Grok.
تُظهر كل شركة مدى تطور التكنولوجيا بسرعات مختلفة وفي اتجاهات مختلفة. ولا يزال المجال مفتوحًا أمام الجميع، وتوضح كل شركة مدى التقدم الذي أحرزته.
منتصف الرحلة تصل إلى الويب
دعونا نبدأ مع Midjourney، التي أطلقت بهدوء محرر ويب جديدًا في أواخر يوم الخميس والذي يجمع عددًا من أدوات معالجة الصور المفيدة في واجهة مستخدم واحدة.
في السابق، كانت الوظائف مثل إعادة التأطير وإعادة الطلاء (إضافة أصول تم إنشاؤها بواسطة الذكاء الاصطناعي إلى صورة موجودة أو تعديلها) والتحريك وتوسيع اللوحة القماشية (توسيع حدود الصورة وإنشاء محتوى لملئه) والتكبير تتطلب جميعها أداة خاصة بها لاستخدامها وكانت موجودة عبر قوائم متعددة، مما يتطلب من المبدعين التبديل باستمرار ذهابًا وإيابًا. تقدم واجهة المستخدم الجديدة هذه عملية تحرير أكثر تماسكًا وانسيابية، وهي انحراف ملحوظ عن بداية البرنامج في عام 2011. الخلاف.
أطلقت Midjourney للتو محرر الويب الخاص بها!!
إنها في الواقع واحدة من أروع الميزات التي أسقطوها منذ فترة
يتيح لك بشكل أساسي القيام بالرسم والتحريك والتكبير والمزيد في خطوة واحدة
قوية حقا حقا pic.twitter.com/Wgyi9ElE5N
— نيك سانت بيير (@nickfloats) 16 أغسطس 2024
تم تصميم محرر الويب الجديد لجعل تحرير الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي أسهل وأكثر سلاسة، لكل الرئيس التنفيذي لشركة Midjourney ديفيد هولز على Discord مؤخرًا. “نعتقد أن هذا يجعل تحرير صور MJ الخاصة بك أكثر سلاسة من ذي قبل ويمثل خطوة كبيرة إلى الأمام”، كما كتب.
على الرغم من أن Midjourney تواصل الانتقال بعيدًا عن Discord نحو كونها تطبيقًا قائمًا على الويب، فقد أعلنت الشركة أيضًا أنها ستعكس الرسائل من القنوات الشهيرة مثل “daily-theme” و”prompt-craft” و”general-1″ بين غرف الويب الخاصة بها و الخلاف كما قامت الشركة بإضافة قنوات جديدة تتيح للأشخاص متابعة هذه المواضيع من أي منصة يفضلونها. كما قدمت الشركة أداة اختيار جديدة تعمل مثل الفرشاة الرقمية، والتي حلت محل أداة الاختيار المربعة وأداة اللاسو.
المحرر الجديد متاح لجميع مستخدمي Midjourney الذين أنشأوا بالفعل أكثر من 10 صور على المنصة. وكانت ردود الفعل الأولية من مجتمع المبدعين إيجابية إلى حد كبير.
يأتي المحرر بعد أسبوعين إصدار Midjourney 6.1، مما أدى إلى تحسين جودة الصورة وتماسكها (مثل العدد الصحيح للأصابع)، فضلاً عن تحسين أوقات المعالجة وفهم دقة النص في مطالبات الصور بشكل كبير.
جروك-2 يطلق العنان للوحش
يأتي تحديث Midjourney أيضًا بعد يومين فقط بعد إصدار Grok-2 بواسطة شركة xAI التابعة لإيلون ماسك، وهو الشيء الكبير التالي الذي حدث هذا الأسبوع.
تعتمد قدرات إنشاء الصور الخاصة بـ Grok على نموذج Flux.1 من Black Forrest Lab، والذي اكتسب شعبية متزايدة بسرعة بسبب جودة صورته الرائعة والاستخدام المجاني.
24 ساعة منذ إطلاق Grok 2.0 وإمكانياته في إنشاء الصور!
لقد قمت بإعداد هذه الأمثلة التسعة لك للاستفادة منها قدر الإمكان + الوصول إلى مكتبة لا نهاية لها من المطالبات!
(ضع إشارة مرجعية لهذا لاحقًا) pic.twitter.com/7EDYSogfV2
— تيك هالا (@techhalla) 15 أغسطس 2024
إن الجدل الأكبر حول Grok-2 ليس فقط في جودته، التي هي جيدة جدًا، ولكن أيضًا في مبادئه التوجيهية غير المحددة على ما يبدو. على عكس العديد من مولدات الصور الأخرى التي تعمل بالذكاء الاصطناعي، يبدو أن Grok-2 لديه القليل جدًا من حيث المبادئ التوجيهية حول الملكية الفكرية والعنف والمحتوى الصريح الآخر. ليست هذه هي المرة الأولى التي يرى فيها مولد صور الذكاء الاصطناعي هذا النوع من الخطأ، ولكن مع Grok، يبدو الأمر مقصودًا، حيث وصفه ماسك بأنه “أكثر الذكاء الاصطناعي متعة في العالم”.
لقد اختبر الناس بالفعل حدود هذه التقنية وأنشأوا كل أنواع الصور المروعة والغريبة، والتي تذكرنا بالأيام الأولى لتوليد الصور بواسطة الذكاء الاصطناعي. ولكن إذا صدقنا خطاب ماسك، فإن افتقار Grok-2 إلى المبادئ التوجيهية يبدو مقصودًا وقد ينتهي به الأمر إلى تشكيل كيفية تطور هذه التقنية في المستقبل.
جوجل تدخل المنافسة مع Imagen 3
وأخيرًا، أعلنت جوجل عن منتجها الجديد نموذج AI Imagen 3، الذي كان تم إصداره لجميع المستخدمين في الولايات المتحدة يوم الخميسوتصفه جوجل بأنه “نموذج النص إلى الصورة الأعلى جودة”، والذي أصبح الآن قادرًا على إنتاج “تفاصيل أفضل وإضاءة أكثر ثراءً وقليل من القطع الأثرية المشتتة للانتباه مقارنة بنماذجنا السابقة”. وتقول جوجل أيضًا إن Imagen-3 أفضل في عرض النص ويأتي الآن في إصدارات مختلفة، مصممة للمهمة المطروحة، مثل شيء خفيف مثل رسم تخطيطي سريع أو شيء أكثر تفصيلاً ودقة عالية.
في الوقت الحالي، يتوفر Imagen 3 فقط من خلال AI Test Kitchen من Google، كجزء من ImageFX. وهو حاليًا في مرحلة تجريبية مغلقة، مما يعني أنه يتعين عليك الانضمام إلى قائمة الانتظار إذا لم تكن مشاركًا بالفعل.