MidJourney V5.2 مقابل V6 Alpha: نختبر الاختلافات

أطلقت شركة MidJourney النسخة التجريبية من طراز V6، وهناك العديد من التحسينات الموعودة مقارنة بالإصدار V5.2. ننظر إلى ما هو أفضل على الورق ونختبره مقابل الطراز الأقدم.




ما الجديد في V6؟

لا شك أن الكثير قد حدث تحت غطاء محرك السيارة مع محرك V6، لكن MidJourney سلطت الضوء على الميزات الرئيسية في موضوع Discord الرسميلاحظ أنه يتعين عليك أن تكون عضوًا في MidJourney Discord لعرض المنشور المعني. وهذه هي التغييرات الأكثر أهمية:

  • الالتزام الدقيق والسريع.
  • مطالبات أطول.
  • تحسين التماسك ومعرفة النموذج.
  • تم تحسين مطالبة الصورة وإعادة مزجها.
  • قدرة بسيطة على رسم النص (مشابهة للنموذج الجديد DALL-E).
  • تم تحسين أجهزة الارتقاء، مع الوضعين “الدقيق” و”الإبداعي”.

باختصار، يجعل V6 برنامج MidJourney أكثر انسجامًا مع القدرات الجديدة المذهلة للأداة المنافسة DALL-E 3، ولكننا هنا مهتمون برؤية مدى تفوقه على طراز V5.2 الذي كان الافتراضي في وقت كتابة هذا التقرير.

إذا كنت مشتركًا في MidJourney، وترغب في تجربة إصدار V6 Alpha الجديد، فما عليك سوى كتابة
/إعدادات
قم بالدخول إلى Discord ثم اختر V6 من قائمة النموذج التي تظهر بعد إرسال الأمر.


الالتزام الفوري

أول شيء أريد اختباره هو مدى التزام النموذج الجديد بالمطالبة. في الماضي، كان MidJourney يتعامل مع التفاصيل في المطالبة على أنها اقتراحات غامضة أكثر من كونها تعليمات. لذا، إليك مطالبة تحتوي على تعليمات مفصلة للغاية.

Draw a marketplace in a futuristic city. To the left of the frame, is a woman with a shopping basket in her left arm. To the right is a street market stall. A robot is behind the stall selling fruit. The robot is purple, and he is holding an apple in his outstretched right arm.

بالنسبة لكل نموذج، اخترت الصورة التي تتطابق بشكل وثيق مع مطالبتي. وفيما يلي أفضل صورة تم تقديمها بواسطة V5.2.

صورة تم إنشاؤها بواسطة الذكاء الاصطناعي لسوق في مدينة مستقبلية.
سيدني لو بتلر/How-To Geek/MidJourney

وهنا أفضل ما توصلت إليه V6.


صورة تم إنشاؤها بواسطة الذكاء الاصطناعي لسوق في مدينة مستقبلية.
سيدني لو بتلر/How-To Geek/MidJourney

في حين أن الإصدار 5.2 يتضمن عمومًا جميع العناصر التي طلبتها، إلا أنها ليست مرتبة بشكل صحيح بالنسبة للإطار أو بعضها البعض على الإطلاق. الخطأ الحقيقي الوحيد الذي ارتكبه الإصدار 6 هنا هو وضع التفاحة في الذراع اليسرى للروبوت وسلة التسوق في الذراع اليمنى للفتاة. ولعل الأهم من ذلك هو أن جميع الصور التي تم إنشاؤها بواسطة الإصدار 6 أكثر تماسكًا من تلك التي تم إنشاؤها بواسطة الإصدار 5.2، والذي لا يوجد لديه إحساس بالإطار أو التوازن هنا، ويبدو وكأنه مزيج من شيء ما.

إضافة نص إلى الصور

مثل DALL-E 3، يتمتع MidJourney V6 بالقدرة على دمج النص بشكل صحيح في الصورة. كل ما عليك فعله هو فصل النص باستخدام علامات الاقتباس في موجه الأوامر الخاص بك. إليك الموجه الذي استخدمناه:


A fabric flag with the words "How To Geek" on it.

أقوم بوضع جميع المحاولات الأربع لكلا النموذجين هنا لإظهار أن V6 ليس مثاليًا في هذا الأمر حتى الآن، ولكن لا توجد أي من صور V5.2 قريبة من الحصول على النص بشكل صحيح.

أربعة أعلام تم إنشاؤها بواسطة الذكاء الاصطناعي في كل ربع من الصورة، مع نص مشوه.
سيدني لو بتلر/How-To Geek/MidJourney

ومع V6، كانت نسبة النجاح 75% في المحاولة الأولى، ويمكنك أن ترى بوضوح أن النص مدمج بشكل صحيح في الصورة، بدلاً من مجرد وضعه فوقها.

أربعة أعلام تم إنشاؤها بواسطة الذكاء الاصطناعي وتحتوي على الكلمات How-To Geek عليها.
سيدني لو بتلر/How-To Geek/MidJourney


الجودة الفنية

في حين يمكننا اختبار مدى قدرة V6 على متابعة موجه أو دمج نص بشكل موضوعي إلى حد ما، إلا أن الجودة الفنية أصعب بكثير في تحديدها. في مقارنتي بين طرازي MidJourney V1 وV5.2، كان من الواضح أنه مع كل طراز جديد، أصبح الذكاء الاصطناعي أكثر “إبداعًا” لعدم وجود كلمة أفضل لوصف ذلك. كما تحسن التكوين والتفاصيل بشكل كبير، وبصراحة، لا يزال V5.2 يتفوق عندما يتعلق الأمر بالذوق الفني، كما لاحظت عندما قارنت MidJourney بـ DALL-E 3.

لذا أعتقد أنه من الأفضل ترك هذا لحكم كل شخص يقرأ هذا، وهنا بعض الأزواج من الصور، مع V5.2 على اليسار وV6 على اليمين.

صورتان متجاورتان تم إنشاؤهما بواسطة الذكاء الاصطناعي لقريتين قزميتين مثاليتين تتميزان بمنازل غريبة ومساحات خضراء مورقة.
سيدني لو بتلر/How-To Geek/MidJourney


Prompt: An epic and beatiful fantasy scene of an elvish village where the elves are going about their business. Make it an oil painting

صورتان متجاورتان لمشهد شارع مستقبلي يضم كائنات فضائية والروبوتات والبشر، كلهم ​​يعيشون في نفس المدينة.
سيدني لو بتلر/How-To Geek/MidJourney

Prompt: A futuristic street scene with aliens, robots, and humans all living in the same city. Make it in the style of a digital speed painting.

زوج من الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي جنبًا إلى جنب مع صورة طبيعية للجبال كما نراها من الشاطئ، مع قمر كبير مرئي في السماء.
سيدني لو بتلر/How-To Geek/MidJourney

Prompt: A nature photograph of mountains as seen from the beach, with a large visible moon in the sky.


إنه مجرد ألفا (في الوقت الحالي)

من المهم حقًا أن تضع في اعتبارك أن MidJourney V6 لم يتم الانتهاء منه في وقت كتابة هذا المقال. إنه نموذج جديد تم تدريبه من الصفر، ولكن مع الدروس المستفادة من النماذج السابقة. لا يزال V6 يفتقر إلى بعض القيم المضافة الرائعة التي يمكنك العثور عليها في V5.2، مثل القدرة على تحريك الصورة.

من الواضح أنه يمكنك التخلص من كل الحيل الهندسية التي تعرفها في MidJourney، حيث لا يزال الإصدار V5.2 قادرًا تمامًا على إنشاء صور مذهلة وقابلة للاستخدام. في هذه المرحلة، لا يوجد ضرر في تجربة نموذج V6 Alpha لمعرفة ما إذا كان يعطي نتائج أفضل مع المطالبات الخاصة بك، ولكن احتفظ بالإصدار V5.2 في متناول يدك أيضًا.

أضف تعليق