كيفية كتابة موجه انتشار مستقر رائع

يتطلب Stable Diffusion، وهو مولد فني شهير للذكاء الاصطناعي، مطالبات نصية لإنشاء صورة. في بعض الأحيان يقوم بعمل مذهل ويولد بالضبط ما تريده بمطالبة غامضة. وفي أحيان أخرى، تحصل على مخرجات دون المستوى الأمثل. فيما يلي بعض النصائح والحيل للحصول على نتائج مثالية.




كيفية كتابة موجه انتشار مستقر

إذا كنت قد أمضيت أي وقت على الإطلاق مع مولدات الصور التي تعمل بالذكاء الاصطناعي، مثل Stable Diffusion أو DALL-E أو MidJourney، فستلاحظ أن التوجيه الصياغ بشكل جيد أمر بالغ الأهمية. إن التوجيه الصياغ بشكل جيد هو الفارق بين تحويل فكرتك إلى صورة رائعة وبين الحصول على وحوش غريبة مع وجود عدد كبير جدًا من الأصابع تحدق فيك.

ذات صلة: كيفية تشغيل Stable Diffusion على جهاز الكمبيوتر الخاص بك لإنشاء صور AI

لقد حاول الناس اكتشاف أفضل الطرق للحصول على نتائج مثالية منذ إطلاق Stable Diffusion في أغسطس 2022، وسيستمرون في “التصميم الفوري” أو “الهندسة الفورية” لسنوات قادمة. ومن المرجح بشكل خاص أن يحدث هذا لأن نقاط التفتيش التي تخبرنا بكيفية إنشاء Stable Diffusion للصور ستتلقى تحديثات دورية. وسوف يكون الهدف المثالي هدفًا متحركًا في المستقبل المنظور.

التحديث: 23/12/22

يستجيب الإصدار الأحدث من Stable Diffusion في وقت هذا التحديث، الإصدار 2.1، بشكل جيد للغاية للمطالبات السلبية. المطالبات السلبية تشبه المطالبات العادية، ولكن بدلاً من وصف ما تريده، فإنك تصف ما لا تريده. حاول إنشاء أول مجموعة من الصور بدون مطالبات سلبية، ثم أضف مطالبات سلبية لإزالة العناصر التي لا تحبها.


ذات صلة: أفضل مولدات الصور بالذكاء الاصطناعي التي يمكنك استخدامها الآن

كن محددًا قدر الإمكان

تميل Stable Diffusion إلى الازدهار عند استخدام مطالبات محددة، وخاصةً عند مقارنتها بشيء مثل MidJourney. تحتاج إلى إخبارها بما تريده بالضبط. فيما يلي مثال باستخدام الحيوانات المفضلة على الإنترنت: القطط اللطيفة.

لوحة مكونة من 6 صور ناتجة من Stable Diffusion باستخدام المطالبة "قطة لطيفة."

حسنًا، إنها لطيفة للغاية، باستثناء الرجل المسكين في الجزء الأوسط العلوي الذي يبدو وكأنه قضى وقتًا طويلاً في التحديق في الهاوية. ولكن ماذا لو كنت تريد قططًا رمادية اللون، وليس مزيجًا من القطط؟ حسنًا، عليك تحديد ذلك. استخدم “قطط رمادية لطيفة” كإشارة بدلاً من ذلك.


لوحة مكونة من 6 صور ناتجة من Stable Diffusion باستخدام المطالبة "قطة رمادية لطيفة."

الآن، يعمل Stable Diffusion على إرجاع جميع القطط الرمادية. يمكنك الاستمرار في إضافة أوصاف لما تريده، بما في ذلك إضافة إكسسوارات للقطط في الصور.

لوحة أخرى مكونة من 6 صور ناتجة من Stable Diffusion باستخدام المطالبة "قطة رمادية لطيفة ذات عيون زرقاء، ترتدي ربطة عنق على شكل فراشة"

ينطبق هذا على أي شيء تريد أن ينتجه Stable Diffusion، بما في ذلك المناظر الطبيعية. كن وصفيًا، وبينما تجرب مجموعات مختلفة من الكلمات الرئيسية، احتفظ بملاحظة ذهنية حول كيفية تغير الصورة. تميل بعض الكلمات والعبارات إلى تحيز الصورة بشكل أقوى من الكلمات الأخرى، لذا قد تحتاج إلى تعديل مطالبتك وفقًا لذلك.


اسم الأنماط أو الوسائط الفنية المحددة

لا تنتهي الحاجة إلى التحديد عندما تصف محتوى الصورة التي تريدها بالكامل. يمكنك (ويجب عليك) أيضًا تحديد الأسلوب الذي تريده. سنلتزم بمطالبتنا “قطة رمادية لطيفة” لهذا الغرض. لنفترض أننا نريد بعض القطط الرمادية اللطيفة، ولكننا نريد أيضًا أن تبدو وكأنها لوحة أكريليك. أول شيء يجب أن تجربه هو إضافة “لوحة أكريليك” ككلمة رئيسية تالية في مطالبتك، بحيث تقرأ: “قطة رمادية لطيفة، لوحة أكريليك”.

من الأفضل عمومًا أن تبدأ بأقل عدد ممكن من الكلمات الرئيسية للوصول إلى ما تريده، ثم قم بإضافة المزيد للوصول إلى المظهر الجمالي الذي تبحث عنه.

6 قطط رمادية من Stable Diffusion تبدو مثل اللوحات الأكريليكية.

الانتشار المستقر يتعرف على العشرات من أنماط مختلفة، كل شيء من الرسومات بالقلم الرصاص إلى نماذج الطين إلى العرض ثلاثي الأبعاد من Unreal Engine.


مثال آخر للقطط الرمادية على غرار "محرك غير واقعي."

إن هذه الأمثلة التوضيحية بسيطة للغاية، ولكن يمكنك استخدام عشرات الكلمات الرئيسية لضبط نتائجك. إذا كنت تريد نماذج دجاج غريبة ذات ألوان زاهية في وول مارت، فأنت بحاجة إلى تحديد كل هذه المصطلحات.

تمثال غريب من الطين الذائب لدجاجة في وول مارت.

أسماء فنانين محددين لتوجيه الانتشار المستقر

إن Stable Diffusion قادر على القيام بأكثر من مجرد محاكاة أنماط أو وسائط معينة؛ بل يمكنه حتى تقليد فنانين معينين إذا كنت ترغب في ذلك. وقد استخدم هذا المثال بابلو بيكاسو.


يجب عليك بالتأكيد تجربة إضافة “بواسطة (اسم الفنان)” إلى مطالباتك إذا لم تكن قد فعلت ذلك بالفعل. يميل هذا إلى إنتاج نتائج مذهلة. لا تخف من الجمع بين الفنانين الذين لا ينسجمون عادةً معًا. في كثير من الأحيان، يجمع Stable Diffusion بين أنماطهم الخاصة بطرق مثيرة وغير متوقعة.

6 قطط، كما صور الانتشار المستقر التي رسمها بيكاسو.

وزن كلماتك الرئيسية

بالطبع، لن يؤدي مجرد حشر الكلمات الرئيسية في موجهك إلى تحقيق هدفك. ماذا يحدث إذا كنت تحصل على كل الأشياء الصحيحة في موجهك، ولكنها ليست متناسبة بشكل صحيح؟


يدعم Stable Diffusion ترجيح الكلمات الرئيسية المطلوبة. بعبارة أخرى، يمكنك إخباره بأنه يحتاج حقًا إلى الاهتمام بكلمة رئيسية معينة (أو كلمات رئيسية) وإيلاء اهتمام أقل للآخرين. إنه مفيد إذا كنت تحصل على نتائج تشبه إلى حد ما ما تبحث عنه، ولكنها ليست كذلك تمامًا.

ذات صلة: كيفية تشغيل Stable Diffusion على جهاز الكمبيوتر الخاص بك لإنشاء صور AI

في إصدار سطر الأوامر من Stable Diffusion، ما عليك سوى إضافة علامة نقطتين كاملة متبوعة برقم عشري إلى الكلمة التي تريد التأكيد عليها. الأرقام العشرية عبارة عن نسب مئوية، لذا يجب أن يصل مجموعها إلى 1.

بالعودة إلى موجه “Cute grey cat” الخاص بنا، فلنتخيل أنه كان ينتج قططًا لطيفة بشكل صحيح، ولكن لم تظهر قطط رمادية في العديد من الصور الناتجة. يمكنك تعديل الموجه ليصبح: “cute, grey cat:0.7” بدلاً من ذلك، وسيولي الموجه أكبر قدر من الاهتمام لكلمة “gray cat”، ثم يطبق الفرق تلقائيًا على “cute”. يمكنك أيضًا تعيين أوزان لكل كلمة في الموجه يدويًا إذا كنت تريد تحكمًا أدق، مثل “Cute:0.10, Grey Cat:0.60, Unreal Engine rendering:0.30” على سبيل المثال.


ذات صلة: كيفية استخدام Stable Diffusion لإنشاء صور GIF ومقاطع فيديو بتقنية الذكاء الاصطناعي

تتعامل أغلب واجهات المستخدم الرسومية المتاحة لـ Stable Diffusion مع الترجيح دون الحاجة إلى إدخال نسب مئوية صريحة. يمكنك عادةً إضافة أقواس حول مصطلح في موجهك للتأكيد عليه، وأقواس لتقليل أهمية المصطلح. لذا قد تبدو “القطة الرمادية اللطيفة” السابقة مثل “(لطيفة)،((القطة الرمادية)).”

بإمكانك استخدام عدة أقواس لتكديس التركيز بالقدر الذي تريده.

ابحث عن الإلهام في مكان آخر

لقد شهدت Stable Diffusion وغيرها من مولدات الفن بالذكاء الاصطناعي ارتفاعًا هائلاً في شعبيتها. يمكنك العثور على هذا النوع من فن الذكاء الاصطناعي في كل مكان. وهذا يعني أن هناك الآن على الأقل بضعة ملايين من الصور التي أنشأها المستخدمون تطفو على الإنترنت، وفي معظم الأحيان، يقوم الأشخاص بتضمين المطالبة التي استخدموها للحصول على نتائجهم.


ذات صلة: معرض الفن هذا الذي يعمل بالذكاء الاصطناعي أفضل حتى من استخدام مولد كهربائي

فيما يلي بعض الموارد التي قد تساعدك على إثارة الإلهام إذا لم تكن متأكدًا مما تريد إنشاءه:

كل هذه الأشياء قد تكون غير مناسبة للعمل.

  • ليكسيكا — مستودع للصور التي تم إنشاؤها باستخدام Stable Diffusion والموجه المقابل. يمكن البحث باستخدام الكلمات الأساسية.
  • دراسات أسلوب الفنان المستقر الانتشار — قائمة غير شاملة للفنانين الذين قد يتعرف عليهم Stable Diffusion، بالإضافة إلى أوصاف عامة لأسلوبهم الفني. يوجد نظام تصنيف لوصف مدى استجابة Stable Diffusion لاسم الفنان كجزء من المطالبة.
  • دراسات معدل الانتشار المستقر — قائمة بالمعدِّلات التي يمكن استخدامها مع Stable Diffusion، تمامًا مثل صفحة الفنان.
  • قائمة تعديلات فن الذكاء الاصطناعي — معرض صور يعرض بعض أقوى أدوات التعديل التي يمكنك استخدامها في مطالباتك، وما تفعله. وهي مرتبة حسب نوع أداة التعديل.
  • أفضل 500 فنان ممثلين في Stable Diffusion — نحن نعلم بالضبط الصور التي تم تضمينها في مجموعة تدريب Stable Diffusion، لذا فمن الممكن معرفة الفنانين الذين ساهموا أكثر في تدريب الذكاء الاصطناعي. وبشكل عام، كلما كان الفنان ممثلاً بشكل أقوى في بيانات التدريب، كلما استجاب Stable Diffusion بشكل أفضل لاسمه ككلمة رئيسية.
  • منتدى Reddit حول الانتشار المستقر — تحتوي صفحة The Stable Diffusion الفرعية على تدفق مستمر من المطالبات الجديدة والاكتشافات الممتعة. إذا كنت تبحث عن الإلهام أو البصيرة، فلن تخطئ أبدًا.


تعديل الإعدادات المهمة الأخرى

يعد الحصول على موجه جيد هو الجزء الأصعب في استخدام Stable Diffusion، ولكن هناك بعض الإعدادات الأخرى التي ستغير النتائج بشكل كبير.

  • سي اف جي: يحدد مدى قوة اتباع Stable Diffusion لمطالبتك. تؤدي الأرقام الأعلى إلى مزيد من الالتزام بالمطالبة، في حين تمنح الأرقام المنخفضة الذكاء الاصطناعي مزيدًا من الحرية. حاول تعديل هذا أولاً.
  • طريقة أخذ العينات: كيف يتم تنقية الصورة من الضوضاء وتحويلها إلى أشكال يمكن التعرف عليها. جرب بعض هذه الطرق. يبدو أن Euler_a وk_LMS وPLMS خيارات شائعة.
  • خطوات أخذ العينات: عدد مرات أخذ العينات من الصورة قبل الحصول على النتيجة النهائية. في بعض الأحيان تحصل على نتائج جيدة عند 30 خطوة، وفي أحيان أخرى تحتاج إلى الانتقال إلى 50 أو 80 خطوة. لا تحصل عادةً على نتائج أفضل عند تجاوز 150 خطوة. ابدأ بعدد أقل من الخطوات ثم زد العدد.

بعض من المطالبات المنمقة المفضلة لدينا

هذه بعض المطالبات المفضلة لدينا لأنها تميل إلى العمل بشكل موثوق للغاية. ما عليك سوى إضافة موضوع من اختيارك بالإضافة إلى بعض المعدِّلات. تم الاحتفاظ بجميع إعدادات الانتشار المستقر الأخرى كما هي في المطالبات أعلاه.


كقاعدة عامة، يقوم Stable Diffusion بإنشاء غروب الشمس وأوراق الخريف بشكل استثنائي.

(الموضوع)، 35 مم، حاد

اختر موضوعًا، وسيقوم هذا الموجه بإرجاع نتائج صور واقعية للأشخاص والحيوانات والمناظر الطبيعية بشكل موثوق.

يتضمن هذا المثال الموجه أيضًا “الساعة الذهبية” للحصول على ألوان غروب الشمس.

صورة التقطتها فرقة Stable Diffusion لجبل كاتادين كما شوهد من الجانب الآخر من البحيرة.

(الموضوع)، عرض ثلاثي الأبعاد منخفض التعدد، ألوان باستيل نابضة بالحياة، تحول الميل، حبيبات الفيلم

أدخل موضوعًا وسوف تحصل عليه في جمالية “فن الرالي”.


سيارة ملونة للغاية.

(الموضوع)، (الوصف البيئي)، سينمائي، درامي، تكوين، سماء مشمسة، وحشي، واقعي للغاية، مقياس ملحمي، شعور بالرهبة، مبالغ فيه، مستوى مجنون من التفاصيل، artstation HQ

ما عليك سوى إدخال موضوع ووصف للبيئة المحيطة، وسيوفر لك هذا الموجه صورًا فنية رائعة لمدينة ذات تأثير بيئي من اختيارك. فيما يلي مثال باستخدام مدينة نيويورك كموضوع وعاصفة غبارية كوصف للبيئة المحيطة:

يوم من الطقس السيئ إلى حد ما في مدينة نيويورك.

كيرميت أي شيء

تنتج تقنية Stable Diffusion نتائج رائعة مع Kermit. يمكنك تجربتها في أي مكان.


كيرميت مع دمية شريرة خلفه.

لماذا تفسر شركة Stable Diffusion رواية “Kermit in Mordor” بهذه الطريقة، ومن هو ذلك الكائن الشرير الأحمر الذي يشبه Kermit والذي يقف خلف بطلنا الصامد؟ ليس لدي أي فكرة.

تذكر، لا تخف من إزالة ما تعتقد أنه قد يكون مصطلحًا رئيسيًا من موجهك. بعض الكلمات، مثل “رائع”، ستؤثر بشدة على شكل الصورة، حتى لو لم يكن لها معنى دقيق. مع قضاء المزيد من الوقت مع Stable Diffusion، ستطور شعورًا بكيفية استجابته لكلمات معينة، وستجد بسرعة أن كتابة موجه جيد هو فن في حد ذاته.

أضف تعليق