كيفية تحسين جودة أي صورة باستخدام تقنية الانتشار المستقر

جدول المحتويات

روابط سريعة

كيفية تحسين الصور في Stable Diffusion

نصائح لتحسين نتائج الترقية

النقاط الرئيسية

في Stable Diffusion WebUI، انقر فوق علامة التبويب “إضافات”.
قم بتحميل الصورة أو الصور التي تريد تحسينها.
قم بضبط شريط تغيير الحجم لاختيار الدقة التي تريدها.
اختر برنامج التطوير الذي تريد استخدامه.
انقر فوق “إنشاء”.

هل تشعر بخيبة الأمل بسبب انخفاض دقة الصور التي أنشأتها باستخدام Stable Diffusion؟ أو ربما لديك صور “حقيقية” قديمة ترغب في تحسينها؟ توفر واجهة Stable Diffusion WebUI أدوات لهذا الغرض، وسنقوم بإرشادك خلال العملية مع مشاركة بعض النصائح التي تعلمناها على طول الطريق.

كيفية تحسين الصور في Stable Diffusion

سواء كان لديك مسح ضوئي لصورة قديمة أو صورة رقمية قديمة أو صورة منخفضة الدقة تم إنشاؤها بواسطة الذكاء الاصطناعي، فابدأ تشغيل Stable Diffusion WebUI واتبع الخطوات أدناه.

1. قم بتحميل صورة

تتواجد جميع أدوات الارتقاء الخاصة بـ Stable Diffusion في علامة التبويب “إضافات”، لذا انقر فوقها لفتح قائمة الارتقاء.

انقر على "إضافات" علامة التبويب في Stable Diffusion WebUI.

أو، إذا كنت قد أنشأت للتو صورة تريد ترقيتها، فانقر فوق “إرسال إلى الإضافات” وسيتم نقلك إلى هناك بالصورة في مكانها للترقية. وإلا، فيمكنك سحب صورتك وإفلاتها في حقل تحميل الإضافات.

صورة موضوعة في حقل تحميل الإضافات في Stable Diffusion WebUI.

إذا كان لديك عدة صور تريد تكبيرها دفعة واحدة، فانتقل إلى علامة التبويب “عملية الدفعات” وقم بإسقاط عدة صور دفعة واحدة. لكن في تجربتي، لا ينجح هذا دائمًا،

الخطوة 2: اختر الحجم

استخدم شريط التمرير “تغيير الحجم” لضبط حجم الصورة الناتجة. بشكل افتراضي، ستستخدم علامة التبويب “تغيير الحجم حسب” التي تتيح لك ضرب دقة الصورة الحالية برقم معين. على سبيل المثال، إذا قمت بتعيينها على 2 وكانت الصورة المدخلة 512×512، فسيتم تكبير الصورة إلى 1024×1024.

ضبط "مقياس حسب" شريط التمرير أو حقل الرقم لاختيار العدد المضاعف الذي تريد ترقيته.

بدلاً من ذلك، يمكنك التبديل إلى علامة التبويب “تغيير الحجم إلى” وإدخال الدقة المحددة التي تريدها. انتبه جيدًا إلى نسبة العرض إلى الارتفاع الحالية للصورة، وقم بإلغاء تحديد خيار “قص لتناسب” إذا كنت لا تريد قطع الحواف.

إذا كنت تخطط لإنشاء خلفية، ضع في اعتبارك أن معظم الهواتف الحديثة تستخدم نسبة عرض إلى ارتفاع 9:16، وتستخدم الأجهزة اللوحية نسبة عرض إلى ارتفاع 4:3، وتستخدم أجهزة الكمبيوتر نسبة عرض إلى ارتفاع 16:9 (على الرغم من أن الشاشات فائقة الاتساع تصل إلى نسبة عرض إلى ارتفاع 21:9).

الخطوة 3: اختر برنامجًا متطورًا

الآن، هنا حيث من السهل أن تشعر بالإرهاق: لديك عدة خوارزميات مختلفة للترقية تحت تصرفك، وكلها بأسماء غامضة، ويجب عليك اختيار واحدة منها.

يعتمد الاختيار النهائي على نوع الصورة التي تريد تحسينها، مثل صورة فوتوغرافية أو لوحة أو رسم أنمي أو نوع آخر من الأعمال الفنية بأسلوب “الرسوم المتحركة”. تعمل الخوارزميات المختلفة أيضًا بسرعات مختلفة، لذا فقد يعتمد الأمر أيضًا على نوع العجلة التي تمر بها.

قائمة منسدلة في Stable Diffusion WebUI تُظهر أدوات الترقية المتوفرة.

ما هو أفضل جهاز ترقية انتشار مستقر؟

إن تجربة الخوارزميات المختلفة هي الطريقة الوحيدة لمعرفة أي من أدوات الترقية المضمنة في Stable Diffucion هي الأفضل لحالتك. ومع ذلك، إذا كنت ترغب في الحصول على توصية أساسية، فهذه عادةً خيارات جيدة:

الصور: إسرغان_4x
اللوحات: ر-إسرغان 4x+
أنيمي: R-ESRGAN 4x+ Anime6B

الخطوة 4: الارتقاء!

بمجرد ضبط الإعدادات، حان وقت الترقية. اضغط على زر “إنشاء” الكبير لبدء العملية.

في المرة الأولى التي تقوم فيها بالترقية باستخدام خوارزمية معينة، ستحتاج Stable Diffusion إلى تنزيل النماذج المناسبة، لذا توقع أن يستغرق التشغيل الأولي وقتًا إضافيًا (سيعتمد جزئيًا على سرعة الاتصال لديك).

بمجرد اكتمال عملية الترقية، ستجد الصور الناتجة في

extras-images

الدليل الفرعي الخاص بك

outputs

مجلد.

ذات صلة: كيفية استخدام Stable Diffusion لإنشاء صور GIF ومقاطع فيديو بتقنية الذكاء الاصطناعي

نصائح لتحسين نتائج الترقية

إذا لم تظهر الصور بالشكل الذي توقعته، فهناك بعض الأشياء التي يمكنك القيام بها للحصول على نتائج أفضل من أدوات الارتقاء بجودة الصور في Stable Diffusion.

جرب مجموعة Upscaler

بالنسبة للترقية المتقدمة، يمكنك تحديد خوارزمية ثانية ستطبق تأثيرها على نفس الصورة، وسيتم دمج نتائج الترقية الثانية للحصول على المنتج النهائي. (وللتوضيح، لن تعمل الترقية الثانية على مضاعفة دقة الإخراج.) وهذا مفيد إذا وجدت أن ترقية مختلفة تنتج نتائج أفضل لأسباب مختلفة.

على سبيل المثال، في اختباري، وجدت أن ESRGAN_4x كان الأفضل في الحفاظ على التفاصيل، لكن SwinIR كان به حبيبات أقل، كما كان يقدم بعض آثار البلاط المزعجة. يمكنني الحصول على أفضل ما في العالمين من خلال تعيين ESRGAN_4x كمحسن أساسي وSwinIR كمحسن ثانوي، مع وضوح 0.5.

تم تحديد المحسن الثانوي في Stable Diffusino WebUI.

إصلاح نسب العرض إلى الارتفاع السيئة باستخدام تقنية Outpainting

إذا كانت لديك صورة تريد استخدامها بنسبة عرض إلى ارتفاع معينة ولكن الصورة التي تم تكبيرها كبيرة جدًا أو عريضة جدًا بحيث لا يمكن استخدامها بدون اقتصاص، فمن المحتمل أن تتمكن من إصلاح هذه المشكلة باستخدام أداة “الطلاء الخارجي” في Stable Diffusionيتيح لك إنشاء “المزيد” من الصورة، وإضافة صور إلى الجانبين أو الجزء العلوي والسفلي لم تكن موجودة من قبل.

للبدء في الرسم الخارجي، أسقط صورتك في مدخل img2img، وابحث عن القائمة المنسدلة “Script” واختر إما Outpainting mk2 أو Poor Man’s Outpainting. اضبط أي إعدادات تراها حسب الضرورة، ثم انقر فوق “Generate”.

كما ستكتشف سريعًا، فإن الرسم بشكل أفضل من الصورة الأصلية أمر صعب، وربما يكون هذا موضوعًا لدليل آخر، خاصة مع محتوى الصور المعقدة مثل الأشخاص والحيوانات. ومع ذلك، من خلال العبث وعدم إجراء الكثير من التغييرات، تمكنت من إنشاء هذه النسخة البانورامية من صورتي التي تبدو للوهلة الأولى قابلة للتصديق إلى حد ما.

صورة مكبرة لمسار للمشي في الخريف مع إنشاء الجانبين الأيسر والأيمن باستخدام الانتشار المستقر. — ترقية ما بعد المعالجة بواسطة: 4، ترقية ما بعد المعالجة: ESRGAN_4x، ترقية ما بعد المعالجة 2: SwinIR_4x

استعادة الوجوه المشوهة باستخدام GPFGAN أو CodeFormer

إذا كان هناك وجه شخص في الصورة التي تقوم بتضخيمها، فيمكن تشويهها بسهولة إلى الحد الذي لا يمكن التعرف عليها. لا شك أنك شاهدت أيضًا بعض عمليات التجسيد المروعة للوجوه البشرية التي قامت بها شركة Stable Diffusion. وفي كلتا الحالتين، قد ترغب في دفع الوجه إلى الأمام. جي بي إف جيان أو كود فورمر أشرطة تمرير الرؤية. كل منها يطبق طبقة من التصحيح الوجهي أثناء عملية الترقية لإصلاح تلك العيون المخيفة والتجاعيد الغريبة.

إذا كنت تستخدم CodeFormer، فيمكنك أيضًا ضبط “وزن” تأثيره، وهو ما يشبه إلى حد ما التحكم في مستوى قوته (بينما يعمل شريط تمرير الرؤية مثل ضبط شفافية طبقة التصحيح الخاصة به). وكلما زادت الوزن، كلما حاول CodeFormer التصحيح. ويمكن أن يؤدي هذا إلى تحسين الصورة النهائية أو تدهورها حسب الموقف. قد تضطر إلى الخضوع لبعض التجارب والأخطاء للحصول على أفضل نتيجة ممكنة.

GPFGAN مقابل CodeFormer لاستعادة الوجه

على الرغم من أن كلاً من البرنامجين يتمتع بقدرة كبيرة، إلا أن GPFGAN أفضل بشكل عام في استعادة بنية الوجه (العينين على وجه الخصوص)، ولكن CodeFormer أفضل في إصلاح ملمس الجلد. يميل GPFGAN إلى إعطاء الجلد البشري مظهرًا ناعمًا للغاية، لذا إذا لاحظت حدوث ذلك، فجرب CodeFormer بدلاً منه. أو يمكنك الجمع بين البرنامجين ومحاولة الحصول على أفضل ما في العالمين. مرة أخرى، التجريب هو المفتاح.

استخدم شريطي التمرير GFPGAN وCodeFormer لإضافة تصحيح الوجه إلى صورك المُحسّنة.

من حيث السرعة، يعد GPFGAN أسرع قليلاً من CodeFormer. لذا، إذا كنت ترغب في جعل عملية الترقية تتم بأسرع ما يمكن، فربما ترغب في الاعتماد على GPFGAN.

ذات صلة: كيفية إنشاء خلفيات رائعة لأي جهاز باستخدام MidJourney