هل تريد انتشارًا مستقرًا بدقة عالية؟ يوفر لك مولد الفن هذا الذي يعمل بالذكاء الاصطناعي

أصبحت مولدات الصور التي تعمل بالذكاء الاصطناعي رائجة هذه الأيام، ولكن معظمها يقتصر على إنشاء صور بدقة منخفضة، أو أن الأجهزة تستهلك ذاكرة الفيديو. والآن يوجد حل واحد (على الأقل) لهذه المشكلة: إصدار معدّل من Stable Diffusion يسمى “txt2imghd”.




يعتمد مشروع txt2imghd الجديد على وضع “GOBIG” من فرع آخر من Stable Diffusion، والذي بدوره هو النموذج المستخدم لإنشاء معظم أعمال الذكاء الاصطناعي الفنية التي ربما رأيتها مؤخرًا. يمكن أن تكون الصور التي تم إنشاؤها باستخدام txt2imghd أكبر من تلك التي تم إنشاؤها باستخدام معظم المولدات الأخرى — الصور التجريبية هي 1536×1536، بينما يقتصر Stable Diffusion عادةً على 1024×768، والوضع الافتراضي لـ Midjourney هو 512×512 (مع إمكانية الترقية الاختيارية إلى 1664×1664).

صورة تم إنشاؤها مع المطالبة: "صورة مقربة 55 مم ليد امرأة ساحرة جميلة مهيبة ذات شعر أحمر وهي تحمل كرة صغيرة من النار في يدها في ليلة ثلجية في القرية. تكبير اليد. التركيز على اليد. عمق المجال. بوكيه. رسم جريج روتكوفسكي ولويس رويو. واقعية للغاية. مفصلة للغاية. نيكون D850. معالجة سينمائية."
الصورة تم إنشاؤها بواسطة txt2imghd


يتمتع برنامج Txt2imghd بطريقة ذكية لرفع مستوى جودة الصور. ووفقًا لوثائق المشروع، فإنه “ينشئ صورًا مفصلة عالية الدقة من خلال إنشاء صورة أولاً من موجه، ورفع مستوى جودتها، ثم تشغيل img2img على أجزاء أصغر من الصورة التي تم رفع مستوى جودتها، ودمج النتيجة مرة أخرى في الصورة الأصلية”. إنه حل ذكي للتغلب على حدود بطاقات الفيديو، ولكن كما قد تتوقع، يستغرق إنشاء النتيجة وقتًا أطول من صورة واحدة منخفضة الدقة.

تتطلب النسخة المحدثة نفس متطلبات النظام تقريبًا مثل Stable Diffusion العادي، الذي يوصي ببطاقة رسوميات تحتوي على 10 جيجابايت على الأقل من ذاكرة الفيديو (VRAM). إذا كنت مهتمًا بتجربتها، فيمكنك قم بتشغيل النموذج في متصفحك (يتطلب حساب GitHub مجانيًا). يمكنك أيضًا تنزيل الكود لتشغيله على جهاز الكمبيوتر الخاص بك من رابط المصدر أدناه.

مصدر: جيثب



أضف تعليق