إليك كيفية اكتشاف مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي (في الوقت الحالي)

مع وصول نموذج SORA لتحويل النص إلى فيديو من OpenAI، فإننا نتطلع إلى مستقبل لا مفر منه مليء بالفيديوهات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي. ولكن التكنولوجيا لم يتم إتقانها بعد، لذا إليك بعض النصائح للتعرف على الفيديو الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي (في الوقت الحالي).




قد يكون اكتشاف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي تحديًا

للوهلة الأولى، قد يظن البعض أن مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي هي مقاطع حقيقية. ولكن عندما تبدأ في النظر بعمق أكثر، قد تبدأ في ملاحظة وجود خطأ ما.

جميع الأمثلة التي سنتحدث عنها في هذه المقالة تتعلق بـ OpenAI نموذج تحويل النص إلى فيديو SORAتم الإعلان عنه في فبراير 2024. إنه النموذج الأكثر تقدمًا من نوعه على الإطلاق، حيث يحول الرسائل النصية إلى صور متحركة. لقد قطعت الأمور شوطًا طويلاً منذ ويل سميث يأكل السباغيتي ظهرت مشاركة Reddit في أوائل عام 2023. وفي وقت كتابة هذا المقال في مارس 2024، لا يزال SORA في مرحلة الاختبار المغلقة.


إن اكتشاف الصور ومقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي هو فن أكثر منه علمًا دقيقًا. هناك طرق لمعرفة ما إذا كانت الصورة تم إنشاؤها بواسطة الذكاء الاصطناعي، لكنها لا تعمل بشكل متسق. غالبًا ما تكون الأدوات المصممة لاكتشاف محتوى الذكاء الاصطناعي غير موثوقة، حتى عندما يتعلق الأمر بالنص.

الهدف هنا هو تسليط الضوء على بعض الطرق التي يمكنك من خلالها اختيار المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، على الأقل في الوقت الحالي. تذكر أن النماذج تتطور دائمًا، لذا سيصبح من الصعب اكتشاف هذه السمات. في بعض الأحيان، يمكن أن يحدث اختيار موضوع وسياق الفيديو فرقًا كبيرًا.

ترقب التغييرات الدقيقة و”الأشباح”

إن البحث عن التغييرات الدقيقة هو إحدى الطرق لاكتشاف زيف الذكاء الاصطناعي المقنع، لكن الأمر ليس سهلاً تمامًا. فقد صور أحد الأمثلة على SORA من OpenAI امرأة تمشي على طول طريق شارع طوكيو المضاء بالنيونإن المشهد مثير للإعجاب بالنسبة لأداة تحويل النص إلى فيديو، ومثير للإعجاب إلى الحد الذي قد يجعلك تفوت تغيير خزانة الملابس في نهاية اللقطات.


تظهر ملابس المرأة في المشهد الافتتاحي فستانًا أحمر مع سترة طويلة وسترة جلدية. تبدو السترة غريبة بعض الشيء في الطريقة التي تبدو بها وكأنها تمتزج بالسترة، لكنني لست من محبي الموضة تمامًا، لذا سأتجاهلها:

مقطع فيديو لمثال على مشهد ليلي في طوكيو باستخدام OpenAI SORA.
أوبن أيه آي

الآن ألق نظرة على نفس الملابس عن قرب وستجد أن الفستان أصبح به الآن بقع داكنة وأن السترة الجلدية لها طية صدر أكبر بكثير خارج المركز:

مشهد ليلي من طوكيو عن قرب باستخدام OpenAI SORA.
أوبن أيه آي


هذا الأمر دقيق للغاية لدرجة أن أغلب الناس سيحتاجون إلى مشاهدة اللقطات عدة مرات لاكتشافها. المشهد كثيف ومليء بالانعكاسات والممثلين في الخلفية مما يساعد في تشتيت انتباهك عن الخطأ.

هناك شيء آخر يجب الانتباه إليه وهو الأشباح أو الأشياء التي تظهر وتختفي من الوجود. مقطع فيديو من OpenAI مدينة كاليفورنيا التي تشهد اندفاعا نحو الذهب يقدم هذا مثالاً جيدًا على ذلك. ألق نظرة على هذا الشكل الغامض إلى حد ما، والذي ربما يفسره عقلك على أنه رجل يمتطي حصانًا:

OpenAI SORA مدينة حمى الذهب في كاليفورنيا.
أوبن أيه آي

بعد ثانيتين، اختفى الشكل تمامًا. إذا شاهدت الفيديو، فسترى هذا الشكل يمتزج بالتراب وكأنه شبح:


OpenAI SORA مدينة كاليفورنيا التي شهدت اندفاع الذهب تظهر "شبح" اختفاء.
أوبن أيه آي

الذكاء الاصطناعي يواجه صعوبات في التعامل مع الأصابع والنظارات والعناصر الدقيقة

من أكبر المشكلات التي تواجه نماذج الذكاء الاصطناعي التوليدية هي الأطراف والخطوط الدقيقة. وعلى وجه الخصوص، يجب إلقاء نظرة فاحصة على الأيدي والأشياء المحمولة والنظارات والطريقة التي تتفاعل بها الأشياء مع السمات البشرية (مثل القبعات أو الخوذ أو حتى الشعر).

يمكن أن يجعل الفيديو هذا النوع من الأخطاء أسهل في الاكتشاف مقارنة بالتصوير الفوتوغرافي الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي لأن هذه الميزات يمكن أن تتغير من مشهد إلى آخر.

إن وضع الأصابع واليد أمر صعب بشكل خاص بالنسبة للذكاء الاصطناعي. تميل النماذج التوليدية إلى إنتاج أيدٍ بأصابع أكثر أو أقل مما تتوقع. في بعض الأحيان لا تبدو الأشياء على ما يرام، أو تكون الأصابع رفيعة للغاية، أو يكون هناك الكثير من المفاصل. تظهر الأشياء المحمولة نفس الالتواء، وفي بعض الأحيان تبدو وكأن الإنسان في الإطار قد امتص أي شيء يحمله.


ابحث عن النظارات التي لا تبدو متناظرة أو التي تندمج مع الوجوه. في مقطع فيديو، قد تظهر وتختفي من العرض وتتغير بين المشاهد. وينطبق الأمر نفسه على الذراعين والساقين، فقط ألق نظرة على مقطع فيديو SORA هذا الناس في لاغوس، نيجيريا:

مشهد شارع في لاغوس من OpenAI SORA يصور بعض المخالفات.
أوبن أيه آي

هل يمكنك أن تزيل ذراعك الثالثة من ساقي من فضلك؟

انظر عن كثب إلى الأشياء الموجودة في خلفية الصورة

غالبًا ما تكون تفاصيل الخلفية بمثابة دليل واضح عندما يتعلق الأمر بالفيديو الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي، حتى أكثر من الصور. يعتمد التزوير الجيد على كون الموضوع مقنعًا بما يكفي لصرف انتباهك عن أن الخلفية لا تتصرف بالطريقة التي ينبغي لها أن تكون عليها.


ألق نظرة مرة أخرى على مقطع فيديو مشهد ليلي في طوكيو. هذا المشهد كثيف للغاية لدرجة أنه من السهل أن تأخذ كل شيء على ظاهره، ولكن انظر عن كثب إلى الأشخاص الذين يسيرون في الخلفية، وخاصة أولئك على يسار الشخص:

تفاصيل خلفية المشهد الليلي في OpenAI SORA Tokyo.
أوبن أيه آي

بعض هذه الحركات لا تبدو صحيحة. ففي مرحلة ما، يبدو أن الشخص يكرر نفسه. وفي وقت لاحق، يبدو أن مجموعة من الأشخاص تتحول إلى شيء واحد كما لو كانوا جميعًا يرتدون نفس التنورة أو المعطف. وفي بعض المناطق، تكون حركات المشي غريبة أيضًا.

انتبه إلى أي نشاط مشبوه في الخلفية لاكتشاف مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي. في بعض الأحيان، ستلاحظ تفاعل أشياء طبيعية مثل الأشجار أو الحقول أو الغابات بطرق غريبة. قد تبدو المنظورات غير واضحة، وأحيانًا لا تتوافق الأشياء المتحركة تمامًا مع المسار الموضح في الرسوم المتحركة.


مثال آخر هو OpenAI لقطة طائرة بدون طيار لساحل بيج سورهل سبق لك أن رأيت موجة تبدو مستقيمة في الطبيعة؟

الإضاءة وهالة الذكاء الاصطناعي

هذا شيء رأيناه كثيرًا في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، ويمكن القول إنه أقرب إلى “الشعور” منه إلى سمة يمكن التعرف عليها بشكل موضوعي. إذا كانت الإضاءة تبدو مسطحة وغير طبيعية بشكل خاص في الحالات التي تتوقع فيها المزيد من التباين، فقد يشير ذلك إلى أنها قد لا تكون حقيقية.

على سبيل المثال، عدم وجود عيوب الكاميرا مثل التفتح، أو انفجار الضوء (حيث يتم فقدان الضوء بسبب دخول الكثير من الضوء إلى العدسة)، أو تراجع الظل (حيث يتم فقدان تفاصيل الظل بسبب غياب الضوء) ببساطة غير موجودة.

قد يبدو كل شيء أشبه بفيديو موسيقي تم إنتاجه بمهارة عالية، أو مثل ألعاب الفيديو في الأيام التي سبقت الإضاءة الواقعية وتتبع الأشعة. قد تبدو الكائنات مضاءة بشكل مثالي في الحالات التي لا تتوقعها.


تأثير الوادي الغريب

تأثير الوادي الغريب هو مصطلح يستخدم لوصف اختلاط السمات البشرية وغير البشرية بطريقة تجعل المشاهد يشعر بعدم الارتياح. غالبًا ما يتم الاستشهاد بالروبوتات التي تشبه البشر لأنها تعطي المظهر الخارجي للإنسان ولكنها غير بشرية في نفس الوقت.

في أغلب الأحيان، يعود تأثير الوادي الغريب إلى شعور ما. يمكنك أن تشعر بأن هناك شيئًا غير صحيح تمامًا، لكن لا يمكنك تحديد ما هو بالضبط. غالبًا ما يظهر هذا التأثير في الصور ومقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي، وإحدى المناطق التي واجهتها هي في SORA فيديو رائد فضاء.

إذا تجاهلنا للحظة أن رائد الفضاء المذكور يرتدي خوذة فضاء محبوكة، فهناك شيء ما في هذا الوجه يرسل قشعريرة أسفل العمود الفقري لدي:


فيديو رائد فضاء OpenAI SORA يرتدي خوذة محبوكة يوضح تأثير الوادي الغريب.
أوبن أيه آي

وهناك على نحو مماثل جدة غولية فشلت في إطفاء شموع عيد ميلادها، وهو ما يبدو أسوأ بكثير أثناء الحركة:

كابوس الجدة OpenAI SORA.
أوبن أيه آي

احذر من الهراء

يبدو هذا أسهل علم أحمر يمكن اكتشافه، ولكن في بعض الأحيان يتجاهل عقلك الأشياء ببساطة. يعد مقطع فيديو رائد الفضاء المذكور أعلاه مثالاً جيدًا على ذلك. يوجد مشهد قصير لباب أو مقبض أو رافعة أو شئ ما هذا لا معنى له على الإطلاق:

فيديو رائد فضاء OpenAI SORA يصور جسمًا غريبًا.
أوبن أيه آي


ما هذا الشيء؟ لماذا يتم تشغيل الرسوم المتحركة بشكل معكوس؟ يمكنني أن أعتذر عن الخوذة المحبوكة، لكن هذا الشيء حيرني منذ اللحظة التي رأيته فيها.

وينطبق نفس الشيء على الحركات. SORA فيديو قطة في السرير إنه أمر مثير للإعجاب، لكن الحركة ليست صحيحة. سيدرك أصحاب القطط أن السلوك غريب وغير طبيعي. يبدو الأمر وكأن هناك عدم تطابق بين سلوك الموضوع وسياق الموقف. بمرور الوقت، سيتحسن هذا.

إن النص المشوه هو مثال جيد آخر على الأخطاء التي ترتكبها عمليات توليد الذكاء الاصطناعي في كثير من الأحيان. فالأحرف اليابانية في مقطع فيديو مشهد ليلي في طوكيو من إنتاج SORA عبارة عن خليط من الأحرف، وكذلك بعض لافتات الطرق والمتاجر. وكان اختيار مشهد حيث لا يستطيع معظم الناس التمييز بين اللغة اليابانية والتقليد السيئ اختيارًا ذكيًا من جانب OpenAI.


درب نفسك على اكتشاف هذا المحتوى بشكل أفضل

أفضل طريقة لتدريب نفسك على اكتشاف المحتوى الذي ينتجه الذكاء الاصطناعي هي دراسته بنفسك. تمتلك معظم نماذج توليد المحتوى مجتمعات نشطة سواء على الويب أو على منصات التواصل الاجتماعي مثل Reddit. ابحث عن بعض هذه المجتمعات وألق نظرة على ما يبتكره الناس.

بالإضافة إلى ذلك، يمكنك إنشاء صورك الخاصة باستخدام أداة مثل Stable Diffusion. في وقت كتابة هذه المقالة، لا تتوفر أداة SORA من OpenAI للاستخدام العام، لذا سيتعين عليك الانتظار قبل البدء في استخدامها بنفسك.

إن مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي مثيرة للإعجاب ورائعة ومرعبة في نفس الوقت. ومع مرور الوقت، من المرجح أن تصبح هذه النصائح أقل أهمية مع تغلب النماذج على نقاط ضعفها. لذا، استعد، لأنك لم تر شيئًا بعد.

أضف تعليق