أول نموذج لتحويل النص إلى فيديو من OpenAI أصبح هنا، لكن لا يمكنك استخدامه

تستعرض شركة OpenAI نموذج Sora، وهو أول نموذج ذكاء اصطناعي لتوليد النصوص إلى مقاطع فيديو. يمكن لنموذج Sora تحويل نص بسيط أو صورة إلى مقطع فيديو عالي الدقة لمدة دقيقة. كما يمكنه “تمديد” أو إدراج إطارات في مقاطع الفيديو الموجودة. ومع ذلك، لا تزال شركة OpenAI في مرحلة اتخاذ القرار بشأن ما إذا كانت ستقدم Sora كمنتج.




هذه ليست أول تقنية ذكاء اصطناعي لتحويل النص إلى فيديو، ولكنها قد تكون الأكثر إثارة للإعجاب. مقاطع فيديو توليدية من جوجل إن أجهزة الكمبيوتر المحمولة من طرازي Sora وMeta منخفضة الدقة ومتقطعة ومرعبة للغاية. وفي الوقت نفسه، تنتج أجهزة Sora فيديو بدقة 1080 بكسل بمعدل إطارات سلس، وقد يخطئ البعض في فهم مخرجاتها على أنها فيديو حقيقي.

تتوفر أمثلة مبكرة من إنتاج سورا على موقع OpenAIبناءً على هذه الأمثلة، يمكننا أن نرى أن الذكاء الاصطناعي لديه فهم جيد لنسب جسم الإنسان والإضاءة الواقعية والتصوير السينمائي الإبداعي. كما يتميز سورا بمهارة رسم الحيوانات الواقعية، ويمكنه تقليد عيوب الأفلام القديمة.

بالطبع، لا تزال مخرجات سورا بعيدة كل البعد عن الكمال. فكل موضوعاتها تتمتع بجودة غريبة من انعدام الوزن، وإذا نظرت عن كثب، فستجد بعض السمات المميزة لتوليد الصور بالذكاء الاصطناعي. تعترف شركة OpenAI بأن سورا قد يكون ناجحًا أو فاشلاً وتقدم بعض الأمثلة “السيئة” لمخرجات الذكاء الاصطناعي، بما في ذلك مقطع فيديو لرجل يركض إلى الخلف على جهاز المشي.


يتمتع نموذج Sora بـ “فهم عميق للغة” ويمكنه “التعبير عن المشاعر النابضة بالحياة” في مخرجاته. ومع ذلك، لا يتطلب Sora مطالبة طويلة أو معقدة. تعتمد بعض الأمثلة التي تقدمها OpenAI على مطالبات مفتوحة النهاية تتكون من جملة واحدة. إنها ليست مختلفة كثيرًا عن ميزة إنشاء الصور في ChatGPT.

لسوء الحظ، لم تعرض OpenAI قدرات Sora في تحويل الصور إلى مقاطع فيديو. كما أننا مهتمون بميزات الذكاء الاصطناعي في تمديد مقاطع الفيديو وإدراج الإطارات – إذا كانت هذه الميزات فعالة، فقد تكون Sora أداة مفيدة لتحرير مقاطع الفيديو أو استعادتها.


كما أننا لا نعرف سوى القليل جدًا عن بيانات تدريب Sora. تقول OpenAI إنها استخدمت ما يقرب من 10000 ساعة من مقاطع الفيديو “عالية الجودة”، ولكن هذا كل شيء. قد يتم الكشف عن مزيد من المعلومات في ورقة Sora البيضاء من OpenAI، والتي سيتم نشرها بحلول نهاية 15 يناير.

في كل الأحوال، يتعين على سورا التغلب على العديد من العقبات قبل أن يصبح منتجًا حقيقيًا. وتستشير شركة OpenAI “صناع السياسات والمعلمين والفنانين” لفهم مخاوف الجمهور بشكل أفضل. كما تعمل مع خبراء يمكنهم قياس إمكانات سورا في “التضليل والمحتوى البغيض والتحيز”. وإذا قررت شركة OpenAI طرح سورا في السوق العامة، فسوف تكون مخرجات الذكاء الاصطناعي مصحوبة ببيانات تعريف C2PA لتسهيل التعرف عليها.

مصدر: أوبن أيه آي

أضف تعليق