مايكروسوفت تطلق VALL-E، الذكاء الاصطناعي الذي يمكنه تقليد صوتك

الفن الذي تم إنشاؤه بواسطة الذكاء الاصطناعي هو تظهر في كل مكانولكن هذه ليست سوى البداية. فقد أصدرت شركة مايكروسوفت مؤخرًا أداة ذكاء اصطناعي جديدة تسمى VALL-E، وهي مشابهة لأداة DALL-E ولكنها مخصصة للأصوات. فبعد الاستماع إلى ثلاث ثوانٍ فقط من الصوت، يمكن لأداة VALL-E تقليد أي صوت.




إذا كان هذا يبدو مرعبًا، فهذا لأنه كذلك بالفعل. وهذا ليس كل شيء أيضًا. وفقًا لـ المواضيعتتوافق أداة Microsoft الجديدة بسهولة مع العاطفة والنبرة، وهو أمر العديد من أدوات الذكاء الاصطناعي الصوتية وقد قام الفريق بتدريب VALL-E على ما يقرب من 60 ألف ساعة من بيانات الكلام باللغة الإنجليزية، وأظهر قدرات التعلم في السياق، وكان قادرًا حتى على تكرار الكلمات التي لم يسمعها من قبل.

متعلق ب: هل يجب عليك استخدام Lensa AI، تطبيق “Magic” للصور الشخصية؟

يقول التقرير إن VALL-E قادر على تحويل النص إلى كلام بناءً على الأوامر، ويتبع السياق، ولا يحتاج إلى صوتيات مصممة مسبقًا أو أي هندسة هيكلية لتقديم عينة صوتية عالية الجودة. في الأساس، تعد أداة الذكاء الاصطناعي الجديدة هذه مثيرة للإعجاب. كل ما يحتاجه VALL-E هو سماع حوالي ثلاث ثوانٍ من أي صوت، وسيكون قادرًا على تقليد (أو تكرار) الصوت بسرعة وسهولة.


هناك العديد من الملفات الصوتية أمثلة من الأداة على GitHubوبينما يبدو بعضها رائعًا، فإن بعضها الآخر ليس مثيرًا للإعجاب وله نغمة آلية. ولكن عندما يعمل، فإنه يعمل بشكل جيد للغاية. ومع ذلك، لا تزال هذه هي الأيام الأولى لـ VALL-E، وستتحسن الأمور بمرور الوقت. بالإضافة إلى ذلك، إذا استخدم الفريق عينات أكبر، فمن المرجح أن تكون أكثر دقة.

من المهم أن نلاحظ أن VALL-E غير متاح للعامة، على الأقل ليس بعد، لذا يمكننا جميعًا أن نتنفس الصعداء. إذا حدث ذلك، فمن المؤكد أنه سيثير مجموعة من المخاوف الأمنية والاجتماعية والأخلاقية، على أقل تقدير. في حين تبدو هذه التكنولوجيا مثيرة للإعجاب بالتأكيد، إلا أنها أيضًا جامحة جدًا.

عبر ويندوز سنترال

أضف تعليق