أضافت Gemini من Google أخيرًا القدرة على تحميل ملفات الصوت وتحليله. تأخذ هذه الميزة الجديدة ملفات الصوت الخاصة بك ، بما في ذلك التنسيقات الشائعة مثل MP3 و M4A و WAV ، ويمكنها نسخ وتلخيص واستخراج التفاصيل الرئيسية من المحتوى.
الميزة متوفرة الآن على Android و iOS و Web. يمكنك الوصول إلى الميزة الجديدة من خلال قائمة Plus على تطبيق Gemini Mobile أو خيار ملفات التحميل على الويب. من هناك ، ما عليك سوى تحديد ملف صوتي من جهازك. سيقوم بعد ذلك بتحليل ما تضعه فيه ويجعل من السهل للغاية العثور على تفاصيل في المحتوى الخاص بك ، سواء كان اجتماعًا مسجلًا أو مقابلة أو محاضرة أو حتى ملاحظة صوتية شخصية.
لسوء الحظ ، تأتي خدمة النسخ الجديدة مع حدود الاستخدام المتدرج ، والتي ستكون مختلفة للمستخدمين الأحرار وأولئك الذين لديهم اشتراك مدفوع. بالنسبة للمستخدمين على المستوى المجاني ، يتم تغطية طول الصوت الكلي الذي يمكن تحميله وتحليله في 10 دقائق. هذا سخية بشكل لا يصدق من Google ، ويوفر وقتًا أكبر للملفات الصوتية أكثر من أي خدمة نسخ مجانية أخرى رأيتها.
الحد الزمني ليس هو القيد الوحيد للبحث عنه. يمكنك تحميل ما يصل إلى 10 ملفات من أي تنسيق مدعوم على موجه واحد افتراضيًا. يتضمن ذلك مجلدات الرمز مع ما يصل إلى 5000 ملف ، ومستودعات GitHub ، وملفات zip التي تحتوي على ما يصل إلى 10 ملفات مضغوطة. لا يوسع التحديث الصوتي هذا الحد ، لكنه يعتبر الحد الأقصى لما بين 10 أطراف لما يمكنك تحميله مرة واحدة.
إذا كنت ستستخدمها لنسخها ، فإنني أوصي بإعادة البرنامج النصي إلى الجوزاء والسؤال عما إذا كان هناك أي شيء لا يوجد في ملف الصوت. هذا فقط في حالة تعبئة الذكاء الاصطناعى في أي وقت ، لأن 10 دقائق إلى ثلاث ساعات هي وقت طويل لأي منظمة العفو الدولية ، وأنا شخصياً لن أثق تمامًا في عدم إرباك الكلمات أو الهلوسة.
ضع في اعتبارك أنه بمجرد تحميل ملف صوتي ، يمكن لـ Gemini فعل أكثر من مجرد تحويله إلى نص. يمكن للمستخدمين مطالبة الذكاء الاصطناعى بتلخيص النقاط الرئيسية ، أو تحديد مكبرات الصوت المختلفة ، أو حتى استخراج عناصر عمل محددة أو علامات اقتباس. هذا يحول ملف الصوت الخام إلى مستند منظم وقابل للبحث ومفيد للغاية.
بالنسبة للمستخدمين والمهنيين الذين يحتاجون إلى قدرات نسخ أكثر شمولاً ، تقدم Google حدود أعلى بكثير. يمكن للمشتركين في Google AI Pro أو Google AI Ultra تحميل ما يصل إلى ثلاث ساعات من الصوت. هذه زيادة كبيرة تجعل الخدمة رائعة لنسخ محتوى طويل الشكل مثل البودكاست أو المقابلات الكاملة أو الحلقات الدراسية. أستطيع أن أتخيل أن أي شخص يدير عمل أو يعمل في النسخ قد يستفيد من التكلفة الشهرية البالغة 20 دولارًا خطة AI Pro.
لقد وفرت الكثير من الوقت في وضع روابط YouTube في Gemini للعثور على بقعة أبحث عنها في مقاطع فيديو مدتها ساعة. تعد Gemini رائعة في الانتباه إلى ما يحدث في روابط الفيديو ، لذلك أعرف أن هذه الترقية للصوت من المحتمل أن تكون مفيدة حقًا للمستخدمين.
مصدر: جوجلو 9to5Google