يمكن لـ Google Gemini الآن تحويل أي شيء تقريبًا إلى بودكاست

ملخص

  • تقدم Google Gemini نظرة عامة على الصوت ، مما يسمح للمستخدمين بإنشاء ملفات صوتية من مستندات تم تحميلها.

  • تستخدم نظرة عامة على الصوت الذكاء الاصطناعي لإنشاء أصوات واقعية وجذاب جاذبية حول محتوى المستند.

  • توفر نظرة عامة على الصوت طريقة مريحة لاستخراج المعلومات من المستندات بتنسيق بودكاست.

يقولون إنك لا تزيد عن ستة أقدام من الفئران ، وربما يكون الأمر نفسه في هذه الأيام صحيحًا بالنسبة للأفراد. يبدو أن كل شخص تقريبًا على هذا الكوكب لديه بودكاست أو سيبدأ واحد.

مع Google Gemini ، يمكنك الآن إنشاء ملفات صوتية مفصلة باستخدام ميزة تسمى نظرة عامة على الصوت. كل ما عليك القيام به هو تحميل مستند ، وسيقوم Gemini بإنشاء بودكاست قصير غوص عميق في محتويات المستند مع مضيفين منظمة العفو الدولية.

ما هي نظرة عامة على الصوت في Google Gemini؟

نظرة عامة على الصوت هي ميزة جديدة في Gemini كانت متوفرة مسبقًا في تطبيق Notebooklm’s NotebookLM من Google AI. الميزة قادرة على تلخيص المعلومات بطريقة فريدة. بدلاً من إعطائك ملخصًا نصفيًا لطيفًا للمعلومات ، تقوم نظرة عامة على الصوت بإنشاء ملف صوتي لبودكاست مع المضيفين المولدين من الذكاء الاصطناعى يناقشان المعلومات التي تريد تلخيصها.

لقطة شاشة NotebookLM مع مشغل صوت.

لوكاس جويفيا / إرشادي

يتمتع المضيفون بمحادثة ذهابًا وإيابًا يناقشون موضوع كل ما يلخصهم ويطرحون أسئلة على بعضهم البعض لإثارة مزيد من المعلومات حول نقاط رئيسية محددة. والنتيجة الإجمالية هي ما يبدو وكأنه بودكاست حقيقي مع شخصين مستنيرين يناقشان الموضوع المطروح.

في الاختبار الخاص بي ، أنشأت Gemini نظرة عامة على الصوت التي تراوحت بين خمس وخمس عشرة دقيقة ، اعتمادًا على مقدار المحتوى الموجود في المستندات التي تم تحميلها. على سبيل المثال ، تم إنشاء البودكاست الذي مدته 15 دقيقة من دليل من 146 صفحة لكاميرا SLR ، في حين أن PDF من صفحة واحدة من جدول مجموعة القمامة ولدت بودكاست يبلغ طوله خمس دقائق.

متعلق ب

كيفية استخدام GarageBand لتسجيل بودكاست

بالإضافة إلى ذلك ، بعض التوصيات لأدوات أفضل عندما تحتاج إلى مزيد من المرونة.

ما الذي يمكنك استخدامه لإنشاء نظرة عامة على الصوت؟

يمكنك إنشاء نظرة عامة على الصوت من مجموعة واسعة من المصادر المختلفة في الجوزاء. يمكنك تحميل مستند ، وسيقوم Gemini بتحويل أي معلومات يحتفظ بها المستند إلى البودكاست الخاص بك. هذه لا يجب أن تكون مستندات نصية فقط ؛ يمكنك تحميل عرض تقديمي لـ Google Slides ، وسيقوم Gemini بإنشاء نظرة عامة على الصوت بناءً على محتوى الشرائح.

هناك خيار آخر مفيد حقًا وهو أنه يمكنك إنشاء نظرة عامة على الصوت من تقرير بحثي عميق. البحث العميق هو ميزة تنشئ تقريرًا عن أي موضوع تختاره من خلال التوصل إلى خطة لما يجب البحث فيه ، وإيجاد المحتوى المناسب على الويب ، ثم تجميع المعلومات التي يجدها في تقرير. النتائج في شكل استجابة مكتوبة مفصلة تحطم كل ما تم اكتشافه ، لكن هذه التقارير غالباً ما تكون طويلة جدًا وجافة إلى حد ما.

مطالبة Gemini بإنشاء نظرة عامة صوتية على تقرير بحثي عميق.

بمجرد إنشاء تقرير بحثي عميق ، يمكنك الحصول على الجوزاء لتحويله إلى نظرة عامة على الصوت. بعد ذلك ، بدلاً من الاضطرار إلى القراءة من خلال التقرير بأكمله ، يمكنك الجلوس والاستماع إلى اثنين من podcasters التي تم إنشاؤها من الذكاء الاصطناعى تناقشها بالتفصيل. يمكن أن يسهل هضم المعلومات من تقرير بحثي عميق ، دون الحاجة إلى قراءة جميع التفاصيل.

يبدو أن نظرة عامة على الصوت هي وسيلة رائعة للحصول على معلومات من صفحات الويب مع الكثير من المعلومات عنها ، ولكن حاليًا ، لا توجد طريقة لإنشاء نظرة عامة على الصوت من رابط ويب. ومع ذلك ، يمكنك نسخ المحتوى إلى ملف نصي ، أو حفظ محتويات صفحة الويب كـ PDF ، ثم يقوم Gemini بإنشاء نظرة عامة صوتية من المحتوى. لقد أنقذت صفحة ويكيبيديا على تاريخ البرازيل كـ PDF ، وأنشأت الجوزاء بودكاست من الملف الذي يناقش تاريخ البرازيل ، والذي كان مفيدًا ومفيدًا.

متعلق ب

رديت هو ويكيبيديا التجربة الإنسانية

هناك سبب لإنشاء الكثير من الأشخاص عمليات البحث عن Google مع “Reddit”

لا يمكنك إنشاء نظرة عامة على الصوت من معظم ملفات الصور ، لكنني وجدت أنه إذا قمت بحفظ الصور كـ PDF ، فستحاول على الأقل إنشاء نظرة عامة على الصوت من الملف. إذا لم يكن هناك نص قابل للقراءة في الصورة ، فسوف يفشل توليد نظرة عامة على الصوت. إذا كانت الصورة تحتوي على نص ، فستعمل ؛ تمكنت من الحصول على مضيفي البودكاست الذي تم إنشاؤه من الذكاء الاصطناعى لإجراء مناقشة متحمسة ومتعمقة حول صورة PDF لجدول جمع النفايات المحلي الخاص بي.

كيفية إنشاء نظرة عامة صوتية

عند تحميل مستند إلى Gemini من خلال النقر على أيقونة “+” ، يجب أن ترى اقتراحًا يطفو على يطفو فوق نافذة المطالبة التي يمكنك النقر عليها لإنشاء نظرة عامة على الصوت. ومع ذلك ، إذا لم يظهر الأمر ، فكل ما عليك فعله هو أن تطلب من Gemini إنشاء نظرة عامة صوتية من المستند ، وطالما أنها مستند صالح مع نص قابل للقراءة ، سيتم إنشاء نظرة عامة على الصوت.

خيار إنشاء نظرة عامة على صوتي فوق مستند تم تحميله في تطبيق Gemini

يمكنك تحميل مجموعة واسعة من الملفات ، على الرغم من أن جميعها قد تكون مناسبة لإنشاء نظرة عامة على الصوت. تشمل أنواع الملفات المدعومة ما يلي:

• ملفات C و CPP و PY و Java و PHP و SQL

• TXT ، DOC ، DOCX ، PDF ، RTF ، DOT ، DOTX ، HWP ، و HWPX Files

• ملفات PPTX و XLS و CSV

• مستندات Google وشرائح Google

إذا كان لديك اشتراك Gemini Advanced ، فيمكنك أيضًا تحميل ملفات HTML و XLSX و TSV و Google Sheets.

كما ذكر أعلاه ، يمكنك تحميل الصور إلى Gemini ، لكنك لن تتمكن من إنشاء نظرة عامة على الصوت من ملفات الصور. ومع ذلك ، إذا قمت بحفظ صورة كصورة PDF ، فمن الممكن إنشاء نظرة عامة على الصوت ، طالما أن الصورة تحتوي على بعض النص القابل للقراءة.

من السهل أيضًا إنشاء نظرة عامة على الصوت من تقرير بحثي عميق ؛ بمجرد إنشاء تقرير البحث العميق ، يجب أن ترى خيارًا لإنشاء نظرة عامة على الصوت للتقرير. ومع ذلك ، وجدت أن هذا لا يحدث دائمًا. إذا لم يظهر الخيار ، فيمكنك فقط مطالبة Gemini بإنشاء نظرة عامة على الصوت ، وسيقوم بإنشاء واحدة لك.

ما مدى جودة نظرة عامة على الجوزاء؟

نظرًا لأن AI chatbots انفجرت في المشهد ، فقد شعرت الكثير من الأشياء التي يمكنهم فعلها مثل السحر قليلاً. ما زال يتفوق على أنه في غضون لحظات ، يمكن لـ AI إنشاء صور لأشياء لم تكن موجودة في الصور من قبل ، مثل وحيد القرن مع ثلاثة أرجل في الديسكو. يمكن أن تشعر نظرة عامة على الصوت الجوزاء أيضًا إلى حد ما مثل السحر أيضًا.

ذلك لأن النتائج مثيرة للإعجاب حقًا. لبداية ، فإن الأصوات واقعية للغاية ، وتجعلها تشعر وكأنك تستمع إلى أشخاص حقيقيين يتحدثون. كما أن الطريقة التي يتفاعلون بها هي أيضًا بشكل جيد ، مع انقطاع والمضيفين يتحدثون عبر بعضهم البعض في مناسبات.

في تجربة هذه الميزة ، كانت نتائجي جيدة عادة في اختيار النقاط الرئيسية للوثائق ومناقشتها بطريقة يمكن الوصول إليها. حاولت تحميل دليل كاميرا فيلم Canon EOS 3 القديمة التي أملكها ، وكان للمضيفين مناقشة مفيدة للغاية حول ميزة ضبط تلقائي تلقائيًا.

لقد قمت أيضًا بتحميل سيناريو غير منشور وتحدث المضيفين من خلال النقاط الرئيسية للمؤامرة بطريقة مسلية للغاية ، والتقاط الكثير من الفكاهة ، ومعظم الأجزاء المركزية من المؤامرة. النتائج ليست دائما مثالية ، ومع ذلك ؛ فات ملخص السيناريو جزءًا رئيسيًا من المؤامرة المطلوبة لفهم كل من عنوان السيناريو وخطه الأخير المؤثر.

نظرة عامة على الصوت هي (في الغالب) طريقة رائعة للوصول إلى المعلومات

يمكن أن تشعر بعض ميزات الذكاء الاصطناعى بأن الشركات تعرض ما يمكن أن تفعله الذكاء الاصطناعي بدلاً من الميزات المفيدة حقًا. ميزة نظرة عامة على الصوت لا تشعر بذلك.

إن قراءة وثيقة طويلة ليست دائمًا أسهل طريقة لاستخراج المعلومات الرئيسية منها. قد يؤدي الاستماع إلى شخصين يناقشان المعلومات إلى تسهيل تقطير الحقائق الرئيسية دون الاضطرار إلى البحث عن كل ذلك بنفسك. إن وجود شخصين يناقشانه هو لمسة ذكية ، حيث أن أحد المضيفين سوف يطرح السؤال الذي كنت تفكر فيه في نفسك.

على وجه الخصوص ، وجدت نظرة عامة على الصوت مفيدة للغاية لتقارير البحث العميق. غالبًا ما تكون هذه التقارير جدران طويلة من النص ، وعلى الرغم من أنها مليئة بمعلومات مفيدة ، إلا أن القراءة من خلال التقرير بأكمله يمكن أن تشعر بأنه شيء من العمل. من الأسهل بكثير هضم نظرة عامة على التقرير ، ويقوم الذكاء الاصطناعي بعمل جيد لاستخراج المعلومات المهمة بدلاً من الفطائر حول الحقائق الأقل أهمية.

هذا لا يعني أن نظرة عامة على الصوت مثالية. لقد وجدت أنني غالبًا ما أواجه نفس المشكلة مع نظرة عامة على الصوت التي لدي عند الاستماع إلى الكتب الصوتية: أبدأ في ضبط ما يقال. بعد ذلك ، يجب أن أعود إلى نظرة عامة على الصوت للحاق بما فاتني.

هذا ليس خطأ نظرة عامة على الصوت ، بالطبع ، لكنني متأكد من أنني لست الشخص الوحيد الذي يعاني من هذه المشكلة. بالنسبة لي ، فإنهم يعملون بشكل أفضل عندما لا يكون لدي أي انحرافات أخرى ، كما لو كنت أذهب في نزهة على سماعات الرأس ، ولكن قد يختلف عدد الأميال.

لا تتميز البودكاست دائمًا بجميع المعلومات التي قد ترغب في استخراجها أيضًا. لم تستخرج نظرة عامة على الصوت للسيناريو معظم نقاط المؤامرة المركزية ، لكنها فاتتها شيء لم يكن بالضرورة مركزيًا للمؤامرة ولكنه كان من المؤكد أنه موضوع رئيسي في البرنامج النصي.


إذا لم تستمتع بالقراءة من خلال كميات كبيرة من النص لاستخراج المعلومات التي تريدها ، فقد تكون نظرة عامة على الصوت بديلاً مفيدًا. يمكنك تحويل أي شيء تقريبًا تريده إلى البودكاست الخاص بك المفصل وتوضيح أشخاص آخرين المعلومات الرئيسية لك ، بدلاً من الاضطرار إلى قراءتها بنفسك. نأمل أن تضيف Google القدرة على إنشاء نظرة عامة على المحتوى من مواقع الويب في مرحلة ما ، لأنه لا يزال يتعين عليك الآن القفز عبر بعض الأطواق لتحقيق ذلك.

(tagstotranslate) متطورة (T) Google (T) AI (الذكاء الاصطناعي)

أضف تعليق