مرحبًا يا Google، ما زلت لا أثق في قدرة الذكاء الاصطناعي Gemini على أداء المهام

النقاط الرئيسية

  • تهدف جوجل إلى تعزيز الذكاء الاصطناعي التوليدي كمساعدين افتراضيين لمختلف المهام ولكن التكنولوجيا الحالية لها حدود.
  • أظهرت شركة جوجل استخدام برنامج Gemini لمقارنة عروض المقاولين لإصلاح المنازل والمهام الأخرى.
  • لا تمتلك Gemini وأدوات الذكاء الاصطناعي التوليدية الأخرى تفكيرًا ومنطقًا يشبه ما لدى البشر.



كان لدى شركة جوجل الكثير من ميزات الذكاء الاصطناعي التي يمكن التحدث عنها اليوم في مؤتمر Google I/O، والتي يُفترض أنها قادرة على كل شيء بدءًا من حل المشكلات الرياضية إلى إدارة إصلاحات المنزل. وكلما شاهدت العرض التقديمي، زاد تساؤلي: كيف يمكنك أن تثق في الذكاء الاصطناعي في هذه المهام؟

كانت الموجة الأولى من روبوتات الدردشة والنماذج التي تعمل بالذكاء الاصطناعي تركز بالكامل تقريبًا على تحليل النصوص وإنشائها. يمكنك أن تطلب من ChatGPT كتابة قصيدة مخصصة، أو تلخيص رواية خيالية كلاسيكية، أو كتابة بعض أكواد JavaScript أو C++. وقد توسع ذلك أيضًا ليشمل تنسيقات الوسائط المختلفة، مثل الصور والفيديو. لا يزال الذكاء الاصطناعي التوليدي ليس الأداة المثالية للعديد من حالات الاستخدام هذه، لكنه يمكن أن يكون مفيدًا بالتأكيد.


تحاول جوجل الآن دفع الذكاء الاصطناعي التوليدي كمساعد افتراضي أكثر اكتمالاً، وقادر على إكمال بعض المهام بأقل تدخل بشري أو بدونه. يمكن لمساعد جوجل وسيري وغيرهما من المساعدين الافتراضيين السابقين التعامل مع بعض المهام الأساسية، مثل العثور على مطعم قريب وبدء توجيهات الملاحة. تريد جوجل دفع ذلك إلى أبعد من ذلك باستخدام تقنية الذكاء الاصطناعي Gemini، والاستيلاء على المهام التي تتطلب عادةً نظرة عامة بشرية ومعالجة منطقية.


عندما تسوء الأمور في الملخصات

كان هناك الكثير من العروض التوضيحية لميزات الذكاء الاصطناعي على خشبة المسرح في Google I/O، ولكن الأهم من ذلك أن معظمها تم تسجيلها مسبقًا أو محاكاتها. ملخص جميع رسائل البريد الإلكتروني الأخيرة في Gmail من مدرسة معينة. كما أنها تم إنشاء ملخص للاجتماع بعد تحليل التسجيل الصوتي للمكالمة. هذه هي نفس حالات الاستخدام التي روجت لها Microsoft لمساعدها Copilot، وعلى الرغم من أن التلخيص الأساسي يحتوي على خطوات أقل يمكن أن تسوء، إلا أنني ما زلت أشعر بالقلق بشأن استخدامه للاجتماعات أو الرسائل المهمة. ماذا يحدث عندما يخطئ Gemini في سماع تعليقات من رئيسك حول المشروع الذي يجب أن يكون له الأولوية؟


جوجل أيضا اظهر كانت رؤية شركة Gemini فيما يتعلق بـ “الوكلاء”، والتي تم وصفها بأنها مساعدين مدعومين بالذكاء الاصطناعي يمكنهم “التفكير في خطوات متعددة للأمام” و”العمل عبر البرامج والأنظمة”. كان المثال الأول هو طلب المساعدة من Gemini في إرجاع زوج من الأحذية تم طلبه عبر الإنترنت – وجد الذكاء الاصطناعي ملصق الشحن، واتصل بشركة Converse لبدء الإرجاع، وأنشأ حدثًا في التقويم لاستلام الطرد مع UPS. تضمن مثال آخر سؤال Gemini، “لقد انتقلت للتو إلى شيكاغو، هل هناك أي شيء يجب أن أفكر فيه؟” ثم اقترحت Gemini تحديث عنوان المستخدم في خدمات مختلفة، وأكملت المهمة تلقائيًا في حساب DoorDash الخاص بهم بعد تأكيد بسيط.

كان العرض التوضيحي الذي صدمني أكثر هو مقطع عن استخدام Gemini في Gmailيحتاج الشخص في المثال إلى إصلاح سقف منزله، ويطلب من جيميني العثور على العروض الثلاثة المرسلة إلى عنوان بريده الإلكتروني وتلخيصها. يقرر الشخص المقاول الذي سيختاره بناءً على تماما في الملخص، ثم يرسل بريدًا إلكترونيًا للرد والذي يتم إنشاؤه أيضًا بواسطة الذكاء الاصطناعي.


محادثة مع الجوزاء تلخص 3 عروض مختلفة لإصلاح المنزل.
جوجل

تتراوح أسعار الإصلاح في البريد الإلكتروني النموذجي من 875 دولارًا إلى 1500 دولار. إذا أخطأت Gemini في تفصيلة واحدة، أو إذا فشلت في تضمين بعض المعلومات المهمة في الملخص، فقد يكون ذلك خطأً مكلفًا للغاية. لا أستطيع أن أتخيل استخدام مساعدة الذكاء الاصطناعي لاتخاذ هذا النوع من القرار. من الممكن جدًا أن أرتكب خطأ في نفس الموقف، مثل نسيان قراءة رسالة واحدة في سلسلة بريد إلكتروني أو خلط الأرقام، ولكن على الأقل سيكون ذلك خطئي. كيف يمكن أن يكون Gemini تحسنًا؟

لن تتحمل شركة جوجل تكلفة السقف المكسور الخاص بي لأن شركة جيميني أخطأت في قراءة البريد الإلكتروني. كما لن تعيد لي أموالي عندما ترسل لي حذائي المرتجع إلى العنوان الخطأ. وعد بتغطية الرسوم القانونية عندما تقوم أدوات الذكاء الاصطناعي الخاصة بها بإنشاء محتوى قريب جدًا من المواد المحمية بحقوق الطبع والنشر، ولكن هذا كل شيء.


لقد استخدمت أدوات الذكاء الاصطناعي التوليدي على مدار العام الماضي لمساعدتي في أعمال الترميز، أو كتابة نصوص bash، أو تحويل البيانات بين التنسيقات. العبارة الأساسية هنا هي “ساعدني”، لأنني ما زلت أنظر إلى المدخلات وأتحقق من النتائج. تريد Google بشكل متزايد أن يتولى الذكاء الاصطناعي التوليدي المهام بالكامل، وهذا ليس شيئًا أشعر بالارتياح تجاهه، نظرًا للحالة الحالية للتكنولوجيا.

كانت هناك محاولات أخرى لاستخدام الذكاء الاصطناعي التوليدي لإنجاز مهام الحياة الواقعية. كان OpenTable أحد المكونات الإضافية الأولى لبرنامج ChatGPT، والذي يسمح لك بحجز العشاء من خلال روبوت الدردشة بالذكاء الاصطناعي. يمكنك العثور على بعض التقارير من الممكن أن يكون ذلك غير فعال، على الرغم من أنه من غير الواضح ما إذا كان الذكاء الاصطناعي أو تكاملات واجهة برمجة التطبيقات الأساسية هو المسؤول عن ذلك.


لا تثق به

تريد شركة جوجل، والعديد من شركات التكنولوجيا الأخرى، أن تبيعك فكرة مفادها أن الذكاء الاصطناعي التوليدي يمكن أن يكون منطقيًا ويتخذ قرارات صحيحة بمعلومات كافية. لا يستطيع الذكاء الاصطناعي التوليدي القيام بذلك. لا يوجد ذكاء اصطناعي موجود حاليًا يمكنه التفكير مثلك أو مثلي أو مثل أي إنسان آخر. لهذا السبب يمكن لـ Gemini وChatGPT وCopilot وكل مساعد ذكاء اصطناعي آخر كتابة البرامج ولكنها لا تزال تفشل في حل المشكلات المنطقية الأساسية. ارتكبت خطأ في مقطع فيديو توضيحي اليوم في مؤتمر Google I/O، وهو حتى أنها لم تكن المرة الأولى التي حدث فيها ذلك.

لماذا أثق في أن الجوزاء سيتخذ قرارات مالية مهمة نيابة عني، أو أي مهمة أخرى في الحياة الواقعية؟ هل توفير بضع ثوانٍ أو دقائق في مهام عادية يستحق حقًا المشاكل المحتملة؟ فكرة أن روبوت الدردشة غير قادر على لعب لعبة “تيك تاك تو” إن فكرة إمكانية أتمتة حياتي بطريقة ما ليست جذابة على الإطلاق، بغض النظر عن مدى حماس Google بشأنها.

أضف تعليق