النقاط الرئيسية
قدمت شركة جوجل ميزات جديدة للذكاء الاصطناعي ولكنها ركزت على الضجيج أكثر من التركيز على الجوهر والعملية.
- Gemini هو نموذج توليدي جديد من Google يتولى دور المساعد الافتراضي على هواتف Android.
- رغم أن بعض الميزات مثل Magic Editor وCall Notes تبدو غريبة وغير منطقية، إلا أن أمان البيانات يظل مصدر قلق مشروع.
كشفت شركة جوجل عن أحدث إصدارات نظامها البيئي المزدهر للذكاء الاصطناعي في حدث Made by Google الذي أقيم في ماونتن فيو يوم الثلاثاء، وهي مجموعة من الميزات المولدة التي تمكنت بطريقة ما من أن تكون أكثر من اللازم وفي نفس الوقت لا تكفي على الإطلاق.
على مدار الحدث الذي تم بثه مباشرة على الهواء مباشرة لمدة ساعة وأربعين دقيقة، صعدت مجموعة من المسؤولين التنفيذيين في Google إلى منصة الحدث للإشادة بنموذج Gemini كبير اللغة وإظهار براعته في الأداء في سلسلة من العروض التوضيحية الحية – والتي سارت معظمها دون أي عقبات. دفعت الشركة بإنجازاتها في مجال الذكاء الاصطناعي أولاً وقبل كل شيء، مع ظهور Pixel 9 وPixel Buds 2 وPixel Watch 3 لأول مرة فقط في النصف الثاني من الحدث. وهذا يمثل انعكاسًا صارخًا لما كان عليه الحال قبل عامين فقط عندما، إذا تم ذكر الذكاء الاصطناعي، فقد كان ذلك فقط بشكل عابر خلال المؤتمرات الصحفية والأحداث الحية التي تركز على البرامج التقليدية في Google.
وقال ريك أوسترلوه، نائب الرئيس الأول للمنصات والأجهزة في جوجل، للحشد المتجمع: “إنها تجربة متكاملة من البداية إلى النهاية لا يمكن لأحد سوى جوجل تقديمها. لسنوات، كنا نسعى لتحقيق رؤيتنا لمساعد الذكاء الاصطناعي المحمول الذي يمكنك العمل معه كما تعمل مع مساعد شخصي في الحياة الواقعية، لكننا كنا مقيدين بحدود ما يمكن أن تفعله التقنيات الحالية”.
ومن أجل تجاوز هذه الحدود، “أعدنا بناء تجربة النظام بالكامل حول نماذج جيميني”، كما واصل حديثه. “يمكن لنظام جيميني الجديد أن يتجاوز فهم كلماتك إلى فهم نيتك والتواصل بشكل أكثر طبيعية”.
جوجل تتجه نحو الذكاء الاصطناعي التوليدي
تتنافس جوجل مع منافسيها في الصناعة مثل Apple وOpenAI وMicrosoft وAmazon وAnthropic للحفاظ على ريادتها في مجال الذكاء الاصطناعي. لقد قامت بدمج وظيفة Gemini التوليدية في مجموعة تطبيقات Workspace الخاصة بها، مما يسمح لنظام التعلم الآلي بالاستفادة من بيانات المستخدم (على وجه التحديد من Google Docs وSlides وGmail وDrive وSheets) للحصول على استجابات مخصصة. يمكن للمستخدمين إنشاء نصوص وصور لمستندات Google، وإنشاء شرائح عرض تقديمي باستخدام لغة طبيعية، أو إنتاج تقارير ذات مظهر احترافي بناءً على جداول بيانات Sheets.
ولكن هذه ليست سوى بداية لطموحات الذكاء الاصطناعي لشركة جوجل. ففي حدث يوم الثلاثاء، أعلنت الشركة عن Gemini كبديل لمساعد جوجل، مما يجعله المساعد الافتراضي على هواتف أندرويد. تتماشى هذه الخطوة مع قرار أبل بتعزيز Siri باستخدام ChatGPT من OpenAI. يقدم Gemini مساعدًا أكثر محادثة وذكاءً وقادرًا على الانقطاع دون فقدان التركيز. تتيح ميزة Gemini Live التي تم تقديمها حديثًا التفاعلات في الوقت الفعلي مع الذكاء الاصطناعي، مما يضع جوجل في وضع يسمح لها بالتنافس مع وضع الصوت المتقدم من OpenAI. كما سيفسر Gemini في النهاية محتوى شاشة الهاتف باستخدام ميزة تراكب قادمة.
لا تزال جوجل ترى ما الذي يحدث
أتمنى أن يكون هذا هو مدى ما تعمل عليه جوجل. ومع ذلك، وكما كانت الحال منذ ظهور ChatGPT لأول مرة قبل حوالي 18 شهرًا، فإن شركات التكنولوجيا لن تتوقف عن محاولة دمج الذكاء الاصطناعي في أي منتج تصنعه، بغض النظر عما إذا كان يضيف قيمة حقيقية لتجربة المستخدم أم لا.
خذ على سبيل المثال ميزة Add Me الجديدة. فهي تتيح لك دمج صورتين – واحدة للمجموعة الأكبر والأخرى للمصور الوحيد – في صورة واحدة. قالت مديرة منتجات Pixel، Shenaz Zack، على خشبة المسرح: “تتمثل إحدى أكبر المشكلات المتعلقة بالصور الجماعية في كيفية تضمين المجموعة بأكملها في بعض الأحيان. ينتهي بك الأمر بالتقاط صورة تريد أن تكون فيها أيضًا. تعمل ميزة Add Me الجديدة على إصلاح ذلك حتى تتمكن من تضمينك في صورة العطلة العائلية الخاصة بك”.
يمكنك أيضًا أن تطلب من أحد المارة أن يلتقط لك صورة سريعة كما يفعل الناس منذ ظهور الكاميرات أو استخدام أحد تلك “الحوامل الثلاثية” الحديثة التي تحمل الكاميرا على الارتفاع والاتجاه المناسبين ويمكنها النقر عن بُعد على مصراع الكاميرا. وفي الوقت نفسه، تقف مع بقية مجموعتك. ونظرًا لمدى كثافة الموارد التي يتطلبها التصوير الفوتوغرافي، تتم مقارنة تشغيل الاستعلامات الأساسية باستخدام الذكاء الاصطناعي بالعمليات البحثية التقليديةلا أفهم كيف يمكن لشركة جوجل تبرير تطوير ميزة تحل أي مشكلة على وجه التحديد – التفاعل مع الأشخاص الآخرين في الأماكن العامة؟ حمل عصا سيلفي؟ إنها فكرة ميزة مثيرة للاهتمام، بلا شك، وعرض جيد لقدرات الذكاء الاصطناعي في التلاعب بالصور، لكنني أجد صعوبة في تصديق أن “إشراك الجميع في الصورة الجماعية” هي قضية ملحة وواقعية بين العديد من مستخدمي جوجل.
Magic Editor هي ميزة أخرى معززة بالذكاء الاصطناعي تعتمد على الكاميرا في نظام أندرويد، وتبدو وكأنها حيلة. في مثال يوم الثلاثاء، قام كيني سليمان، مدير منتجات Pixel Camera في Google، بإرشاد جمهور Made by Google خلال الجولة الأخيرة من التحديثات الخاصة بالميزة. ستسمح لك هذه التحديثات، بصفتك مالكًا لهاتف Pixel 9، بإعادة تأطير الصور، وجعل الذكاء الاصطناعي يقترح اقتصاصات مثالية، وتوسيع الخلفيات باستخدام الذكاء الاصطناعي التوليدي. كما تسمح لك “بإعادة تصور” مناطق وجوانب معينة من الصورة، مثل تغيير حقل من العشب إلى حقل من الزهور البرية أو إضافة عناصر إضافية إلى خلفية الصورة.
يتم الترويج للذكاء الاصطناعي باستمرار باعتباره تقنية ثورية ستساعدنا علاج الأمراض المستعصية, اكتشف هياكل جديدة للأدوية والبروتينات، وحل أعمق ألغاز الكون. لكن يبدو أن أفضل ما تستطيع جوجل فعله هو منح الجمهور طريقة أسهل لإضافة بالونات الهواء الساخن التي تم إنشاؤها بواسطة الذكاء الاصطناعي إلى الصور وكأنها قصاصات فنية من القرن الحادي والعشرين. يا له من غجر.
يمكنك أن ترى النوايا الحسنة وراء ميزتي Pixel Screenshots وCall Notes الجديدتين. تستخدم الأولى الذكاء الاصطناعي لمعالجة لقطات الشاشة لمساعدتك على العثور عليها بسهولة لاحقًا باستخدام مطالبات نصية، وتوفر لك الثانية ملخصًا تم إنشاؤه بواسطة الذكاء الاصطناعي لأهم الموضوعات والمعلومات المتعلقة بمكالمة هاتفية. ومع ذلك، فإن الآثار المحتملة على الخصوصية لاستخدامها تجعلني أتوقف للحظة.
تحمل لقطات الشاشة أكثر من مجرد تشابه عابر مع النسخة المتوقفة ميزة استدعاء مايكروسوفت كان ذلك مؤخرا تم إغلاقه وسط صرخات المطالبة بخصوصية البيانات الشخصية ولكن على عكس Recall، فإنه لا يستوعب سوى الصور التي يلتقطها المستخدم مباشرة ويمكن تبديلها يدويًا. وسيتعين على مستخدمي Call Notes منح Google إمكانية الوصول في الوقت الفعلي إلى مكالماتهم الهاتفية حتى تعمل الميزة. وهذا يفتح مصدرًا آخر لبياناتك الشخصية التي يمكن (ومن المرجح أن يحدث ذلك في مرحلة ما) أن تتسرب عبر الإنترنت. الأمر ليس مثل صناعة الذكاء الاصطناعي لديه سجل حافل بالنجاحات بشكل خاص ل الحفاظ على أمن البيانات.
يحتاج المستهلكون إلى التركيز على أمن البيانات أكثر من الحيل
قد تظن أن الصناعة ستفعل ذلك، نظرًا لكمية البيانات التي تحتاجها من أجل العمل بالمستويات التي تم الترويج لها. من ميزات المستخدم النهائي نفسها إلى نماذج اللغة الكبيرة التي تم بناؤها فوقها، تتطلب أنظمة الذكاء الاصطناعي اليوم كميات هائلة من البيانات، غالبًا ما يتم استخلاصها من الإنترنت العام من الممكن أن تستخدم الشركات التي تستخدم الحوسبة السحابية مثل Google أو Microsoft أو AWS الحوسبة السحابية دون إذن، وذلك من أجل تنفيذ عمليات الاستدلال بدرجة عالية من الدقة. ولكن كلما زادت البيانات التي تجمعها الشركات الضخمة مثل Google أو Microsoft أو AWS، زادت احتمالية وصول المستخدمين غير المصرح لهم إلى هذه البيانات، سواء كانوا من موظفي Google أو المتعاقدين معها أو قراصنة الطرف الثالث أو أفراد إنفاذ القانون.
في حين أعتقد أن جوجل تسير بشكل عام على الطريق الصحيح فيما يتعلق بتطوير الذكاء الاصطناعي، لا يسعني إلا أن ألاحظ الطبيعة العشوائية للميزات التي تم عرضها يوم الثلاثاء وكيف يحتاج كل منها إلى الوصول إلى جزء مختلف من بياناتي الشخصية. أنا من محبي دمج جيميني مع ورك سبيس، لكن يبدو أن جوجل لا تزال ترمي الأفكار على الحائط وترى أي حيلة تلتصق بشكل أفضل بدلاً من بناء ميزات الذكاء الاصطناعي بشكل مقصود من شأنها أن تخلق تغييرًا حقيقيًا في حياة الناس. ربما يثبت مشروع أسترا القادم من جوجل، والذي سيسمح للذكاء الاصطناعي باستخدام كاميرا هاتفك لمراقبة العالم من حوله وتحليله وفهمه، أنه التطبيق القاتل الذي تحتاجه صناعة الذكاء الاصطناعي. للحفاظ على فقاعتها من الانفجار.