لا يكون اكتشاف المحتوى بواسطة الذكاء الاصطناعي دقيقًا دائمًا! قد تقوم أداة الاكتشاف الخاصة بك أحيانًا بتمييز المحتوى المكتوب بواسطة الإنسان على أنه من إنتاج الذكاء الاصطناعي. إليك سبب حدوث ذلك وما يمكنك فعله حيال ذلك.
كيف تعمل أجهزة الكشف عن الذكاء الاصطناعي؟
قبل أن نفهم سبب فشل أجهزة الكشف عن الذكاء الاصطناعي، دعونا نضع بعض الأساسيات. يعتمد اكتشاف محتوى الذكاء الاصطناعي على العثور على الأنماط.
لماذا؟ ببساطة لأن الإنسان عندما يكتب، فإنه يمزج أفكارًا عشوائية في جمل ذات معنى. لا يوجد نمط محدد. قد تكون بعض الجمل طويلة جدًا بحيث يصعب قراءتها، وقد تكون بعضها قصيرة.
هذا هو العكس تمامًا من الطريقة التي يفكر بها الذكاء الاصطناعي ويكتب بها. هناك حد أدنى من العشوائية، والنص منظم للغاية. قد يكون هناك أيضًا تكرار للأفكار أو الكلمات. وقد يكون اختيار الكلمات في حد ذاته آليًا للغاية بحيث يصعب قراءته.
وتأخذ أجهزة الكشف عن المحتوى التي تعمل بالذكاء الاصطناعي كل هذا في الاعتبار. فهي تبحث عن مثل هذه الأنماط للتمييز بين المحتوى الذي يكتبه الإنسان والمحتوى الذي ينتجه الذكاء الاصطناعي.
وللقيام بذلك، هناك أربعة مفاهيم تدخل حيز التنفيذ.
إنهم يطبقون التصنيفات
المصنف هو خوارزمية تقوم بتصنيف النص إلى فئات مختلفة استنادًا إلى عوامل مثل الاستخدام والقواعد والأسلوب والنغمة.
على سبيل المثال، من المرجح أن يتم تصنيف النص الذي يحتوي على لهجة باهتة وقواعد نحوية ضعيفة وأسلوب كتابة متكرر على أنه نص تم إنشاؤه بواسطة الذكاء الاصطناعي.
إنهم يستخدمون التضمينات
في اكتشاف المحتوى باستخدام الذكاء الاصطناعي، تكون التضمينات عبارة عن تمثيلات رقمية للكلمات وعلاقاتها مع بعضها البعض. يتم التعبير عنها كمتجهات في مساحة عالية الأبعاد، ولكل منها رمز فريد.
تساعد هذه الرموز أجهزة الكمبيوتر على فهم كيفية ارتباط كل كلمة ببعضها البعض وسياق استخدامها. يتم تدريب نموذج التعلم الآلي الأساسي باستمرار لتحديد الرموز الشائعة للنص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي والتي ليست كذلك.
إنهم ينظرون إلى الحيرة
الحيرة هي سمة من سمات النص تحدد درجة العشوائية في قطعة من الكتابة. يكتب البشر بحرفية عالية جدًا، لكن الذكاء الاصطناعي لا يفعل ذلك.
على سبيل المثال، فكر في النهايات المحتملة لهذه الجملة: “ذهبت لمشاهدة أوبنهايمر بالأمس، وكان _____.”
إذا أجبت بشيء متوقع مثل “رائع” أو “متميز” أو “رائع” أو “مثير للإعجاب” أو “آسر”، فأنا آسف، ولكن ربما تكون روبوتًا. ومع ذلك، لديك ذوق جيد في الأفلام!
وبصرف النظر عن النكات، فمن المرجح أن يكمل الإنسان الجملة بشيء أكثر تفاعلية أو يستند إلى تجربة شخصية. شيء مثل “مجنون تمامًا” أو “ليس كما توقعت أن يكون”. ففي نهاية المطاف، يمكن للإنسان أن يتوقع شيئًا من فيلم. ومن الواضح أن الذكاء الاصطناعي لا يستطيع ذلك. وإذا ادعى ذلك، فمن المحتمل أن يكون نموذج اللغة الأساسي مصابًا بالهلوسة (يختلق ادعاءات على الفور دون أدلة واقعية) أو يفتقر إلى الحواجز الوقائية (هيكلة المخرجات ومراقبة الجودة).
إنهم يتحققون من الانفجار
لقد تحدثنا بالفعل عن كيفية كتابة البشر بطريقة غير متوقعة، وكيف يمكن أن تكون بعض الجمل طويلة وبعضها الآخر قصيرًا. والواقع أن الاندفاع هو سمة نصية أخرى تحدد هذا.
عادةً ما يتكون النص المكتوب بواسطة الذكاء الاصطناعي من جمل متشابهة في الطول والبنية (تقطعات منخفضة). فيما يلي مثال لبعض النصوص التي تم إنشاؤها بواسطة ChatGPT. لاحظ البنية الرتيبة والطول المتقارب للجملتين:
“إن انفجار النص، المعروف أيضًا باسم انفجار الكلمات أو انفجار المصطلحات، هو مفهوم في معالجة اللغة الطبيعية وتحليل النصوص يشير إلى التوزيع غير المنتظم للكلمات أو المصطلحات في نص أو مستند معين. بعبارة أخرى، يصف الظاهرة التي تظهر فيها كلمات أو مصطلحات معينة بشكل متكرر في سياق أو مستند معين أكثر مما هو متوقع بناءً على توزيع عشوائي أو منتظم.”
إن النص البشري هو العكس (مثل هذه المقالة). فهو يحتوي على مزيج صحي من الجمل الطويلة والقصيرة مع قدر كافٍ من الإبداع لكسر الأنماط. ويبتعد عن الهياكل المملة (الاندفاعية العالية).
تستخدم أجهزة الكشف عن الذكاء الاصطناعي مزيجًا من هذه المفاهيم الأربعة لاكتشاف المحتوى المكتوب بواسطة الذكاء الاصطناعي. إذن، العلم موجود. ولكن هل هذا صحيح؟
هل اكتشاف الذكاء الاصطناعي دقيق؟
لسوء الحظ، لا يمكن الكشف عن الذكاء الاصطناعي بدقة 100%. ليس بعد على الأقل. إنها مجرد لعبة احتمالية.
ولهذا السبب فإن تشغيل أي محتوى من خلال كاشف الذكاء الاصطناعي يعطي مستوى ثقة، وليس مستوى دقة. على سبيل المثال، إذا أعطاك كاشف الذكاء الاصطناعي درجة 70%، فهذا يعني أنه واثق بنسبة 70% من أن المحتوى من إنتاج الذكاء الاصطناعي، وواثق بنسبة 30% من أنه مكتوب بواسطة الإنسان.
الآن تخيل هذا. سأريك عشرة أنواع من الشوكولاتة وأخبرك أن سبعة منها داكنة وثلاثة منها بيضاء. الآن أطلب منك اختيار واحدة عشوائيًا وإخباري بالنكهة التي حصلت عليها بدون هل تستطيع الإجابة على هذا السؤال؟ بالطبع لا! إن الفرضية نفسها تهيئك للفشل. وهذا هو بالضبط ما يحدث مع أجهزة الكشف عن الذكاء الاصطناعي. فمع وجود مستويات الثقة والاحتمالات التي يمكن الاعتماد عليها فقط، فمن المؤكد أنها ستخطئ عاجلاً أم آجلاً.
لماذا تفشل أجهزة كشف المحتوى بالذكاء الاصطناعي؟
هناك العديد من الأسباب التي تجعل اكتشاف محتوى الذكاء الاصطناعي يصبح صعبًا بشكل متزايد.
- إن مولدات المحتوى التي تعمل بالذكاء الاصطناعي تتفوق عليهم:أصبحت نماذج مثل ChatGPT 4 (وحتى الإصدار المجاني) جيدة حقًا في كتابة محتوى يشبه المحتوى البشري. فهي تستخدم التصنيفات والتضمينات والحيرة والاندفاع الصحيحين. وقد قامت بتحليل كميات هائلة من المحتوى الذي ينتجه البشر للعثور على النقطة المثالية بين الاستخدام الصحيح للقواعد النحوية واختيار المفردات.
- أداة اكتشاف الذكاء الاصطناعي الخاصة بك ليست جيدة بما فيه الكفاية:تمامًا مثل مولدات الذكاء الاصطناعي، تحتاج أجهزة الكشف عن الذكاء الاصطناعي إلى التدريب على كميات هائلة من البيانات. وإلا فلن تتمكن من تصنيف المحتوى الذي ينتجه الإنسان والذكاء الاصطناعي بدقة.
- غالبًا ما يتسلل التحيز إلى بيانات التدريب:عندما يتخذ الذكاء الاصطناعي قرارات غير صحيحة بشكل منهجي لحالات استخدام محددة، يُعرف ذلك بالتحيز. وهذه مشكلة خطيرة. وتوجد هذه التحيزات لأن جميع بيانات التدريب تأتي من البشر. والبشر لديهم تحيزات، حتى لو لم يكونوا على علم بها.
- استراتيجيات توليد المحتوى الجديدة باستخدام الذكاء الاصطناعي تجعل الأمور أسوأ:يعمل كتاب ومدونو الذكاء الاصطناعي المحترفون باستمرار على تطوير استراتيجيات جديدة لخداع أجهزة الكشف عن الذكاء الاصطناعي. على سبيل المثال، توصلوا إلى مطالبات محددة لجعل ChatGPT يكتب محتوى من المرجح ألا يتم اكتشافه. حتى أن هناك مكونًا إضافيًا مخصصًا الآن لإضفاء الطابع الإنساني على نص ChatGPT!
ماذا يمكنك أن تفعل حيال ذلك؟
أفضل رهان لك هو أن تتعلم كيفية اكتشاف محتوى الذكاء الاصطناعي بنفسك.
هل الأمر سهل؟ ليس الأمر سهلاً حقًا. ولكن من المؤكد أنه ممكن. مع بعض الممارسة، يمكنك تدريب عينك على البحث عن الأشياء التالية:
- كلمات وعبارات متكررة، وخاصة تلك التي تركز على الكلمات الرئيسية المستهدفة المحتملة. حتى البنية قد تبدو موحدة للغاية. على سبيل المثال، “أنا أحب القطط لأنها لطيفة. القطط لها فراء ناعم وخرخرة دافئة. لا أستطيع أن أتخيل حياتي بدون القطط”.
- أسلوب عام وآلي مع عدم وجود أي إبداع أو الحد الأدنى منه. على سبيل المثال، “مرحبًا بكم في موقعنا الإلكتروني. نحن نقدم مجموعة واسعة من المنتجات والخدمات. نحن نلبي احتياجات عملائنا. يعمل فريقنا بجد لتوفير أفضل جودة ورضا لعملائنا”.
- عمق سطحي للأفكار الرئيسية دون فهم حقيقي أو تعلم عملي يعتمد على تجارب الحياة الواقعية. على سبيل المثال، “يجب أن تظل إيجابيًا دائمًا ولا تستسلم أبدًا. الإيجابية تجلب النجاح والسعادة في الحياة. إنها عادة جيدة”.
- الأخطاء الواقعية والمعلومات القديمة. من المعروف أن منشئي المحتوى الذين يعتمدون على الذكاء الاصطناعي “يصابون بالهلوسة” أحيانًا ويخترعون شيئًا ما على الفور دون أي أساس حقيقي. على سبيل المثال، “وفقًا لدراسة حديثة أجريت عام 2002، فإن الأرض مسطحة، والشمس تدور حولها”.
- التناقضات المنطقية والأخطاء التي قد يكون من المحرج قراءتها. على سبيل المثال، “كان جون يتناول غداءه في الليل عندما وصل البريد الصباحي”.
- شعور عام بعدم الحياة في المحتوى.
إن مستقبل مولدات الذكاء الاصطناعي في مقابل أجهزة الكشف عن الذكاء الاصطناعي غير قابل للتنبؤ حقًا. ولا أحد يستطيع أن يجزم بمن سيفوز في النهاية. وفي الوقت الحالي، من الأفضل أن تسلك الطريق اليدوي وتعمل على تطوير هذه المهارة البديهية.