السؤال الذي يُشغل بال كثيرين اليوم، هل نماذج الذكاء الاصطناعي ستبقى بحاجة إلى البشر لتكون قادرة على القيام بوظائف بشرية؟ وما مدى "اصطناعية" هذه النماذج في ظل اعتمادها على الإنسان؟
في الوقت الحالي، تعتمد نماذج الذكاء الاصطناعي على النصوص المكتوبة لتدريبها وتزويدها بالمعرفة التي تحتاجها للقيام بوظائف متنوعة. لكن مع تقدّم التكنولوجيا، من الممكن بالفعل أن تتطور طرق جديدة لتدريب هذه النماذج.
على سبيل المثال، قد تظهر تقنيات تدريب جديدة تعتمد على أنواع مختلفة من البيانات، أو حتى طرق تفاعلية أكثر تطوراً. كما يمكن أن تظهر أساليب جديدة لتوليد البيانات وتعليم النماذج، ما قد يقلل من الاعتماد المستمر على النصوص المكتوبة.
باختصار، بينما النصوص المكتوبة تلعب دوراً حاسماً الآن، المستقبل قد يغير ذلك.
مساعدو روبوت الدردشة... بين الحاجة والاستغناء
يكتب مساعدو روبوت الدردشة، من روائيين وأكاديميين والعديد من الصحفيين، لساعات عدة لصالح شركات التكنولوجيا التي تبلغ قيمتها مليارات الدولارات. وطبعاً ما يكتبونه لن يقرأه أحد خارج جدران شركاتهم. هذا لأنهم لا يكتبون للناس، بل للذكاء الاصطناعي.
تبدو أدوات الـ"AI" ممتازة، لكن لتقدم نتائج جيدة، الأمر ليس بالسهولة التي يظنها أغلب الناس، فهي تحتاج أولاً إلى التدريب. ولهذا الهدف، تتعاقد شركات التكنولوجيا مع متخصصين للمساعدة في تدريب نماذجها ومحاولة تجنب "الهلوسة" وقول الأكاذيب.
أما الأمثلة حول "هلوسة" الـ"AI" فكثيرة، أبرزها عندما أجابت أداة "AI Overviews" من "غوغل" أنه لجعل الجبن يلتصق بالبيتزا بشكل أفضل، فمن الممكن استخدام "غراء غير سام". لا تستغربوا، فقد قالت استجابات محرك البحث أيضاً إن الجيولوجيين يوصون البشر بتناول صخرة واحدة يومياً.
وسعياً لتجنب "الهلوسة"، فإن الجزء الأساسي من المهمّة يكمن في كتابة ردود وهمية على أسئلة روبوت الدردشة الافتراضية. فهذه هي بيانات التدريب التي يحتاج النموذج إلى تغذيتها. باختصار، من دون البيانات اللغوية، لا يمكن لهذه النماذج اللغوية ببساطة أن تتحسن. فعالمهم هو كلمتنا.
ألا يمكن تدريب النماذج على ناتجها الخاص؟
يسأل كثيرون: هل من الممكن تدريب النماذج على ناتجها الخاص أي "ما يسمّى بالبيانات الاصطناعية"؟
يُقدّر أن هناك حوالى 20 ألف شخص يعملون بدوام كامل لإنشاء بيانات لتدريب نماذج لغوية كبيرة. ويعتبر الخبراء أنه من دون العمل البشري اليدوي، فإن ناتج النماذج سيكون "سيئاً للغاية".
حول هذه المسألة، يعلّق إيليا شوميلوف في مجلة "نيتشر": أن "التعلم العشوائي من البيانات التي تنتجها نماذج أخرى يتسبب في انهيار النموذج". وبعبارة أخرى، تخرج النماذج عن مسارها وتميل إلى إنتاج "الهراء". فإن تغذية شيء بمخلفاته الخاصة يؤدي إلى الضمور بحيث يتآكل نطاق المعرفة، وإذ كانت البيانات الأصلية متحيّزة بالفعل، فإن هذا التحيّز سوف يتكرر، وهنا تتعاظم المشكلة.
وفي السياق، يُذكر أن شركة "أوبن أي آي" الرائدة في المجال، وقّعت اتفاقيات ترخيص، بقيمة مئات الملايين من الدولارات، مع العديد من المؤسسات الإعلامية في العالم، للاستفادة من بياناتها. لكن بالطبع الأمر لا يتعلق فقط بتجميع المزيد من الكلمات الأصلية. تحتاج هذه الشركات إلى نوع الكتابة الذي سيسعى النموذج إلى محاكاته، وهنا يأتي دور البشريين.
"غذاء موقّت"
المعضلة الأساس اليوم هي التناقض في أنه كان من المفترض أن تعمل نماذج اللغة الكبيرة على أتمتة وظائف الكتاب، ولكن ما يحدث اليوم هو العكس. فهل ستستمر هذه العملية؟ هل سيكتب البشر إلى الأبد الكلمات التي تحتاجها نماذج الذكاء الاصطناعي لتكون قادرة على القيام بالوظائف المطلوبة منها؟ ألا يتعارض هذا مع غرض وجودها بأكمله؟
وإذا كانت شركات التكنولوجيا قادرة على رمي مبالغ ضخمة من المال في توظيف الكتاب لإنشاء بيانات تدريب أفضل، فإن هذا يثير تساؤلات حول مدى "اصطناعية" نماذج الذكاء الاصطناعي الحالية.
أما الخلاصة أن الجيل القادم سيحتاج إلى أن يكون أفضل من الذكاء الاصطناعي في أي مهارة يحتاج إلى اتقانها. وفي ظل توقع اختلاف احتياجات الذكاء الاصطناعي، هل ستكون الكلمات مجرد "غذاء موقت"؟