تحقيق استقصائي يكشف اعتماد GPT-5.2 على “غروكيبيديا” كمصدر للمعلومات ويثير مخاوف من تلوث النماذج

في تطور أثار قلق الأوساط الأكاديمية وخبراء مكافحة التضليل، كشف تحقيق لصحيفة The Guardian عن أن النسخة الأحدث من روبوت الدردشة ChatGPT، المعروفة باسم GPT-5.2، باتت تستشهد بشكل متكرر بموسوعة “غروكيبيديا” كمصدر معلومات في عدد من الموضوعات الحساسة.
ما هي “غروكيبيديا” وكيف برزت في المشهد الرقمي؟
أطلق رجل الأعمال Elon Musk عبر شركته xAI في أكتوبر/تشرين الأول 2025 موسوعة Grokipedia كمنافس مباشر لويكيبيديا. وتعتمد المنصة بالكامل على محتوى يولده نموذج الذكاء الاصطناعي Grok، مع غياب شبه كامل للتحرير البشري التقليدي.
ووفق تصريحات ماسك، تقوم الموسوعة على مبدأ “تحرير المحتوى من الانحياز الأيديولوجي”، إلا أنها واجهت منذ إطلاقها انتقادات تتعلق بدقة المعلومات واتهامات بنشر سرديات سياسية منحازة. وبحلول مطلع العام الجاري، تجاوز عدد مقالاتها 5.6 ملايين مقال.
اختبارات تكشف نمطا متكررا من الاستشهاد
بحسب التحقيق المنشور في 24 يناير/كانون الثاني، استشهد نموذج GPT-5.2 بمحتوى “غروكيبيديا” في 9 من أصل 12 استفسارًا وُصفت بأنها “غامضة” أو “شائكة”. وشملت هذه الحالات موضوعات تتعلق بالشأن الإيراني، وسيرًا ذاتية تاريخية، وقضايا سياسية مثيرة للجدل.
وفي إحدى الحالات، نُسبت معلومات غير دقيقة إلى المؤرخ البريطاني Richard Evans، تبين لاحقًا أنها واردة في موسوعة ماسك دون توثيق مستقل في مصادر أكاديمية رصينة.
مخاوف من “تلوث النماذج” وحلقات التضليل المغلقة
يثير هذا التطور مخاوف مما يُعرف بـ“تلوث النماذج” (Model Contamination)، حيث تتغذى أنظمة الذكاء الاصطناعي على مخرجات أنظمة أخرى دون تحقق بشري كافٍ، ما قد يؤدي إلى تكريس الأخطاء أو تضخيم الروايات المنحازة ضمن حلقة معلوماتية مغلقة يصعب تصحيحها لاحقًا.
وترى الباحثة في مجال التضليل الإعلامي Nina Jankowicz أن الخطورة لا تكمن فقط في دقة المعلومات، بل في “إضفاء الشرعية” على مصدر بعينه من خلال استشهاد نموذج يحظى بثقة واسعة بين المستخدمين، مما قد يمنح محتوى غير موثق هالة من المصداقية.
رد “أوبن إيه آي”: البحث في نطاق واسع من المصادر
من جانبها، أكدت شركة OpenAI أن نموذج GPT-5.2 يعتمد على ميزة البحث في الويب للوصول إلى طيف واسع من المصادر العامة، مشيرة إلى وجود “فلاتر سلامة” للحد من المحتوى الضار. لكنها أقرت ضمنيًا بأن خوارزميات البحث قد تُبرز محتوى معينًا إذا كان الأكثر تفصيلاً أو انتشارًا حول موضوع محدد.
انعكاسات أوسع على مستقبل المعرفة الرقمية
يمثل هذا الجدل اختبارًا مهمًا لموثوقية أنظمة الذكاء الاصطناعي التي باتت تُستخدم كمصادر معرفية بديلة لمحركات البحث التقليدية. وفي ظل التنافس المتصاعد بين شركات التقنية الكبرى، يسلط هذا التطور الضوء على إشكالية أعمق تتعلق بمن يتحكم في تدفق المعلومات الرقمية، وكيف يمكن منع تضخم المحتوى المولّد آليًا ليصبح مرجعًا لذكاء اصطناعي آخر دون رقابة بشرية صارمة.







