الذكاء الاصطناعي يتفوق في اختبار تورينج ..فهل نحتاج لتعريف جديد للذكاء؟
30 October 2025
نشرت بتاريخ 30 أكتوبر 2025
اختبار المحاكاة الشهير الذي وضعه عالم الرياضيات آلان تورينج لقياس قدرة الآلة على محاكاة الذكاء البشري باتت روبوتات الدردشة اليوم تجتازه بنجاح ساحق، لكن شتان ما بين المحاكاة والذكاء!
في عالم اليوم، تجتاز نماذج الذكاء الاصطناعي الأكثر تقدمًا بسهولة اختبار تورينج، وهو تجربة فكرية شهيرة تبحث قدرة الحواسيب على محاكاة البشر في التفاعل الكتابي.
من هنا، يرى بعض الباحثين ضرورة لوضع اختبار محدث كمعيار لقياس مدى التقدم المُحرز نحو الذكاء الاصطناعي العام (AGI) — وهو مصطلح ملتبس تستخدمه العديد من شركات التقنية للإشارة إلى نظام ذكاء اصطناعي يتمتع بسعة حيلة مضاهية للبشر على صعيد جميع الملكات الفكرية. بيد أنه في فعالية انعقدت بجمعية لندن الملكية في الثاني من أكتوبر الجاري، رأى عديد من الباحثين ضرورة إلغاء اختبار تورينج تمامًا، ليتجه مطورو أنظمة الذكاء الاصطناعي بدلًا من ذلك إلى التركيز على مدى أمان هذه النظم وتصميمها بملكات قد تخدم المجتمع.
على سبيل المثال، يقول أنيل سيث، اختصاصي علم الأعصاب من جامعة ساسكس في مدينة برايتون بالمملكة المتحدة: "فلنفكر في نوع الذكاء الاصطناعي الذي ننشده، ونجري له بدلًا من ذلك اختبارات على هذا الأساس". فبرأيه، بالتركيز على "هذا التوجه نحو الذكاء الاصطناعي العام، نجعل خيالنا قاصرًا فيما يخص نوع الذكاء الاصطناعي الذي قد نرغب فيه وننشده، ونضع - قبل كل شيء - حدودًا لتصورنا لماهية الأنظمة التي لا نرغب في أن تكون جزءًا من مجتمعنا".
نُظمت الفعالية احتفالًا بالذكرى الخامسة والسبعين لنشر عالم الرياضيات البريطاني آلان تورينج ورقته البحثية الرائدة، والتي أوردت أوصاف اختبار تورينج، الذي أطلق عليه العالم أيضًا اسم "لعبة المحاكاة". وهذا الاختبار - الذي يتصدى لبحث الإجابة عن سؤال فلسفي إشكالي هو: هل باستطاعة الآلات التفكير؟1 - يشمل سلسلة من المحادثات النصية بين مُحكم وشخص أو حاسوب. ولاجتياز الاختبار، على الآلة أن تُقنع المُحكم بأنها بشري.
ناقشت الفعالية بموضوعية مجردة من المغالاة ذكاء الآلة، وهي مقاربة قوبلت بالاستحسان. وتولى فيها بيتر جابريال، قائد فرقة الروك الموسيقية «جينيسيس» Genesis تقديم جاري ماركوس مدير النقاش، وشارك في حضورها لورانس فيشبورن نجم سلسلة أفلام «ماتريكس» Matrix، بوصفه صديقًا شخصيًا لماركوس. وحظت الفعالية بأكثر من 1000 مشاهدة على الإنترنت.
وخلال كلمة افتتاحية بها، قال ماركوس، اختصاصي علم الأعصاب من جامعة نيويورك في مدينة نيويورك الأمريكية : "الوصول إلى الذكاء الاصطناعي العام قد لا يكون الهدف الصحيح، على الأقل في الوقت الحالي". ولفت إلى أن بعضًا من أكثر نماذج الذكاء الاصطناعي تقدمًا عالية التخصص، مثل نظام «ألفافولد,» AlphaFold للتنبؤ بالبِنى البروتينية، الذي أنتجته شركة «ديب مايند » DeepMind التابعة لـ«جوجل». وأضاف ماركوس: “ينهض هذا النظام بمهمة واحدة. ولا يسعى إلى الإبداع".
ما بعد اختبار تورينج
بحسب سارا ديلون، الباحثة المتخصصة في الأدبيات البحثية من جامعة كامبريدج في المملكة المتحدة، والتي تدرس أعمال تورينج، كثيرًا ما استُخدمت تجربة تورينج الفكرية الشائقة كمعيار يُحتكم إليه لقياس ذكاء الآلة، رغم أنه لم يُقصد منها قط أن تخدم كاختبار جاد أو عملي لهذا الذكاء.
وبعض من أكثر أنظمة الذكاء الاصطناعي كفاءة اليوم هي نسخ مطورة من نماذج لغوية كبيرة تتنبأ بالنصوص بناء على علاقات نصية تعلمت استنتاجها في بيانات الإنترنت. في مارس الماضي، على سبيل المثال، باستخدام صورة من اختبار تورينج، أجرى فريق من الباحثين اختبارات لأربعة روبوتات دردشة، ووجد أن أفضل النماذج نجحت في الاختبار.
لكن قدرة روبوتات الدردشة على محاكاة الخطاب البشري على نحو مقنع لا تعني قدرته على الفهم، بحسب عدد من الباحثين المشاركين في الفعالية. فرغم أن إجابات النماذج اللغوية الكبيرة قد تشبه إلى حد مدهش تلك التي قد تصدر عن البشر، نجد - بتعبير ماركوس- أنها "تقع في مأزق كبير عندما يخرج المرء عن الإطار التقليدي للأسئلة التي تُطرح عادة على هذه الأنظمة". وكمثال على ذلك، أشار إلى عدم قدرة بعض الأنظمة على تصنيف أجزاء جسد الفيل بدقة، أو عجزها عن رسم عقارب ساعة تشير إلى أي وقت آخر بخلاف الساعة العاشرة وعشر دقائق. لهذا السبب، قد تفشل أنظمة الذكاء الاصطناعي برغم كل شيء في اختبار تورينج، إن اختبرها عالم خبير بنقاط ضعفها.
رغم ذلك، فإن التحسن الذي تشهده الأنظمة القائمة على النماذج اللغوية الكبيرة، والذي يسير بخطى حثيثة في طيف شاسع من المجالات، لا سيما في المهام التي تتطلب قدرات استدلالية، قد حدا ببعض الباحثين إلى التساؤل عما إذا كانت بعض الآلات ستصل عن قريب إلى مضاهاة الذكاء البشري في الاختبارات المعرفية. ومن هنا، سعيًا إلى تتبع تنامي مهارات الذكاء الاصطناعي والوقوف على مستوى أدائه في المهارات غير اللغوية، عمد باحثون إلى وضع اختبارات أكثر صعوبة له. ومن أحدث هذه الاختبارات: النسخة الثانية من مجموعة اختبارات التفكير المنطقي والمجرد القائمة على ألغاز لقياس الذكاء الاصطناعي العام (ARC-AGI-2)، ، وهي اختبارات تهدف إلى تقييم كفاءة ومرونة الذكاء الاصطناعي في مواجهة المشكلات الجديدة. وكثيرًا ما توصف هذه الاختبارات على أنها محطات على الطريق إلى الذكاء الاصطناعي العام لكن الباحثين لا يُجمعون على معيار محدد يحسم الوصول إلى الذكاء الاصطناعي العام.
وفي الفعالية، أخبر ماركوس المراسلين الصحفيين في جمعية لندن الملكية أن التقييم الأنسب سيكون بعقد ما أسماه بـ« أوليمبياد تورينج»، وهو مجموعة من عشرات الاختبارات التي تتضمن، على سبيل المثال، مشاهدة فيلم وفهم مجرياته، واتباع عدد من التعليمات لتركيب قطع أثاث. غير أن بعض الباحثين تساءل عما إذا كان على مطوري نماذج الذكاء الاصطناعي السعي من الأساس إلى الوصول للذكاء الاصطناعي العام. على سبيل المثال، نوه سيث إلى أن هذه الاختبارات لقياس الذكاء الاصطناعي العام تقلل من أهمية أنماط الذكاء المرتبط بالكينونة في جسد، أي الذكاء المرتبط بعلاقة مع جسد مادي، والذي لا تكون فيه الملكات الجسدية مجرد "مزية إضافية"، بل تُعد جزءًا أصيلًا في تشكيل السلوك البشري".
الفائدة وليس الذكاء هي المعيار
شانون فالور، اختصاصية الأخلاقيات الحاكمة للذكاء الاصطناعي من جامعة إدنبرة في المملكة المتحدة، وصفت الذكاء الاصطناعي العام بأنه "مفهوم علمي فقد صلته بالواقع، لا يصف كيانًا حقيقيًا أو سمة لها وجود"، منوهة إلى أن ما يُعد ذكاءً يختلف باختلاف الثقافة والبيئة والعصر ومن نوع إلى آخر. وأضافت: "أعتقد أن علينا أن نكف عن التساؤل عما إذا كانت آلة ما تتحلى بالذكاء، لنتساءل بدلًا من ذلك، عما تقوم به هذه الآلة”.
وأضافت: "تحليل قدرات الآلة وتصنيفها إلى مهارات مختلفة، بتسليط الضوء على اللغة مثلًا كمهارة وليس مؤشرًا على التمتع بملكات معرفية قد يساعد في تجنب إسناد سمات إلى الذكاء الاصطناعي تُنسب في الإنسان إلى الذكاء، مثل فهم الآخر والتعاطُف معه. فمن الأفضل كثيرًا لنا أن نحلل الذكاء إلى الملكات المختلفة العديدة التي يشير إليها المصطلح بشكل غامض وغير مباشر".
وترى فالور أن التركيز على الذكاء الاصطناعي العام يحيد باهتمامنا عما هو مهم ويسمح لشركات التقنية بتجاهُل الأضرار المحتملة لهذه التقنية، مثل إضعاف المهارات البشرية وخلق أفكار مضللة وتعزيز الانحيازات الكامنة في البيانات التي تتعلم منها النماذج اللغوية الكبيرة. وبدلًا من التركيز على استيفاء معايير الذكاء، ينبغي أن تتنافس نماذج الذكاء الاصطناعي على استيفاء معايير الأمان "واجتياز الاختبارات التي تقيم مدى سهولة استغلال هذه الأدوات لأغراض خبيثة ومدى احتمالية قيامها بتصرفات غير متوقعة وغير مرغوب فيها على أرض الواقع".
وهو ما أيده بشكل كبير ويليام آيزاك، الباحث المتخصص في دراسة استخدام الذكاء الاصطناعي في صناعة السياسات العامة من شركة «ديب مايند» التابعة لـ«جوجل» والتي تتخذ من لندن مقرًا لها (شركة التقنيات الوحيدة التي حضر لها ممثلون في الفعالية)؛ فرأى آيزاك أن اختبارات تورينج في المستقبل ينبغي أن تبحث في أمان أنظمة الذكاء الاصطناعي وفي موثوقيتها وفي تقديمها فوائد ملموسة، وأن تتساءل من يتحمل الأثمان المطلوبة لتحقيق المكاسب من الذكاء الاصطناعي. فيقول: "كعلماء، من واجبنا أن نقود هذه المسيرة بالاستناد إلى المعلومات التجريبية المتاحة لدينا، كي نقدم حججًا دقيقة تحد من المبالغات والضجة فيما يخص هذه التقنيات"
هذه ترجمة المقال الإنجليزي المنشور في دورية Nature بتاريخ 20 أكتوبر عام 2025.
doi:10.1038/nmiddleeast.2025.192
تواصل معنا: