حقوق الصورة: إيلكينزيفيرلي IlkinZeferli/شاترستوك Shutterstock
وفقًا للمقاييس البشرية فإن الشطرنج ليست لعبةً سهلةً، ولكن بالنسبة لنظام ذكاء اصطناعي ذي عقليةٍ مذهلةٍ، بل تبدو تقريبًا فضائيةً، يمكن إتقان وسيلة التسلية البسيطة هذه خلال بضع ساعاتٍ من الفراغ.
يوضح باحثو غوغل Google في ورقةٍ بحثيةٍ جديدةٍ بالتفاصيل كيف أن ابتكارهم الجديد في مجال الذكاء الاصطناعي ذو الاسم ألفازيرو AlphaZero قد تمكن من تطوير أداءٍ خارقٍ في الشطرنج بعد أن استغرق أربع ساعاتٍ فقط لتعلم قواعد اللعبة، ومن ثم هزم البرنامجَ الأول على العالم في الشطرنج المُسمّى ستوكفيش Stockfish هزيمةً ساحقةً.
بمعنىً آخر، استوعب نظامُ ذكاءٍ اصطناعيٍّ كلَّ المعرفة البشرية في مجال الشطرنج (وما يتخطى الشطرنج) وتفوّق عليها خلال مدةٍ زمنيةٍ تعادل الوقت المستغرق للوصول من مدينة نيويورك إلى واشنطن بالسيارة.
بعد أن بُرمِج بقواعد الشطرنج فقط (بدون أيٍّ من استراتيجياته) أتقن ألفازيرو اللعبة خلال 4 ساعاتٍ فقط إلى حدٍّ مكّنه من التغلب على ستوكفيش، البرنامج الأعلى تقييمًا القادر على لعب الشطرنج.
لعب ألفازيرو 100 لعبةٍ ضد ستوكفيش، ربح 25 منها عند لعبه بالحجر الأبيض (مما يعطيه أفضلية الحركة الأولى)، بينما ربح 3 منها عند لعبه بالحجر الأسود، وانتهت بقيتها بالتعادل، حيث لم يسجل ستوكفيش أيّ فوزٍ ولم يسجل ألفازيرو أيّ خسارةٍ.
يقول ديفيد كراماليDavid Kramaley، الباحث في مجال الشطرنج والمدير التنفيذي لموقع علم الشطرنج تشيسابل Chessable: "نعلم الآن من هو قائدنا المطلق الجديد. هذا سيسبب دون شكٍّ ثورةً في عالم الشطرنج، ولكن عند التفكير خارج مجال الشطرنج نرى بأنه يمكن لهذه الخوارزمية أن تقود مدنًا، قاراتٍ وأكوان".
طُوِّر ألفازيرو في مختبر ديب مايند DeepMind للذكاء الاصطناعي الخاص بغوغل، وهو نسخةٌ معدلةٌ عن ألفاغو زيرو AlphaGo Zero الذي يختص بلعب اللعبة اللوحية الصينية غو Go.
يعمل مختبر ديب مايند على نظام الذكاء الاصطناعي هذا منذ سنواتٍ، تفوق خلالها على مجموعةٍ من الأبطال البشريين الذي تساقطوا كأحجار الدومينو أمام هذه الشبكة العصبية التي لا تُقهر.
تُوّجت سلسلة الانتصارات تلك بنجاحٍ تحقق في شهر أكتوبر/تشرين الأول، عندما تمكنت نسخةٌ جديدةٌ من النظام ذاتية التحكم بالكامل (أي تتعلم باللعب ضد نفسها فقط دون أن تواجه لاعبين بشريين) من التفوق على جميع النسخ السابقة. بالمقابل، فإن النسخ السابقة من ألفاغو زيرو تعلمت جزئيًا من خلال مشاهدة حركات لعبٍ يؤديها لاعبون بشريون.
كان الهدف من تلك العملية أن تساعد النظام الجديد في تعلم الاستراتيجية، ولكن يبدو أنها كانت في الحقيقة معيقةً بالنسبة له، حيث أثبتت النسخة ذاتية التعلم كليًا من ألفاغو زيرو بأنها أكثر فعاليةً إلى درجةٍ هائلةٍ في المنافسات الفردية (لاعب ضد لاعب).
يقول عالم الحاسوب نيك هاينز Nick Hynes في تصريحٍ لغيزمودو Gizmodo في أكتوبر/تشرين الأول: "الأمر شبيهٌ بحضارةٍ غريبةٍ تقوم باختراع علم الرياضيات الخاص بها. ما نراه هنا هو عبارةٌ عن نموذجٍ متحررٍ من الانحياز الإنساني والاعتقادات المسبقة. بإمكانه تعلّم ما يراه أمثلًا، والذي من الممكن أن يكون حقيقةً أكثر دقةً من معتقاداتنا نحن في ذات المجال". ولكنّ التطور في هذا المجال سريعٌ جدًّا لدرجةٍ أنه من الممكن أن يكون قد تجاوز الإنجاز الذي تحقق في أكتوبر/تشرين الأول.
يوضح الفريق في ورقتهم البحثية الجديدة أن النسخة الأكثر حداثةً من نظام الذكاء الاصطناعي ألفازيرو تعتمد على التعلم الذاتي (المُسمّى بالتعلّم المعزّز) بأسلوبٍ أكثر تعميمًا مما يمنحها تركيزًا أوسع في مجال حلّ المشاكل. ذلك يعني أن ألفازيرو لا يلعب الشطرنج فحسب، بل هو يلعب شوغي Shogi (أو ما يُعرف بالشطرنج اليابانية) أيضًا وكذلك غو، حيث إنه استغرق ساعتين لإتقان اللعبة الأولى وثمان ساعاتٍ لإتقان الثانية فقط، وهو أمرٌ ليس بالمفاجئ.
حتى الآن، يمتنع علماء الحاسوب في ديب مايند وغوغل عن التعليق علنيًا على البحث الجديد، والذي لم يراجعه أقرانهم حتى اللحظة. ولكن مما يمكن معرفته حتى الآن، فإن الصعود المبهر لهذه الخوارزمية والذي أوصلها إلى قمة عالم الذكاء الاصطناعي لم ينتهِ بعد.
حتى سادة الشطرنج في العالم مذهولون بهذا الحدث، حيث صرح بطل الشطرنج بيتر هاين نيلسن Peter Heine Nielsen لـ بي بي سي BBC: "لطالما تساءلت كيف سيبدو الأمر إذا هبطت فصيلةٌ متفوقةٌ من المخلوقات على الأرض وأخبرونا كيف يلعبون الشطرنج. الآن أنا أعرف".