كيف يمكن للحواسيب -أو لعقولنا- أن تتعرف على الصور؟

نحن لا نتعرّف على الأشياء فحسب، بل إنّ عقولنا بارعة للغاية في هذه المهمة حيث إنّها قادرة على التعرف على كأسٍ موجودة في صورة ما فقط من خلال المقبض المنحني الخاص بها، أو التعرّف على وجود وجه فقط من خلال الأذن أو الأنف. يهتم كل من علماء الأعصاب، وعلماء الحواسيب، ومهندسي الروبوت بفهم آلية التعرّف هذه عند كلٍّ من أنظمة الرؤية الموجودة عند البشر أو الحواسيب. يقترح بحث جديد أجراه علماء من معهد ويزمان للعلوم Weizmann Institute of Science ومعهد ماساتشوستس للتكنولوجيا MIT-Massachusetts Institute of Technology وجود وحدة قياس "ذريّة" لعملية التعرّف، وهي تمثّل أقل كمية من المعلومات الواجب توفرها في صورة ما لتحدث عملية التعرّف. وتقتضي نتائج الدراسة التي نشرت مؤخّرا في مجلّة أحداث الأكاديميّة الوطنيّة للعلوم PNAS-Proceedings of the National Academy of Sciences بوجوب إجراء المزيد من التعديلات على النماذج الحاليّة، علاوةً على أنهم لديهم بعض الاقتراحات لتصميم أنظمة الرؤية عند الحاسوب والروبوت.

ففي مجال الرؤيّة الحاسوبيّة مثلا، كانت القدرة على التعرّف على غرض ما في صورة معينة تمثّل تحدياً لباحثي الحواسيب والذكاء الصناعي. ولقد أراد كل من البروفيسور شيمون أولمان Shimon Ullman والدكتور دانييل هاراري Daniel Harari سويّة مع لياف آسيف Liav Assif وإيثان فيتايا Ethan Fetaya أن يعرفوا مدى روعة نماذج الرؤية الحاسوبية الحاليّة، وفيما إذا كانت قادرة على تقديم نفس قدرات العقل البشري. وحتّى الآن، قاموا بتجنيد آلاف المشاركين من#ميكانيكال_تورك Mechanical Turk الخاصّة بأمازون Amazon، وجعلوهم يقومون بالتعرّف على سلسلة من الصور. كانت الصور مصاغةً بعدّة صيغ: قُطِع البعض منها تباعاً من صور أكبر، والتي تُظهِر تفاصيلا أقل من الصورة الأصليّة. وبعضها الآخر كان ذا دقّةٍ منخفضة تباعاً، مترافقة مع تقليل التفاصيل فيها.


يمكن لتغيّر بسيط في الصور التي تحتوي على أقل عدد من التفاصيل الممكن التعرف عليها (MIRC-Minimal Recognizable Configurations) أن يؤدي إلى حدوث هبوط حاد في نسبة التعرّف عند البشر. تُظهر الصور في الأعلى أشكالاً تحتوي على عدد قليل من التفاصيل التي يمكن التعرف عليها MIRC، والصور في الأسفل تحتوي على نفس الأشكال ولكن بتفاصيل أقل، وفي أسفل كل صورة يوجد عدد يدل على معدل تعرف البشر على الصور. حقوق الصورة: معهد ويزمان للعلوم Weizmann Institute of Science.
يمكن لتغيّر بسيط في الصور التي تحتوي على أقل عدد من التفاصيل الممكن التعرف عليها (MIRC-Minimal Recognizable Configurations) أن يؤدي إلى حدوث هبوط حاد في نسبة التعرّف عند البشر. تُظهر الصور في الأعلى أشكالاً تحتوي على عدد قليل من التفاصيل التي يمكن التعرف عليها MIRC، والصور في الأسفل تحتوي على نفس الأشكال ولكن بتفاصيل أقل، وفي أسفل كل صورة يوجد عدد يدل على معدل تعرف البشر على الصور. حقوق الصورة: معهد ويزمان للعلوم Weizmann Institute of Science.
وعندما قام العلماء بمقارنة النتائج الخاصة بالأشخاص مع تلك الخاصّة بالنماذج الحاسوبيّة، وجدوا أن البشر كانوا أفضل بكثير في التعرّف على أجزاء الصور، أو الصور ذات الدقة المنخفضة. كما اقترحت المقارنة أنّ الاختلافات كانت نوعيّة أيضاً؛ حيث إن غالبيّة الأشخاص المشاركين تُوِجوا بالنجاح في التعرّف على الأغراض في الصور المختلفة، وحتّى عند فقدان كميّة مقبولة من التفاصيل. ولكن بعد حد معيّن من فقدان التفاصيل، أخطأ معظمهم عند النقطة ذاتها. كان الاختلاف حاداً للغاية، واصطلح العلماء اسمًا لهذه الظاهرة هو انتقال الطور Phase Transition. يقول أولمان: "إذا فقدت صورة ذات حدٍ دنوي من التفاصيل مقداراً ضئيلاً إضافيّاً منها، سيفقد الجميع فجأة مقدرتهم على التعرف على الأشياء الموجودة فيها. وهذا يشير إلى أنّه مهما كانت خبرتنا في الحياة وحجم التدريب الذي تلقيناه، ستبقى المقدرة على التعرّف خاصّية طبيعيّة عند الإنسان تأتي عند ولادته وهي ذاتها عند الجميع".


يقترح العلماء أنّ الفرق بين قدرات البشر والحواسيب تكمن في حقيقة أنّ الخوارزميات الحاسوبيّة تتبنى طريقة التعرّف من الأسفل إلى الأعلى Bottom-up والتي تنتقل من التفاصيل البسيطة إلى التفاصيل المعقّدة. ومن ناحية أخرى يعمل العقل البشري بطريقة التعرّف من الأسفل إلى الأعلى Bottom-up ومن الأعلى إلى الأسفل Top-down في آنٍ واحد، وذلك بمقارنة العناصر الموجودة في الصورة بما قد نسميه النماذج المحفوظة في بنك الذاكرة.


تقترح النتائج أيضاً احتمال وجود شيء أساسي متأصّل في عقولنا والمضبوط ليعمل مع مقدار دنوي - "ذرة" أساسيّة - من المعلومات. قد تكون هذه الكميّة الأساسيّة جوهرية لقدرتنا على التعرّف، وقد يحسّن من حساسيتها فيما لو تمّ دمجها مع النماذج الموجودة حالياً. وقد تكون "ذرّات التعرّف" هذه أدوات قيّمة في أبحاث متقدّمة عن عمل العقل البشري، ولتطوير أنظمة رؤية حاسوبية وروبوتيّة جديدة.


البروفسور شيمون أولمان يشغل منصب روث وسامي كون الخاص بالأساتذة Ruth وSamy Cohn #Professoria_Chair في علوم الحاسب.

إمسح وإقرأ

المصادر

شارك

اترك تعليقاً () تعليقات