الرؤية الحاسوبية: تقنية جديدة للتحسين من دقة تعرف الحواسيب على الكائنات


طوّر باحثون من جامعة شمال ولاية كارولينا North Carolina State University تقنيّة جديدة من شأنها تحسين قدرة تكنولوجيا الرؤية الحاسوبيّة على التعرّف بشكل أفضل على الأجسام والكائنات والتمييز بينها في صورة ما، في عملية تدعى التجزئة (segmentation).

لمعالجة الصور والرؤية الحاسوبية أهميتها بالنسبة لمجال واسع من التطبيقات، بدءاً من المركبات ذاتيّة القيادة وصولاً إلى الكشف عن الحالات الشاذة في التصوير الطبي.

تستخدم تكنولوجيا الرؤية الحاسوبيّة خوارزميات لتجزئة الصورة إلى أجسام، أو تحديد الأجسام في صورة معينة. على سبيل المثال: تمييز أحد المشاة في خلفيّة لشارع مزدحم.
تعتمد هذه الخوارزميات على معاملات محدّدة -قيم مبرمجة - لتجزئة الصور. على سبيل المثال: إذا تخطى التغير في اللون درجة معينة–عتبة threshold-، فسيفسرها برنامج الرؤية الحاسوبيّة على أنّها خط فاصل بين جسمين، وهذه العتبة المحدّدة هي أحد معاملات الخوارزمية.

ولكن، يوجد هنا تحدٍ. حتّى التغيرات الصغيرة في إحدى المعاملات قد تؤدي إلى اختلاف كبير في نتائج الرؤية الحاسوبيّة. فعلى سبيل المثال، إذا كان شخص ما يعبر الشارع ويمشي بداخل وخارج المناطق المُظلّلة، التي من شأنها أن تؤثر على اللون الذي يراه الحاسوب، عندها قد "يرى" الحاسوب الشخص يختفي ويعاود الظهور، أو قد يفسَر الشخص والظل كما لو أنّه جسم واحد، كبير، سيارة مثلاً.

يقول إيدغار لوباتون Edgar Lobaton وهو أستاذ مساعد في هندسة الكهرباء والكمبيوتر في جامعة شمال ولاية كارولينا والكاتب الرئيسي للورقة البحثية حول هذا العمل: "إنّ بعض معاملات الخوارزميّة قد تعمل على نحو أفضل من غيرها في أي مجموعة محدّدة من الظروف، ونحن أردنا أن نعرف كيفيّة الجمع بين المعاملات المتعدّدة والخوارزميّات لتحسين تجزئة الصور عبر برامج الرؤية الحاسوبيّة".

وقد طوّر كل من لوباتون وأحد طلاب الدكتوراه كيان جي Qian Ge تقنيّة تُطبق بيانات عمليّة التجزئة الناتجة من خوارزميات متعددة على الحاسوب وتجمعها، خالقة بذلك نسخة جديدة من الصورة. ثم تُجزء هذه الصورة الجديدة مرّة أخر، بناءً على مدى استمرار أي جزء محدّد من بين جميع مدخلات الخوارزميات الأساسيّة.

يقول لوباتون: "بصريّاً، تبدو نتائج هذه التقنيّة أفضل من أي خوارزمية أخرى بمفردها"، ويتابع قائلاً: "على أيّة حال، إنّ طبيعة هذا العمل لا تتوافق مع المقاييس الحاليّة لقياس دقّة الرؤية الحاسوبيّة. لذلك نحن بحاجة إلى تطوير وسيلة جديدة لتقييم دقّة الرؤية الحاسوبيّة، وهو مشروع مستقبلي بالنسبة لنا".

ويشير لوباتون إلى أنّه من الممكن استخدام التقنيّة الجديدة لتجزئة الصورة في الزمن الحقيقي، معالجة 30 صورة في الثانية الواحدة. ويرجع ذلك إلى حقيقة أنّ معظم الخطوات الحاسوبيّة يمكن تنفيذها بشكل متوازي، بدلاً من التنفيذ على التسلسل.

عُرض البحث المعنون: " Consensus-Based Image Segmentation via Topological Persistence" في 1 يوليو/تموز في مؤتمر IEEE للرؤية الحاسوبيّة والتعرّف على الأنماط في لاس فيغاس، نيفادا. وقد أنجز العمل بدعم من مؤسسة العلوم الوطنية"National Science Foundation" في إطار المنحة CNS-1239323.

 

إمسح وإقرأ

المصادر

شارك

اترك تعليقاً () تعليقات