يمكنك الاستماع إلى المقال عوضاً عن القراءة
الذكاء الصناعي يجعل الوجوه الباهتة أكثر حِدة بـ 60 مرة

 

عمل باحثون في جامعة Duke على تطوير نظام أحد أدوات الذكاء الاصطناعي، بحيث تتمكن من تحويل الصور الباهتة وغير الواضحة، التي لا يمكن التعرف على ملامح الأشخاص فيها، إلى صور أكثر إقناعًا ووضوحًا، إذ يتم إنشاؤها بواسطة الكمبيوتر بتفاصيل أفضل وأكثر دقة.

في الطرق السابقة كان بالإمكان التحكم بحجم الصورة بدقة تصل إلى ثمانية أضعاف دقتها الأصلية، ولكن فريق ديوك توصل إلى طريقة يمكن من خلالها جمع البكسل وتصميم وجوه تبدو حقيقية وواقعية بدقة تصل إلى 64 ضعف الدقة الأصلية، كما تعطي للصورة مميزات خيالية كإضافة وتوضيح الخطوط الرفيعة في الوجه والرموش، حتى أنها توضح القصبة الهوائية التي لن تكون ظاهرة في الغالب في الصورة الأصلية.

قالت عالمة الكمبيوتر في Duke، وقائدة فريق البحث سينثيا رودين : " لم يتم من قبل إنشاء صور بهذه الدقة العالية وبكل هذه التفاصيل الواضحة"

هذا النظام من الذكاء الصناعي لا يمكنه تحديد الأشخاص غير المعروفين، ويقول الباحثون أنه لا يمكن استخدام النظام لتحويل صورة بعيدة أو تم إلتقاطها من دون التركيز على الوجه مثل الكاميرات الأمنية، وتحويلها لصورة واضحة حقيقية تبرز معالم الشخص، ولكنها قادرة على إنشاء صور لوجوه جديدة غير موجودة أصلًا وتبدو كما لو كانت حقيقية فعلًا.

يقول ساشيت مينون Sachit Menon الحاصل على البكالوريوس من جامعة ديوك في تخصص رياضيات وعلوم الحاسوب: " في الوقت الذي ركز فيه معظم الباحثون في هذا المجال على ملامح الوجه لتوضيح المفهوم، يجب التنويه إلى أن هذه التقنية يمكنها أن تحول اللقطات المنخفضة الجودة إلى صور واضحة جدًا وأكثر حدة وواقعية، مثل تلك الصور الملتقطة في المجاهر العلمية والطبية، أو صور الأقمار الصناعية والفلك."

بالكاد يمكن تمييز ملامح الوجه مثل العيون والشفاه في الصورة المشوشة على اليسار. لكن تضخيمها لأكثر من ستين ضعفًا (على اليمين) حكاية أخرى بفضل الذكاء الاصطناعي. حقوق الصورة: Duke University
بالكاد يمكن تمييز ملامح الوجه مثل العيون والشفاه في الصورة المشوشة على اليسار. لكن تضخيمها لأكثر من ستين ضعفًا (على اليمين) حكاية أخرى بفضل الذكاء الاصطناعي. حقوق الصورة: Duke University


قدم الباحثون طريقتهم المسماة PULSE، في مؤتمر (CVPR) عام 2020، وهو مؤتمر رؤية الكمبيوتر والتعرف على الأنماط ( Computer Vision and Pattern Recognition)، والذي عقد بين من 14و19 يونيو.

الأساليب التقليدية تأخذ الصورة منخفضة الدقة وتخمن كم تحتاج من بكسلات إضافية من أجل جعلها متطابقة إلى حد كبير مع الأصل، وهذا المتوسط في الببكسلات لجعلها عالية الجودة سينتج صورة لا تتضح فيها الكثير من الملامح المهمة مثل المناطق النسيجية في الجلد أو الشعرذات الدقة العالية.

توصل فريق Duke إلى طريقة مختلفة بعض الشيء، فبدلًا من التقاط صورة بدقة مخفضة، ومن ثم العمل على إضافة تفاصيل جديدة تدريجيًا لتوضيحها، يعمل هذا النظام بفحص النماذج التي تم إنشاؤها بواسطة نظام الذكاء الاصطناعي للوجوه عالية الدقة، ويختار تلك الصور التي تبدو مثل الصور المدخلة عند تقليصها إلى نفس الحجم .


استخدم الفريق أداة في التعلم الآلي تسمى "الشبكة الخصومة التوليدية" أو GAN، وهي عبارة عن شبكتين عصبيتين مدربتين على مجموعة من البيانات للصور نفسها. تأتي إحدى الشبكات بأوجه بشرية تم إنشاؤها بواسطة الذكاء الاصطناعي تحاكي الوجوه التي تم تدريبها عليها ، بينما تأخذ الأخرى هذا المخرجات والنتائج، وتقرر ما إذا كانت مقنعة بما يكفي، أم أنها غير ذلك. تصبح الشبكة الأولى أفضل مع الخبرة، حتى لا تتمكن الشبكة الثانية من معرفة الفرق.

إمسح وإقرأ

المصادر

شارك

المصطلحات
  • الرؤية الحاسوبية (Computer vision): هو أحد مجالات علوم الحاسب، ويعمل على تمكين الحاسوب من رؤية الصور ومعالجتها والتعرف عليها كالبشر تماماً، ومن ثم اعطاء المخرجات المناسبة.

اترك تعليقاً () تعليقات