أحدثت ورقة جديدة في دورية PNAS ضجة بسبب مقال كان بعنوان "عنقود الفشل: لماذا قامت نتائج التصوير بالرنين المغناطيسي الوظيفي بتضخيم معدلات الإيجابية الكاذبة في الأبحاث[1]" Cluster failure: Why fMRI inferences for spatial extent have inflated false-positive rates. المقال من تأليف عالم الأعصاب السويدي أنديرس إيكلوند Anders Eklund، وتوم نيكولز Tom Nichols، وهانس نوتسون Hans Knutsson.
وبحسب العديد من العناوين التي تتحدث عن مقال "عنقود الفشل"، فإن هذه الورقة بمثابة "قنبلة مدمرة" قد تدمر مجال التصوير بالرنين المغناطيسي الوظيفي بأكمله:
- خلل في نظام التصوير بالرنين المغناطيسي الوظيفي يشكك في 15 سنة من الأبحاث (مجلة Wired)
- خلل في نظام التصوير بالرنين المغناطيسي الوظيفي قد يُبطل 15 سنة من أبحاث الدماغ. هذه نتائج هائلة (موقع ScienceAlert)
- يقترح بحث جديد أن عشرات الآلاف من دراسات التصوير بالرنين المغناطيسي الوظيفي للدماغ قد تحوي أخطاء (مجلة Forbes)
ما الذي يحدث إذًا، وهل هذا الموضوع بهذه الجدية؟
أول ما يجب أخذه في الاعتبار أن هذه القصة ليست حديثة حقًا، فقد كنت مهتمًا بتغطية عمل إيكلوند وغيره على مسألة الإيجابية الكاذبة منذ 2012. خاض إيكلوند وزملاؤه خلال ذلك الوقت جدالًا حول أن العديد من أدوات تحليل نظام التصوير بالرنين المغناطيسي الوظيفي المُستخدَمة بشكل شائع، تعاني من خلل أساسي يؤدي إلى تزايد معدلات الإيجابية الكاذبة عندما يتعلق الأمر بإيجاد أنشطة متعلقة بمهمات أو محفزات. وبكلمات أخرى، إيجاد أي منطقة في الدماغ تصدر ضوءًا خلال القيام بمهمات معيّنة.
الورقة الجديدة ليست إلا تتويجًا لهذا البرنامج، والنتائج المذكورة (التي تقول أن 70% من التحاليل تُنتج على الأقل نتيجة إيجابية خاطئة واحدة، وذلك بحسب البرمجية المستخدمة، وبحسب حالة الدراسة نفسها) لن تفاجِئ من كان يتابع هذه القضية.
بالرغم من وجود أمر غير متوقع في مقال "عنقود الفشل": كشف إيكلوند والآخرون أنهم اكتشفوا خللًا من نوع آخر في أحد الحزم البرمجية تدعى بـ AFNI:
عُثر على خلل عمره 15 سنة في أداة AFNI 3dClustSim عندما اُختبرت رزم النظام الثلاث، وتم إصلاح الخلل بواسطة مجموعة AFNI في شهر مايو/أيار من عام 2015، وذلك خلال إعداد هذا النص. قلّص الخلل حجم الصورة المستخدمة للبحث عن العناقيد، مما يقلل من أهمية تصحيح التعدد multiplicity correction والمبالغة في تقدير أهميتها، بكلمات أخرى كانت قيم p الخاصة بأداة 3dClustSim FEW منخفضة جدًا.
هذه قضية جديدة ومهمة، لكن هذا الخلل الجديد يوجد في رزمة AFNI فقط، ولا يوجد في الرزم المستعملة بكثرة مثل FSL و SPM.
أما بالنسبة إلى سؤال "ما مدى جدية الموضوع؟"، فهو جديٌّ حقًا، لكنه لا يبطل 15 سنة من أبحاث الدماغ كما يقول أحد العناوين. فمثلًا، قد يؤثر الخلل على أجهز التصوير بالرنين المغناطيسي الوظيفي فقط، ومعظم أبحاث الدماغ لا تستعمل التصوير بالرنين المغناطيسي الوظيفي. إضافةً إلى أن اكتشافات إيكلوند والآخرين لا تشكك في كل الدراسات المتعلقة بالتصوير بالرنين المغناطيسي الوظيفي، بل المشكلة تؤثر فقط في دراسات تخطيط النشاط activies mapping. بالرغم من كون هذه التجارب شائعة، إلا أنها بعيدة عن كونها التطبيق الوحيد للتصوير بالرنين المغناطيسي الوظيفي، فدراسات الارتباطية الوظيفية، وتحليل النمط متعددُ الفوكسلات multi-voxel pattern analysis هي دراسات ذات شهرة متزايدة، وبالنسبة لها، فإنها من غير المحتمل أن تكون تأثرت بالخلل، بحسب ما يبدو عليه الأمر حتى الآن.
في النهاية، من المهم تذكر أن جملة "احتمالية العثور على نتيجة إيجابية كاذبة هي 70%" لا تعني أن 70% من النتائج الإيجابية تكون خاطئة. إن كانت هناك العديد من النتائج الإيجابية، ستكون أقلية فقط من هذه النتائج خاطئة. بالرغم من ذلك، إنه لمن المستحيل أن نعرف مباشرة المعدل الحقيقي للنتائج الإيجابية الكاذبة.
تحديث بتاريخ 15 يوليو/تمّوز 2016: قام توم نيكولز، أحد مؤلفي ورقة "عنقود الفشل" بطلب تصحيح للورقة من أجل حذف بعض التعبيرات التي أدت لسوء فهم للدراسة (بسبب العناوين المُضخمة). بالرغم من ذلك، لم توافق دورية PNAS على التصحيح، لذا قام نيكولز بوضعها على PubMed Commons
ملاحظات
[1] نسبة الإيجابية الكاذبة (في التشخيص وفي الأبحاث) False-postive rate: هو أن يُظهر الفحص نتيجة إيجابية (مشيرًا إلى وجود المرض) مع أن المرض غير موجود، وفي الأبحاث: أن يُظهر الفحص نتيجة إيجابية مشيرًا إلى أن منطقةً ما في الدماغ فاعلة وهي في الحقيقة غير فاعلة (مثلًا).