تشخیص آسیب‌های زانو با کمترین داده و بالاترین حفظ حریم خصوصی؛ داستان مدل‌های فدره‌ای و یادگیری کم‌نمونه!

اگه زانو درد گرفتی یا کسی رو می‌شناسی که مشکل پارگی رباط صلیبی (یعنی همون ACL که خیلی هم شایع شده این روزا) یا پاره شدن منیسک داره، حتما می‌دونی این آسیب‌ها چقدر می‌تونن زندگی آدم رو مختل کنن. مشکل اینه که اگه این آسیب‌ها زود تشخیص داده نشن، یه عالمه عوارض بعدش سراغ آدم میاد، مثلا آرتروز زانو که حسابی اذیت‌کننده‌ست.

حالا با پیشرفت هوش مصنوعی و یادگیری عمیق (یا Deep Learning، یعنی کلی مدل کامپیوتری با مغزهای شبه مغز انسان که می‌تونن تصویر رو تفسیر کنن)، امید داشتیم این مدل‌ها کار تشخیص رو راحت‌تر کنن. اما یه مشکل اساسی داریم: این مدل‌ها برای اینکه خوب یاد بگیرن و اشتباه نکنن، به یه عالمه داده MRIِ تشخیص داده‌شده و برچسب‌خورده نیاز دارن. خب تو بیمارستانا، هم پیدا کردن این حجم داده سخته و هم به‌خاطر حریم خصوصی بیماران نمی‌تونیم داده‌ها رو راحت بچرخونیم و به اشتراک بذاریم!

اینجا بود که یه ترکیب خفن اومد: یادگیری کم‌نمونه یا Few-shot Learning (یعنی مدلی که با چندتا نمونه درست و حسابی هم بتونه درست یاد بگیره!) و یادگیری فدره‌ای یا Federated Learning (این یکی یعنی داده‌ها تو هر بیمارستان یا منطقه می‌مونن و اصلاً جمع نمی‌شن یه جا؛ فقط مدل‌ها رو می‌بریم اونجا، آموزش می‌دیم، و اطلاعات یادگیری رو میاریم، پس حریم خصوصی بیماران حسابی حفظ می‌شه!).

توی این تحقیق، اومدن مدل خیلی خفن 3DResNet50 رو به‌عنوان هسته اصلی‌شون انتخاب کردن؛ این یه مدل خیلی قوی واسه تحلیل تصاویر سه‌بعدی MRI هست که تو استخراج ویژگی‌های مهم کمک زیادی می‌کنه (ویژگی یعنی چیزایی که توی تصویر مثل پارگی، تورم یا تغییر شکل هستن که پزشک با چشم می‌فهمه ولی کامپیوتر باید یاد بگیره تشخیص بده).

روش آموزش هم جذابه! از یه استراتژی به اسم ‘آموزش اپیزودی’ استفاده کردن روی شبکه‌های Prototypical (این مدل ها به جای حفظ همه داده‌ها، یه نمونه مرکز از هر کلاس می‌سازن – خلاصه، مدل خیلی سریع‌تر و با داده کمتر یاد می‌گیره). آموزش مدل رو با روش Stochastic Gradient Descent (SGD، یعنی آپدیت تدریجی مدل به کمک داده‌های تصادفی)، تابع خطای Cross-Entropy Loss (برای سنجیدن تفاوت پیش‌بینی مدل با واقعیت)، و تنظیم‌کننده نرخ یادگیری MultiStep Scheduler (که باعث میشه مدل یادش نره روی داده‌های جدید هم دقت کنه) جلو بردن.

حالا بیایم سراغ نتایج! مدل رو روی دیتاست MRNet (یه مجموعه مشهور عکس‌های MRI زانو) تست کردن. شگفت‌انگیزه! تو حالت متمرکز، دقت مدل این بود: توی عکس‌های محور Axial (یعنی برش افقی)، 85.3%؛ محور Sagittal (اینا برش‌هایی هستن که زانو رو از بغل نشون می‌دن)، 82.1%؛ محور Coronal (برش از روبه‌رو)، 71%. وقتی رفتن روی حالت فدره‌ای کم‌نمونه، نتایج خیلی نزدیک شدن و حتی تو بعضی زاویه‌ها بهتر: محور Axial شد 83%، Sagittal 83.9% و Coronal 65%.

جمع‌بندی اینه که این روش ترکیبی چندتا حسن بزرگ داره: هم تشخیص دقیق‌تر میده، هم رو همه نماهای مختلف MRI خوب کار می‌کنه، هم حریم خصوصی داده‌های بیمارها رو کامل حفظ می‌کنه چون اصلاً داده جابجا نمی‌شه. البته یه نقطه‌ضعف هم بود: توی نمای Coronal دقتش کمی پایین‌تر درمیاد و همینطور از نظر قدرت پردازشی حسابی پرمصرفه (یعنی نیاز به کامپیوترهای قوی داره).

در کل، این مدل یه قدم خیلی مهمه توی تشخیص زود و بهتر آسیب‌های زانو، مخصوصاً وقتی حجم داده‌ها کمه و بیمارستان‌ها هم نمی‌خوان داده‌هاشون رو به اشتراک بذارن. اگه قراره تو آینده، دکترها با کمک هوش مصنوعی تشخیص بدن، چنین روش‌هایی خیلی به کمکشون میان!

منبع: +