FLA-UNet: یه مدل خفن جدید برای تشخیص دقیق منطقه بی‌عروق تو تصاویر OCTA

خب بیا با هم راحت و دوستانه درباره یه موضوع جالب تو دنیای چشم و تصویر پزشکی صحبت کنیم! میدونستی این روزا خیلی از دکترها و محقق‌ها برای بررسی بیماری‌های شبکیه چشم، از روشی به اسم OCTA استفاده می‌کنن؟ اگر نشنیدی باید بگم OCTA یعنی Optical Coherence Tomography Angiography که یه جور اسکن تصویره که هم غیر تماسیه و هم غیر تهاجمی، یعنی نه سوزن خبریه و نه دستکاری عجیبی! خلاصه، تصویر رگ‌های شبکیه رو خیلی حرفه‌ای و واضح می‌گیره.

حالا همه چی درباره یه ناحیه خیلی مهم به اسم FAZ یا همون Foveal Avascular Zone هستش. این ناحیه مثل یه دایره کوچیک وسط شبکیه‌ست که هیچ رگی توش وجود نداره. دکترها خیلی روش حساسن، چون وضعیت این ناحیه می‌تونه براشون سرنخ بزرگی باشه از اینکه آیا چشم دچار یه بیماری شده یا نه.

تا الان کلی مدل هوش مصنوعی برای اینکه این ناحیه FAZ تو عکس‌های OCTA دقیقاً تشخیص داده بشه ساخته شدن. یکی از معروف‌ترین‌ها U-Net هست که اگه ندیدی، خلاصه بگم یه مدل شبکه عصبی خیلی محبوب برای برش زدن تصویر (یا همون سگمنتیشن) حساب میشه. منتها مدل اصلیش و حتی نسخه‌های بهبودیافته‌ای که تا الان ازش اومده، هنوز جای بهتر شدن دارن. یعنی میشه هم دقت و هم اینکه رو تصاویر مختلف خوب جواب بدن رو بیشتر کرد.

حالا بریم سر پیشنهاد خفن مقاله: بچه‌ها یه مدل تازه درست کردن به اسم FLA-UNet که کلی از مشکلات قبلی رو برطرف کرده. اسمش یعنی Feature-Location Attention U-Net، حالا این یعنی چی؟ اومدن تو U-Net یه بخش جدید گذاشتن به اسم “بلوک توجه به ویژگی و مکان” یا FLAB (Feature-location Attention Block) که باعث میشه بهتر حواسش به هم مشخصات ریز ناحیه FAZ و هم جای دقیقش تو تصویر باشه. حالا یعنی چی؟

توی FLAB دو تا بخش موازی هست: یکی “feature-aware block” که یعنی بلوکی که می‌فهمه ویژگی‌های تصویر مثلاً چه جایی مرز FAZ هست (ویژگی‌های ریزی که فقط یه مدل هوشمند می‌تونه تشخیص بده!)، یکی هم “location-aware block” که به موقعیت‌های مکانی توی عکس اهمیت میده. تلفیق این دو تا باعث میشه ناحیه FAZ هم دقیق معلوم شه و هم مرزهاش قشنگ جدا شه. خلاصه اینکه، این بلوک‌ها تو قسمت‌های مختلف شبکه گنجونده شدن و خب خیلی کمک کردن به کیفیت برش زدن تصویر.

یک نکته جالب دیگه هس درباره اینکه چه جوری شبکه رو آموزش دادن. اومدن یه تابع خطای ترکیبی (joint loss function) طراحی کردن که خودش از دوتا بخش ساخته شده: “cross-entropy loss” یا همون تابع خطای متقاطع که بیشتر برای یادگیری دسته‌بندی استفاده میشه، و “Dice loss” که مخصوصاً برای سنجش کیفیت برش تصویر تو حالت‌هایی که داده نامتوازن هست، به کار میره. به زبان ساده، این ترکیب باعث شده شبکه هم توی جدا کردن مرزهای FAZ، هم توی شناسایی بخش داخلی خیلی بهتر و مقاوم‌تر عمل کنه.

حالا آیا کار کرده؟ برای آزمایش، مجموعه‌داده‌های مختلف و معروف را بررسی کردن: OCTAGON، FAZID و OCTA-500 (اینا هر کدوم مجموعه‌ای از تصاویر چشم‌های واقعی هستن که توی تحقیقات بین‌المللی استفاده میشن). نتیجه؟ مدل FLA-UNet از نظر دقت (Accuracy یا ACC)، MIoU (یعنی متوسط میزان همپوشانی پیش‌بینی با واقعیت) و Dice coefficient (شاخص معروف برای سنجش کیفیت برش خوردن تصاویر) همه رو شکست داده، یعنی نسبت به مدل‌های قبلی و هر چی تو این زمینه بوده، بهتر عمل کرده.

در نهایت نویسنده‌ها خودشون جمع‌بندی کردن که این مدل جدید واقعا تونسته هم دقت بالاتری بده، هم اینکه اگه یه سری تصاویر عجیب و متفاوت بهش بدن، همچنان پایدار و قابل اطمینان بمونه. این خیلی برای کاربردهای تشخیص کمکی بیماری‌های چشم (مثلاً همون جایی که بهش میگن auxiliary diagnosis) مهمه. دیگه خلاصه، اینجا یه پایه تئوریک پرقدرت برای آینده گذاشته شده که خب واقعاً می‌تونه تو دستگاه‌ها یا نرم‌افزارهای کمک تشخیص چشم، زندگی آدمارو بهتر کنه.

پس اگر عاشق هوش مصنوعی، تصویر پزشکی و کاربردهای شگفت‌انگیزش هستی، یادت باشه FLA-UNet می‌تونه یه ستاره جدید تو این زمینه باشه!

منبع: +