خب بیا با هم راحت و دوستانه درباره یه موضوع جالب تو دنیای چشم و تصویر پزشکی صحبت کنیم! میدونستی این روزا خیلی از دکترها و محققها برای بررسی بیماریهای شبکیه چشم، از روشی به اسم OCTA استفاده میکنن؟ اگر نشنیدی باید بگم OCTA یعنی Optical Coherence Tomography Angiography که یه جور اسکن تصویره که هم غیر تماسیه و هم غیر تهاجمی، یعنی نه سوزن خبریه و نه دستکاری عجیبی! خلاصه، تصویر رگهای شبکیه رو خیلی حرفهای و واضح میگیره.
حالا همه چی درباره یه ناحیه خیلی مهم به اسم FAZ یا همون Foveal Avascular Zone هستش. این ناحیه مثل یه دایره کوچیک وسط شبکیهست که هیچ رگی توش وجود نداره. دکترها خیلی روش حساسن، چون وضعیت این ناحیه میتونه براشون سرنخ بزرگی باشه از اینکه آیا چشم دچار یه بیماری شده یا نه.
تا الان کلی مدل هوش مصنوعی برای اینکه این ناحیه FAZ تو عکسهای OCTA دقیقاً تشخیص داده بشه ساخته شدن. یکی از معروفترینها U-Net هست که اگه ندیدی، خلاصه بگم یه مدل شبکه عصبی خیلی محبوب برای برش زدن تصویر (یا همون سگمنتیشن) حساب میشه. منتها مدل اصلیش و حتی نسخههای بهبودیافتهای که تا الان ازش اومده، هنوز جای بهتر شدن دارن. یعنی میشه هم دقت و هم اینکه رو تصاویر مختلف خوب جواب بدن رو بیشتر کرد.
حالا بریم سر پیشنهاد خفن مقاله: بچهها یه مدل تازه درست کردن به اسم FLA-UNet که کلی از مشکلات قبلی رو برطرف کرده. اسمش یعنی Feature-Location Attention U-Net، حالا این یعنی چی؟ اومدن تو U-Net یه بخش جدید گذاشتن به اسم “بلوک توجه به ویژگی و مکان” یا FLAB (Feature-location Attention Block) که باعث میشه بهتر حواسش به هم مشخصات ریز ناحیه FAZ و هم جای دقیقش تو تصویر باشه. حالا یعنی چی؟
توی FLAB دو تا بخش موازی هست: یکی “feature-aware block” که یعنی بلوکی که میفهمه ویژگیهای تصویر مثلاً چه جایی مرز FAZ هست (ویژگیهای ریزی که فقط یه مدل هوشمند میتونه تشخیص بده!)، یکی هم “location-aware block” که به موقعیتهای مکانی توی عکس اهمیت میده. تلفیق این دو تا باعث میشه ناحیه FAZ هم دقیق معلوم شه و هم مرزهاش قشنگ جدا شه. خلاصه اینکه، این بلوکها تو قسمتهای مختلف شبکه گنجونده شدن و خب خیلی کمک کردن به کیفیت برش زدن تصویر.
یک نکته جالب دیگه هس درباره اینکه چه جوری شبکه رو آموزش دادن. اومدن یه تابع خطای ترکیبی (joint loss function) طراحی کردن که خودش از دوتا بخش ساخته شده: “cross-entropy loss” یا همون تابع خطای متقاطع که بیشتر برای یادگیری دستهبندی استفاده میشه، و “Dice loss” که مخصوصاً برای سنجش کیفیت برش تصویر تو حالتهایی که داده نامتوازن هست، به کار میره. به زبان ساده، این ترکیب باعث شده شبکه هم توی جدا کردن مرزهای FAZ، هم توی شناسایی بخش داخلی خیلی بهتر و مقاومتر عمل کنه.
حالا آیا کار کرده؟ برای آزمایش، مجموعهدادههای مختلف و معروف را بررسی کردن: OCTAGON، FAZID و OCTA-500 (اینا هر کدوم مجموعهای از تصاویر چشمهای واقعی هستن که توی تحقیقات بینالمللی استفاده میشن). نتیجه؟ مدل FLA-UNet از نظر دقت (Accuracy یا ACC)، MIoU (یعنی متوسط میزان همپوشانی پیشبینی با واقعیت) و Dice coefficient (شاخص معروف برای سنجش کیفیت برش خوردن تصاویر) همه رو شکست داده، یعنی نسبت به مدلهای قبلی و هر چی تو این زمینه بوده، بهتر عمل کرده.
در نهایت نویسندهها خودشون جمعبندی کردن که این مدل جدید واقعا تونسته هم دقت بالاتری بده، هم اینکه اگه یه سری تصاویر عجیب و متفاوت بهش بدن، همچنان پایدار و قابل اطمینان بمونه. این خیلی برای کاربردهای تشخیص کمکی بیماریهای چشم (مثلاً همون جایی که بهش میگن auxiliary diagnosis) مهمه. دیگه خلاصه، اینجا یه پایه تئوریک پرقدرت برای آینده گذاشته شده که خب واقعاً میتونه تو دستگاهها یا نرمافزارهای کمک تشخیص چشم، زندگی آدمارو بهتر کنه.
پس اگر عاشق هوش مصنوعی، تصویر پزشکی و کاربردهای شگفتانگیزش هستی، یادت باشه FLA-UNet میتونه یه ستاره جدید تو این زمینه باشه!
منبع: +