یه مدل ترکیبی خفن برای تشخیص بهتر سرطان روده بزرگ تو عکس‌های بافت

خب بریم سراغ یکی از موضوعاتی که واقعاً اهمیت داره: سرطان روده بزرگ یا همون Colorectal Cancer (CRC). اگه بدونی، این بیماری جزو شایع‌ترین سرطان‌هاست که خیلی‌ها رو هر سال گرفتار می‌کنه و میشه گفت یکی از اصلی‌ترین دلایل مرگ و میر ناشی از سرطان هم هست. حالا یه نکته مهم تو درمانش اینه که هر چی زودتر شناسایی و دقیق‌تر تشخیص داده بشه، احتمال اینکه درمان جواب بده بیشتر میشه.

تا حالا روال کار این بوده که دکترها میومدن با میکروسکوپ، اسلایدهای بافت رو نگاه می‌کردن و بر اساس تجربه خودشون می‌گفتن که این بافت سالمه یا نه. ولی خب، این روش دستی هم خیلی وقت‌گیره، هم خیلی وقتا می‌تونه سلیقه‌ای باشه و دو تا پزشک شاید نظرشون با هم فرق کنه. خلاصه بگم، خیلی جای خطا داره!

حالا یه تیم پژوهشی باحال اومدن یه مدل ترکیبی deep learning ساختن که بتونه تو این زمینه کمک حسابی‌ای بکنه. Deep learning همون یادگیری عمیقی هست که به هوش مصنوعی اجازه می‌ده مفاهیم پیچیده رو خودش بفهمه. اینا سه تا مدل معروف به اسم‌های Swin Transformer، EfficientNet و ResUNet-A رو با هم ترکیب کردن. بذار هرکدوم رو خیلی خلاصه معرفی کنم:

Swin Transformer: یه مدل پیشرفته تو هوش مصنوعی که می‌تونه همزمان به جزئیات بالا و ارتباطات دور تصاویر توجه کنه. بهش میگن self-attention، یعنی خودش می‌فهمه کجاها تصویر مهمه.
EfficientNet: مدلیه که با کمترین امکانات، بهترین عملکرد رو می‌ده. اصطلاحش compound scaling هست؛ یعنی پارامترهای مدل رو متناسب با هم زیاد یا کم می‌کنه.
ResUNet-A: قهرمان واقعی تو بین اینا برای شناخت و جداسازی بخش‌های مختلف تو یه تصویر. اون بخشی که می‌گن residual learning یعنی مدل همیشه یه راه فرار برای اطلاعات گذشته دم دست داره تا چیزی رو از قلم نندازه.

این مدل ترکیبی رو روی دیتاستی از تصاویر بافت‌های مختلف سرطان روده بزرگ تست کردن. توش همه جور بافت پیدا می‌شد: از serrated adenoma (نوع خاصی از پولیپ)، انواع پولیپ‌ها، adenocarcinoma (یه جور سرطان جدی‌تر)، intraepithelial neoplasia با درجات پایین و بالا (یعنی مراحل اولیه و پیشرفته تغییرات سلولی) تا بافت نرمال.

نتایج هم واقعاً عالی شدن:

دقت (accuracy): ۹۳٪، یعنی مدل تقریباً تو ۹۳ تا از هر ۱۰۰ مورد درست تشخیص داده.
پریسیژن (precision): ۹۲٪، یعنی وقتی مدل گفت کسی سرطان داره، تو ۹۲٪ موارد واقعاً داشته.
ریکال یا حساسیت (recall): ۹۳٪، یعنی از بین همه کسایی که سرطان داشتن، مدل تونسته ۹۳٪ رو درست شناسایی کنه.
F1-score هم ۹۳٪ بوده، که یه معیار تلفیقی از precision و recall هست.

جوی کار حتی این بوده که وقتی با حاشیه‌های دقیق (segmentation mask) که متخصص‌ها تعیین کردن مقایسه‌ش کردن، دیدن تقریباً عین برچسب‌های کارشناس‌ها عمل می‌کنه. یعنی دقت مدل عملاً نزدیک متخصص‌های واقعی بوده!

در کل، این مدل ترکیبی به نظر میاد یه ابزار خیلی قوی و کاربردی می‌تونه باشه برای خودکار کردن تحلیل تصاویر بافتی در سرطان روده بزرگ. اگه تو بیمارستان‌ها و کلینیک‌ها استفاده‌ش کنن، هم سرعت کار بیشتر میشه، هم تشخیص‌ها دقیق‌تر و قابل اعتمادتر درمیاد و استرس کمتر برای بیمارها و خانواده‌ها داره. خلاصه در حد تیم ملی هوش مصنوعی داره گام برمی‌داره! اگر من بودم که حتماً پیگیر استفاده از این مدل توی مراکز درمانی می‌شدم!

منبع: +