حتماً براتون پیش اومده که رفتین دندونپزشکی و ازتون عکس پانورامیک گرفتن؛ همون عکسهایی که کل دندونا رو با هم نشون میده. حالا محققها اومدن و با کمک هوش مصنوعی (یا همون AI)، دارن سعی میکنن با همین عکسها بفهمن هر دندونی چه مشکلی داره. توی این مقاله یک تحقیق جدید رو بررسی میکنیم که کلی نکته جالب داره!
چه دادههایی داشتن؟
توی این تحقیق، یه مجموعه داده داشتن که شامل 1512 تا عکس پانورامیک دندون بود (همون عکسهایی که تو کلینیکها میگیرن)، کلی هم متخصص نشستن روی این عکسها و 11137 تا توضیح دقیق روی این دندونها گذاشتن؛ مثلاً گفتن این دندون پر شده (filling)، این یکی پوسیده (cavity)، یکی ایمپلنت داره (implant) و یه سری هم دندون عقل نهفته (impacted tooth) بوده. یعنی همه چی رو با دقت دستهبندی کردن.
چطوری مدلها رو ساختن؟
برای اینکه بفهمن هوش مصنوعی اصلاً میتونه این موارد رو با عکس تشخیص بده یا نه، چند مدل مختلف رو امتحان کردن:
-
مدل سفارشی شبکه عصبی کانولوشنی یا CNN:
یعنی یه مدل اختصاصی با نورونهای کانولوشنی درست کردن (CNN یه مدل پرکاربرد برای کار با عکس و تصویر هست که میتونه ویژگیهای مهم رو از تصویر بکشه بیرون). -
مدل ترکیبی (Hybrid یا دو مرحلهای):
تو این روش اول با CNN یه سری ویژگی کلیدی از عکس میکشن بیرون، بعد این ویژگیها رو میدن به یه مدل سنتیتر مثل Random Forest (که یه الگوریتم دستهبندی معروفه بر پایه درخت تصمیم و نظر جمعی یا همون Ensemble). -
استفاده از مدلهای از قبل آموزشدیده شده یا Pre-trained مثل VGG16، Xception، ResNet50:
یعنی مدلهایی که قبلاً کلی عکس دیده و آموزش دیدن و حالا فقط لازم بود برای دندون تنظیمش کنن (به این کار میگن Fine-tuning).
آزمون و خطا با دقت بالا
برای اینکه خیالشون راحت باشه، اومدن هر کدوم از این مدلها رو 5 بار با دادههای متفاوت امتحان کردن (این روش رو میگن 5-fold cross-validation، یعنی هر سری یه بخش از دادهها میره تست، بقیه میشه آموزش، تا نتیجه نهایی کلی باشه و به یه بخش خاص وابسته نباشه).
چه فاکتورهایی رو در نظر گرفتن؟
چهار تا معیار مهم رو چک کردن:
- دقت (Accuracy): این که مدل تو مجموع چند درصد درست میگه
- صحت یا دقت مثبت (Precision): از بین چیزهایی که گفته مشکل دارن، چند تاش واقعاً درست بوده
- فراخوانی (Recall): از بین همه مواردِ واقعیِ بیمار، چند تاشو درست شناخته
- F1 Score: ترکیب دوتای بالایی برای یه عدد نهایی
خب، برنده کی بود؟
بهترین مدل ترکیبی بود! مدل CNN + Random Forest تونست 85.4 درصد دقت بیاره که از مدل سفارشی CNN خیلی بیشتره (اونی 74.3 درصد آورده بود). از مدلهای آماده هم، VGG16 نتیجه بهتر داد (82.3 درصد دقت)، بعدش Xception و ResNet50 بودن.
این یعنی چی؟
یعنی ترکیب قدرت یه شبکه عصبی که خوب بلده تصویر رو تجزیه کنه، با مدلهای سنتی که تو دستهبندی قویان، میتونه حسابی کمک کنه که مشکل دندونو دقیقتر تشخیص بدیم. مخصوصاً وقتی دو تا مشکل خیلی شبیه هم نشون میدن (مثلاً بعضی پرکردگیها و پوسیدگیها ظاهرشون نزدیکه)، این مدلها بهتر تفاوتشون رو درک میکنن.
اما یه نکته؛ هنوزم باید دادههای بیشتری جمع بشه و روی بیماران واقعی توی کلینیکها امتحان بشه تا مطمئن شیم این سیستمها تو دنیای واقعی هم همینقدر قوی میمونن.
در کل، این تحقیق نشون داد اگر شبکههای عصبی رو با مدلهای دستهبندی سنتی (مثل Random Forest) ترکیب کنیم، یه راه عملی و خوب داریم که هوش مصنوعی جاش رو تو تشخیص دندونپزشکی باز کنه؛ فقط باید بیشتر تمرین کنه و تست بشه!
منبع: +