چطور هوش مصنوعی با عکس‌برداری دندون‌ها حال دندونامون رو چک می‌کنه!

حتماً براتون پیش اومده که رفتین دندون‌پزشکی و ازتون عکس پانورامیک گرفتن؛ همون عکس‌هایی که کل دندونا رو با هم نشون میده. حالا محقق‌ها اومدن و با کمک هوش مصنوعی (یا همون AI)، دارن سعی می‌کنن با همین عکس‌ها بفهمن هر دندونی چه مشکلی داره. توی این مقاله یک تحقیق جدید رو بررسی می‌کنیم که کلی نکته جالب داره!

چه داده‌هایی داشتن؟
توی این تحقیق، یه مجموعه داده داشتن که شامل 1512 تا عکس پانورامیک دندون بود (همون عکس‌هایی که تو کلینیک‌ها می‌گیرن)، کلی هم متخصص نشستن روی این عکس‌ها و 11137 تا توضیح دقیق روی این دندون‌ها گذاشتن؛ مثلاً گفتن این دندون پر شده (filling)، این یکی پوسیده (cavity)، یکی ایمپلنت داره (implant) و یه سری هم دندون عقل نهفته (impacted tooth) بوده. یعنی همه چی رو با دقت دسته‌بندی کردن.

چطوری مدل‌ها رو ساختن؟
برای اینکه بفهمن هوش مصنوعی اصلاً می‌تونه این موارد رو با عکس تشخیص بده یا نه، چند مدل مختلف رو امتحان کردن:

مدل سفارشی شبکه عصبی کانولوشنی یا CNN:
یعنی یه مدل اختصاصی با نورون‌های کانولوشنی درست کردن (CNN یه مدل پرکاربرد برای کار با عکس و تصویر هست که می‌تونه ویژگی‌های مهم رو از تصویر بکشه بیرون).
مدل ترکیبی (Hybrid یا دو مرحله‌ای):
تو این روش اول با CNN یه سری ویژگی کلیدی از عکس می‌کشن بیرون، بعد این ویژگی‌ها رو میدن به یه مدل سنتی‌تر مثل Random Forest (که یه الگوریتم دسته‌بندی معروفه بر پایه درخت تصمیم و نظر جمعی یا همون Ensemble).
استفاده از مدل‌های از قبل آموزش‌دیده شده یا Pre-trained مثل VGG16، Xception، ResNet50:
یعنی مدل‌هایی که قبلاً کلی عکس دیده و آموزش دیدن و حالا فقط لازم بود برای دندون تنظیمش کنن (به این کار میگن Fine-tuning).

آزمون و خطا با دقت بالا
برای اینکه خیالشون راحت باشه، اومدن هر کدوم از این مدل‌ها رو 5 بار با داده‌های متفاوت امتحان کردن (این روش رو می‌گن 5-fold cross-validation، یعنی هر سری یه بخش از داده‌ها میره تست، بقیه میشه آموزش، تا نتیجه نهایی کلی باشه و به یه بخش خاص وابسته نباشه).

چه فاکتورهایی رو در نظر گرفتن؟
چهار تا معیار مهم رو چک کردن:

دقت (Accuracy): این که مدل تو مجموع چند درصد درست میگه
صحت یا دقت مثبت (Precision): از بین چیزهایی که گفته مشکل دارن، چند تاش واقعاً درست بوده
فراخوانی (Recall): از بین همه مواردِ واقعیِ بیمار، چند تاشو درست شناخته
F1 Score: ترکیب دوتای بالایی برای یه عدد نهایی

خب، برنده کی بود؟
بهترین مدل ترکیبی بود! مدل CNN + Random Forest تونست 85.4 درصد دقت بیاره که از مدل سفارشی CNN خیلی بیشتره (اونی 74.3 درصد آورده بود). از مدل‌های آماده هم، VGG16 نتیجه بهتر داد (82.3 درصد دقت)، بعدش Xception و ResNet50 بودن.

این یعنی چی؟
یعنی ترکیب قدرت یه شبکه عصبی که خوب بلده تصویر رو تجزیه کنه، با مدل‌های سنتی که تو دسته‌بندی قوی‌ان، می‌تونه حسابی کمک کنه که مشکل دندونو دقیق‌تر تشخیص بدیم. مخصوصاً وقتی دو تا مشکل خیلی شبیه هم نشون میدن (مثلاً بعضی پرکردگی‌ها و پوسیدگی‌ها ظاهرشون نزدیکه)، این مدل‌ها بهتر تفاوت‌شون رو درک می‌کنن.

اما یه نکته؛ هنوزم باید داده‌های بیشتری جمع بشه و روی بیماران واقعی توی کلینیک‌ها امتحان بشه تا مطمئن شیم این سیستم‌ها تو دنیای واقعی هم همین‌قدر قوی می‌مونن.

در کل، این تحقیق نشون داد اگر شبکه‌های عصبی رو با مدل‌های دسته‌بندی سنتی (مثل Random Forest) ترکیب کنیم، یه راه عملی و خوب داریم که هوش مصنوعی جاش رو تو تشخیص دندون‌پزشکی باز کنه؛ فقط باید بیشتر تمرین کنه و تست بشه!

منبع: +