بیا با هم یکم صمیمی راجعبه یه موضوع جدی صحبت کنیم: تشخیص زودهنگام سرطان تخمدان (همون OC). خب همه میدونیم کشف این بیماری تو مراحل اولیه همیشه یه چالش بزرگه، اما این روزها اسم هوش مصنوعی (AI) همهجا شنیده میشه و کسی نیست که ازش انتظار معجزه نداشته باشه! تازه یه عالمه تحقیق کردن که ببینن واقعا هوش مصنوعی تو تشخیص تودههای تخمدان با سونوگرافی (یعنی همین عکسبرداری سادهای که با امواج صوتی انجام میشه) چقدر خوب عمل میکنه.
این مقاله اومده همه تحقیقاتی که تا آخر سال ۲۰۲۴ درباره استفاده از AI تو تشخیص تودههای تخمدان با سونوگرافی B-mode (یعنی همون سونوگرافی معمولی سیاهسفید) انجام شده رو زیر و رو کرده. اینجور مقالات که بهشون میگن مرور سیستماتیک و متا-آنالیز (یعنی جمعبندی کلی از همه تحقیقات)، چندتا کار کردن: اولا هر مطالعهای که با هوش مصنوعی و سونوگرافی توده تخمدان کار کرده و درباره دقت و معیارهای فنی مثل sensitivity (حساسیت، یعنی چقدر خوب موارد واقعی بیماری رو پیدا میکنه)، specificity (اختصاصیت، یعنی چقدر موارد غیر بیماری رو رد میکنه) و AUC (یه درصد کلی از عملکرد مدل) توضیح داده، انتخاب کردن. اونم از بین ۸۲۳ مقاله!
در نهایت ۴۴ مقاله به درد بخور رو برداشتن که با هم روی بیشتر از ۶۵۰ هزار تا تصویر کار کرده بودن. بذار خلاصه بفهمی چی دراومده: با هم جمعزدن، میشه گفت که مدلهای هوش مصنوعی تونستن با دقت تقریباً ۹۲.۳٪، حساسیت ۹۱.۶٪، اختصاصیت ۹۰.۱٪ و AUC برابر ۰.۹۳ عمل کنن.
یه نکته خیلی جالب اینه که روشهایی که خودشون به صورت اتوماتیک segmentation کردن (یعنی خودشون بریدن و بخش مورد نظر عکس رو مشخص کردن) نسبت به روشهایی که آدمها دستی این کار رو انجام میدادن، عملکرد بسیار بهتری داشتن. این یعنی وقتی هوش مصنوعی خودش کار رو انجام میده، خطای انسان کمتر میشه و نتایج هم قابل اعتمادتر.
برعکس چیزی که فکر میکنی، اندازه دیتاست (تعداد تصاویری که به مدل داده شده) خیلی ربطی به بهتر شدن دقت نداشته! یعنی بیشتر از اینکه مدل، دیتای زیاد بخوره، اینکه چقدر خوب و اصولی آموزش دیده و ارزیابی شده اهمیت داشته. حالا جالبه بدونی که هیچ معماری خاصی از هوش مصنوعی (یعنی نوع مدلهای مختلف مثل CNN و غیره – حالا کارشون رو راحت بگم: مدلهایی که هرکدوم روش یادگیری متفاوت دارن) اونقدر سرتر از بقیه نبوده. همه مدلها تقریباً شبیه هم بودن.
البته یه جاهایی هنوز ایراد هست: خیلی از این مقالهها مشکل روایی و اعتبارسنجی دارن (مثلاً با دیتای کم یا شرایط کنترل نشده مدل رو آزمایش کردن یا تو بیمارستانهای محدود)، بعضیهاشون اطلاعات کامل نمیدن یا خیلی پراکنده هستن. برای همین هنوز نمیشه بلافاصله این مدلها رو با خیال راحت وارد کار روزمره بیمارستانها کنیم.
برای اینکه واقعاً مدلهای هوش مصنوعی بیان وارد عملیات واقعی پزشکی بشن، چندتا توصیه خیلی مهم تو این مقاله شده. باید اعتبارسنجیهای سختگیرانهتر انجام بدن، گزارشها رو مطابق استانداردهای بینالمللی مثل TRIPOD-AI و STARD-AI که راهنمای شفافیت و گزارشدهی برای AI تو پزشکی هستن، تنظیم کنن و حتما آزمایش هاشون رو تو بیمارستانهای مختلف و دنیای واقعی هم پیاده کنن تا مطمئن بشن مدلها همهجا خوب جواب میدن.
در مجموع اگه خیلی خلاصه بخوام بگم: هوش مصنوعی تو تشخیص سرطان تخمدان با سونوگرافی واقعاً امیدبخشه و نتایجش تا اینجاش عالی بوده، اما برای اینکه به طور رسمی بشه روش حساب کرد و به دکترها معرفیاش کرد، باید هنوز کلی روش کار انجام بشه. پس فعلاً گوشی دستمون باشه، ولی منتظر خبرهای خیلی خوب در آینده نزدیک باشیم!
منبع: +