هوش مصنوعی و شناسایی سریع مننژیت: ماجرای یادگیری ماشین تو سائو پائولو!

ببین، داستان مننژیت همیشه جدیه! این بیماری باعث التهاب تو غشاهایی میشه که مغز و نخاع رو پوشوندن و خیلی وقتا عاملش باکتریه که شدیدترین نوعشه. چون آمار مرگ و میر و عوارضش خیلی بالاست، آدم‌ها دنبال راه‌حل‌های سریع و دقیق برای شناسایی این بیماری می‌گردن. حالا یه تیم از بچه‌های باحال برزیلی تو ایالت سائو پائولو اومدن سراغ هوش مصنوعی، که به انگلیسی بهش میگن Machine Learning یا ML. این همون الگوریتم‌هایی هستن که با تحلیل داده‌ها، یه چیزی رو یاد می‌گیرن و بعد پیش‌بینی یا دسته‌بندی می‌کنن.

توی این پروژه، گروه محققین داده‌هاشونو از یک دیتابیس خیلی بزرگ به نام SINAN گرفتن؛ این بانک اطلاعاتیه برای کنترل و گزارش بیماری‌ها تو برزیل. یعنی اطلاعات مریض‌ها، علایمشون، شرایط اجتماعیشون و خلاصه حتی آزمایش مایع نخاعیشون رو جمع کردن (CSF Analysis، یعنی بررسی همون کمی مایعی که برای تشخیص بیماریای مغز و نخاع می‌گیرن).

بعد بخش جالبش اینه: بچه‌ها اومدن ۵ مدل مختلف ML رو امتحان کردن که اسم‌هاشون شاید برات عجیب باشه، اما هر کدوم یه سبک یادگیری خاص دارن:

Random Forest
LightGBM
XGBoost
CatBoost
AdaBoost

این اسم‌ها رو زیاد میشنوی: همه‌شون مدل‌های ML هستن که با ترکیب کلی درخت تصمیم می‌تونن چیزارو خیلی دقیق پیش‌بینی کنن. مثلاً XGBoost و LightGBM و CatBoost، مدل‌هایی هستن که تو رقابت‌های جهانی هم حسابی محبوبن، چون دقتشون خیلی بالاست.

هدفشون این بوده که بفهمن میشه با این مدل‌ها بفهمن مننژیت مریض باکتریاییه، قارچی، ویروسی یا کلاً یه نوع دیگه‌ست. حتی جزئی‌تر، بتونن بگن مثلاً اگه باکتریاییه، عاملش Neisseria meningitidis (مننژیتیس نایسریا)، Streptococcus pneumoniae (استرپتوکوک پنومونیه) یا Haemophilus influenzae (هموفیلوس آنفولانزا) هست یا نه.

برای اینکه ببینن کدوم مدل بهتره، از یه سری معیار علمی استفاده کردن:

دقت (Precision)
فراخوانی یا حساسیت (Recall)
F1-score (یه میانگینی بین دقت و حساسیت)
AUC-ROC (یه شاخص خیلی مهم برای اندازه گیری قدرت تشخیص مدل)
MCC (یک معیار دیگه که مخصوص سنجش دسته‌بندی‌های دقیق و دقیق‌تره)

نتیجه‌ها خیلی باحال بود! مدل CatBoost تونست AUC-ROC معادل 0.95 رو برای دسته‌بندی دوگانه (یعنی باکتریایی یا غیر باکتریایی) بیاره که فوق‌العاده‌ست. تو حالت چندگانه (سه باکتری معروف بالا)، نمره 0.85 رو زد که بازم خیلی خوبه. دوتای دیگه یعنی XGBoost و LightGBM هم نتیجه‌های نزدیکی داشتن: اولی 0.94 و دومی 0.92.

از نظر حساسیت و ویژگی (sensitivity و specificity)، CatBoost خیلی خوب بود، یعنی احتمال اینکه مریض واقعاً مننژیت باکتریایی داشته باشه رو به‌درستی شناسایی می‌کرد.

یک تکنیک جالب دیگه که استفاده کردن SHAP بود—این یه ابزار برای فهیمدن اینه که مدل اصلاً به چه فاکتورهایی اهمیت داده تا تشخیص بده. مثلاً تعداد لکوسیت‌ها (سلول‌های سفید) تو آزمایش CSF و وجود پتشی (Petechiae یعنی لکه‌های قرمز زیر پوست، نشون‌دهنده عفونت شدید)، خیلی تو پیش‌بینی مدل تاثیر داشتن. این یعنی وقتی این علائم هست، مدل احتمال قویتری میده که مننژیت باکتریاییه.

حالا چرا کل این قضیه مهمه؟ چون با این مدل‌ها و هوش مصنوعی میشه تو سیستم سلامتی عمومی کارها رو خیلی سریع‌تر کرد! اگه یه موج جدید مننژیت بیاد، یا مریضی با علایم مشکوک ظاهر بشه، AI می‌تونه کمک کنه سریع‌تر نوعش رو بفهمن و درمان درست رو شروع کنن. تازه حتی میشه سیستم رو تو پروتکل‌های سلامتی گذاشت که جلوی شیوع بیماری رو هم بگیرن.

در کل می‌خوام بگم، هوش مصنوعی (همون ML و مدل‌های پیشرفته‌ش مثل CatBoost, XGBoost و LightGBM) نشون دادن که می‌تونن تو تشخیص مننژیت یا حتی بخش‌بندی بین تیپ‌های مختلفش یه ابزار فوق‌العاده باشن. مخصوصاً جاهایی که بیمارستانا ممکنه منابع و وقت کافی نداشته باشن. خلاصه، اگه کسی فکر می‌کرد هوش مصنوعی فقط به‌درد عکس گرفتن با فیلتر می‌خوره، باید بدونه که تو پزشکی هم غوغا کرده!

منبع: +