تا حالا شده برای بچهات وقت عکسبرداری پزشکی رزرو کنی (مثلاً MRI یا سونوگرافی) و بعد یا طرف نیاد، یا کلی منتظر بمونی؟ خب، این مشکل تو خیلی از بیمارستانها هست. یه تیم تو بیمارستان SickKids توی تورنتو اومدن یه راه خیلی باحال پیدا کنن تا بفهمن کدوم مریضها احتمال داره نیان (یعنی همون No-show که بهش غیبت بدون خبر میگن)، یا کدوما قرار کلی منتظر بمونن (بیشتر از یه ساعت!).
اون چیزی که اینجا جذابش میکنه، استفاده از مدلهای مختلف یادگیری ماشین (Machine learning یعنی سیستمهایی که میتونن از کلی اطلاعات، خودشون یاد بگیرن و پیشبینی کنن) برای حل این مسئلهست. تیم تحقیقاتی با سه تا نوع مختلف عکسبرداری سر و کار داشتن: تشخیصی، مداخلهای و یکی دیگه مخصوص بچهها. هدفشون چی بوده؟ این بوده که یه سیستمی بسازن که بشه قبل از روز عکسبرداری، بفهمن کیا ممکنه نیان یا دیر بیان، تا بهتر بتونن زمانبندی کنن و مریضها رو کمتر معطل کنن.
برای این کار شیش مدل مختلف رو تست کردن:
- XGBoost (یه مدل فوقالعاده قوی برای کار با دادههایی که ویژگیهای زیاد یا پیچیده دارن)
- Random Forest یا RF (یعنی یه جنگل از درختهای تصمیمگیرنده، کلی درخت که با هم تصمیم میگیرن پیشبینی بدن)
- Support Vector Machine (یه مدل شستهرفته برای پیشبینی دستهبندی)
- Logistic Regression (مدلی که احتمال وقوع یه اتفاق رو پیشبینی میکنه)
- Artificial Neural Network (یعنی شبکه عصبی مصنوعی، مدلی که دنبال یادگیری مثل مغز انسان طراحی شده)
- LLM یا Large Language Model که همون مدل زبونی بزرگه و مثلاً هوش مصنوعیهایی مثل ChatGPT همشون جزو این گروهان. این مدل میتونه با متن و دادههای مختلف خیلی خوب کار کنه.
برای آموزش این مدلها، از ۲۰ تا ویژگی مختلف استفاده کردن. ویژگیها ترکیبی از اطلاعات دمدستی مثل سن و جنسیت مریض بوده تا چیزایی که مربوط به عکسبرداری بوده. تازه، اومدن چند تا روش برای متعادل کردن دادهها پیادهسازی کردن، مثل وزندهی به کلاسها یا Instance Hardness Threshold (IHT) که یعنی به مدل کمک کنی تا دادههای سختتر رو بهتر یاد بگیره و پیشبینی کنه.
حالا نتایج چی شد؟ بهترین مدل برای اینکه بفهمه کی قرار نیاد، مدل XGBoost بود. این مدل امتیاز AUC (مقیاس خوبی برای اینکه مدل چقدر دقیق پیشبینی میکنه، عددش هر چی به ۱ نزدیکتر باشه بهتره) برابر با 0.96، و امتیاز F1 (یه مقیاس برای تعادل دقت و بازخوانی) برابر 0.62 رو گرفت. برای پیشبینی اینکه کی دیر میرسه، مدل Random Forest بهترین نتیجه رو داد، با AUC برابر 0.83 و F1 برابر 0.61. گزارش کردن که LLM یا همون مدل زبانی هم با اطمینان ۹۰ درصد برای پیشبینی مریضهای ریسکی (یعنی اونایی که احتمال زیادی داره نیان یا دیر بیان)، خیلی خوب جواب داده، حتی وقتی روی دادههای جدید امتحانش کردن.
یه نکته خیلی مهم که فهمیدن این بود که اطلاعات مربوط به خود قرار عکسبرداری (مثلاً روز و ساعت و نوع عکسبرداری)، مهمتر از اطلاعات جمعیتی مریضها بوده! یعنی مثلاً اینکه کی چه ساعتی عکسبرداری داره، تاثیر بیشتری رو پیشبینی داشته نسبت به اینکه بچه چند سالشه یا پسر یا دختره.
در آخر، تیم تحقیقاتی گفتن میشه خروجی این مدلها (یعنی اون احتمالی که برای هر مریض حساب میکنن که آیا قرار نیاد یا منتظر بمونه) رو بدن به تیم زمانبندی بیمارستان تا بتونن یک برنامه زمانبندی انعطافپذیرتر و منصفانهتر درست کنن. اینطوری هر کسی شانس بیشتری داره تا همونموقعی که نیاز داره، به خدمات پزشکی برسه.
خلاصه اینکه، این ترکیب یادگیری ماشین و هوش مصنوعی داره به عالم پزشکی هم کمک میکنه تا کمتر اعصاب خوردی داشته باشیم، وقت کمتری تلف بشه و بچهها درمان بهتری بگیرن!
منبع: +