چطوری با هوش مصنوعی میشه فهمید بچه‌ها سر وقت عکسبرداری میان یا نه؟ (و تا کی باید منتظر بمونن!)

تا حالا شده برای بچه‌ات وقت عکسبرداری پزشکی رزرو کنی (مثلاً MRI یا سونوگرافی) و بعد یا طرف نیاد، یا کلی منتظر بمونی؟ خب، این مشکل تو خیلی از بیمارستان‌ها هست. یه تیم تو بیمارستان SickKids توی تورنتو اومدن یه راه خیلی باحال پیدا کنن تا بفهمن کدوم مریض‌ها احتمال داره نیان (یعنی همون No-show که بهش غیبت بدون خبر می‌گن)، یا کدوما قرار کلی منتظر بمونن (بیشتر از یه ساعت!).

اون چیزی که اینجا جذابش می‌کنه، استفاده از مدل‌های مختلف یادگیری ماشین (Machine learning یعنی سیستم‌هایی که می‌تونن از کلی اطلاعات، خودشون یاد بگیرن و پیش‌بینی کنن) برای حل این مسئله‌ست. تیم تحقیقاتی با سه تا نوع مختلف عکسبرداری سر و کار داشتن: تشخیصی، مداخله‌ای و یکی دیگه مخصوص بچه‌ها. هدفشون چی بوده؟ این بوده که یه سیستمی بسازن که بشه قبل از روز عکسبرداری، بفهمن کیا ممکنه نیان یا دیر بیان، تا بهتر بتونن زمان‌بندی کنن و مریض‌ها رو کمتر معطل کنن.

برای این کار شیش مدل مختلف رو تست کردن:

  1. XGBoost (یه مدل فوق‌العاده قوی برای کار با داده‌هایی که ویژگی‌های زیاد یا پیچیده دارن)
  2. Random Forest یا RF (یعنی یه جنگل از درخت‌های تصمیم‌گیرنده، کلی درخت که با هم تصمیم می‌گیرن پیش‌بینی بدن)
  3. Support Vector Machine (یه مدل شسته‌رفته برای پیش‌بینی دسته‌بندی)
  4. Logistic Regression (مدلی که احتمال وقوع یه اتفاق رو پیش‌بینی می‌کنه)
  5. Artificial Neural Network (یعنی شبکه عصبی مصنوعی، مدلی که دنبال یادگیری مثل مغز انسان طراحی شده)
  6. LLM یا Large Language Model که همون مدل زبونی بزرگه و مثلاً هوش مصنوعی‌هایی مثل ChatGPT همشون جزو این گروه‌ان. این مدل می‌تونه با متن و داده‌های مختلف خیلی خوب کار کنه.

برای آموزش این مدل‌ها، از ۲۰ تا ویژگی مختلف استفاده کردن. ویژگی‌ها ترکیبی از اطلاعات دم‌دستی مثل سن و جنسیت مریض بوده تا چیزایی که مربوط به عکسبرداری بوده. تازه، اومدن چند تا روش برای متعادل‌ کردن داده‌ها پیاده‌سازی کردن، مثل وزن‌دهی به کلاس‌ها یا Instance Hardness Threshold (IHT) که یعنی به مدل کمک کنی تا داده‌های سخت‌تر رو بهتر یاد بگیره و پیش‌بینی کنه.

حالا نتایج چی شد؟ بهترین مدل برای اینکه بفهمه کی قرار نیاد، مدل XGBoost بود. این مدل امتیاز AUC (مقیاس خوبی برای اینکه مدل چقدر دقیق پیش‌بینی می‌کنه، عددش هر چی به ۱ نزدیک‌تر باشه بهتره) برابر با 0.96، و امتیاز F1 (یه مقیاس برای تعادل دقت و بازخوانی) برابر 0.62 رو گرفت. برای پیش‌بینی این‌که کی دیر می‌رسه، مدل Random Forest بهترین نتیجه رو داد، با AUC برابر 0.83 و F1 برابر 0.61. گزارش کردن که LLM یا همون مدل زبانی هم با اطمینان ۹۰ درصد برای پیش‌بینی مریض‌های ریسکی (یعنی اونایی که احتمال زیادی داره نیان یا دیر بیان)، خیلی خوب جواب داده، حتی وقتی روی داده‌های جدید امتحانش کردن.

یه نکته خیلی مهم که فهمیدن این بود که اطلاعات مربوط به خود قرار عکسبرداری (مثلاً روز و ساعت و نوع عکسبرداری)، مهم‌تر از اطلاعات جمعیتی مریض‌ها بوده! یعنی مثلاً اینکه کی چه ساعتی عکسبرداری داره، تاثیر بیشتری رو پیش‌بینی داشته نسبت به اینکه بچه چند سالشه یا پسر یا دختره.

در آخر، تیم تحقیقاتی گفتن میشه خروجی این مدل‌ها (یعنی اون احتمالی که برای هر مریض حساب می‌کنن که آیا قرار نیاد یا منتظر بمونه) رو بدن به تیم زمان‌بندی بیمارستان تا بتونن یک برنامه زمان‌بندی انعطاف‌پذیرتر و منصفانه‌تر درست کنن. اینطوری هر کسی شانس بیشتری داره تا همون‌موقعی که نیاز داره، به خدمات پزشکی برسه.

خلاصه اینکه، این ترکیب یادگیری ماشین و هوش مصنوعی داره به عالم پزشکی هم کمک می‌کنه تا کمتر اعصاب خوردی داشته باشیم، وقت کمتری تلف بشه و بچه‌ها درمان بهتری بگیرن!

منبع: +