تا حالا شده فکر کنین اگه به جای کلی وقت و هزینه برای انجام آزمایشهای بالینی کلاسیک روی آدمهای مختلف، یه مدل هوشمند باشه که بتونه همه این کارارو تو دنیای مجازی انجام بده چی؟ مثلاً همین آزمایشهای RCT یا همون آزمایشهای بالینی تصادفی – یه استاندارد طلایی برای بررسی اثر داروها هستن، اما همیشه محدود به یه مشت آدم با شرایط خاص میشن و یه عالمه از آدمهای واقعی که تو دنیای بیرون هن رو نمیپوشونن.
حالا تیمی از محققین یه روش خفن و جدید درست کردن که با کمک هوش مصنوعی مولد (مثلاً Generative AI یعنی همون هوش مصنوعیای که میتونه خودش دیتا و اطلاعات تولید کنه، شبیه یه نویسندهی ماهر یا نقاش حرفهای) و یادگیری علّی (Causal Learning، یعنی اینکه مدل بتونه از رابطه علت و معلول سر دربیاره) تونستن یه مدل بسازن که شبیهسازی مجازی آزمایش بالینی انجام میده. خلاصه، این مدل میتونه دادههای واقعی آدمها رو بگیره، آدمای جدید و مجازی (Virtual Patients) بسازه و روشون تاثیر درمان رو پیشبینی کنه.
برای تست این ایدهشون، سراغ یه داروی خیلی پرطرفدار برای دیابت نوع ۲ رفتن: همون گروه GLP-1 agonists (یعنی یه دسته دارویی که کارشون کمک به تنظیم قند خون و هورمون گلوکاگون هست) – اینجا لیرگلوتاید (Liraglutide) بود. داروی دوم هم انسولین پایه یا glargine و سومین گزینه هم پلاسبو (Placebo، همون دارونما که واقعاً دارو نیست و فقط برای کنترل آزمایشه).
حالا نکته جالب این بود که اومدن مدلشون رو با نتایج یه آزمایش واقعی به اسم LEAD-5 مقایسه کردن (یه تحقیق بزرگ روی تاثیر GLP-1 روی دیابت نوع ۲). کل دیتای آموزشیشون اطلاعات درمان قبل و بعد از ۵۴۷۶ نفر با دیابت نوع ۲ بود که نتایج واقعیشون ثبت شده بود. بعد، به سبک همون آزمایش LEAD-5 با معیارهاش، از هر گروه درمانی ۲۳۲ بیمار مجازی نمونه گرفتن و بعدش خروجی مدل رو دیدن.
اینجا بحث جالبِ Difference-in-Differences (یا همون تفاوت در تفاوتها، که یه روش آماری برای مقایسه تاثیر دو تا درمان مختلف روی یه ویژگی خاص مثل HbA1c هستش) مطرح میشه. اونا با این روش بررسی کردن کاهش HbA1c یعنی همون قند خون سهماهه که نشون میده وضعیت کنترل دیابت چطور بوده.
حالا نتایج چی شد؟ معلوم شد که در بیماران مجازی، تاثیر درمان با GLP-1 نسبت به انسولین پایه برابر با ۱.۲۱ میلیمول کمتر در هر مول (یا ۰.۱۱ درصد کمتر) بود و نسبت به پلاسبو حتی بهتر (۲.۵۸ میلیمول کمتر یا ۰.۲۴ درصد). جالب اینجاست که این اعداد خیلی نزدیک همون چیزیه که توی آزمایش واقعی LEAD-5 در اومده بود (مثلاً لیرگلوتاید نسبت به گلارژین ۲.۶۲ میلیمول کمتر و نسبت به پلاسبو ۱۱.۹۱ میلیمول کمتر!). یعنی مدل هوش مصنوعی حتی تونسته تاثیر دارو رو درست شبیهسازی کنه. سطح معنیداری آماریش هم خیلی خوب بوده (p کمتر از ۰.۰۰۱ یعنی بعیده این تفاوت اتفاقی باشه).
نتیجه؟ این مدل میتونه آزمایشهای بالینی رو توی دنیای مجازی دوبارهسازی کنه و حتی روی کلیتی از جمعیت (نه فقط آدمای محدود توی RCTها) تست کنه که واقعاً داروها چه جوری اثر میکنن. تازه الگوریتم عملاً محدود به تخصص خاصی نیست (Specialty agnostic یعنی برای هر رشته پزشکی جواب میده) و حتی میتونه به سوالات فرضی جواب بده (مثلاً اگه به آدمایی که توی آزمایش اصلی نبودن دارو رو بدیم چی میشه)، و پایه خوبی میشه برای تصمیمگیریهای پزشکی و حتی سیاستگزاریها!
در کل داره نشون میده که آیندهی تحقیقات پزشکی و آزمایشهای بالینی خیلی ممکنه به دنیای مجازی و هوش مصنوعی کشیده بشه و این یعنی شاید دیگه لازم نباشه کلی آدم واقعی رو هر سری وارد آزمایش کنیم و سریعتر و امنتر بتونیم بفهمیم کدوم دارو واقعا اثر داره – اونم تو جمعیت وسیعتر.
منبع: +