خب بچهها، بیاید یه موضوع جذاب رو زیر ذرهبین بذاریم که خیلی تخصصیه ولی میخوام آسون و عامیونه براتون بازش کنم! موضوع درباره پیشبینی اینه که آیا یه داروی خاص (مثل Glucocorticoid، که نوعی داروی ضدالتهابیه و توی درمان سرطان هم دست داره) میتونه با یه ژن خاص توی سرطان سلول سنگفرشی دهان یا همون OSCC ارتباط داشته باشه یا نه.
حالا کل ماجرا رو با دو مدل هوش مصنوعی جدید مقایسه کردن: Graph Attention Networks یا همون GAT (که یه مدل عصبی تو شبکههای گرافیه و میتونه متوجه بشه هر قسمت گراف چقدر مهمه؛ یعنی ارتباطات مهم رو خودش تشخیص میده)، و GraphSAGE (این یکی هم یه مدل گرافیه اما از رو همسایههای هر گره کلی اطلاعات جمع میکنه تا پیشبینی رو بهتر کنه).
دانشمندان برای این کار، یه دیتاست مخصوص جمع کردن — یعنی کلی اطلاعات داشتن که فلان دارو با فلان ژن تعامل داره یا نه و کلی پروفایل مولکولی هم کنارش گذاشتن (پروفایل مولکولی یعنی کلی اطلاعات علمی درباره ژنها و داروها). بعد اومدن با هر دو مدل GraphSAGE و GAT این اطلاعات رو تحلیل کردن تا بفهمن کدوم میتونه بهتر این رابطههای دارو-ژن رو توی سرطان پیشبینی کنه.
برای اینکه دقیق قضاوت کنن، کلی معیار مختلف استفاده کردن: دقت یا Accuracy (یعنی چند درصد جوابها درست بود)، Precision (چقدر پیشبینیهای درست بین کل جوابهای مدل وجود داره)، Recall (چقدر از کل جوابهای درست واقعی رو مدل پیدا کرده)، و F1-score (یه عدد که تعادل Precision و Recall رو نشون میده، خلاصهاش اینکه بالا باشه یعنی مدل تعادل خوبی داره).
توی دیتای اونها، کل شبکه ۱۷۴ تا گره داشته (گره اینجا مثلا یه ژن یا یه دارو هست)، و ۴۰۹ تا لبه (لبه به ارتباط بین گرهها میگن)، که ساختار خلوت و اتصالش متوسط بوده. مقدار همبستگی بین گرهها هم پایین بوده، یعنی ارتباطات متنوع و خیلی متمرکز نبوده — مثلاً همه نمیان با همه دوست شن! یه نکته بامزه هم اینکه شبکه کامل متصل بوده و کلی سریعم محاسبات انجام شده، یعنی کار با سرعت خوبی پیش رفته.
اما اصل بحث اینه: کدوم مدل قویتره؟ توی نتایج، GraphSAGE توی دقت (Accuracy) یه ذره جلوتر بوده (۰.۹۴۹ در برابر ۰.۹۴۷) و F1 کل (بهش میگن Macro F1) هم بهتر عمل کرده (۰.۲۷۵ نسبت به ۰.۱۹۵). حتی مقدار AUC-ROC هم بالاتر بوده براش (۰.۷۸۰ در برابر ۰.۵۱۴ — AUC-ROC یه معیار باحاله برای اینکه بفهمیم مدل چقدر خوب میتونه نمونههای مثبت و منفی رو درست جدا کنه). این یعنی GraphSAGE بین Precision و Recall توازن بهتری داره و معمولاً اگه دنبال یه مدل مطمئن باشیم، میتونیم روی اون حساب باز کنیم.
ولی این وسط نتایج نشون دادن که هر دو مدل واقعا خوب عمل کردن و تونستن ارتباط دارو و ژن رو توی سرطان دهان پیشبینی کنن. جالب اینجاست که با اینکه GraphSAGE عملکرد کلی بهتری نشون داده، اما GAT توی پیدا کردن دقیقتر ارتباطات مربوط به همین داروی Glucocorticoid توی سرطان دهان (همون OSCC)، تونسته Accuracy و F1-score بالاتری بگیره. یعنی اگه فقط این دارو برامون مهم باشه، ممکنه GAT رو بیشتر دوست داشته باشیم!
ته ماجرا چی شد؟ این تحقیقات نشون داد این مدلهای گرافی خیلی برای رمزگشایی از رابطه داروها و ژنها توی سرطان دهان مفید هستن. مخصوصاً GAT یعنی شبکه توجه گرافی، برای پیشبینی اینکه کدوم دارو با کدوم ژن همکاری میکنه، حسابی امیدوارکننده بوده و شاید فرداها درمانها کاملاً شخصیسازی بشن. تازه، قراره تو تحقیقات آینده هم این مدلها قویتر و پیشرفتهتر بشن و حتی داروهای جدید دیگهای هم وارد این بازی بشن تا ببینن مدلها چقدر میتونن به درمان بهتر سرطان دهان کمک کنن.
خلاصهش اینکه این مدلها دارن مسیر درمان سرطان رو روزبهروز دقیقتر و شخصیتر میکنن؛ هرچی جلوتر بریم، پیشبینیها و درمانها هم هوشمندتر میشن!
منبع: +