نبرد شبکه‌های گرافی برای پیش‌بینی دارو و ژن توی سرطان دهان: کدوم بهتره، GAT یا GraphSAGE؟

خب بچه‌ها، بیاید یه موضوع جذاب رو زیر ذره‌بین بذاریم که خیلی تخصصیه ولی می‌خوام آسون و عامیونه براتون بازش کنم! موضوع درباره پیش‌بینی اینه که آیا یه داروی خاص (مثل Glucocorticoid، که نوعی داروی ضدالتهابیه و توی درمان سرطان هم دست داره) می‌تونه با یه ژن خاص توی سرطان سلول سنگفرشی دهان یا همون OSCC ارتباط داشته باشه یا نه.

حالا کل ماجرا رو با دو مدل هوش مصنوعی جدید مقایسه کردن: Graph Attention Networks یا همون GAT (که یه مدل عصبی تو شبکه‌های گرافیه و می‌تونه متوجه بشه هر قسمت گراف چقدر مهمه؛ یعنی ارتباطات مهم رو خودش تشخیص می‌ده)، و GraphSAGE (این یکی هم یه مدل گرافیه اما از رو همسایه‌های هر گره کلی اطلاعات جمع می‌کنه تا پیش‌بینی رو بهتر کنه).

دانشمندان برای این کار، یه دیتاست مخصوص جمع کردن — یعنی کلی اطلاعات داشتن که فلان دارو با فلان ژن تعامل داره یا نه و کلی پروفایل مولکولی هم کنارش گذاشتن (پروفایل مولکولی یعنی کلی اطلاعات علمی درباره ژن‌ها و داروها). بعد اومدن با هر دو مدل GraphSAGE و GAT این اطلاعات رو تحلیل کردن تا بفهمن کدوم می‌تونه بهتر این رابطه‌های دارو-ژن رو توی سرطان پیش‌بینی کنه.

برای اینکه دقیق قضاوت کنن، کلی معیار مختلف استفاده کردن: دقت یا Accuracy (یعنی چند درصد جواب‌ها درست بود)، Precision (چقدر پیش‌بینی‌های درست بین کل جواب‌های مدل وجود داره)، Recall (چقدر از کل جواب‌های درست واقعی رو مدل پیدا کرده)، و F1-score (یه عدد که تعادل Precision و Recall رو نشون می‌ده، خلاصه‌اش اینکه بالا باشه یعنی مدل تعادل خوبی داره).

توی دیتای اونها، کل شبکه ۱۷۴ تا گره داشته (گره اینجا مثلا یه ژن یا یه دارو هست)، و ۴۰۹ تا لبه (لبه به ارتباط بین گره‌ها می‌گن)، که ساختار خلوت و اتصالش متوسط بوده. مقدار همبستگی بین گره‌ها هم پایین بوده، یعنی ارتباطات متنوع و خیلی متمرکز نبوده — مثلاً همه نمیان با همه دوست شن! یه نکته بامزه هم اینکه شبکه کامل متصل بوده و کلی سریعم محاسبات انجام شده، یعنی کار با سرعت خوبی پیش رفته.

اما اصل بحث اینه: کدوم مدل قوی‌تره؟ توی نتایج، GraphSAGE توی دقت (Accuracy) یه ذره جلوتر بوده (۰.۹۴۹ در برابر ۰.۹۴۷) و F1 کل (بهش می‌گن Macro F1) هم بهتر عمل کرده (۰.۲۷۵ نسبت به ۰.۱۹۵). حتی مقدار AUC-ROC هم بالاتر بوده براش (۰.۷۸۰ در برابر ۰.۵۱۴ — AUC-ROC یه معیار باحاله برای اینکه بفهمیم مدل چقدر خوب می‌تونه نمونه‌های مثبت و منفی رو درست جدا کنه). این یعنی GraphSAGE بین Precision و Recall توازن بهتری داره و معمولاً اگه دنبال یه مدل مطمئن باشیم، می‌تونیم روی اون حساب باز کنیم.

ولی این وسط نتایج نشون دادن که هر دو مدل واقعا خوب عمل کردن و تونستن ارتباط دارو و ژن رو توی سرطان دهان پیش‌بینی کنن. جالب اینجاست که با اینکه GraphSAGE عملکرد کلی بهتری نشون داده، اما GAT توی پیدا کردن دقیق‌تر ارتباطات مربوط به همین داروی Glucocorticoid توی سرطان دهان (همون OSCC)، تونسته Accuracy و F1-score بالاتری بگیره. یعنی اگه فقط این دارو برامون مهم باشه، ممکنه GAT رو بیشتر دوست داشته باشیم!

ته ماجرا چی شد؟ این تحقیقات نشون داد این مدل‌های گرافی خیلی برای رمزگشایی از رابطه داروها و ژن‌ها توی سرطان دهان مفید هستن. مخصوصاً GAT یعنی شبکه‌ توجه گرافی، برای پیش‌بینی اینکه کدوم دارو با کدوم ژن همکاری می‌کنه، حسابی امیدوارکننده بوده و شاید فرداها درمان‌ها کاملاً شخصی‌سازی بشن. تازه، قراره تو تحقیقات آینده هم این مدل‌ها قوی‌تر و پیشرفته‌تر بشن و حتی داروهای جدید دیگه‌ای هم وارد این بازی بشن تا ببینن مدل‌ها چقدر می‌تونن به درمان بهتر سرطان دهان کمک کنن.

خلاصه‌ش اینکه این مدل‌ها دارن مسیر درمان سرطان رو روزبه‌روز دقیق‌تر و شخصی‌تر می‌کنن؛ هرچی جلوتر بریم، پیش‌بینی‌ها و درمان‌ها هم هوشمندتر می‌شن!
منبع: +