خب بچهها بیاید درباره یه موضوع خیلی جالب حرف بزنیم: صرع لوب گیجگاهی یا همون Temporal Lobe Epilepsy (TLE). این یه جور اختلال عصبیه که دلیلش خیلی پیچیده و بیشترش هم ژنتیکی هست. یعنی ژنهامون حسابی توی این ماجرا نقش دارن!
حالا تصور کن یه گروه پژوهشی اومدن با دادههای RNA-seq و Microarray که تقریبا همه چیز درباره فعالیت ژنها توی مغز رو نشون میده (این یعنی کلی اطلاعات دقیق درباره اینکه کدوم ژنها فعالن و چطوری کار میکنن)، یه مدل باحال و قابل فهم برای تشخیص این بیماری ساختن. دادههاشون رو هم از هشت تا دیتاست معروف به اسم GEO جمع کردن که توش ۲۸۷ نمونه بوده.
خب، حالا بریم سر اصل ماجرا! این پژوهشگرها انواع و اقسام الگوریتمهای یادگیری ماشین رو امتحان کردن؛ از DNN (یعنی Deep Neural Network که هوش مصنوعی خیلی حرفهایه و میتونه ساختارهای پیچیده رو بشناسه)، گرفته تا XGBoost (که برای مسائل طبقهبندی و رگرسیون فوقالعاده کاربردیه)، Random Forest (یه روش جنگلی برای دستهبندی و پیشبینی)، Logistic Regression (برای پیشبینی بله یا نه) و KNN (کوتاهشده K-Nearest Neighbors؛ یعنی همسایههای نزدیک رو نگاه میکنه و تصمیم میگیره).
نتیجه؟ مدل DNN که با ۱۰ تا ویژگی ژنتیکی بهینه شده بود، تونست بینقص بیماری رو تشخیص بده. یعنی چی؟ یعنی معیار AUC (این یه شاخص برای سنجش دقت مدلهای تشخیصی هست و هر چی به ۱ نزدیکتر باشه بهتره)، و دقت نهایی هر دوشون کاملاً ۱ بودن! میشه گفت عالی.
ولی صبر کن! یکی از مشکلهای هوش مصنوعی اینه که گاهی شبیه یه جعبه سیاه میشه: دقیق کار میکنه اما دلیل تصمیمش رو نمیفهمیم. اینجا گروه اومدن از تکنیک SHAP استفاده کردن (Shapley Additive exPlanations؛ یعنی روشی برای فهمیدن اینکه هر ویژگی چقدر توی تصمیم مدل نقش داره). این طوری معلوم شد که ژنهای DEPDC5، STXBP1، GABRG2، SLC2A1 و LGI1 بیشترین نقش رو توی پیدایش صرع لوب گیجگاهی دارن. به زبان سادهتر، این ژنها خیلی توی ماجرای این بیماری دخیل هستن.
یه اتفاق جذاب دیگه این بوده که مدل KAN رو به کار گرفتن (Kolmogorov-Arnold Networks؛ که یه روش پیشرفته برای کشف رابطههای غیرخطی پیچیده است و حتی میتونه فرمول ریاضی ارائه بده!). این کار کمک کرد بفهمیم ارتباط این ژنها با صرع فقط یه رابطه ساده نیست و توش کلی پیچیدگی ریاضی نهفته است.
حالا چطوری پزشکها میتونن از این مدلها استفاده کنن؟ خیلی راحت: اونها یه پلتفرم آنلاین ساختن که با وارد کردن مقدار فعالیت ژنها، پیشبینی مدل رو با توضیح میده؛ یعنی پزشک میفهمه چی به چی شد و چرا این نتیجه ارائه شده.
در نهایت، این مطالعه کمک میکنه خیلی بهتر منشأ ژنتیکی صرع لوب گیجگاهی رو بفهمیم و با کنار هم گذاشتن این مدل هوش مصنوعی و روشهای تشخیصی سنتی، میشه تشخیص بیماری رو دقیقتر و مطمئنتر کرد. مثل یه ابزار کمکی باحال که کار پزشکها رو راحتتر میکنه و ممکنه کلی زندگی رو تغییر بده!
منبع: +