یه نگاه خودمونی به دسته‌بندی نوین پارکینسون با درخت تصمیم: کشف زیرگروه‌های جدید با دیتای بنیاد مایکل جی فاکس!

خب بچه‌ها، امروز می‌خوام یه موضوع جالب رو براتون تعریف کنم که درباره‌ی یه بیماریه نسبتاً معروف یعنی پارکینسون (Parkinson’s Disease یا به اختصار PD) و یه رویکرد خلاقانه واسه شناخت بهتر انواع مختلفش. اگه نمی‌دونین پارکینسون چیه: این بیماری یه اختلال عصبیه که باعث میشه حرکت کردن برای آدم سخت بشه و علائمش تو هر کسی می‌تونه متفاوت باشه. یعنی هم سرعت پیشروی بیماری فرق داره، هم واکنش به درمان و حتی علت ژنتیکی اون!

یکی از دغدغه‌های مهم دانشمندها اینه که چطور بیماران پارکینسون رو دسته‌بندی کنن تا بهتر بفهمن تو بدن هر کسی چی داره می‌گذره و بعدش بتونن درمان مناسب رو پیشنهاد بدن. معمولاً واسه این کار از “تحلیل خوشه‌ای” یا Cluster Analysis استفاده می‌شه (یعنی داده‌ها رو بر اساس شباهتشون گروه‌بندی می‌کنن). اما این روش چند تا مشکل جدی داره: اول اینکه دسته‌بندی‌ها خیلی وابسته به نوع مطالعه و دیتایی هست که جمع می‌کنیم، دوم این‌که قوانینی که برای دسته‌بندی تولید می‌شن خیلی واضح و قابل توضیح نیستن و سوم اینکه اگه همین کار رو با دیتای جدید انجام بدیم، معمولاً نتیجه‌ها یکی نیست و به سختی می‌شه بهش اعتماد کرد!

حالا این مقاله‌ای که دارم براتون خلاصه می‌کنم می‌گه: بیا یه جور دیگه به ماجرا نگاه کنیم! نویسنده‌ها گفتن بیاین سمت درخت تصمیم یا Decision Tree (یه روش معروف یادگیری ماشینی که مثل یک بازی بیست سوالی با پرسیدن سؤال‌های ساده، دسته‌بندی انجام می‌ده و نتیجه‌ش رو هم راحت می‌تونی ببینی و توضیح بدی). واسه شروع، تیم تحقیق یک مدل درخت تصمیم رو با استفاده از دیتای LRRK2 از بنیاد مایکل جی فاکس (که یک دیتاست خیلی معتبر از بیماران پارکینسونه) آموزش دادن. هدفشون این بود که مشخص کنن هر بیمار جزو گروه با شروع زودهنگام (early onset) یا دیرهنگام (late onset) پارکینسونه.

وقتی مدل رو ساختن، اومدن از پایین‌ترین شاخه‌های درخت یا همون برگ‌ها، قوانین دسته‌بندی رو درآوردن. به این روش می‌گن “backtracing” یعنی مسیر برگشت از برگ به ریشه برای استخراج قواعد.

برای اینکه مطمئن بشن روششون فقط توی یک دیتاست جواب نمی‌ده، رفتن سراغ یک دیتاست مستقل دیگه به اسم MDS و ویژگی‌ها رو یکسان‌سازی کردن تا بشه داده‌ها رو مقایسه کرد. بعدش دیدن که واقعاً دسته‌بندی‌هاشون قابل تکرار و اعتباردهی هست.

در نهایت، تونستن شش نوع جدید از زیرگروه‌های پارکینسون رو شناسایی کنن که هم از نظر کلینیکی معقوله، هم تعداد بیماران تو هر گروه قابل توجهه و هم توی هر دو دیتاست اصلی و اعتبارسنجی تکرار می‌شه.

حالا جالب‌ترین قسمت این بود که از لحاظ ویژگی‌های پزشکی دیدن موارد زیر برای این شش زیرگروه خیلی مهم و تعیین‌کننده هستن:
۱. “عدم تقارن مداوم در علائم” (یعنی یک سمت بدن بیشتر تحت تأثیر قرار می‌گیره و این حالت ادامه‌داره)،
۲. “طول مدت بیماری ۱۰ سال یا بیشتر”،
۳. “بی‌ثباتی بدن به خاطر پارکینسون” (یعنی مثلاً کسی مشکل تعادل داره ولی این بی‌ثباتی دلیل دیگه‌ای نداره).

این شش تا زیرگروه کمک می‌کنن بفهمیم کدوم بیمار چه مسیری رو ممکنه دنبال کنه و چه درمانی براش بهتره. مثلا یکی از این گروه‌ها به اسم E4 مخصوص پارکینسون‌های با شروع زودهنگامه و پیش‌آگهی بهتر و طول عمر بیشتری براش متصورن. در عوض، زیرگروه‌هایی مثل M3 و M7 که شروع ترکیبی دارن (mixed onset یعنی نه خیلی زود و نه خیلی دیر)، معمولاً سریع‌تر قدرت عملکردشون رو از دست می‌دن و شاید لازم باشه پزشک‌ها براشون مراقبت ویژه‌تر و حمایت بیشتری در نظر بگیرن.

تو گروه‌های با شروع دیرتر (late onset) هم مثلاً گروه L1 وضعیت آروم‌تری داره، اما دوتای دیگه (L2 و L4) بیشتر با نشونه‌هایی از کاهش کیفیت زندگی و نیاز به مراقبت ویژه همراه بودن.

در کل، این مدل جدید مبتنی بر درخت تصمیم کمک می‌کنه دسته‌بندی‌های پارکینسون خیلی بهتر و قابل فهم‌تر باشه و می‌شه ازش برای برنامه‌ریزی درمان‌های شخصی‌سازی شده و حتی پیش‌بینی آینده بیماری استفاده کرد!

پس خلاصه اینکه دانشمندها دارن تلاش می‌کنن با ابزارهای جدید و دیتای ناب، یه دید خفن‌تر به دنیای پیچیده پارکینسون بدن و بیمارا رو امیدوارتر کنن!

منبع: +