حتماً تا حالا اسم بیماری آلزایمر به گوشتون خورده، همون بیماری که حافظه رو دچار اختلال میکنه. توی تحقیقات آلزایمر، دانشمندان همیشه دنبال راههایی هستن که بتونن اطلاعات مهم مثل دادههای پزشکی، عکسبرداری مغزی، اطلاعات ژنتیکی و مقدار مواد خاصی که توی خون هست رو با همدیگه به اشتراک بذارن تا بتونن بهتر بفهمن و درمان کنن. اما یدونه مشکل عمده دارن: حفظ حریم خصوصی آدمها!
یه راهحل نسبتاً جدید اومده به اسم “یادگیری فدرهای” یا Federated Learning (FL). این روش یه جورایی باحاله و اینطوری کار میکنه که بدون اینکه اطلاعات شخصی بیماران جایی کپی بشه یا لو بره، آزمایشگاهها و مراکز درمانی میتونن با هم روی مدلهای یادگیری ماشین کار کنن و از اطلاعات هم استفاده کنن.
حالا توی یه مطالعه جالب تو مرکز آلزایمر بارسلونا، اومدن از صدای بیماران – بله، دقیقاً صدای ضبط شدهشون – واسه تشخیص اینکه آیا مشکل حافظه دارن یا نه استفاده کردن! فکر کن، فقط با یه چند دقیقه صحبت کردن میتونن سرنخهایی از سلامت مغز به دست بیارن.
سوال اصلی این تحقیق این بود که وقتی دادهها متفاوت و پخش باشن (مثلاً بعضیا داده کم دارن، بعضیا زیاد یا نسبت کسانی که مشکل دارن به کسانی که ندارن فرق کنه)، آیا این روش یادگیری فدرهای هنوز فایده داره یا نه. سه سناریوی مختلف رو بررسی کردن:
- همه جا دادهها و نسبت کلاسها (یعنی کسانی که سالم هستن یا اختلال دارن) یکسان باشه.
- یه جا داده خیلی کم باشه و یه جا داده زیاد؛ یعنی مشارکت برابر نباشه.
- نسبت افراد با اختلال و بدون اختلال تو مراکز درمانی مختلف متعادل یا نامتعادل باشه.
تو هر کدوم از این حالتها، به کمک دادههای صوتی و مدل شبکه عصبی (که به انگلیسی بهش میگن MLP feed-forward neural network، یعنی یه مدل هوشمند تقلبی که با دادههای ورودی آموزش میبینه)، عملکرد مدل رو بررسی کردن. بعد مدلهای کوچیک و محلی هر مرکز رو با روشی معروف به Federated Averaging (یا FedAvg) و همینطور Iterative Data Aggregation (IDA یعنی جمع و تفریق و آپدیت مدلها به صورت تکراری و هماهنگ) تلفیق کردن تا یه مدل جهانی بسازن.
حالا بیاین یکم وارد دیتای اصلی کار بشیم. توی این تحقیق 2239 نفر شرکت داشتن. از این تعداد، 221 نفر بدون اختلال حافظه بودن (میانگین سن تقریباً 67 سال و اکثراً خانم بودن)، بقیه یعنی 2018 نفر اختلال داشتن که خودشون دو دسته میشدن: 1219 نفر با اختلال خفیف شناختی (میانگین سنی 74.3 سال) و 799 نفر با آلزایمر خفیف (میانگین سنشون حدود 81 سال بود!).
نتیجه چی شد؟
تو سناریو 1 و 3 که دادهها تقریباً متعادل یا مشابه بودن، یادگیری فدرهای کمی تونست دقت پیشبینی مدل رو بهتر کنه، ولی نه خیلی زیاد. اما تو سناریو 2 که یک مرکز داده کم داشت و اون یکی زیاد، یادگیری فدرهای واقعاً گل کاشت! دقت دسته کوچکتر از 0.51 (که تقریباً همون حدس زدن تصادفیه!) رسید به 0.80 (تقریباً عالیه)، و دقت دسته بزرگتر همچنان خوب موند (0.86). این یعنی این روش میتونه مشکل نابرابری داده بین مراکز رو حل کنه و برای همه منصفانه باشه.
تهش چی؟
این تحقیق نشون داد یادگیری فدرهای میتونه کمک کنه مراکز مختلف بدون اینکه اطلاعات شخصی رو جابجا کنن یا افشای حریم خصوصی پیش بیاد، با هم همکاری کنن و مدلهای هوشمندی بسازن که از روی صدای افراد، مشکلات شناختی مثل آلزایمر رو تشخیص بدن. این کار یه آینده روشن برای پزشکی دیجیتال و تشخیص زودهنگام اختلالات مغزی نشون میده و نشون داده که این روش نه تنها جواب میده، بلکه در برابر مشکلات نابرابری داده و تعداد مریضها هم مقاوم و مقیاسپذیره (یعنی هرچی داده و مرکز بیشتر بشه، باز هم کار میکنه).
در نهایت، یادمون نره: یادگیری فدرهای یعنی همکاری بدون خطر افشای اطلاعات شخصی، و این واقعاً برای دنیای دیجیتال امروز، یه برگ برنده است!
منبع: +