تشخیص مشکلات حافظه با همکاری و حفظ حریم خصوصی: یادگیری فدره‌ای و صدای ما!

حتماً تا حالا اسم بیماری آلزایمر به گوشتون خورده، همون بیماری که حافظه رو دچار اختلال می‌کنه. توی تحقیقات آلزایمر، دانشمندان همیشه دنبال راه‌هایی هستن که بتونن اطلاعات مهم مثل داده‌های پزشکی، عکسبرداری مغزی، اطلاعات ژنتیکی و مقدار مواد خاصی که توی خون هست رو با همدیگه به اشتراک بذارن تا بتونن بهتر بفهمن و درمان کنن. اما یدونه مشکل عمده دارن: حفظ حریم خصوصی آدم‌ها!

یه راه‌حل نسبتاً جدید اومده به اسم “یادگیری فدره‌ای” یا Federated Learning (FL). این روش یه جورایی باحاله و اینطوری کار می‌کنه که بدون اینکه اطلاعات شخصی بیماران جایی کپی بشه یا لو بره، آزمایشگاه‌ها و مراکز درمانی می‌تونن با هم روی مدل‌های یادگیری ماشین کار کنن و از اطلاعات هم استفاده کنن.

حالا توی یه مطالعه جالب تو مرکز آلزایمر بارسلونا، اومدن از صدای بیماران – بله، دقیقاً صدای ضبط شده‌شون – واسه تشخیص اینکه آیا مشکل حافظه دارن یا نه استفاده کردن! فکر کن، فقط با یه چند دقیقه صحبت کردن می‌تونن سرنخ‌هایی از سلامت مغز به دست بیارن.

سوال اصلی این تحقیق این بود که وقتی داده‌ها متفاوت و پخش باشن (مثلاً بعضیا داده کم دارن، بعضیا زیاد یا نسبت کسانی که مشکل دارن به کسانی که ندارن فرق کنه)، آیا این روش یادگیری فدره‌ای هنوز فایده داره یا نه. سه سناریوی مختلف رو بررسی کردن:

همه جا داده‌ها و نسبت کلاس‌ها (یعنی کسانی که سالم هستن یا اختلال دارن) یکسان باشه.
یه جا داده خیلی کم باشه و یه جا داده زیاد؛ یعنی مشارکت برابر نباشه.
نسبت افراد با اختلال و بدون اختلال تو مراکز درمانی مختلف متعادل یا نامتعادل باشه.

تو هر کدوم از این حالت‌ها، به کمک داده‌های صوتی و مدل شبکه عصبی (که به انگلیسی بهش میگن MLP feed-forward neural network، یعنی یه مدل هوشمند تقلبی که با داده‌های ورودی آموزش می‌بینه)، عملکرد مدل رو بررسی کردن. بعد مدل‌های کوچیک و محلی هر مرکز رو با روشی معروف به Federated Averaging (یا FedAvg) و همینطور Iterative Data Aggregation (IDA یعنی جمع و تفریق و آپدیت مدل‌ها به صورت تکراری و هماهنگ) تلفیق کردن تا یه مدل جهانی بسازن.

حالا بیاین یکم وارد دیتای اصلی کار بشیم. توی این تحقیق 2239 نفر شرکت داشتن. از این تعداد، 221 نفر بدون اختلال حافظه بودن (میانگین سن تقریباً 67 سال و اکثراً خانم بودن)، بقیه یعنی 2018 نفر اختلال داشتن که خودشون دو دسته می‌شدن: 1219 نفر با اختلال خفیف شناختی (میانگین سنی 74.3 سال) و 799 نفر با آلزایمر خفیف (میانگین سنشون حدود 81 سال بود!).

نتیجه چی شد؟
تو سناریو 1 و 3 که داده‌ها تقریباً متعادل یا مشابه بودن، یادگیری فدره‌ای کمی تونست دقت پیش‌بینی مدل رو بهتر کنه، ولی نه خیلی زیاد. اما تو سناریو 2 که یک مرکز داده کم داشت و اون یکی زیاد، یادگیری فدره‌ای واقعاً گل کاشت! دقت دسته کوچک‌تر از 0.51 (که تقریباً همون حدس زدن تصادفیه!) رسید به 0.80 (تقریباً عالیه)، و دقت دسته بزرگ‌تر همچنان خوب موند (0.86). این یعنی این روش می‌تونه مشکل نابرابری داده بین مراکز رو حل کنه و برای همه منصفانه باشه.

تهش چی؟
این تحقیق نشون داد یادگیری فدره‌ای می‌تونه کمک کنه مراکز مختلف بدون اینکه اطلاعات شخصی رو جابجا کنن یا افشای حریم خصوصی پیش بیاد، با هم همکاری کنن و مدل‌های هوشمندی بسازن که از روی صدای افراد، مشکلات شناختی مثل آلزایمر رو تشخیص بدن. این کار یه آینده روشن برای پزشکی دیجیتال و تشخیص زودهنگام اختلالات مغزی نشون می‌ده و نشون داده که این روش نه تنها جواب می‌ده، بلکه در برابر مشکلات نابرابری داده و تعداد مریض‌ها هم مقاوم و مقیاس‌پذیره (یعنی هرچی داده و مرکز بیشتر بشه، باز هم کار می‌کنه).

در نهایت، یادمون نره: یادگیری فدره‌ای یعنی همکاری بدون خطر افشای اطلاعات شخصی، و این واقعاً برای دنیای دیجیتال امروز، یه برگ برنده است!

منبع: +