دیتاست RSD-15K: یه گنجینه بزرگ برای شناسایی ریسک خودکشی تو شبکه‌های اجتماعی!

Fall Back

ببین، دیگه امروزه موضوع سلامت روان و مشکلات ذهنی یا همون Cognitive and Mental Health (CMH) خیلی جدی‌تر از قبل شده. مخصوصاً وقتی حرف از خودکشی وسط میاد که دلایلش معمولاً مربوط به رقابت‌های اجتماعی، فشار اقتصادی و حتی روابط انسانی بین جوون‌ها و میانسال‌هاست. خیلیا مثل من و تو اینجور مسائلو تو دلشون نگه نمی‌دارن و ترجیح میدن تو شبکه‌های اجتماعی بیانش کنن. واسه همین، این فضا شده محل اصلی برای ابراز احساسات و حتی درخواست کمک.

حالا خبر خوب چیه؟ یه تیم حسابی اومده یه دیتاست گنده درست کرده به اسم RSD-15K. دیتاست یعنی مجموعه داده‌ها، اینجا منظورش ۱۵ هزار تا پست متنی از کاربرا تو شبکه‌های اجتماعیه. قضیه خیلی باحاله چون برعکس خیلی از دیتاست‌های قبلی، تو این یکی هر کاربر با همه پست‌ها و ترتیب زمانی‌شون ثبت شده. یعنی میشه دنبال کرد که آدم‌ها به مرور زمان چه طوری درباره خودشون و احساساتشون نوشتن و اصلاً این ریسک رو چجوری میشه ازش فهمید.

یه نکته مهم اینه که این تیم تخصصی کل پست‌ها رو با نهایت دقت و ریزبینی برچسب‌گذاری (annotate) کردن. Annotate یعنی هر پست رو بررسی کردن و فهمیدن که آیا نشونه‌ای از ریسک خودکشی توش هست یا نه و تو چه سطحیه. این کار باعث شده دیتاستشون هم خیلی علمی و هم قابل اعتماد باشه.

برای اینکه معلوم کنن دیتاستشون واقعاً به درد خودکشی‌یابی می‌خوره یا نه، تیم آزمایش‌های مختلفی انجام داده. مدل‌های یادگیری ماشین کلاسیک (همون machine learning سنتی)، مدل‌های یادگیری عمیق (deep learning یعنی شبکه‌های عصبی پیشرفته که خودشون می‌تونن الگو کشف کنن) و حتی مدل‌های زبانی خیلی بزرگ و تر و تمیز مثل GPT رو تست کردن. نتیجه چی شد؟ دیتاست RSD-15K حسابی کمک کرده که این مدل‌ها بتونن خودکار ریسک خودکشی رو پیدا کنن و کلی از بقیه دیتاست‌ها بهتر بودن.

یه وجه مهم ماجرا هم حفظ حریم خصوصی و توصیه‌های اخلاقی بود. یعنی چی؟ یعنی چون داده‌ها خیلی حساس و مهمن و بحث سلامت روان وسطه، کلی فکر و دقت گذاشتن که داده‌ها سو استفاده نشه یا اطلاعات شخصی کاربرا لو نره. Ethical use یعنی استفاده درست و با وجدان از دیتاست‌ها.

ولی کار اینجا تموم نشد. این دیتاست فقط به درد تحقیق تو حوزه سلامت روان نمی‌خوره؛ میشه به کلی جاهای دیگه هم کمک کرد. مثلاً تست‌های سلامت روان آنلاین، کمک به دکترهای روانپزشکی تو درمان و حتی کمک به ساخت ابزارهای جدید که بتونن آدم‌هایی که در معرض خودکشی هستن رو سریع‌تر پیدا کنن. آخرش هم یه سری پیشنهاد و مسیر جدید برای محققای آینده دادن که این دیتاست چجوری می‌تونه به کارشون بیاد.

تهش بخوام جمع‌بندی کنم: اگه علاقه‌مند به موضوعات هوش مصنوعی، سلامت روان یا دیتا ساینس هستی، RSD-15K یه گنج واقعیه. نه فقط واسه دیجیتال‌گردها، بلکه برای هرکسی که دنبال کمک به سلامت جامعه‌ست. به قول خودمون: دمشون گرم که همچین کار بزرگی رو انجام دادن!

منبع: +