ببین، دیگه امروزه موضوع سلامت روان و مشکلات ذهنی یا همون Cognitive and Mental Health (CMH) خیلی جدیتر از قبل شده. مخصوصاً وقتی حرف از خودکشی وسط میاد که دلایلش معمولاً مربوط به رقابتهای اجتماعی، فشار اقتصادی و حتی روابط انسانی بین جوونها و میانسالهاست. خیلیا مثل من و تو اینجور مسائلو تو دلشون نگه نمیدارن و ترجیح میدن تو شبکههای اجتماعی بیانش کنن. واسه همین، این فضا شده محل اصلی برای ابراز احساسات و حتی درخواست کمک.
حالا خبر خوب چیه؟ یه تیم حسابی اومده یه دیتاست گنده درست کرده به اسم RSD-15K. دیتاست یعنی مجموعه دادهها، اینجا منظورش ۱۵ هزار تا پست متنی از کاربرا تو شبکههای اجتماعیه. قضیه خیلی باحاله چون برعکس خیلی از دیتاستهای قبلی، تو این یکی هر کاربر با همه پستها و ترتیب زمانیشون ثبت شده. یعنی میشه دنبال کرد که آدمها به مرور زمان چه طوری درباره خودشون و احساساتشون نوشتن و اصلاً این ریسک رو چجوری میشه ازش فهمید.
یه نکته مهم اینه که این تیم تخصصی کل پستها رو با نهایت دقت و ریزبینی برچسبگذاری (annotate) کردن. Annotate یعنی هر پست رو بررسی کردن و فهمیدن که آیا نشونهای از ریسک خودکشی توش هست یا نه و تو چه سطحیه. این کار باعث شده دیتاستشون هم خیلی علمی و هم قابل اعتماد باشه.
برای اینکه معلوم کنن دیتاستشون واقعاً به درد خودکشییابی میخوره یا نه، تیم آزمایشهای مختلفی انجام داده. مدلهای یادگیری ماشین کلاسیک (همون machine learning سنتی)، مدلهای یادگیری عمیق (deep learning یعنی شبکههای عصبی پیشرفته که خودشون میتونن الگو کشف کنن) و حتی مدلهای زبانی خیلی بزرگ و تر و تمیز مثل GPT رو تست کردن. نتیجه چی شد؟ دیتاست RSD-15K حسابی کمک کرده که این مدلها بتونن خودکار ریسک خودکشی رو پیدا کنن و کلی از بقیه دیتاستها بهتر بودن.
یه وجه مهم ماجرا هم حفظ حریم خصوصی و توصیههای اخلاقی بود. یعنی چی؟ یعنی چون دادهها خیلی حساس و مهمن و بحث سلامت روان وسطه، کلی فکر و دقت گذاشتن که دادهها سو استفاده نشه یا اطلاعات شخصی کاربرا لو نره. Ethical use یعنی استفاده درست و با وجدان از دیتاستها.
ولی کار اینجا تموم نشد. این دیتاست فقط به درد تحقیق تو حوزه سلامت روان نمیخوره؛ میشه به کلی جاهای دیگه هم کمک کرد. مثلاً تستهای سلامت روان آنلاین، کمک به دکترهای روانپزشکی تو درمان و حتی کمک به ساخت ابزارهای جدید که بتونن آدمهایی که در معرض خودکشی هستن رو سریعتر پیدا کنن. آخرش هم یه سری پیشنهاد و مسیر جدید برای محققای آینده دادن که این دیتاست چجوری میتونه به کارشون بیاد.
تهش بخوام جمعبندی کنم: اگه علاقهمند به موضوعات هوش مصنوعی، سلامت روان یا دیتا ساینس هستی، RSD-15K یه گنج واقعیه. نه فقط واسه دیجیتالگردها، بلکه برای هرکسی که دنبال کمک به سلامت جامعهست. به قول خودمون: دمشون گرم که همچین کار بزرگی رو انجام دادن!
منبع: +