ربات باهوش برای تست جمله‌نویسی: راهی تازه برای سنجش افسردگی!

ببین، همیشه توی روانشناسی وقتی می‌خوان غربالگری وسیع انجام بدن، کلی چالش دارن. مثلاً معمولاً از پرسش‌نامه‌های خودسنجی استفاده میشه، اما مشکل بزرگش اینه که خیلی از آدم‌ها ممکنه جوابا رو جور دیگه بزنن، چون یا می‌خوان خودشون رو بهتر نشون بدن یا اصلاً دوست ندارن حقیقت رو بگن (که به این میگن سوگیری مطلوبیت اجتماعی یا فریب پاسخ). حالا این وسط یه تست هست به اسم Sentence Completion Test یا همون SCT؛ یعنی آزمون کامل کردن جمله. این روش یه تکنیک فرافکنانه‌ست، یعنی می‌خوان با استفاده از پر کردن جمله‌های ناقص، به احساسات و افکار واقعی طرف پی ببرن، مخصوصاً جاهایی که خودش هم شاید دقیقاً ندونه چی تو سرشه!

اما مشکل این SCT چیه؟ خب، یه نمره‌دهی دستی و گرون داره، یعنی باید متخصص حقیقی بشینه جوابا رو بخونه و نمره بده، که هم سخته هم گرون درمیاد. اینجا وارد داستان هوش مصنوعی میشیم! تو این تحقیق، اومدن آزمون SCT رو با پیشرفتای جدید در Large Language Models یا همون مدل‌های زبانی بزرگ ترکیب کردن؛ مدل‌هایی مثل GPT که می‌تونن متن بسازن و معنی رو بفهمن. پس مثلاً اومدن یه عامل هوشمند ساختن که بتونه خودش جواب بچه‌ها رو تحلیل کنه و افسردگی رو تشخیص بده.

چی‌کار کردن دقیقاً؟ اومدن یه مجموعه مخصوص از آیتم‌های SCT درست کردن برای دانشجوهای چینی تا افسردگی‌شون رو سنجش کنن. این کار رو هم مرحله به مرحله، تو سه تا مطالعه عملی انجام دادن. نتیجه‌ش چی بود؟ این عامل هوشمند کلی قابل اعتماد بود. مثلاً ضریب آلفای کرونباخ بین ۰.۸۹ تا ۰.۹۲ بوده (این یعنی نمره‌دهی جوابا خیلی بهم نزدیک و شبیه بودن؛ نشونه اعتبار خوب تست). نتیجه‌هاش تقریباً ۹۶٪ با داوری‌های دستی تطبیق داشته (یعنی ضریب همبستگی r معادل ۰.۹۶). حتی اگر با تست معروف Beck Depression Inventory که یکی از بهترین تست‌های افسردگیه مقایسه کنیم، ضریبش ۰.۸۹ بوده. با Self-Rating Depression Scale هم ۰.۸۵ بوده، که هر دومورد عالی هستن.

یه بخش باحال دیگه این بود که این عامل هوشمند حسابی جواب‌های غلط یا نامعتبر رو هم می‌تونست تشخیص بده. مثلاً دقت (Precision) و صحت کلی (Accuracy) هر دو ۰.۹۹ بوده، حتی Recall هم به ۰.۹۰ رسیده و F1 Score معادل ۰.۹۴ بوده (یعنی خیلی خیلی خوب می‌تونه پاسخ‌های تقلبی رو پیدا کنه). ضمن اینکه اعتبار ساختاری این سیستم هم با تحلیل عاملی کشف‌گر (Exploratory Factor Analysis) تایید شده؛ تحلیل عاملی کشف‌گر یعنی آماری که می‌ره می‌گرده ببینه آیا سوال‌ها واقعاً دارن همون چیزی رو می‌سنجن که باید یا نه.

در کل، این تحقیق یه گام بزرگه تو هوشمندسازی تست‌های روانشناسی، مخصوصاً SCT. این کار می‌تونه مسیر تازه‌ای باشه، هم برای پژوهشای آکادمیک و هم تو عمل. دیگه لازم نیست برای سنجش افسردگی کلی روانشناس و هزینه صرف بشه، یه ربات باهوش می‌تونه بخشی از کار رو دقیق و سریع انجام بده. خلاصه که هوش مصنوعی واقعاً داره روش‌های کلاسیک روانشناسی رو متحول می‌کنه!

منبع: +