ببین، همیشه توی روانشناسی وقتی میخوان غربالگری وسیع انجام بدن، کلی چالش دارن. مثلاً معمولاً از پرسشنامههای خودسنجی استفاده میشه، اما مشکل بزرگش اینه که خیلی از آدمها ممکنه جوابا رو جور دیگه بزنن، چون یا میخوان خودشون رو بهتر نشون بدن یا اصلاً دوست ندارن حقیقت رو بگن (که به این میگن سوگیری مطلوبیت اجتماعی یا فریب پاسخ). حالا این وسط یه تست هست به اسم Sentence Completion Test یا همون SCT؛ یعنی آزمون کامل کردن جمله. این روش یه تکنیک فرافکنانهست، یعنی میخوان با استفاده از پر کردن جملههای ناقص، به احساسات و افکار واقعی طرف پی ببرن، مخصوصاً جاهایی که خودش هم شاید دقیقاً ندونه چی تو سرشه!
اما مشکل این SCT چیه؟ خب، یه نمرهدهی دستی و گرون داره، یعنی باید متخصص حقیقی بشینه جوابا رو بخونه و نمره بده، که هم سخته هم گرون درمیاد. اینجا وارد داستان هوش مصنوعی میشیم! تو این تحقیق، اومدن آزمون SCT رو با پیشرفتای جدید در Large Language Models یا همون مدلهای زبانی بزرگ ترکیب کردن؛ مدلهایی مثل GPT که میتونن متن بسازن و معنی رو بفهمن. پس مثلاً اومدن یه عامل هوشمند ساختن که بتونه خودش جواب بچهها رو تحلیل کنه و افسردگی رو تشخیص بده.
چیکار کردن دقیقاً؟ اومدن یه مجموعه مخصوص از آیتمهای SCT درست کردن برای دانشجوهای چینی تا افسردگیشون رو سنجش کنن. این کار رو هم مرحله به مرحله، تو سه تا مطالعه عملی انجام دادن. نتیجهش چی بود؟ این عامل هوشمند کلی قابل اعتماد بود. مثلاً ضریب آلفای کرونباخ بین ۰.۸۹ تا ۰.۹۲ بوده (این یعنی نمرهدهی جوابا خیلی بهم نزدیک و شبیه بودن؛ نشونه اعتبار خوب تست). نتیجههاش تقریباً ۹۶٪ با داوریهای دستی تطبیق داشته (یعنی ضریب همبستگی r معادل ۰.۹۶). حتی اگر با تست معروف Beck Depression Inventory که یکی از بهترین تستهای افسردگیه مقایسه کنیم، ضریبش ۰.۸۹ بوده. با Self-Rating Depression Scale هم ۰.۸۵ بوده، که هر دومورد عالی هستن.
یه بخش باحال دیگه این بود که این عامل هوشمند حسابی جوابهای غلط یا نامعتبر رو هم میتونست تشخیص بده. مثلاً دقت (Precision) و صحت کلی (Accuracy) هر دو ۰.۹۹ بوده، حتی Recall هم به ۰.۹۰ رسیده و F1 Score معادل ۰.۹۴ بوده (یعنی خیلی خیلی خوب میتونه پاسخهای تقلبی رو پیدا کنه). ضمن اینکه اعتبار ساختاری این سیستم هم با تحلیل عاملی کشفگر (Exploratory Factor Analysis) تایید شده؛ تحلیل عاملی کشفگر یعنی آماری که میره میگرده ببینه آیا سوالها واقعاً دارن همون چیزی رو میسنجن که باید یا نه.
در کل، این تحقیق یه گام بزرگه تو هوشمندسازی تستهای روانشناسی، مخصوصاً SCT. این کار میتونه مسیر تازهای باشه، هم برای پژوهشای آکادمیک و هم تو عمل. دیگه لازم نیست برای سنجش افسردگی کلی روانشناس و هزینه صرف بشه، یه ربات باهوش میتونه بخشی از کار رو دقیق و سریع انجام بده. خلاصه که هوش مصنوعی واقعاً داره روشهای کلاسیک روانشناسی رو متحول میکنه!
منبع: +