هوش مصنوعی به کمک آزمون شخصیت اومد: خداحافظ تعارف‌زدگی!

تا حالا شده یه تست شخصیت بدین و حس کنین باید جواب‌هایی بدین که مردم بیشتر دوست دارن یا مثلاً حس کنین باید مهربون‌تر یا منظم‌تر از چیزی که واقعاً هستین ظاهر بشین؟ به این میگن “Social Desirability Bias” یا همون تعارف‌زدگی موقع جواب دادن به سوال‌ها. یعنی آدما به سوالا یه جوری جواب میدن که نظر بقیه یا حتی خودشون رو جلب کنن.

حالا تو این تحقیق جالب، اومدن از هوش مصنوعی بزرگ – دقیق‌تر بگم LLM (Large Language Model، یعنی مدل زبانی خیلی بزرگ شبیه GPT-3 که می‌تونه شبیه آدم‌ها متن بنویسه) – استفاده کردن که این تعارف‌زدگی رو کم کنن. به این کار گفتن “item neutralization” یا خنثی‌سازی سوال‌ها. یعنی سوالای آزمون شخصیت معروف (IPIP-BFM-50) رو دادن به GPT-3 و بهش گفتن یه جوری دوباره بنویسشون که ملت دیگه نتونن جواب غیرواقعی بدن یا تحت تاثیر نگاه بقیه قرار بگیرن.

تو این آزمایش، ۲۰۳ نفر شرکت کردن و به دو مدل سوال جواب دادن: یکی همون سوالای اصلی، یکی هم ورژن جدید و خنثی‌شده با هوش مصنوعی. بعد هم یه تست به اسم Marlowe-Crowne Social Desirability Scale (یه آزمون برای سنجش میزان تعارف‌زدگی افراد) رو هم دادن.

نتایج چی شد؟ جالبه بدونین که مثلا میزان پایایی یا Reliability (یعنی، می‌تونیم به نتایج آزمون اعتماد کنیم یا نه) و همون ساختار پنج عاملی شخصیت حفظ شد. مثلاً هنوز میشد پنج ویژگی اصلی شخصیت رو جدا کرد. حتی یه جاهایی افرادی که تست رو جواب دادن، نمره وجدان یا “Conscientiousness” شون بالا رفت، اما در عوض نمره موافق بودن (Agreeableness) و ذهن‌باز بودن (Openness) یه کم اومد پایین. این یعنی هوش مصنوعی تونسته سوالارو یه جوری بازنویسی کنه که افراد جواب واقعی‌تری بدن، اما هنوز به طور کامل همه چیو عالی درست نکرده.

یه نکته‌ی فنی هم هست: تو مباحث آماری، بحث Invariance (یعنی پایداری ساختار تست) مهمه. اینجا دیدن Configural Invariance (یعنی ساختار کلی تست) حفظ شد، ولی Metric و Scalar Invariance (یعنی همسانی اندازه‌گیری بین دوتا گروه و همسانی معنایی سوالا) برقرار نبود. به زبون خودمونی: سوالا تو اصلشون شبیه هم موندن، اما تو بعضی جزئیات اندازه‌گیری و معنی، فرق پیش اومد.

در کل چی میشه گفت؟ هوش مصنوعی مثل GPT-3 می‌تونه کمک کنه که سوالای آزمون شخصیت رو طوری بنویسن که مردم کمتر با تعارف جواب بدن، اما هنوزم کامل بی‌نقص نشده. اما پیشرفت بزرگیه واسه اینکه بتونیم تست‌هایی بسازیم که دقیق‌تر شخصیت آدما رو نشون بده و تعارف توش کمتر باشه!

اگه همیشه به تست‌های شخصیت شک داشتی که واقعاً خود واقعی آدم رو نشون میدن یا نه، این خبر خوبیه که هوش مصنوعی داره یه کمکی می‌کنه که قضیه واقعی‌تر بشه. ولی فعلاً کاملاً حل نشده و هنوز جای بهتر شدن داره!

منبع: +