تا حالا شده یه تست شخصیت بدین و حس کنین باید جوابهایی بدین که مردم بیشتر دوست دارن یا مثلاً حس کنین باید مهربونتر یا منظمتر از چیزی که واقعاً هستین ظاهر بشین؟ به این میگن “Social Desirability Bias” یا همون تعارفزدگی موقع جواب دادن به سوالها. یعنی آدما به سوالا یه جوری جواب میدن که نظر بقیه یا حتی خودشون رو جلب کنن.
حالا تو این تحقیق جالب، اومدن از هوش مصنوعی بزرگ – دقیقتر بگم LLM (Large Language Model، یعنی مدل زبانی خیلی بزرگ شبیه GPT-3 که میتونه شبیه آدمها متن بنویسه) – استفاده کردن که این تعارفزدگی رو کم کنن. به این کار گفتن “item neutralization” یا خنثیسازی سوالها. یعنی سوالای آزمون شخصیت معروف (IPIP-BFM-50) رو دادن به GPT-3 و بهش گفتن یه جوری دوباره بنویسشون که ملت دیگه نتونن جواب غیرواقعی بدن یا تحت تاثیر نگاه بقیه قرار بگیرن.
تو این آزمایش، ۲۰۳ نفر شرکت کردن و به دو مدل سوال جواب دادن: یکی همون سوالای اصلی، یکی هم ورژن جدید و خنثیشده با هوش مصنوعی. بعد هم یه تست به اسم Marlowe-Crowne Social Desirability Scale (یه آزمون برای سنجش میزان تعارفزدگی افراد) رو هم دادن.
نتایج چی شد؟ جالبه بدونین که مثلا میزان پایایی یا Reliability (یعنی، میتونیم به نتایج آزمون اعتماد کنیم یا نه) و همون ساختار پنج عاملی شخصیت حفظ شد. مثلاً هنوز میشد پنج ویژگی اصلی شخصیت رو جدا کرد. حتی یه جاهایی افرادی که تست رو جواب دادن، نمره وجدان یا “Conscientiousness” شون بالا رفت، اما در عوض نمره موافق بودن (Agreeableness) و ذهنباز بودن (Openness) یه کم اومد پایین. این یعنی هوش مصنوعی تونسته سوالارو یه جوری بازنویسی کنه که افراد جواب واقعیتری بدن، اما هنوز به طور کامل همه چیو عالی درست نکرده.
یه نکتهی فنی هم هست: تو مباحث آماری، بحث Invariance (یعنی پایداری ساختار تست) مهمه. اینجا دیدن Configural Invariance (یعنی ساختار کلی تست) حفظ شد، ولی Metric و Scalar Invariance (یعنی همسانی اندازهگیری بین دوتا گروه و همسانی معنایی سوالا) برقرار نبود. به زبون خودمونی: سوالا تو اصلشون شبیه هم موندن، اما تو بعضی جزئیات اندازهگیری و معنی، فرق پیش اومد.
در کل چی میشه گفت؟ هوش مصنوعی مثل GPT-3 میتونه کمک کنه که سوالای آزمون شخصیت رو طوری بنویسن که مردم کمتر با تعارف جواب بدن، اما هنوزم کامل بینقص نشده. اما پیشرفت بزرگیه واسه اینکه بتونیم تستهایی بسازیم که دقیقتر شخصیت آدما رو نشون بده و تعارف توش کمتر باشه!
اگه همیشه به تستهای شخصیت شک داشتی که واقعاً خود واقعی آدم رو نشون میدن یا نه، این خبر خوبیه که هوش مصنوعی داره یه کمکی میکنه که قضیه واقعیتر بشه. ولی فعلاً کاملاً حل نشده و هنوز جای بهتر شدن داره!
منبع: +