چطور میشه احساسات آدم‌ها رو تو شرایط مختلف درست تشخیص داد؟ یه روش جدید و جذاب!

خب، بذارید بدون مقدمه برم سر اصل مطلب! حتما تاحالا براتون پیش اومده که بخواید احساس کسی رو از روی قیافه‌ش تشخیص بدید، اما همه‌چیز اون‌قدر هم راحت نباشه. مثلاً طرف ممکنه لبخند بزنه (که نشونه شادیه)، ولی شرایط اطراف یا فضا یه جوری باشه که حس غم یا استرس تو چشماش معلوم باشه! پس فقط به صورت توجه کردن کافی نیست و باید به شرایط و زمینه‌ی اطرافش هم دقت کنیم.

این مقاله (که روی سایت arXiv جدید منتشر شده)، دقیقاً اومده سراغ همین چالش سخت: فهمیدن احساسات آدم‌ها بر اساس ترکیب نگاه به قیافه و شرایطی که توش قرار دارن.

خلاصه قضیه چیه؟

میگن اگه بخوایم توی موقعیت‌های اجتماعی واقعاً بفهمیم یکی چه احساسی داره، باید بین حالات چهره و سرنخ‌های محیط (یعنی همون اشاره‌های زمینه‌ای و شرایط اطراف) یه تعادلی برقرار کنیم. ساده بگم، نباید فقط به لبخند یا اخم نگاه کنیم، باید دقت کنیم اتفاقات اطراف چی‌ان و چقدر تو این حس تأثیرگذارن.

روششون چیه؟

پیشنهاد دادن که از یه «فریمورک با سالینس‌ادجاستمنت» استفاده کنیم. سالینس یعنی چی؟ سالینس تو روانشناسی به معنی برجستگی و اهمیت یه چیز بین بقیه چیزهاست. اینجا یعنی تصمیم بگیریم که چقدر باید رو قیافه طرف زوم کنیم و چقدر به زمینه اهمیت بدیم. حالا این تنظیم میزان توجه رو با دو تا تکنیک انجام میدن:

ترکیب سرنخ‌ها با بیزین (Bayesian Cue Integration): این یه مدل ریاضی ـ آماریه که کمک میکنه اطلاعات مختلف (مثل حالت صورت و نشونه‌های محیط) رو حساب‌شده با هم ترکیب کنی. بیزین یعنی با توجه به احتمالات قبلی و شواهد جدید، بهترین حدس رو بزنی.
مدل‌های بصری-زبانی (Visual-Language Models یا VLMs): مثلا مدل‌هایی مثل ChatGPT یا Bard که میتونن عکس و متن رو همزمان بفهمن و تحلیل کنن. این مدل‌ها کمک میکنن سرنخ‌های تصویری و متنی رو با هم بسنجیم تا به نتیجه دقیق‌تری برسیم.

این روش رو چجوری تست کردن؟

اومدن سناریوی معروف «معمای زندانی»(Prisoner’s Dilemma) رو استفاده کردن. این یه بازی فکریه که تو روانشناسی و اقتصاد زیاد استفاده میشه تا باعث بشه افراد احساس‌هایی مثل اعتماد، ترس، همدلی یا حتی خیانت نشون بدن. دانشمندا با استفاده از این سناریو و نگاه به حالات چهره و شرایط، سعی کردن احساسات رو تشخیص بدن.

برای بررسی نتیجه‌ها هم، هم از امتیاز دادن انسان‌ها (یعنی چند نفر واقعی نشستن احساسات رو ارزیابی کردن)، هم از سیستم‌های خودکارِ تشخیص احساسات استفاده کردن.

نتیجه‌ها چی شد؟

نتایج جالب بود! این روشِ سالینس‌ادجاستمنت باعث شد تشخیص احساسات دقیق‌تر و بهتر بشه. یعنی وقتی باهوشانه تعادل بین اطلاعات چهره و زمینه رو تنظیم می‌کنی، کلی اشتباهات قدیمی کمتر میشه و آدم می‌تونه حالات روحی رو واقعی‌تر درک کنه.

آینده این کار: چه استفاده‌هایی داره؟

نویسنده‌های مقاله میگن این روش می‌تونه تو بقیه موقعیت‌های اجتماعی و حتی اپلیکیشن‌های چندرسانه‌ای (مثلاً تشخیص احساسات تو ویدئو چت، بازی‌های آنلاین یا روبوت‌های دوست‌داشتنی!) هم استفاده بشه و ایده‌های زیادی برای گسترش داره.

جمع‌بندی دوستانه

اگه هوش مصنوعی رو دوست دارین یا دنبال ساخت سیستم‌هایی هستین که بتونن رفتار و احساسات آدما رو واقعی‌تر تشخیص بدن، این مقاله یه نمونه خیلی خوبه. ترکیب مدل‌های تصویری-زبانی همراه با سالینس‌ادجاستمنت، آینده‌ی تحلیل احساسات رو حسابی تغییر میده! خلاصه: فقط به قیافه نگاه نکنید، به شرایط هم دقت کنید!

پ.ن: اگه تا الان فکر می‌کردین تشخیص دادن احساس آدما از صورتشون آسونه، بدونید که دانشمندها کلی روش پیشرفته برای بهتر شدن این قضیه ساختن – و این مقاله یه نمونه باحال و کاربردیه.

منبع: +