خب، بذارید بدون مقدمه برم سر اصل مطلب! حتما تاحالا براتون پیش اومده که بخواید احساس کسی رو از روی قیافهش تشخیص بدید، اما همهچیز اونقدر هم راحت نباشه. مثلاً طرف ممکنه لبخند بزنه (که نشونه شادیه)، ولی شرایط اطراف یا فضا یه جوری باشه که حس غم یا استرس تو چشماش معلوم باشه! پس فقط به صورت توجه کردن کافی نیست و باید به شرایط و زمینهی اطرافش هم دقت کنیم.
این مقاله (که روی سایت arXiv جدید منتشر شده)، دقیقاً اومده سراغ همین چالش سخت: فهمیدن احساسات آدمها بر اساس ترکیب نگاه به قیافه و شرایطی که توش قرار دارن.
خلاصه قضیه چیه؟
میگن اگه بخوایم توی موقعیتهای اجتماعی واقعاً بفهمیم یکی چه احساسی داره، باید بین حالات چهره و سرنخهای محیط (یعنی همون اشارههای زمینهای و شرایط اطراف) یه تعادلی برقرار کنیم. ساده بگم، نباید فقط به لبخند یا اخم نگاه کنیم، باید دقت کنیم اتفاقات اطراف چیان و چقدر تو این حس تأثیرگذارن.
روششون چیه؟
پیشنهاد دادن که از یه «فریمورک با سالینسادجاستمنت» استفاده کنیم. سالینس یعنی چی؟ سالینس تو روانشناسی به معنی برجستگی و اهمیت یه چیز بین بقیه چیزهاست. اینجا یعنی تصمیم بگیریم که چقدر باید رو قیافه طرف زوم کنیم و چقدر به زمینه اهمیت بدیم. حالا این تنظیم میزان توجه رو با دو تا تکنیک انجام میدن:
-
ترکیب سرنخها با بیزین (Bayesian Cue Integration): این یه مدل ریاضی ـ آماریه که کمک میکنه اطلاعات مختلف (مثل حالت صورت و نشونههای محیط) رو حسابشده با هم ترکیب کنی. بیزین یعنی با توجه به احتمالات قبلی و شواهد جدید، بهترین حدس رو بزنی.
-
مدلهای بصری-زبانی (Visual-Language Models یا VLMs): مثلا مدلهایی مثل ChatGPT یا Bard که میتونن عکس و متن رو همزمان بفهمن و تحلیل کنن. این مدلها کمک میکنن سرنخهای تصویری و متنی رو با هم بسنجیم تا به نتیجه دقیقتری برسیم.
این روش رو چجوری تست کردن؟
اومدن سناریوی معروف «معمای زندانی»(Prisoner’s Dilemma) رو استفاده کردن. این یه بازی فکریه که تو روانشناسی و اقتصاد زیاد استفاده میشه تا باعث بشه افراد احساسهایی مثل اعتماد، ترس، همدلی یا حتی خیانت نشون بدن. دانشمندا با استفاده از این سناریو و نگاه به حالات چهره و شرایط، سعی کردن احساسات رو تشخیص بدن.
برای بررسی نتیجهها هم، هم از امتیاز دادن انسانها (یعنی چند نفر واقعی نشستن احساسات رو ارزیابی کردن)، هم از سیستمهای خودکارِ تشخیص احساسات استفاده کردن.
نتیجهها چی شد؟
نتایج جالب بود! این روشِ سالینسادجاستمنت باعث شد تشخیص احساسات دقیقتر و بهتر بشه. یعنی وقتی باهوشانه تعادل بین اطلاعات چهره و زمینه رو تنظیم میکنی، کلی اشتباهات قدیمی کمتر میشه و آدم میتونه حالات روحی رو واقعیتر درک کنه.
آینده این کار: چه استفادههایی داره؟
نویسندههای مقاله میگن این روش میتونه تو بقیه موقعیتهای اجتماعی و حتی اپلیکیشنهای چندرسانهای (مثلاً تشخیص احساسات تو ویدئو چت، بازیهای آنلاین یا روبوتهای دوستداشتنی!) هم استفاده بشه و ایدههای زیادی برای گسترش داره.
جمعبندی دوستانه
اگه هوش مصنوعی رو دوست دارین یا دنبال ساخت سیستمهایی هستین که بتونن رفتار و احساسات آدما رو واقعیتر تشخیص بدن، این مقاله یه نمونه خیلی خوبه. ترکیب مدلهای تصویری-زبانی همراه با سالینسادجاستمنت، آیندهی تحلیل احساسات رو حسابی تغییر میده! خلاصه: فقط به قیافه نگاه نکنید، به شرایط هم دقت کنید!
پ.ن: اگه تا الان فکر میکردین تشخیص دادن احساس آدما از صورتشون آسونه، بدونید که دانشمندها کلی روش پیشرفته برای بهتر شدن این قضیه ساختن – و این مقاله یه نمونه باحال و کاربردیه.
منبع: +