بررسی مدل‌های هوش مصنوعی توی ساخت انیمیشن سه‌بعدی احساسی برای واقعیت مجازی: واقعاً چقدر خوبن؟

بیا با هم یه موضوع جالب رو بررسی کنیم! می‌دونی این روزها تو بازی‌ها و دنیای واقعیت مجازی (VR یعنی دنیایی که با عینک مخصوص واردش می‌شی و همه‌چی سه‌بعدی و واقعی به‌نظر می‌رسه)، تعامل‌های اجتماعی فقط با حرف زدن اتفاق نمی‌افته. کلی حالت صورت، حرکت دست و بدن و این جور چیزها هم لازم دارن تا حس و حال واقعی‌تر بشه.

اینجا هوش مصنوعی وارد ماجرا می‌شه. به‌خصوص مدل‌هایی که بهشون می‌گن “Generative Models” (یعنی مدل‌های مولدی که خودشون می‌تونن چیز جدید بسازن. مثلاً انیمیشن بدن یا صورت تولید کنن با توجه به حرف زدن شخصیت). این مدل‌ها تونستن انیمیشن‌ بدن کامل و هماهنگ با گفتار بسازن که قبلاً خیلی هیجان‌انگیز بوده. ولی یه مشکلی هست؛ بیشتر آزمایشایی که باهاشون شده، روی ویدیوهای دوبعدی بوده و فقط با یه سری اعداد و ارقام سر و کار داشتن! اینکه آیا واقعاً مخاطب می‌فهمه اون احساس رو مدل منتقل کرده یا نه، کمتر بررسی شده بود.

حالا یه تیم تصمیم گرفت تو محیط واقعیت مجازی همه‌چی رو واقعی‌تر امتحان کنه! کارشون اینطوری بود:
یه مطالعه کاربری با ۴۸ نفر (یعنی با شرکت‌کننده واقعی!) گذاشتن و ۳ تا از بهترین مدل‌های جدید ساخت انیمیشن سه‌بعدی باهوش مصنوعی رو تست کردن. اون مدل‌ها طراحی‌شده بودن تا وقتی یه دیالوگ پخش می‌شه، باهاش حرکت بدن و صورت شخصیت مجازی رو بسازن. دوتا حس خاص رو هم برای آزمایش انتخاب کردن: شادی (که می‌گن High Arousal، یعنی انرژی بالایی داره و راحت قابل تشخیصه) و حالت “خنثی” (که Mid Arousal، یعنی حس خاصی نشون نمی‌ده).

برای اینکه بفهمن چقدر این انیمیشن‌ها خوبن، کلی ملاک جذاب گذاشتن؛ مثلاً:

  • واقعی بودن احساس (بفهمی مثلا شخصیت واقعاً خوشحاله یا نه)
  • طبیعی بودن انیمیشن
  • اینکه تماشاش جذاب و لذت‌بخش هست یا نه
  • چقدر حرکت‌ها متنوعه
  • کیفیت ارتباط و تعامل تو اون صحنه واقعیت مجازی

راستش رو بخوای، مدل‌هایی که مخصوصاً واسه انتقال احساس طراحی شدن (نه فقط هماهنگ کردن بدن با حرف)، تونستن حس رو بهتر منتقل کنن. یعنی تشخیص شادی خیلی راحت‌تر بوده تا حس خنثی یا کمتر هیجانی. این نشون می‌ده وقتی یه حس قوی تو داستان باشه، هوش مصنوعی راحت‌تر می‌تونه تو انیمیشن نشونش بده.

از اون طرف وقتی می‌خواستن این مدل‌ها رو با نمونه‌های واقعی مقایسه کنن (یعنی مثلا بازیگر، بازی کرده و سیستم حرکت‌هاشو برداشته و بازسازی کرده)، هنوز مدل‌های هوش مصنوعی کم میاوردن. مخصوصاً تو صورت کاراکترها، جزئیات احساس رو نتونستن درست مثل نمونه واقعی نشون بدن.

یه نکته دیگه هم این بود که کاربران لزوماً عاشق این انیمیشن‌های تولید‌شده نشدن! یعنی نمره‌هایی که به لذت تماشا و کیفیت تعامل دادن، نسبتاً پایین بوده. نشون می‌ده که هنوز راه دارن تا کاملاً برای کاربرها قانع‌کننده و جذاب بشن.

اما یه نکته مثبت هم این وسط بود! شرکت‌کننده‌ها تغییرپذیری و تنوع حرکتی مدل‌های هوش مصنوعی رو تأیید کردن. یعنی حتی اگه کیفیت عالی نبوده، دست‌کم تکراری و یکنواخت نبوده حرکت‌ها.

کلاً نتیجه بحث اینه که اگه قراره تو آینده کاراکترهای مجازی واقعی‌تر بشن و ما بتونیم تو دنیای VR احساس واقعی بگیریم، هوش مصنوعی باید بیشتر از قبل توجه کنه به اینکه ما چطور احساسات رو دریافت می‌کنیم و نه فقط به یه سری معیار عددی بسنده کنه. پس این تحقیقات حسابی لازمه و می‌تونه آینده بازی‌ها و دنیای مجازی رو تغییر بده!

منبع: +