چطور با هوش مصنوعی میشه فهمید تو ماشین خودران کی حالش خوب نیست؟

این روزا دیگه بحث ماشین‌های خودران و خودروهای هوشمند حسابی داغ شده و خیلی‌ها دارن روش کار می‌کنن. ولی یه نکته جالب و مهم این وسط هست که زیاد کسی بهش توجه نمی‌کنه: اینکه وقتی سوار همچین ماشینی می‌شیم، گاهی ممکنه حس کنیم معذب یا ناراحت‌ایم. این حس «ناراحتی» یا Discomfort یه چیزیه که مرتب تو زمان تغییر می‌کنه و کاملاً هم حس شخصیه.

حالا دانشمندا اومدن گفتن چطور میشه این حس ناراحتی رو تو مسافرای ماشین‌های خودران راحت و دقیق تشخیص داد. اونا تو تحقیقات‌شون سعی کردن با استفاده از سنسورهایی که اطلاعات فیزیولوژیکی (مثلاً ضربان قلب، عرق کردن دست و…)، محیطی (شرایط محیط ماشین مثل دما و نور) و وضعیت خود اتوماسیون خودرو (یعنی ماشینی که خودش رانندگی می‌کنه) رو می‌گیرن، بفهمن هر فرد چقدر تو لحظه ناراحته.

واسه این کار، محققین از یه مدل خیلی باحال به اسم Temporal Fusion Transformer یا TFT استفاده کردن. اگه نمی‌دونی چی هست، بگم که این یه نوع هوش مصنوعی عمیق و پیشرفته‌ست که با کمک «توجه» (attention) می‌تونه بفهمه توی زمان، چه چیزایی به چی ربط داره و حتی خیلی از اتفاق‌های آینده رو با دقت خیلی خوب پیش‌بینی کنه. ضمن اینکه کلی ابزار برای تحلیل و تفسیر اتفاق‌های زمانی (temporal dynamics) داره، یعنی تو بازه‌های زمانی از رفتار و احساسات آدما سر درمیاره.

توی این تحقیق، ماجرا اینجوری بوده: 100 نفر آدم تو یه تست شبیه‌سازی‌شده سوار ماشین خودران شدن. هر وقت احساس ناراحتی می‌کردن، با یه دستگاه دستی این حس رو اعلام می‌کردن. محققین دوتا مدل TFT ساختن؛ یکی کامل که همه سیگنال‌ها رو استفاده می‌کرد (TFT-full) و یکی مدل جمع و جورتر با سیگنال‌های کمتر (TFT-restricted). بعدش عملکرد این مدل‌ها رو با یه مدل دیگه به اسم DeepAR مقایسه کردن. (DeepAR یه مدل یادگیری عمیقه که پیش‌بینی زمانی می‌کنه و معروفه به auto-regressive بودن؛ یعنی پیش‌بینی هر مرحله، به اون مرحله‌های قبلی ربط داره.)

یه نکته باحال: توی این آزمایش، اومدن اندازه اون قطعه زمانی (یا همون window) که مدل قراره بررسی کنه رو هم تغییر دادن تا ببینن مدل تو شرایط مختلف چه میکنه. جالبه بدونی بهترین عملکرد از مدل TFT-restricted با window سایز 300 بدست اومد، که تقریباً میشه بازه 5 ثانیه‌ای. خطای میانگینش فقط 0.037 بود (یعنی واقعاً مدل دقیق بوده!) و خطای مهم دیگه‌ش هم فقط 0.131 شد.

جمع‌بندی بخوام بگم: نتیجه این شد که مدل TFT-restricted تو پیش‌بینی ناراحتی، هم مدل کامل خودش رو شکست داد، هم مدل DeepAR رو. این تحقیق نشون داد مدل TFT واقعاً تو فهمیدن وابستگی‌های زمانی داده‌ها عالی عمل می‌کنه و حتی کاری می‌کنه بفهمیم تو هر لحظه چی باعث شده کسی در یه ماشین هوشمند معذب بشه یا حس خوبی نداشته باشه.

در کل، اینجور پیشرفت‌ها می‌تونن کمک کنن ماشین‌های خودران آینده دوست‌داشتنی‌تر و پذیرفتنی‌تر بشن، چون اگه ماشین بفهمه تو کی معذب شدی، راحت‌تر می‌تونه کاری کنه که حال مسافرها خوب بشه. چه دنیای جالبی داریم جلو رومون!

منبع: +