واقعاً چرا ماشین‌ها ترمز می‌زنن؟ سناریوهای عجیب با کمک هوش مصنوعی!

تا حالا برات پیش اومده توی ماشین نشستی یهو ماشین ترمز محکم بزنه و خودت گیج شی که “خب چی شد؟ چرا ترمز؟” واقعاً دلیلش چیه؟ این سؤال فقط ذهن ما رو درگیر نکرده، بلکه کلی آدم تو دنیای تحقیقاتی خودشون رو با همین موضوع سرگرم کردن!

حالا با زیاد شدن ماشین‌های جدید که سیستم کمک‌راننده دارن، یعنی همون ADAS که خلاصه‌ی Advanced Driver Assistance Systems هست و به راننده برای امنیت و راحتی کمک می‌کنه، کلی داده‌ی رانندگی تولید شده. ولی یه نکته هست: بیشتر این داده‌ها به درد خاصی نمی‌خورن! یعنی فقط اتفاقات روتین و خسته‌کننده رانندگی توشون هست و خبری از لحظات بحرانی و خطرناک نیست.

موضوع جالب اینه که معمولاً همین صحنه‌های خطرناک، مثلاً وقتی یه ماشین یا موتوری یهو سبز میشه جلوت و راننده مجبوره خیلی ناگهانی ترمز بزنه، همون لحظه‌هایی هستن که واقعاً باید بفهمیم چی شده. شناسایی اینجور سناریوها اصلاً راحت نیست و توی اون حجم عظیم داده گم میشن.

روش‌های قبلی برای پیدا کردن علت ترمزها، بیشتر روی قانون‌ها و شرط‌هایی که از قبل تعیین شده بودن کار می‌کردن. مثلاً می‌گفتن هر وقت سرعت به زیر یه مقداری رسید، یا فاصله‌ با مانع کم شد، احتمالاً ترمز زده شده. این مدل‌ها توی جاده‌های ساده مثل بزرگراه‌ها جواب میده، ولی وای به روزی که پای شهر شلوغ و خیابون‌های عجیب غریب وسط بیاد؛ دیگه اون قانون‌ها جوابگو نیستن!

اینجا جادوی هوش مصنوعی وارد میشه. توی مقاله‌ای که بهت معرفی می‌کنم، تیم تحقیقاتی اومدن نوآوری جذابی انجام دادن: از Large Language Model یا همون LLM استفاده کردن. LLM یعنی مدل زبانی خیلی بزرگی مثل ChatGPT، که می‌تونه متن‌های پیچیده رو بفهمه، خلاصه کنه یا حتی استدلال کنه.

اینا یه چارچوب جدید رو معرفی کردن که داده‌های عددی و خشک مثل سرعت و فاصله رو به زبان طبیعی (همون حرف زدن خودمون) تبدیل می‌کنه تا LLM بتونه معنی سناریوها رو درک کنه و درست دسته‌بندی کنه. اینطوری دیگه لازم نیست فقط به چندتا شرط ساده بسنده کنن؛ مدل می‌تونه بفهمه که آیا واقعاً یه موقعیت خطرناک بوده یا نه.

یه نکته خیلی باحال اینه که سیستم‌شون دوتا مسیر جست‌و‌جو داره:

یکی اینکه برای موقعیت‌هایی که از قبل براش تعریف شده، مثلاً «سبقت خطرناک»، می‌تونه بره و اونا رو پیدا کنه.
دوم اینکه، اگه به سناریوی جدیدی برسه که قبلاً تعریف نشده (بهش می‌گن OOD یا Out-of-Distribution یعنی خارج از توزیع معمول داده)، با کمک embedding که یک جور نمایش عددی از متن‌ها یا داده‌هاست، می‌تونه سناریوی جدید رو هم شناسایی کنه!

برای تست هم رفتن سراغ یه دیتاست حسابی به اسم Argoverse 2 Sensor Dataset — این مجموعه بزرگیه که کلی داده رانندگی واقعی داخلشه. تیم تحقیق، سناریوها رو خودشون لیبل‌گذاری کردن تا مدل‌ها گم نشه!

نتیجه؟ مدل مبتنی بر LLM اونا تونست هم نسبت به مدل‌های قانون‌محور قدیمی هوشمندتر عمل کنه و هم موقعیت‌های جدید و ناشناخته را بهتر بفهمه.

ته ماجرا هم اینکه اگه یه روزی ماشین هوشمندت یه ترمز ناگهانی زد، یادت باشه شاید پشتش یه مدل هوش مصنوعی داره تحلیل می‌کنه که واقعاً چرا ترمز شد و قراره حتی چیزهای جدیدتر رو هم خودش یاد بگیره! دیگه دوران قانون‌های خشک و ساده گذشته. این هوش مصنوعی‌ها حسابی دارن کمک‌مون می‌کنن تا دفعه‌ی بعدی از جاده‌های پیچیده و شهرهای شلوغ هم بی‌خطر رد بشیم.

منبع: +