تا حالا برات پیش اومده توی ماشین نشستی یهو ماشین ترمز محکم بزنه و خودت گیج شی که “خب چی شد؟ چرا ترمز؟” واقعاً دلیلش چیه؟ این سؤال فقط ذهن ما رو درگیر نکرده، بلکه کلی آدم تو دنیای تحقیقاتی خودشون رو با همین موضوع سرگرم کردن!
حالا با زیاد شدن ماشینهای جدید که سیستم کمکراننده دارن، یعنی همون ADAS که خلاصهی Advanced Driver Assistance Systems هست و به راننده برای امنیت و راحتی کمک میکنه، کلی دادهی رانندگی تولید شده. ولی یه نکته هست: بیشتر این دادهها به درد خاصی نمیخورن! یعنی فقط اتفاقات روتین و خستهکننده رانندگی توشون هست و خبری از لحظات بحرانی و خطرناک نیست.
موضوع جالب اینه که معمولاً همین صحنههای خطرناک، مثلاً وقتی یه ماشین یا موتوری یهو سبز میشه جلوت و راننده مجبوره خیلی ناگهانی ترمز بزنه، همون لحظههایی هستن که واقعاً باید بفهمیم چی شده. شناسایی اینجور سناریوها اصلاً راحت نیست و توی اون حجم عظیم داده گم میشن.
روشهای قبلی برای پیدا کردن علت ترمزها، بیشتر روی قانونها و شرطهایی که از قبل تعیین شده بودن کار میکردن. مثلاً میگفتن هر وقت سرعت به زیر یه مقداری رسید، یا فاصله با مانع کم شد، احتمالاً ترمز زده شده. این مدلها توی جادههای ساده مثل بزرگراهها جواب میده، ولی وای به روزی که پای شهر شلوغ و خیابونهای عجیب غریب وسط بیاد؛ دیگه اون قانونها جوابگو نیستن!
اینجا جادوی هوش مصنوعی وارد میشه. توی مقالهای که بهت معرفی میکنم، تیم تحقیقاتی اومدن نوآوری جذابی انجام دادن: از Large Language Model یا همون LLM استفاده کردن. LLM یعنی مدل زبانی خیلی بزرگی مثل ChatGPT، که میتونه متنهای پیچیده رو بفهمه، خلاصه کنه یا حتی استدلال کنه.
اینا یه چارچوب جدید رو معرفی کردن که دادههای عددی و خشک مثل سرعت و فاصله رو به زبان طبیعی (همون حرف زدن خودمون) تبدیل میکنه تا LLM بتونه معنی سناریوها رو درک کنه و درست دستهبندی کنه. اینطوری دیگه لازم نیست فقط به چندتا شرط ساده بسنده کنن؛ مدل میتونه بفهمه که آیا واقعاً یه موقعیت خطرناک بوده یا نه.
یه نکته خیلی باحال اینه که سیستمشون دوتا مسیر جستوجو داره:
- یکی اینکه برای موقعیتهایی که از قبل براش تعریف شده، مثلاً «سبقت خطرناک»، میتونه بره و اونا رو پیدا کنه.
- دوم اینکه، اگه به سناریوی جدیدی برسه که قبلاً تعریف نشده (بهش میگن OOD یا Out-of-Distribution یعنی خارج از توزیع معمول داده)، با کمک embedding که یک جور نمایش عددی از متنها یا دادههاست، میتونه سناریوی جدید رو هم شناسایی کنه!
برای تست هم رفتن سراغ یه دیتاست حسابی به اسم Argoverse 2 Sensor Dataset — این مجموعه بزرگیه که کلی داده رانندگی واقعی داخلشه. تیم تحقیق، سناریوها رو خودشون لیبلگذاری کردن تا مدلها گم نشه!
نتیجه؟ مدل مبتنی بر LLM اونا تونست هم نسبت به مدلهای قانونمحور قدیمی هوشمندتر عمل کنه و هم موقعیتهای جدید و ناشناخته را بهتر بفهمه.
ته ماجرا هم اینکه اگه یه روزی ماشین هوشمندت یه ترمز ناگهانی زد، یادت باشه شاید پشتش یه مدل هوش مصنوعی داره تحلیل میکنه که واقعاً چرا ترمز شد و قراره حتی چیزهای جدیدتر رو هم خودش یاد بگیره! دیگه دوران قانونهای خشک و ساده گذشته. این هوش مصنوعیها حسابی دارن کمکمون میکنن تا دفعهی بعدی از جادههای پیچیده و شهرهای شلوغ هم بیخطر رد بشیم.
منبع: +