امروز میخوام یه مدل جدید و خفن برای تشخیص خطهای جاده توی ماشینهای خودران رو بهت معرفی کنم که اسمش StaBle-MambaNet ـه. راستش، توی دنیای ماشینهای خودران، سیستم بینایی یا همون “perception system” یکی از مهمترین بخشهاست. اگه این سیستم اشتباه کنه یا درست خطکشیهای جاده رو نشناسه، ماشین اصلاً نمیدونه کجای جادهست و خب، معلومه چه فاجعهای میشه!
ولی مشکل چیه؟ به خاطر سرعت بالای ماشین یا اینکه نور خوب نیست (مثلاً شب یا موقع غروب)، دوربین ماشین یه سری جاها رو تار و مبهم میبینه. این تاری باعث میشه خطهای سفید و زرد جاده نصفه پیدا باشن یا کلاً غیب بشن! خب طبیعیه که این داستانها دقت تشخیص خط رو میاره پایین، مخصوصاً سر پیچها یا جاهایی که نور کمه یا ماشین جلویی جلوی دید گرفته.
تا الان چی کار میکردن؟ مدلهای قدیمی یه جورایی دو مرحلهای کار میکردن: اول میومدن کل عکس رو واضحتر یا باکیفیتتر میکردن (یه چیزی مثل “deblurring” یعنی رفع تاری یا “super-resolution” یعنی افزایش وضوح تصویر) بعد تازه میرفتن سراغ پیدا کردن خطهای جاده. ولی این روش چند تا مشکل داشت:
- هم کند بود، چون کل عکس باید ویرایش میشد
- هم معلوم نبود بعضی خطها واقعاً تو عکس نیستن یا فقط تار شدن
- اگر رفع تاری خوب کار نمیکرد، مرحله دومم کلاً به هم میریخت
اینجاست که StaBle-MambaNet وارد میشه!
این مدل اومده یه کار خفنتر انجام داده و گفته چرا بخواهیم کل عکس رو الکی واضح کنیم؟ بیاین فقط اون قسمتهایی که مشکوکن و ممکنه تار شده باشه رو تشخیص بدیم و دقیقا همون جاها رو باهوشتر بررسی کنیم. یعنی اول مدل با یه ماژول مخصوص (Structure-Aware Restoration Module یعنی یه بخشی که میتونه ساختار خطهای جاده رو تشخیص بده و خودش کاملش کنه) جاهایی که احتمال داره خط باشه رو شناسایی میکنه و فقط اونا رو واضحتر میکنه یا حتی به صورت هوشمند ادامه خط رو حدس میزنه.
یه مرحله خفنتر هم هست:
اینجا یه بخش جدید به اسم Blur-Guided Consistency Reasoning Module داره که بیاد ببینه واقعاً خطی که داریم میبینیم، به صورت پایدار و واقعی وجود داره یا فقط یه کدری بیخود تو عکسه! منظور از Consistency Reasoning اینه که با هوش مصنوعی بررسی کنه که آیا دادهها باهم جور در میان یا نه، یه جور چک کردن پایداری داده.
حالا همه این اطلاعات که بهتر و تمیزتر شده، توی قالب یه توکن سکانسی فضایی (Spatially Continuous Token Sequence یعنی یه دنباله منظم داده که فضای تصویر رو مرتب پوشش میده) وارد یه مدل سبُک و جدید به اسم Mamba میشه. این Mamba در واقع یه مدل به سبک state-space model ـه، یعنی میتونه تغییرات و تحولات تصویر رو دنبال و مدلسازی کنه، مخصوصاً نقاطی که تار بودن رو!
مدل StaBle-MambaNet چند جا تست شده ـ مثلاً رو دیتاستهای معروفی مثل CULane و CurveLanes (اینها مجموعهعکسهایی هستن که برای آموزش و تست مدلهای تشخیص خط جاده استفاده میشن). نتیجهها شگفتانگیز بوده: به خصوص تو شرایط سخت مثل جادههای شبانه، جاهایی که خطهای جاده پشت ماشین یا هر مانعی پنهون باشه یا مسیرهای پیچدار، StaBle-MambaNet هم دقت بالاتری تو تشخیص داره و هم ساختار خطها رو بهتر نگه میداره. خلاصه که نسبت به مدلهای دیگه، هم سریعتره، هم هوشمندتر، هم قابل اعتمادتر!
اگه بخوام جمع بندی کنم: این مدل StaBle-MambaNet واقعا قد یه انقلاب تو تشخیص خطوط جاده برای ماشینهای خودران ارزش داره، چون مشکل تاری و مبهم شدن خطها رو هوشمندانه، سریع و دقیق حل میکنه! اگه به هوش مصنوعی علاقه داری، حتماً پیگیر این مدل بمون چون قراره حسابی خبرساز بشه.
منبع: +