تا حالا به این فکر کردی زیر آب چطور اشیا رو پیدا میکنن؟ مخصوصاً وقتی دیتای کافی برای آموزش هوش مصنوعی وجود نداره؟ خب، این موضوع واقعاً یکی از سختترین چالشها تو دنیای بینایی ماشین یا همون Computer Vision هست؛ یعنی وقتی یه کامپیوتر سعی میکنه چیزی رو ببینه و تشخیص بده. مخصوصاً زیر آب که شرایط خیلی فرق داره و پر از نویز صوتی و سختی کار با سونار و همه این داستانهاست!
خیلی وقتها شرکتها و محققها دوس دارن با استفاده از یادگیری عمیق یا همون Deep Learning (یعنی هوش مصنوعیهایی که خودشون یاد میگیرن و خیلی قوی هستن) اشیا رو زیر آب تشخیص بدن. اما اینجا یه مشکل گنده هست: جمع کردن دیتای لازم از سونار، مخصوصاً دیتای برچسبخورده و باکیفیت، واقعاً گرونه و دردسراش کم نیست! فرض کن باید قایق تخصصی داشته باشن، کارشناسهای حرفهای لازمه، تازه باید هوا هم خوب باشه که بتونن داده جمع کنن. خلاصه که موضوع سادهای نیست.
حالا سوال اصلی این مقاله اینه: میشه بدون اینکه داده واقعی از دنیای واقعی داشته باشیم، یه مدل خوب برای تشخیص اشیای سهبعدی زیر آب ساخت؟! اینجاست که داستان جذاب میشه!
توی این تحقیق، محققها دوتا رویکرد رو تست کردن. یکی، استفاده از شبیهسازی فیزیکی سونار برای ساخت داده مصنوعی. یعنی با یه شبیهساز، مثل اینکه داری تو بازی کامپیوتری سونار رو شبیهسازی میکنی، داده جعلی میسازن و بعد با اون دادهها یه مدل یادگیری عمیق رو آموزش میدن.
اما رویکرد دوم یه روش سنتیتر و باحالتر رو استفاده کرده: تطبیق قالب یا همون Template Matching. توضیح کوتاهش این میشه که میرن دنبال اشکال هندسیای که انتظار دارن هدفشون شبیه اونا باشه، و مدل رو مجبور نمیکنن چیز جدیدی یاد بگیره؛ فقط دنبال تطبیق دادن با الگوهای هندسی معروفه.
وقتی این دوتا روش رو روی داده واقعی که از بررسی بستر دریای بالتیک (Baltic Sea) جمع شده بودن امتحان کردن، نتایج جالبی گرفتن! اون مدل هوش مصنوعی که با داده شبیهسازیشده آموزش دیده بود، وقتی روی دیتای ساختگی اجرا شد تقریباً عالی جواب داد (۹۸ درصد mAP گرفت – mAP یعنی میانگین دقت مدل تو تشخیص اشیا که برای ارزیابی خیلی استفاده میشه)، اما وقتی همون مدل رو روی داده واقعی سونار امتحان کردن، دقتش ریخت پایین و شد فقط ۴۰ درصد. این افت به خاطر یه پدیده معروف به اسم domain shift اتفاق میفته – یعنی فرق بین دنیای واقعی و دنیای شبیهسازیشده!
اما روش سنتی تطبیق قالب چی؟ جالبه بدونی بدون اینکه هیچ دیتایی برای آموزش لازم داشته باشه، روی داده واقعی ۸۳ درصد mAP گرفت! یعنی تقریباً دوبرابر بهتر از اون مدل هوش مصنوعی که کلی براش داده ساختگی ساخته بودن!
درس بزرگی که این تحقیق بهمون میگه اینه که همیشه لازم نیست دنباله داده و هوش مصنوعی پرهزینه باشیم. گاهی اوقات همون روشهای سادهتر و مبتنی بر مدلهای هندسی میتونن حتی بهتر جواب بدن، مخصوصاً جاهایی که جمعکردن داده سخته و گرونه – مثل همین زیر آب.
این یافتهها نهتنها فکر خیلیها رو اینجا عوض کرد، بلکه اولین مرجع جدی مقایسه برای تشخیص اشیای سهبعدی زیر آب بدون نیاز به آموزش رو هم ساخت. راه رو برای کلی کاربرد خفن باز میکنه: مثل کاوش ناوشکستگان دریایی برای باستانشناسی، یا نظارت بر سکوهای نفتی، یا حتی کمک به رباتهای زیر آبی که به جای انسانها باید حرکت کنن و اشیا رو پیدا کنن.
در نهایت، این داستان بهمون نشون میده اگه منابع کمی داشتی یا داده واقعی جمع کردن برات سخت بود، ناامید نشو! هنوز هم کلی راه باحال هست برای حل مسئله، حتی توی چالشبرانگیزترین جاها مثل زیر آب.
منبع: +