آیا واقعاً میشه بدون آموزش، زیر آب اشیا سه‌بعدی پیدا کرد؟ مقایسه روش‌های سنتی و یادگیری عمیق!

Fall Back

تا حالا به این فکر کردی زیر آب چطور اشیا رو پیدا می‌کنن؟ مخصوصاً وقتی دیتای کافی برای آموزش هوش مصنوعی وجود نداره؟ خب، این موضوع واقعاً یکی از سخت‌ترین چالش‌ها تو دنیای بینایی ماشین یا همون Computer Vision هست؛ یعنی وقتی یه کامپیوتر سعی می‌کنه چیزی رو ببینه و تشخیص بده. مخصوصاً زیر آب که شرایط خیلی فرق داره و پر از نویز صوتی و سختی کار با سونار و همه این داستان‌هاست!

خیلی وقت‌ها شرکت‌ها و محقق‌ها دوس دارن با استفاده از یادگیری عمیق یا همون Deep Learning (یعنی هوش مصنوعی‌هایی که خودشون یاد می‌گیرن و خیلی قوی هستن) اشیا رو زیر آب تشخیص بدن. اما اینجا یه مشکل گنده هست: جمع کردن دیتای لازم از سونار، مخصوصاً دیتای برچسب‌خورده و باکیفیت، واقعاً گرونه و دردسراش کم نیست! فرض کن باید قایق تخصصی داشته باشن، کارشناس‌های حرفه‌ای لازمه، تازه باید هوا هم خوب باشه که بتونن داده جمع کنن. خلاصه که موضوع ساده‌ای نیست.

حالا سوال اصلی این مقاله اینه: میشه بدون اینکه داده واقعی از دنیای واقعی داشته باشیم، یه مدل خوب برای تشخیص اشیای سه‌بعدی زیر آب ساخت؟! اینجاست که داستان جذاب میشه!

توی این تحقیق، محقق‌ها دوتا رویکرد رو تست کردن. یکی، استفاده از شبیه‌سازی فیزیکی سونار برای ساخت داده مصنوعی. یعنی با یه شبیه‌ساز، مثل این‌که داری تو بازی کامپیوتری سونار رو شبیه‌سازی می‌کنی، داده جعلی می‌سازن و بعد با اون داده‌ها یه مدل یادگیری عمیق رو آموزش میدن.

اما رویکرد دوم یه روش سنتی‌تر و باحال‌تر رو استفاده کرده: تطبیق قالب یا همون Template Matching. توضیح کوتاهش این میشه که میرن دنبال اشکال هندسی‌ای که انتظار دارن هدفشون شبیه اونا باشه، و مدل رو مجبور نمی‌کنن چیز جدیدی یاد بگیره؛ فقط دنبال تطبیق دادن با الگوهای هندسی معروفه.

وقتی این دوتا روش رو روی داده واقعی که از بررسی بستر دریای بالتیک (Baltic Sea) جمع شده بودن امتحان کردن، نتایج جالبی گرفتن! اون مدل هوش مصنوعی که با داده شبیه‌سازی‌شده آموزش دیده بود، وقتی روی دیتای ساختگی اجرا شد تقریباً عالی جواب داد (۹۸ درصد mAP گرفت – mAP یعنی میانگین دقت مدل تو تشخیص اشیا که برای ارزیابی خیلی استفاده میشه)، اما وقتی همون مدل رو روی داده واقعی سونار امتحان کردن، دقتش ریخت پایین و شد فقط ۴۰ درصد. این افت به خاطر یه پدیده معروف به اسم domain shift اتفاق میفته – یعنی فرق بین دنیای واقعی و دنیای شبیه‌سازی‌شده!

اما روش سنتی تطبیق قالب چی؟ جالبه بدونی بدون اینکه هیچ دیتایی برای آموزش لازم داشته باشه، روی داده واقعی ۸۳ درصد mAP گرفت! یعنی تقریباً دوبرابر بهتر از اون مدل هوش مصنوعی که کلی براش داده ساختگی ساخته بودن!

درس بزرگی که این تحقیق بهمون میگه اینه که همیشه لازم نیست دنباله داده و هوش مصنوعی پرهزینه باشیم. گاهی اوقات همون روش‌های ساده‌تر و مبتنی بر مدل‌های هندسی می‌تونن حتی بهتر جواب بدن، مخصوصاً جاهایی که جمع‌کردن داده سخته و گرونه – مثل همین زیر آب.

این یافته‌ها نه‌تنها فکر خیلی‌ها رو اینجا عوض کرد، بلکه اولین مرجع جدی مقایسه برای تشخیص اشیای سه‌بعدی زیر آب بدون نیاز به آموزش رو هم ساخت. راه رو برای کلی کاربرد خفن باز می‌کنه: مثل کاوش ناوشکستگان دریایی برای باستان‌شناسی، یا نظارت بر سکوهای نفتی، یا حتی کمک به ربات‌های زیر آبی که به جای انسان‌ها باید حرکت کنن و اشیا رو پیدا کنن.

در نهایت، این داستان بهمون نشون میده اگه منابع کمی داشتی یا داده واقعی جمع کردن برات سخت بود، ناامید نشو! هنوز هم کلی راه باحال هست برای حل مسئله، حتی توی چالش‌برانگیزترین جاها مثل زیر آب.

منبع: +