روبات‌های مگسی: دسته پهپادهایی که مثل حشره‌ها حرفه‌ای از پس موانع برمیان!

اگه بهت بگم چندتا دانشمند تو یه دانشگاه تو شانگهای یه کار خفن کردن که ممکنه دنیا رو تکون بده، باورت میشه؟! طرفای دانشگاه Shanghai Jiao Tong اومدن یه سیستم هوش مصنوعی ساختن که باعث میشه دسته‌ای پهپاد (یعنی همون کلی پهپاد که با هم حرکت می‌کنن) بتونن خیلی راحت و با سرعت از بین کلی مانع و محیط شلوغ رد بشن؛ بدون اینکه گرون تموم شه یا اصلاً نیاز به کنترل انسان یا سخت‌افزار عجیب‌غریب باشه.

قبلاً داستان اینجوری بود که اگه می‌خواستی یه پهپاد توی همچین محیطی باشه، باید براش کلی بخش مثل نقشه‌کشی، تشخیص مسیر، تشخیص مانع و کنترل پرواز جدا درست می‌کردی. خب این باعث می‌شد پهپادها هم کند واکنش نشون بدن، هم اگه یه جایی اشتباه پیش میومد تا آخر ماموریت خراب بشه. خلاصه همه چی پیچیده و گرون درمیومد.

حالا محققین چینی یه مدل جدید آوردن که همه کارها رو به یه شبکه عصبی فشرده (یعنی هوش مصنوعی جدی!) سپرد. این شبکه مبتنی بر «فیزیک قابل تفکیک» هست. یه توضیح کوچولو: Differentiable Physics یعنی می‌تونن توی شبیه‌سازی‌های کامپیوتری قوانین فیزیکی رو وارد مدل کنن و شبکه عصبی طبق اون خودش رو تنظیم کنه. به این کار توی آموزش شبکه عصبی میگن «Backpropagation» که یعنی شبکه می‌تونه خودش رو بعد از هر اشتباه بهینه کنه.

یکی دیگه از بخش‌های خفن کارشون اینه که برای دیدن محیط اصلاً لازم نیست از دوربین گرون یا سنسورهای عجیب‌غریب استفاده بشه. فقط یه دوربین عمق ۱۲ در ۱۶ پیکسلی گذاشتن! یعنی تصویرش خیلی محو و بی‌جزئیاته. شبیه چشم‌های مرکب حشره‌ها! اما همین اطلاعات خیلی کم برای هوش مصنوعی کافیه که تو لحظه تصمیم بگیره و از لابلای موانع رد کنه پهپاد رو. این حرکت رو قبلاً خیلی جاها امتحان کردن اما این تیم تونست پهپادهاشو به سرعت ۲۰ متر بر ثانیه (یعنی ۶۵.۶ فوت بر ثانیه) برسونه! تقریباً دو برابر سریعتر از روش‌های قبلی که مبتنی بر یادگیری بودن.

تازه جالب‌تر اینکه موفقیتشون توی رد شدن از محیط شلوغ به ۹۰٪ رسیده، در حالی که قبلاً سیستم‌ها فقط حدود ۶۰٪ موفق بودن. یعنی حسابی حرفه‌ای تر عمل کردن. همه اینا روی یه برد خیلی کوچیک که فقط ۲۱ دلار قیمتشه اجرا میشه! نیازی هم به کارت گرافیک و سخت‌افزار خفن (مثلاً GPU که مخصوص پردازش گرافیکه) نداره، پس می‌تونی کلی پهپاد ارزون بسازی و راه بندازی.

نکته‌ی جالب بعدی اینکه معمولاً شبکه‌های عصبی (Deep Learning یعنی یادگیری عمیق توسط هوش مصنوعی) به یه عالمه اطلاعات واقعی و داده‌های برچسب‌خورده توسط افراد متخصص نیاز دارن، اما اینجا کل آموزش تو محیط شبیه‌سازی بوده! یعنی فقط فیزیک پایه و محیط‌های هندسی ساده دادن و مدل رو یاد دادن که چطور پرواز کنه. اصلاً نه پرواز واقعی ضبط کردن، نه داده‌های تمرینیِ ساخت دست آدم!

وقتی این سیستم رو امتحان کردن، چندتا پهپاد مثل یک گروه بدون اینکه با هم حرف بزنن یا یه مرکزی بهشون دستور بده، خودشون برنامه‌ریزی کردن و با هم جلو رفتن. این رفتار خودسازمان‌دهی تو دنیا روبات‌های گروهی خیلی خاصه و پتانسیل زیادی داره. تیم الان داره بررسی می‌کنه که به جای دوربین عمق، از «حسگر جریان اپتیکال» استفاده کنه. Optical flow یعنی یه روش که حرکت رو می‌سنجه و از قدیم هم تو زیست‌شناسی دیده شده که حشره‌ها باهاش جهت می‌گیرن.

استاد Zou و Lin گفتن که داریم بررسی می‌کنیم اگه بجای Depth Map (یعنی نقشه‌برداری عمق محیط)، از Optical Flow استفاده کنیم، پرواز پهپادها کاملاً خودکار و دقیق‌تر بشه. میگن حسگر جریان نوری اطلاعات حرکتی پایه رو به سیستم میده و دانشمندا سالهاست فهمیدن این روش اساس بینایی حشرات مثل مگس و زنبوره. هدفشون اینه که پرنده‌های روباتیک هر چی بیشتر شبیه استراتژی‌های طبیعی حشرات بشن و ناوبری رو یاد بگیرن.

یه نکته‌ی دیگه هم دارن بررسی می‌کنن، اونم اینکه دقیقاً این شبکه یادگیرنده چجوری تصمیم می‌گیره؟ می‌خوان مدل رو شفاف‌تر کنن که بشه قشنگ فهمید تو ذهن مدل چی می‌گذره موقع تصمیم‌گیری—که بهش میگن «تفسیرپذیری یادگیری انتها به انتها» یا همون End-to-End Learning Interpretability.

در کل اگه دوست داشتی بیشتر بخونی، اصل مقاله رو تو مجله Nature Machine Intelligence یا تو سایت arXiv راحت پیدا می‌کنی! خلاصه، احتمالاً همین روزا باید انتظار پهپادهایی رو داشته باشیم که مثل یه گروه مگس، شیک و سریع از بین موانع رد میشن و به کمک بشر میان، چه سر ضبط فیلم، چه تو عملیات امداد و نجات و حتی کارای صنعتی!

منبع: +