اگه بهت بگم چندتا دانشمند تو یه دانشگاه تو شانگهای یه کار خفن کردن که ممکنه دنیا رو تکون بده، باورت میشه؟! طرفای دانشگاه Shanghai Jiao Tong اومدن یه سیستم هوش مصنوعی ساختن که باعث میشه دستهای پهپاد (یعنی همون کلی پهپاد که با هم حرکت میکنن) بتونن خیلی راحت و با سرعت از بین کلی مانع و محیط شلوغ رد بشن؛ بدون اینکه گرون تموم شه یا اصلاً نیاز به کنترل انسان یا سختافزار عجیبغریب باشه.
قبلاً داستان اینجوری بود که اگه میخواستی یه پهپاد توی همچین محیطی باشه، باید براش کلی بخش مثل نقشهکشی، تشخیص مسیر، تشخیص مانع و کنترل پرواز جدا درست میکردی. خب این باعث میشد پهپادها هم کند واکنش نشون بدن، هم اگه یه جایی اشتباه پیش میومد تا آخر ماموریت خراب بشه. خلاصه همه چی پیچیده و گرون درمیومد.
حالا محققین چینی یه مدل جدید آوردن که همه کارها رو به یه شبکه عصبی فشرده (یعنی هوش مصنوعی جدی!) سپرد. این شبکه مبتنی بر «فیزیک قابل تفکیک» هست. یه توضیح کوچولو: Differentiable Physics یعنی میتونن توی شبیهسازیهای کامپیوتری قوانین فیزیکی رو وارد مدل کنن و شبکه عصبی طبق اون خودش رو تنظیم کنه. به این کار توی آموزش شبکه عصبی میگن «Backpropagation» که یعنی شبکه میتونه خودش رو بعد از هر اشتباه بهینه کنه.
یکی دیگه از بخشهای خفن کارشون اینه که برای دیدن محیط اصلاً لازم نیست از دوربین گرون یا سنسورهای عجیبغریب استفاده بشه. فقط یه دوربین عمق ۱۲ در ۱۶ پیکسلی گذاشتن! یعنی تصویرش خیلی محو و بیجزئیاته. شبیه چشمهای مرکب حشرهها! اما همین اطلاعات خیلی کم برای هوش مصنوعی کافیه که تو لحظه تصمیم بگیره و از لابلای موانع رد کنه پهپاد رو. این حرکت رو قبلاً خیلی جاها امتحان کردن اما این تیم تونست پهپادهاشو به سرعت ۲۰ متر بر ثانیه (یعنی ۶۵.۶ فوت بر ثانیه) برسونه! تقریباً دو برابر سریعتر از روشهای قبلی که مبتنی بر یادگیری بودن.
تازه جالبتر اینکه موفقیتشون توی رد شدن از محیط شلوغ به ۹۰٪ رسیده، در حالی که قبلاً سیستمها فقط حدود ۶۰٪ موفق بودن. یعنی حسابی حرفهای تر عمل کردن. همه اینا روی یه برد خیلی کوچیک که فقط ۲۱ دلار قیمتشه اجرا میشه! نیازی هم به کارت گرافیک و سختافزار خفن (مثلاً GPU که مخصوص پردازش گرافیکه) نداره، پس میتونی کلی پهپاد ارزون بسازی و راه بندازی.
نکتهی جالب بعدی اینکه معمولاً شبکههای عصبی (Deep Learning یعنی یادگیری عمیق توسط هوش مصنوعی) به یه عالمه اطلاعات واقعی و دادههای برچسبخورده توسط افراد متخصص نیاز دارن، اما اینجا کل آموزش تو محیط شبیهسازی بوده! یعنی فقط فیزیک پایه و محیطهای هندسی ساده دادن و مدل رو یاد دادن که چطور پرواز کنه. اصلاً نه پرواز واقعی ضبط کردن، نه دادههای تمرینیِ ساخت دست آدم!
وقتی این سیستم رو امتحان کردن، چندتا پهپاد مثل یک گروه بدون اینکه با هم حرف بزنن یا یه مرکزی بهشون دستور بده، خودشون برنامهریزی کردن و با هم جلو رفتن. این رفتار خودسازماندهی تو دنیا روباتهای گروهی خیلی خاصه و پتانسیل زیادی داره. تیم الان داره بررسی میکنه که به جای دوربین عمق، از «حسگر جریان اپتیکال» استفاده کنه. Optical flow یعنی یه روش که حرکت رو میسنجه و از قدیم هم تو زیستشناسی دیده شده که حشرهها باهاش جهت میگیرن.
استاد Zou و Lin گفتن که داریم بررسی میکنیم اگه بجای Depth Map (یعنی نقشهبرداری عمق محیط)، از Optical Flow استفاده کنیم، پرواز پهپادها کاملاً خودکار و دقیقتر بشه. میگن حسگر جریان نوری اطلاعات حرکتی پایه رو به سیستم میده و دانشمندا سالهاست فهمیدن این روش اساس بینایی حشرات مثل مگس و زنبوره. هدفشون اینه که پرندههای روباتیک هر چی بیشتر شبیه استراتژیهای طبیعی حشرات بشن و ناوبری رو یاد بگیرن.
یه نکتهی دیگه هم دارن بررسی میکنن، اونم اینکه دقیقاً این شبکه یادگیرنده چجوری تصمیم میگیره؟ میخوان مدل رو شفافتر کنن که بشه قشنگ فهمید تو ذهن مدل چی میگذره موقع تصمیمگیری—که بهش میگن «تفسیرپذیری یادگیری انتها به انتها» یا همون End-to-End Learning Interpretability.
در کل اگه دوست داشتی بیشتر بخونی، اصل مقاله رو تو مجله Nature Machine Intelligence یا تو سایت arXiv راحت پیدا میکنی! خلاصه، احتمالاً همین روزا باید انتظار پهپادهایی رو داشته باشیم که مثل یه گروه مگس، شیک و سریع از بین موانع رد میشن و به کمک بشر میان، چه سر ضبط فیلم، چه تو عملیات امداد و نجات و حتی کارای صنعتی!
منبع: +