خب بچهها، امروز میخوام براتون درباره یه پروژه خیلی جالب و خفن تعریف کنم! یه تیم پژوهشگر اومدن سراغ یه چالش سخت: اینکه چجوری رباتهای چهارپا – مثلاً همون رباتهایی که شبیه سگ هستن – بتونن اشیایی که وسط هوا پرتاب میشن رو با یه سبد (basket) بگیرن. حالا چرا این کار انقدر سخته؟ دوتا مشکل اساسی داره:
اولاً هیچ دیتاست (مجموعه داده) عمومیای وجود نداشت که توش کلی شیء مختلف با رفتارهای هوایی عجیب و غریب قرار داشته باشه. مثلاً فرض کن یه توپ پلاستیکی با یه تیکه چوب فرق داره وقتی پرتابشون میکنی، چون هر کدوم تو هوا حرکت متفاوتی دارن (این میشه unsteady aerodynamics یعنی دینامیکهای هوایی نامتعادل و متنوع).
دوماً توی مراحل اولیه پرتاب، مسیر پرواز (trajectory) خیلی از این اشیا شبیه همه. پس پیشبینی اینکه دقیقاً کجا فرود میان، خیلی سخته.
برای حل این داستانها، این تیم یک دیتاست واقعی درست کردن که توش ۸۰۰۰ تا مسیر پرواز (trajectory) برای ۲۰ نوع شیء مختلف جمعآوری شده. یعنی کلی توپ و مکعب و اشیای عجیب تو شرایط واقعی پرتاب شدن و بررسی شدن که چه مسیری تو هوا طی میکنن و کجا فرود میان.
حالا میرسیم به اصل پروژه:
این بچهها سیستمی به اسم DIPP ساختن، که مخفف “Discriminative Impact Point Predictor” هستش. خب بذار توضیح بدم چی میشه: “Discriminative” یعنی جداکننده یا تشخیصدهنده (یعنی سیستم میتونه فرق اشیای مختلف رو بفهمه)، “Impact Point” یعنی همون نقطه برخورد یا نقطه فرود، و “Predictor” هم یعنی پیشبینیکننده. پس کلیت DIPP اینه که بتونه نقطه فرود هر شیء رو – حتی اگه تو هوا همدیگه رو شبیه باشن – درست حدس بزنه.
خود DIPP دوتا بخش اساسی داره:
۱. Discriminative Feature Embedding (DFE): یه بخشیه که میاد ویژگیهای هر مسیر پرواز رو استخراج میکنه و سعی میکنه فرقهاشون رو به خوبی تشخیص بده. مثلا اگه توپ باشه یا قطعه چوب، بر اساس دینامیک حرکتیشون تفکیکشون میکنه (اصطلاحاً embedding یعنی تبدیل چیزها به عددهایی که مدل میتونه راحتتر بفهمه).
۲. Impact Point Predictor (IPP): این بخش از همون ویژگیهایی که DFE ساخته، نقطه فرود رو پیشبینی میکنه. IPP خودش دو مدل مختلف داره:
– یکی به اسم Neural Acceleration Estimator (NAE)، یعنی مدلی که شتابهایی که شیء تو هوا تجربه میکنه رو با شبکه عصبی (همون هوش مصنوعی) تخمین میزنه و بعد نقطه فرود رو در میاره.
– یکی دیگه هم Direct Point Estimator (DPE) که راه سادهتر رو انتخاب میکنه و مستقیم نقطه فرود رو حدس میزنه.
حالا نتیجه چی شد؟ آزمایشها نشون دادن دیتاست جدید این گروه هم متنوعتر و هم پیچیدهتر از دیتاستهای قبلیه. مهمتر از اون، این مدل DIPP توی پیشبینی نقطه فرود هم برای ۱۵ تا از اشیایی که مدل دیده بود و هم برای ۵ تا شیء جدید که اصلاً قبلاً به مدل نشون نداده بودن، بهتر از روشهای پایهای (baselines یعنی همون مدلهای سادهتر یا قدیمیتر) عمل کرد!
یه نکته مهم دیگه هم اینه که اگه پیشبینی نقطه برخورد سریعتر و دقیقتر انجام بشه، احتمال اینکه ربات تو شبیهساز بتونه اون شیء پرتابی رو بگیره خیلی زیاد میشه! تازه تو آزمایشهای واقعی هم عملکرد این روش رو نشون دادن و کلی فیلم و دموی جذاب دارن که میتونین اینجا ببینین:
https://sites.google.com/view/robot-catching-2025
در کل خلاصه بگم خود DIPP و دیتاست جدیدشون واقعاً یه قدم خیلی جدی برای اینه که رباتهای سگمانند بتونن توی دنیای واقعی با پیچیدگیهای پرتاب اجسام دست و پنجه نرم کنن و باحالتر شدنشون رو بیشتر ببینیم!
منبع: +