تا حالا راجع به رباتهایی که میتونن خودشون توی اینترنت بچرخن و کار انجام بدن شنیدی؟ مثلاً همین هوش مصنوعیهایی که میتونن براساس هدفی که بهشون میدی، اطلاعات جمع کنن، گزارش بنویسن یا حتی خرید آنلاین انجام بدن! اینها رو بهشون میگن autonomous web agents یعنی رباتهای خودگردان وب!
حالا مشکل اینجاست که اگه بخوای این رباتها رو با مدلهای زبانی بزرگ (Large Language Models یا همون LLMs، مثلاً ChatGPT) راه بندازی، خیلی وقتا تو انجام کارهای چند مرحلهای کم میارن یا نمیتونن به عقب برگردن و دوباره مسیر جدید امتحان کنن. یه سری روشهای جستجو هم که هست کلی سنگین و کندن و عملاً توی عمل به درد بخور نیستن.
حالا یه تیم خفن اومده یه چارچوب جدید درست کرده به اسم Branch-and-Browse. این روش، کلی نوآوری باحال داره که هم انجام کار رو سریعتر میکنه، هم باعث میشه ربات بتونه باهوشتر عمل کنه و حتی به عقب برگرده و اشتباهاتش رو جبران کنه! اینجوری میشه رباتهایی داشت که واقعاً میتونن مثل یه آدم هوشمند توی وب بچرخن و دنبال هدفشون برن.
درِ اصل این Branch-and-Browse سه کار اصلی میکنه:
-
مدیریت زیر کارها با ساختار درختی
یعنی هر کاری که باید انجام بشه رو به چند زیرکار کوچیک تقسیم میکنه و بعد هر کدوم رو جدا جدا با یه مدل به اسم درخت (tree-structured) جلو میبره. ساختار درختی یعنی مثل یه درخت که شاخه داره، این هم میتونه چند مسیر همزمان امتحان کنه و لنگ یه خط مستقیم نمونه. اینجوری ربات میتونه چند راه رو همزمان بررسی کنه و بهتر تصمیم بگیره. -
بازپخش حالتهای وب با استدلال پسزمینه
این بخش یعنی ربات میتونه اون چیزی که قبلاً توی سایت دیده یا امتحان کرده رو دوباره مرور کنه و براساسش بهتر فکر کنه. فرض کن کل قدمها و تصمیمهاش رو ذخیره میکنه و هر وقت بخواد، مثل فیلم سریعپیشروی، برگرده و نگاه کنه ببینه چی شده. -
حافظه عملکرد صفحه (page action memory)
یه حافظه مخصوص داره که اون کارهایی که قبلاً انجام داده (مثلاً کلیک کردن رو یک دکمه یا باز کردن یه لینک) رو نگه میداره و باز هم اگه لازم شد ازش استفاده میکنه. حتی این اطلاعات میتونه توی استفادههای بعدی هم کمکش کنه.
توی یه آزمون معروف به اسم WebArena، که مخصوص تست همین رباتهاست، Branch-and-Browse حدود ۳۵.۸٪ موفقیت تو انجام هدفها داشته که واقعاً عدد خوبیه. جالبتر اینه که زمان انجام کارها رو هم تا ۴۰.۴٪ نسبت به روشهای قبلی کم کرده! یعنی هم سریعتر، هم موفقتر.
در کل اگه دنبال یه روش باحال و خلاقانه برای رباتهای وبگرد میگردی، Branch-and-Browse هم کار رو آسونتر میکنه، هم بهتر کنترل تو دست خودته و میتونه باعث بشه مدل هوش مصنوعیات توی اینترنت واقعاً بدرخشه!
منبع: +