با روش Branch-and-Browse سریع و باحال وب‌گردی کن!

Fall Back

تا حالا راجع به ربات‌هایی که می‌تونن خودشون توی اینترنت بچرخن و کار انجام بدن شنیدی؟ مثلاً همین هوش مصنوعی‌هایی که می‌تونن براساس هدفی که بهشون می‌دی، اطلاعات جمع کنن، گزارش بنویسن یا حتی خرید آنلاین انجام بدن! این‌ها رو بهشون می‌گن autonomous web agents یعنی ربات‌های خودگردان وب!

حالا مشکل اینجاست که اگه بخوای این ربات‌ها رو با مدل‌های زبانی بزرگ (Large Language Models یا همون LLMs، مثلاً ChatGPT) راه بندازی، خیلی وقتا تو انجام کارهای چند مرحله‌ای کم میارن یا نمی‌تونن به عقب برگردن و دوباره مسیر جدید امتحان کنن. یه سری روش‌های جستجو هم که هست کلی سنگین و کندن و عملاً توی عمل به درد بخور نیستن.

حالا یه تیم خفن اومده یه چارچوب جدید درست کرده به اسم Branch-and-Browse. این روش، کلی نوآوری باحال داره که هم انجام کار رو سریع‌تر می‌کنه، هم باعث میشه ربات بتونه باهوش‌تر عمل کنه و حتی به عقب برگرده و اشتباهاتش رو جبران کنه! اینجوری میشه ربات‌هایی داشت که واقعاً می‌تونن مثل یه آدم هوشمند توی وب بچرخن و دنبال هدفشون برن.

درِ اصل این Branch-and-Browse سه کار اصلی می‌کنه:

  1. مدیریت زیر کارها با ساختار درختی
    یعنی هر کاری که باید انجام بشه رو به چند زیرکار کوچیک تقسیم می‌کنه و بعد هر کدوم رو جدا جدا با یه مدل به اسم درخت (tree-structured) جلو می‌بره. ساختار درختی یعنی مثل یه درخت که شاخه داره، این هم می‌تونه چند مسیر همزمان امتحان کنه و لنگ یه خط مستقیم نمونه. اینجوری ربات می‌تونه چند راه رو همزمان بررسی کنه و بهتر تصمیم بگیره.

  2. بازپخش حالت‌های وب با استدلال پس‌زمینه
    این بخش یعنی ربات می‌تونه اون چیزی که قبلاً توی سایت دیده یا امتحان کرده رو دوباره مرور کنه و براساسش بهتر فکر کنه. فرض کن کل قدم‌ها و تصمیم‌هاش رو ذخیره می‌کنه و هر وقت بخواد، مثل فیلم سریع‌پیشروی، برگرده و نگاه کنه ببینه چی شده.

  3. حافظه عملکرد صفحه (page action memory)
    یه حافظه مخصوص داره که اون کارهایی که قبلاً انجام داده (مثلاً کلیک کردن رو یک دکمه یا باز کردن یه لینک) رو نگه می‌داره و باز هم اگه لازم شد ازش استفاده می‌کنه. حتی این اطلاعات می‌تونه توی استفاده‌های بعدی هم کمکش کنه.

توی یه آزمون معروف به اسم WebArena، که مخصوص تست همین ربات‌هاست، Branch-and-Browse حدود ۳۵.۸٪ موفقیت تو انجام هدف‌ها داشته که واقعاً عدد خوبیه. جالب‌تر اینه که زمان انجام کارها رو هم تا ۴۰.۴٪ نسبت به روش‌های قبلی کم کرده! یعنی هم سریع‌تر، هم موفق‌تر.

در کل اگه دنبال یه روش باحال و خلاقانه برای ربات‌های وب‌گرد می‌گردی، Branch-and-Browse هم کار رو آسون‌تر می‌کنه، هم بهتر کنترل تو دست خودته و می‌تونه باعث بشه مدل هوش مصنوعی‌ات توی اینترنت واقعاً بدرخشه!

منبع: +