خب بچهها، بذارین یه چیز خفن رو توضیح بدم که دنیای هوش مصنوعی رو مخصوصاً واسه برنامهنویسا و کسایی که با پروژههای بزرگ دست و پنجه نرم میکنن، حسابی جذابتر کرده! موضوع در مورد یه ابزار جدیده به اسم Git-Context-Controller یا همون GCC ـه که کلی ذهنها رو درگیر خودش کرده. حالا GCC چیه؟
اول از همه، حتماً با هوش مصنوعیهای زبانی بزرگ یا همون LLMها آشنا شدین – مثلاً همونی که میتونه باهات حرف بزنه، سوالهات رو جواب بده و حتی برات کدنویسی کنه. مشکل اینجاست که وقتی از این مدلها تو پروژههای خیلی بزرگ و طولانی مدت استفاده میکنی، مدیریت همه چیزایی که بلدن و یاد گرفتن (یا همون کانتکست یا حافظهشون) حسابی سخت و پیچیده میشه. اینجا دقیقاً همون جاییه که GCC وارد میشه و میخواد کار رو آسون کنه!
GCC الهام گرفته از گیت (Git) هست، همون ابزار محبوبی که برنامهنویسا واسه کنترل نسخهی کارهاشون ازش استفاده میکنن. گیت بهت اجازه میده هر موقع خواستی یه نقطهی ذخیره (commit)، شاخه جدید (branch)، ترکیب شاخهها (merge) و این قبیل کارهای جالب رو بزنی تا بتونی تغییراتت رو کنترل کنی و اگه لازم شد به هرجای پروژه برگشتی. حالا تو دنیای هوش مصنوعی، GCC اومده همین ایده رو روی حافظه و تجربههای این مدل های زبانی پیاده کنه!
مثلاً فرض کن یه مامور (agent) بر پایه LLM داری که داره روی یه پروژه بزرگ نرمافزاری کار میکنه و باید کلی باگ رو رفع کنه یا قابلیتهای جدید اضافه کنه. خب، این مامور باید بتونه یادش بمونه دفعهی قبل چی کار کرده، تصمیمهای مهم چی بوده، یا حتی راههای مختلفی که تست کرده رو جدا نگه داره و هر موقع لازم شد برگرده و دوباره اونها رو ببینه. اینجاست که GCC با عملیاتهای COMMIT (ذخیره لحظهای)، BRANCH (شاخهزنی واسه تست راههای مختلف)، MERGE (ادغام نتایج)، و CONTEXT (کنترل دقیق حافظه و شرح وضعیت) به کمکش میاد.
جالبیش اینجاست که با استفاده از GCC، مامورهای هوش مصنوعی میتونن اهداف بلندمدت رو مدیریت کنن، انواع آزمایشهای معماری رو جداسازی کنن (مثلاً ببینن کدوم راه حل بهتر جواب میده)، یا حتی حافظهشون رو به یه مامور دیگه بدن یا ازش پس بگیرن. یعنی دیگه اون مشکلات فراموشی یا گیج شدن وسط پروژههای بزرگ خیلی راحتتر حل میشه!
حالا برسیم به نتایج دهنپر کن: این تیم با آزمایشهای واقعی نشون دادن که وقتی از GCC استفاده بشه، عملکرد مامورهای هوش مصنوعی رو شدیداً بهبود میده. مثلاً توی یه آزمون معتبر به نام SWE-Bench-Lite که مربوط به رفع باگهای نرمافزاریه، مامورهایی که از GCC بهره بردن تونستن ۴۸٪ باگها رو حل کنن که خیلی بیشتر از ۲۶ تا سیستم رقیب دیگهس!
حتی تو یه تست عجیبتر، یه مامور مجهز به GCC اومده و از صفر برای خودش یه مامور خط فرمانی ساخته – تقریباً مثل اینه که خودش خودش رو تکثیر کرده! این مامور تونست ۴۰.۷ درصد وظایف رو تموم کنه، درحالی که مامور بدون GCC فقط ۱۱.۷ درصد موفق شد. یعنی واقعاً تفاوت محسوسه.
خلاصه اگر به هوش مصنوعی علاقهمندین یا با پروژههای نرمافزاری بزرگ سر و کار دارین، GCC یه ایده فوقالعاده جذابه که نحوه فکر کردن و سازماندهی یادگیری هوش مصنوعیها رو به سطح جدیدی برده. این پروژه متنباز هم هست و میتونین سورس کدش رو از اینجا ببینین: https://github.com/theworldofagents/GCC
ته داستان: GCC اومده که مدیریت حافظه و تجربهی مامورهای هوش مصنوعی رو مثل گیت برای آدمها، نظمونسخهپذیر کنه؛ تا دیگه وسط پروژهها چیزی رو گم یا فراموش نکنن و همیشه دستشون باز باشه دنبال ایدههای جدید برن. اگه کنجکاو شدی، یه سر به گیتهابش بزن و خودت امتحانش کن!
منبع: +