اگه اسم RAG تا حالا به گوشتون نخورده، بذارین یه توضیح ساده بدم: RAG یعنی “Retrieval-Augmented Generation”؛ یعنی یه مدل هوش مصنوعی که برای جواب دادن به سوالات، هم میره دنبال اطلاعات (retrieval) هم خودش جواب رو تولید میکنه (generation). مثلاً وقتی از چتباتی دربارهی یه گزارش کاری سوال میپرسین، اول میگرده دنبال بخش مربوط به سوال، بعدش خلاصهش میکنه و جواب میده.
حالا خیلی از شرکتها و تیمها دارن از RAG برای کارهای مختلف روی دادههای سازمانیشون استفاده میکنن. تا همین چند وقت پیش، RAG بیشتر محدود بود به همین جستجوی متن و دوباره رتبهبندی کردن نتایج. یعنی متنها رو میگرده، جواب مرتبط پیدا میکنه و جوابش رو میده. ولی واقعیت اینه که این روش، جای پیشرفت زیادی داره، مخصوصاً وقتی کارمون فقط خلاصه کردن یا جواب دادن به سوالات ساده نیست، یا حتی وقتی فقط با نوشته (text) سر و کار نداریم.
اینجا یه سوال پیش میاد: وقتی سوالات پیچیدهتر میشن – مثلاً نیاز به تحلیل، استدلال، یا کار با دادههایی غیر از متن، مثل تصویر یا جدول داریم – آیا همین RAG جواب میده؟ خب نه! واسه همین، کلی آدم دور هم جمع شدن تا روی روشها و مدلهای جدیدتری کار کنن که RAG بتونه جواب این مدل سوالات رو هم بده و توقع کاربرا رو برآورده کنه.
نویسندههای این مقاله اومدن یه چارچوب جدید معرفی کردن – بهش میگن چارچوب پنجسطحی RAG یا همون L1 تا L5. اینطوری بهتر میفهمیم هر سیستم جوابدهی (Question Answering System) تا چه حد پیچیدگی و دادههای مختلف رو پشتیبانی میکنه:
- L1: اطلاعات سطحی از دادههای بدون ساختار (Unstructured Data) مثلاً فقط بلدن جواب سوالات خیلی ساده رو از یه متن بلند پیدا کنن.
- L2: کمی تحلیل بیشتر میتونن اطلاعات ساده رو کنار هم بذارن، ولی هنوز هم دنبال تحلیل عمیق یا استدلال نیستن.
- L3: جمعزنی و ترکیب اطلاعات از چند تا سورس داده، مثلاً متنی به اضافه جدول یا نمودار.
- L4: دانش استدلالی و بازتابی این سطح یعنی سیستم خودش میتونه دست به استدلال بزنه یا از چند منبع، استنتاج کنه. (مثلاً خودش متوجه میشه یه جواب درست چطوری ساخته میشه)
- L5: هوش عمومی (General Intelligence) – این بخش فعلاً آرزوی ماست! یعنی سیستمی که مثل یه آدم واقعی همهچیز رو بفهمه و حل کنه.
حرف جالب تو این مقاله اینه که RAG فعلاً مثل یه جعبه ابزار پر از تکنیکهای مختلفه، نه یه راهحل مشخصِ واحد. برای همینم لازمه هر وقت از RAG حرف میزنیم، به مشکل و نیاز واقعی کاربرها هم فکر کنیم.
توی همین مقاله، بچهها چهار تا پلتفرم معروف رو هم بررسی کردن: LangChain، Azure AI Search، OpenAI و Corvic AI. اینا از بهترین روشهای RAG هستن که هر کدوم یه جور خاص کار میکنن. نتیجه؟ هر چی سیستم پیچیدهتر و امکاناتش بیشتر باشه (مثلاً بتونه همزمان توی چند نوع داده بچرخه، یا فرآیند جواب دادن رو پویا و داینامیک مدیریت کنه)، راحتتر میتونه وظایف L1 تا L4 رو انجام بده.
واسه اینکه این تقسیمبندی حرفی نباشه، کلی تست و آزمون هم با دیتاستهای مختلف شرکتها انجام دادن تا ببینن واقعاً چند مرده حلاجن! خلاصه اینکه، الان دیگه میشه فهمید سیستمهای مختلف RAG کجا کاربرد دارن و بر اساس همین سطوح، میتونیم سنجششون کنیم.
در کل، این چارچوب پنجسطحی باعث میشه بهتر بفهمیم هر سیستم جوابدهی روی چه جور داده و چه مدل سوالاتی قویتره و چه جاهایی هنوز جای کار داره. پس اگه دنبال راهاندازی RAG برای شرکت یا تیمتون هستین، حتما به این سطحها توجه کنین تا بتونین بهترین خروجی و جوابها رو بگیرین!
منبع: +