خب بریم سراغ یه موضوع خیلی جذاب تو دنیای هوش مصنوعی! اگه تا حالا با مدلهایی که جواب سوالها رو میدن سر و کار داشتی، احتمالاً اسم RAG به گوشت خورده. RAG یعنی «تولید متن با کمک بازیابی اطلاعات»؛ یعنی اول با جستجو توی یه عالمه متن، اطلاعات لازم رو جمع میکنه و بعد جواب رو تولید میکنه. حالا تو این مقاله اومدن یک مدل جدید به اسم Query-Aware Graph Neural Network ساختن، که به شدت جوابدهی این سیستمها تو سوالا پیچیده رو بهتر میکنه.
اول یه توضیح کوچیک: Graph Neural Network یا همون GNN یعنی یه نوع از شبکههای عصبی که تخصصش کار با دیتا به صورت گرافیه؛ گراف هم میدونی چیه؟ همون چیزی که از کلی نقطه و خط تشکیل شده، و میتونی روابط بین دیتاها رو نشون بدی.
تمام مدلهای قبلی RAG معمولاً هر سند یا متن رو جداجدا در نظر میگرفتن؛ انگار هر تیکه متن تو یه جزیره جداگانهس! اینجا اما داستان فرق داره. این مدل جدید، برای هر سوال (یا «اپیزود») یه گراف دانش میسازه، که توش نه فقط ترتیب تیکههای متن بلکه رابطه معنایی بینشون رو هم به صورت گراف نشون میده. یعنی میره دنبال این که کدوم تیکهها به هم وصلن و چرا، نه فقط این که قبل و بعد کدوم اومدن.
یه قابلیت جذاب دیگه هم که آوردن، اینه که موقع جواب دادن به جای اینکه همه گراف رو با هم نگاه کنه، میاد با توجه به همون سوال (Query-Aware)، روی بخشای مهم و مرتبط تمرکز میکنه. این کار با استفاده از یه چیزی به اسم Query-Guided Pooling انجام میشه. منظور از Pooling همون جمعبندی هوشمنده که مثلاً میگه “آقا اینا مهمترن، رو اینا بیشتر دقیق شو!”.
برای اینکه بدونیم این روش چقدر جواب میده، تو آزمایشها دیدن که واسه سوالات پیچیده که جوابشون تو چند تا سند مختلف قایم شده (بهشون میگن Multi-hop Questions)، این مدل جدید، از مدلهای قدیمی Dense Retriever خیلی بهتر عمل میکنه. Dense Retriever یعنی سیستمهایی که صرفاً به شکل فشرده دادهها رو کنار هم میذارن و دنبال جواب میگردن، اما به رابطه بین تیکهها دقتی ندارن. پس تو سوالای چندمرحلهای که باید از چند جا اطلاعات رو برداری و بهم وصل کنی، این روش جدید واقعاً میدرخشه.
یه نکته فنی هم اینه که واسه پیادهسازی این مدل، از PyTorch Geometric استفاده کردن. این یه کتابخونه خیلی قوی تو پایتورچ (یه فریمورک معروف هوش مصنوعی) مخصوص کار با دادههای گرافی هست، که باعث میشه اجرا و مقیاسگذاری مدل خیلی راحتتر بشه.
خلاصه که اگه دنبال ساختن مدلهایی هستی که بتونن جواب سوالای سخت رو با هوشمندی بیشتر و سرعت بالا پیدا کنن، این سبک جدید GNN که آگاه به سوال هم هست، واقعاً حرف نداره!
منبع: +