شبکه‌های عصبی گرافی هوشمندتر: وقتی پاسخ به سوالات سخت رو به یک مدل باهوش‌تر می‌سپاریم!

Fall Back

خب بریم سراغ یه موضوع خیلی جذاب تو دنیای هوش مصنوعی! اگه تا حالا با مدل‌هایی که جواب سوال‌ها رو میدن سر و کار داشتی، احتمالاً اسم RAG به گوشت خورده. RAG یعنی «تولید متن با کمک بازیابی اطلاعات»؛ یعنی اول با جستجو توی یه عالمه متن، اطلاعات لازم رو جمع می‌کنه و بعد جواب رو تولید می‌کنه. حالا تو این مقاله اومدن یک مدل جدید به اسم Query-Aware Graph Neural Network ساختن، که به شدت جواب‌دهی این سیستم‌ها تو سوالا پیچیده رو بهتر می‌کنه.

اول یه توضیح کوچیک: Graph Neural Network یا همون GNN یعنی یه نوع از شبکه‌های عصبی که تخصصش کار با دیتا به صورت گرافیه؛ گراف هم می‌دونی چیه؟ همون چیزی که از کلی نقطه و خط تشکیل شده، و می‌تونی روابط بین دیتاها رو نشون بدی.

تمام مدل‌های قبلی RAG معمولاً هر سند یا متن رو جداجدا در نظر می‌گرفتن؛ انگار هر تیکه متن تو یه جزیره جداگانه‌س! اینجا اما داستان فرق داره. این مدل جدید، برای هر سوال (یا «اپیزود») یه گراف دانش می‌سازه، که توش نه فقط ترتیب تیکه‌های متن بلکه رابطه معنایی بینشون رو هم به صورت گراف نشون می‌ده. یعنی می‌ره دنبال این که کدوم تیکه‌ها به هم وصلن و چرا، نه فقط این که قبل و بعد کدوم اومدن.

یه قابلیت جذاب دیگه هم که آوردن، اینه که موقع جواب دادن به جای اینکه همه گراف رو با هم نگاه کنه، میاد با توجه به همون سوال (Query-Aware)، روی بخشای مهم و مرتبط تمرکز می‌کنه. این کار با استفاده از یه چیزی به اسم Query-Guided Pooling انجام میشه. منظور از Pooling همون جمع‌بندی هوشمنده که مثلاً می‌گه “آقا اینا مهم‌ترن، رو اینا بیشتر دقیق شو!”.

برای اینکه بدونیم این روش چقدر جواب می‌ده، تو آزمایش‌ها دیدن که واسه سوالات پیچیده که جوابشون تو چند تا سند مختلف قایم شده (بهشون می‌گن Multi-hop Questions)، این مدل جدید، از مدل‌های قدیمی Dense Retriever خیلی بهتر عمل می‌کنه. Dense Retriever یعنی سیستم‌هایی که صرفاً به شکل فشرده داده‌ها رو کنار هم می‌ذارن و دنبال جواب می‌گردن، اما به رابطه بین تیکه‌ها دقتی ندارن. پس تو سوالای چندمرحله‌ای که باید از چند جا اطلاعات رو برداری و بهم وصل کنی، این روش جدید واقعاً می‌درخشه.

یه نکته فنی هم اینه که واسه پیاده‌سازی این مدل، از PyTorch Geometric استفاده کردن. این یه کتابخونه خیلی قوی تو پایتورچ (یه فریم‌ورک معروف هوش مصنوعی) مخصوص کار با داده‌های گرافی هست، که باعث میشه اجرا و مقیاس‌گذاری مدل خیلی راحت‌تر بشه.

خلاصه که اگه دنبال ساختن مدل‌هایی هستی که بتونن جواب سوالای سخت رو با هوشمندی بیشتر و سرعت بالا پیدا کنن، این سبک جدید GNN که آگاه به سوال هم هست، واقعاً حرف نداره!

منبع: +