احتمالاً تا حالا برات پیش اومده که یه چیزی رو از یه سیستم هوش مصنوعی بپرسی و با خودت فکر کنی “خب این سوال من الان رفت پیش یه شرکت بزرگ و خدا میدونه چه اتفاقی میافته!” به طور خاص، الان خیلی از سیستمهای هوش مصنوعی، از چیزی به اسم Retrieval-Augmented Generation یا همون RAG استفاده میکنن. حالا این چیه؟ RAG یعنی وقتی هوش مصنوعی به جای اینکه فقط به دادههای خودش تکیه کنه، میره یه سری اطلاعات جدید هم از دیتابیسها و منابع خارجی جمع میکنه و بعد جواب میده. خیلی خفن و باهوشه، اما یه مشکل اساسی داره: سوالات یا درخواستهایی که کاربرا میفرستن لو میرن!
حالا یه تیم باحال اومده یه سیستمی ساخته به اسم PIR-RAG که واقعاً یک کار اساسی برای حفظ حریم خصوصی میکنه. PIR مخفف Private Information Retrieval ـه. یعنی جوری طراحی شده که هوش مصنوعی بدون اینکه بدونه دقیقاً دنبال چی میگردی (یا چی پرسیدی)، بتونه جواب رو پیدا کنه؛ اونم با سرعت خوب و خیلی بهینه.
چه جوری کار میکنه؟ بچهها توی PIR-RAG یه معماری جالب درست کردن که اول میاد کل اطلاعات رو دستهبندی معنایی (Semantic Clustering) میکنه – یعنی شبیه به همها رو میذاره تو یه گروه. اینجوری جستجو توی کل دیتا خیلی سریعتر و هدفمندتر میشه. بعدش یه پروتکل خاص برا اساس lattice-based PIR یا همون روش «بازی با ساختار شبکهایِ دادهها واسه مخفیکاری» استفاده میکنن. تو این روش، کل یه دسته یا خوشه از داکیومنت (یا همون اسناد و اطلاعات) رو به صورت دستهای میکشه بیرون، بدون اینکه سرور دقیقاً بفهمه دنبال چی بودی.
این یعنی چی؟ یعنی تو به صورت خصوصی و سریع میتونی همون اطلاعاتی که هوش مصنوعی برای تولید جوابهای دقیق لازم داره رو بگیری، بدون اینکه جایی ثبت بشه چی خواستی یا چی خوندی. تازه تو آزمایشهایی که داشتن، نشون دادن نسبت به روشهای دیگه مثل graph-based PIR (یه جور روش بازیابی اطلاعات با گراف) یا روش Tiptoe-style private scoring (مدل امتیازدهی مخفیانه) هم قویتر عمل میکنه. یه ویژگی باحالشم اینه که چیزی به اسم “RAG-Ready Latency” رو حساب میکنن، که یعنی اون مدت زمان واقعی و از سر تا ته که طول میکشه تا کل اطلاعات لازم رو به صورت مخفی و خصوصی برای یه مدل زبانی بزرگ (LLM) آماده کنند.
در نهایت خلاصهش این میشه: سیستمی ساختن که حتی وقتی حجم اطلاعات خیلی زیاده و تعداد کاربرا بالاست، بازم حسابی مقیاسپذیره و میتونه بدون دردسر و با حفظ حریم خصوصی، محتوای مورد نیاز هوش مصنوعی رو آماده کنه. یعنی اگه دنبال یه راه ریلکس و بیدرسر واسه حفظ محرمانگی توی سیستمهای هوش مصنوعی هستی، PIR-RAG الآن یکی از بهترین گزینههاس!
منبع: +