معرفی مدل‌های جدید Granite R2: آچار فرانسه‌ای برای جستجو و بازیابی داده‌ها!

اگه اهل تکنولوژی باشی یا حتی یه کم دنبال هوش مصنوعی و مدل‌های زبونی بوده باشی، احتمالاً اسم مدل‌های embedding و encoder-based به گوشت خورده.

حالا شرکت IBM یه خانواده جدید از این مدل‌ها به اسم Granite Embedding R2 معرفی کرده که واقعاً کارشون ترکونده! 😎 بیاین با هم یه نگاه دوستانه بهشون بندازیم و ببینیم چرا حسابی سر و صدا کردن.

مدل Granite Embedding R2 چیه؟

یه جور مدل هوش مصنوعی‌ان که می‌تونن متن انگلیسی رو به شکل عدد و بردار (همون embedding، یعنی تبدیل اطلاعات به یه فرمت قابل فهم برای کامپیوتر) دربیارن و برای جستجو و بازیابی داده‌ها توی مقیاس شرکتی (enterprise-scale، یعنی جاهایی که واقعاً حجم داده زیاده!) به کار می‌رن.

چه پیشرفتی نسبت به نسخه قبلی داشتن؟

واقعاً جهش بزرگی داشتن! مثلاً:

طول زمینه یا همون context length رو 16 برابر بیشتر کردن و رسونده‌ن به 8192 تا توکن. این یعنی مدل می‌تونه با حجم خیلی بیشتری از متن‌ها کار کنه بدون اینکه مزه‌ش رو از دست بده.
توی کارایی و سرعت، واقعاً رو دست رقبا زدن: بین 19 تا 44 درصد سریع‌تر از مدل‌های معروف بازارن اونم بدون این که دقت‌شون بیاد پایین، کلی هم بهتر عمل می‌کنن.

کجاها جواب می‌ده؟

هر جا فکرش رو بکنی! از جستجوی متن معمولی گرفته تا سرچ بین کدها (یعنی حتی برنامه‌نویس‌ها هم می‌تونن حال کنن!)، جستجو توی سندهای بلند (long-document search)، گفت‌وگوهای چندمرحله‌ای (multi-turn conversational، یعنی چت‌هایی که چند دور سوال و جواب پیش می‌ره)، و داده‌های جدولی (tabular data – مثل اکسل و دیتا بِیس).

مدل‌های مختلف توی این خانواده:

اگه اهل فنی باشی احتمالاً اینا برات جالبه:

هم bi-encoder دارن هم cross-encoder؛ bi-encoder یعنی مدل می‌تونه سوال و جواب رو جداگانه پردازش کنه و cross-encoder یعنی همزمان هر دو رو با هم تحلیل می‌کنه. بسته به سرعت و دقت، دستت بازه انتخاب کنی.
یک مدل ۲۲ لایه‌ای super-efficient دارن برای پیدا کردن جواب (retriever model) که خیلی قوی عمل می‌کنه. یه ورژن ۱۲ لایه‌ای هم دارن که سبک‌تر و سریع‌تره اگه منابع کمتر داری.
برای مرحله بازچینی جواب‌ها هم یه reranker توپ دارن که از پس هر چیزی برمیاد!

یکی از باحال‌ترین بخش‌ها اینه که همه‌شون کاملاً با داده‌های مربوط به شرکت‌ها (enterprise-appropriate data) و زیر نظر کامل قوانین و نظارت (همون comprehensive governance oversight – یعنی چی؟ یعنی هیچ ماست مالی‌ای توی دیتا نبوده و نظارت کامل بوده!) آموزش داده شدن.

توی آزمایش‌ها و تست‌های استاندارد (benchmarks)، توی مجموعه‌هایی که خود IBM برای ارزیابی درست کرده و حتی توی پروژه‌ها و کیس‌های واقعی شرکت‌ها، این مدل واقعاً غوغا کرده!

مزایا برای شرکت‌ها و برنامه‌نویس‌ها:

کدباز و آزاد، یعنی همه می‌تونن هم برای تحقیق هم بیزینس بیارنش تو میدون (Apache 2.0 license – یه جور لایسنس خیلی باز)
شفافیت داده‌ها (transparent data provenance – یعنی معلومه دیتا از کجا اومده و خیالت راحت)
آماده مصرف برای مأموریت‌های حیاتی شرکت‌ها که دیگه نمی‌خوای ریسک کنی!

خلاصه، اگه دنبال یه مدل هوش مصنوعی می‌گردی که هم تو سرعت و هم دقت رو دست همه بزنه، open source باشه، و راحت بتونی توی کارهای جدی شرکت ازش استفاده کنی، Granite Embedding R2 همون چیزیه که دنبالش بودی! اگه خواستی عمیق‌تر بری سراغش، همه مدل‌هاش مجانی و آزاد توی این آدرس هست:
https://huggingface.co/collections/ibm-granite

واقعا دستشون درد نکنه – حالا دیگه تو سرچ و بازیابی داده‌ها کم نمیاری!

منبع: +