اگه اهل تکنولوژی باشی یا حتی یه کم دنبال هوش مصنوعی و مدلهای زبونی بوده باشی، احتمالاً اسم مدلهای embedding و encoder-based به گوشت خورده.
حالا شرکت IBM یه خانواده جدید از این مدلها به اسم Granite Embedding R2 معرفی کرده که واقعاً کارشون ترکونده! 😎 بیاین با هم یه نگاه دوستانه بهشون بندازیم و ببینیم چرا حسابی سر و صدا کردن.
مدل Granite Embedding R2 چیه؟
یه جور مدل هوش مصنوعیان که میتونن متن انگلیسی رو به شکل عدد و بردار (همون embedding، یعنی تبدیل اطلاعات به یه فرمت قابل فهم برای کامپیوتر) دربیارن و برای جستجو و بازیابی دادهها توی مقیاس شرکتی (enterprise-scale، یعنی جاهایی که واقعاً حجم داده زیاده!) به کار میرن.
چه پیشرفتی نسبت به نسخه قبلی داشتن؟
واقعاً جهش بزرگی داشتن! مثلاً:
- طول زمینه یا همون context length رو 16 برابر بیشتر کردن و رسوندهن به 8192 تا توکن. این یعنی مدل میتونه با حجم خیلی بیشتری از متنها کار کنه بدون اینکه مزهش رو از دست بده.
- توی کارایی و سرعت، واقعاً رو دست رقبا زدن: بین 19 تا 44 درصد سریعتر از مدلهای معروف بازارن اونم بدون این که دقتشون بیاد پایین، کلی هم بهتر عمل میکنن.
کجاها جواب میده؟
هر جا فکرش رو بکنی! از جستجوی متن معمولی گرفته تا سرچ بین کدها (یعنی حتی برنامهنویسها هم میتونن حال کنن!)، جستجو توی سندهای بلند (long-document search)، گفتوگوهای چندمرحلهای (multi-turn conversational، یعنی چتهایی که چند دور سوال و جواب پیش میره)، و دادههای جدولی (tabular data – مثل اکسل و دیتا بِیس).
مدلهای مختلف توی این خانواده:
اگه اهل فنی باشی احتمالاً اینا برات جالبه:
- هم bi-encoder دارن هم cross-encoder؛ bi-encoder یعنی مدل میتونه سوال و جواب رو جداگانه پردازش کنه و cross-encoder یعنی همزمان هر دو رو با هم تحلیل میکنه. بسته به سرعت و دقت، دستت بازه انتخاب کنی.
- یک مدل ۲۲ لایهای super-efficient دارن برای پیدا کردن جواب (retriever model) که خیلی قوی عمل میکنه. یه ورژن ۱۲ لایهای هم دارن که سبکتر و سریعتره اگه منابع کمتر داری.
- برای مرحله بازچینی جوابها هم یه reranker توپ دارن که از پس هر چیزی برمیاد!
یکی از باحالترین بخشها اینه که همهشون کاملاً با دادههای مربوط به شرکتها (enterprise-appropriate data) و زیر نظر کامل قوانین و نظارت (همون comprehensive governance oversight – یعنی چی؟ یعنی هیچ ماست مالیای توی دیتا نبوده و نظارت کامل بوده!) آموزش داده شدن.
توی آزمایشها و تستهای استاندارد (benchmarks)، توی مجموعههایی که خود IBM برای ارزیابی درست کرده و حتی توی پروژهها و کیسهای واقعی شرکتها، این مدل واقعاً غوغا کرده!
مزایا برای شرکتها و برنامهنویسها:
- کدباز و آزاد، یعنی همه میتونن هم برای تحقیق هم بیزینس بیارنش تو میدون (Apache 2.0 license – یه جور لایسنس خیلی باز)
- شفافیت دادهها (transparent data provenance – یعنی معلومه دیتا از کجا اومده و خیالت راحت)
- آماده مصرف برای مأموریتهای حیاتی شرکتها که دیگه نمیخوای ریسک کنی!
خلاصه، اگه دنبال یه مدل هوش مصنوعی میگردی که هم تو سرعت و هم دقت رو دست همه بزنه، open source باشه، و راحت بتونی توی کارهای جدی شرکت ازش استفاده کنی، Granite Embedding R2 همون چیزیه که دنبالش بودی! اگه خواستی عمیقتر بری سراغش، همه مدلهاش مجانی و آزاد توی این آدرس هست:
https://huggingface.co/collections/ibm-granite
واقعا دستشون درد نکنه – حالا دیگه تو سرچ و بازیابی دادهها کم نمیاری!
منبع: +