مقایسه باحال هوش مصنوعی‌های جدید: کدوم مدل زبون‌باز به درد کار ما می‌خوره؟

Fall Back

خب بچه‌ها، این روزا کلی حرف از Large Language Models یا همون LLMها می‌شنویم، یعنی اون مدل‌های هوش مصنوعی غول‌پیکری که می‌تونن کلی متن رو بفهمن و جواب بدن. مثلاً همون ChatGPT یا مدلای شبیهش. LLM یعنی یه سیستم که می‌تونه زبون ما رو بفهمه و حتی خلاصه‌سازی کنه، ترجمه کنه یا مجموعه‌ای از کارها رو مثل یه دستیار هوشمند انجام بده.

حقیقتش این مدل‌ها باعث شدن نحوه کار کردن ما با کامپیوتر و نرم‌افزارها یه تغییر اساسی کنه. قبل‌ترها باید توی منوها، کلیک‌کلیک می‌کردیم تا یه کاری راه بیفته. الان فقط کافیه به مدل هوش مصنوعی بگیم: «برام یه گزارش درست کن، ایمیلم رو هم باهاش وصل کن و همه رو توی فایل ورد بچسبون»! یعنی کاربر می‌تونه منظورش رو مستقیم با زبون خودش بگه و LLM خودش بقیه رو هندل می‌کنه. این رو بهش می‌گن language-first interaction paradigm، یعنی تعامل بر پایه زبان که یه سبک جدید برای کار با کامپیوتره.

ولی یه نکته مهم این وسط هست: خیلی از این مدل‌های باحال روی کلود و سرورهای شرکت‌های بزرگ می‌چرخن، مثلاً سرورهای OpenAI یا Google. این یعنی اطلاعاتت ممکنه بره پیش اونا. خب این داستان دو تا ایراد مهم داره: ۱. حریم خصوصی (privacy) به خطر می‌افته چون نمی‌دونی داده‌هات دقیقاً چه سرنوشتی پیدا می‌کنن. ۲. وابسته می‌شی به اون سرویس‌ها، پس آزادی و استقلالت کمتر می‌شه. اما همه دوست دارن خودشون کنترل سیستم‌شون رو داشته باشن، نه اینکه همه چیز بره پیش شرکتای بزرگ.

اینجا بود که یه سوال مهم پیش اومد: آیا به‌جای این مدلای انحصاری و ابری، می‌تونیم مدل‌هایی داشته باشیم که باز—یعنی open-source—باشن و بشه به صورت لوکال (روی لپ‌تاپ یا سرور خونه‌مون) اجراشون کرد؟ Open-source یعنی مثل یه پروژه جمعی و رایگان که همه می‌تونن توش دست ببرن و استفاده کنن. این‌جوری دیگه حریم خصوصی و استقلال خیلی بیشتر حفظ می‌شه و کسایی که دوست دارن با خیال راحت سیستم شخصی خودشون رو داشته باشن، دست‌شون بازتره.

تو این مطالعه که درباره‌ش صحبت می‌کنیم، اومدن چند تا مدل open-source و open-access رو آوردن رو میدون و با GPT-4 (از OpenAI) مقایسه کردن تا ببینن تو درک منظور کاربر (user intent resolution) و ساختن ورک‌فلو (یعنی یه سری کارهای پشت‌سرهم که برای انجام هدف کاربر چیده می‌شن)، چقدر خوب عمل می‌کنن. هدف این بود که بفهمن آیا این مدل‌های باز واقعاً در عمل به درد می‌خورن و چه تفاوت‌هایی با مدل‌های پولی و انحصاری دارن.

بررسی‌ها نشون داد که مدل‌های open-source به‌شکل جالبی نزدیک به مدل‌های تجاری شدن، مخصوصاً تو بعضی وظایف حتی با عملکرد خوب! البته هنوز بعضی تفاوت‌ها و عقب‌افتادگی‌ها هست، ولی روند رشدشون نویدبخشه. همچنین این مطالعه به ما نشون داد که استفاده از AI به صورت محلی (locally embedded intelligence یعنی هوش مصنوعی که روی سیستم خودت نصب می‌کنی)، می‌تونه تعامل رو هم راحت‌تر کنه و هم امنیت بیشتری بده.

در نهایت، نتایج این تحقیق به یه بحث قشنگ‌تر دامن زد: غیرمتمرکز شدن و مردمی‌تر شدن زیرساخت هوش مصنوعی. یعنی به‌جای اینکه همه چی دست چند تا شرکت بمونه، افراد معمولی هم بتونن از قدرت AI استفاده کنن، اونم با کنترل کامل روی داده‌هاشون! به نظر می‌رسه آینده به سمتی می‌ره که تعامل انسان و دستگاه خیلی ساده‌تر، هوشمندتر و خصوصی‌تر می‌شه—اونم به کمک همین مدل‌های باز و لوکالی که رو لپ‌تاپمون اجرا می‌شن!

در کل، اگه از مدلای اوپن سورس خوشتون میاد یا دغدغه حریم خصوصی دارین، این مطالعه براتون خیلی حرف برا گفتن داره. آینده نزدیک‌تر از چیزیه که فکرشو می‌کنیم!

منبع: +