خب بچهها، این روزا کلی حرف از Large Language Models یا همون LLMها میشنویم، یعنی اون مدلهای هوش مصنوعی غولپیکری که میتونن کلی متن رو بفهمن و جواب بدن. مثلاً همون ChatGPT یا مدلای شبیهش. LLM یعنی یه سیستم که میتونه زبون ما رو بفهمه و حتی خلاصهسازی کنه، ترجمه کنه یا مجموعهای از کارها رو مثل یه دستیار هوشمند انجام بده.
حقیقتش این مدلها باعث شدن نحوه کار کردن ما با کامپیوتر و نرمافزارها یه تغییر اساسی کنه. قبلترها باید توی منوها، کلیککلیک میکردیم تا یه کاری راه بیفته. الان فقط کافیه به مدل هوش مصنوعی بگیم: «برام یه گزارش درست کن، ایمیلم رو هم باهاش وصل کن و همه رو توی فایل ورد بچسبون»! یعنی کاربر میتونه منظورش رو مستقیم با زبون خودش بگه و LLM خودش بقیه رو هندل میکنه. این رو بهش میگن language-first interaction paradigm، یعنی تعامل بر پایه زبان که یه سبک جدید برای کار با کامپیوتره.
ولی یه نکته مهم این وسط هست: خیلی از این مدلهای باحال روی کلود و سرورهای شرکتهای بزرگ میچرخن، مثلاً سرورهای OpenAI یا Google. این یعنی اطلاعاتت ممکنه بره پیش اونا. خب این داستان دو تا ایراد مهم داره: ۱. حریم خصوصی (privacy) به خطر میافته چون نمیدونی دادههات دقیقاً چه سرنوشتی پیدا میکنن. ۲. وابسته میشی به اون سرویسها، پس آزادی و استقلالت کمتر میشه. اما همه دوست دارن خودشون کنترل سیستمشون رو داشته باشن، نه اینکه همه چیز بره پیش شرکتای بزرگ.
اینجا بود که یه سوال مهم پیش اومد: آیا بهجای این مدلای انحصاری و ابری، میتونیم مدلهایی داشته باشیم که باز—یعنی open-source—باشن و بشه به صورت لوکال (روی لپتاپ یا سرور خونهمون) اجراشون کرد؟ Open-source یعنی مثل یه پروژه جمعی و رایگان که همه میتونن توش دست ببرن و استفاده کنن. اینجوری دیگه حریم خصوصی و استقلال خیلی بیشتر حفظ میشه و کسایی که دوست دارن با خیال راحت سیستم شخصی خودشون رو داشته باشن، دستشون بازتره.
تو این مطالعه که دربارهش صحبت میکنیم، اومدن چند تا مدل open-source و open-access رو آوردن رو میدون و با GPT-4 (از OpenAI) مقایسه کردن تا ببینن تو درک منظور کاربر (user intent resolution) و ساختن ورکفلو (یعنی یه سری کارهای پشتسرهم که برای انجام هدف کاربر چیده میشن)، چقدر خوب عمل میکنن. هدف این بود که بفهمن آیا این مدلهای باز واقعاً در عمل به درد میخورن و چه تفاوتهایی با مدلهای پولی و انحصاری دارن.
بررسیها نشون داد که مدلهای open-source بهشکل جالبی نزدیک به مدلهای تجاری شدن، مخصوصاً تو بعضی وظایف حتی با عملکرد خوب! البته هنوز بعضی تفاوتها و عقبافتادگیها هست، ولی روند رشدشون نویدبخشه. همچنین این مطالعه به ما نشون داد که استفاده از AI به صورت محلی (locally embedded intelligence یعنی هوش مصنوعی که روی سیستم خودت نصب میکنی)، میتونه تعامل رو هم راحتتر کنه و هم امنیت بیشتری بده.
در نهایت، نتایج این تحقیق به یه بحث قشنگتر دامن زد: غیرمتمرکز شدن و مردمیتر شدن زیرساخت هوش مصنوعی. یعنی بهجای اینکه همه چی دست چند تا شرکت بمونه، افراد معمولی هم بتونن از قدرت AI استفاده کنن، اونم با کنترل کامل روی دادههاشون! به نظر میرسه آینده به سمتی میره که تعامل انسان و دستگاه خیلی سادهتر، هوشمندتر و خصوصیتر میشه—اونم به کمک همین مدلهای باز و لوکالی که رو لپتاپمون اجرا میشن!
در کل، اگه از مدلای اوپن سورس خوشتون میاد یا دغدغه حریم خصوصی دارین، این مطالعه براتون خیلی حرف برا گفتن داره. آینده نزدیکتر از چیزیه که فکرشو میکنیم!
منبع: +