خب بچهها یکی از خبرای داغ تکنولوژی اینه که OpenAI (همون شرکتی که ChatGPT رو ساخته) بعد از مدتها، بالاخره اولین مدلهای زبانی با وزن بازش رو داد بیرون! یعنی چی؟ بذارین براتون توضیح بدم.
وزن باز یا Open-weight یعنی شما میتونین خود مدل رو کامل دانلود کنین، روی لپتاپ خودتون اجراش کنین، حتی توش دست ببرید و هرجور دوست دارین تغییرش بدین. این برخلاف همون مدلهای بستهایه که فقط تو سایت خودشون اجرا میشه و بهتون کد و وزن اصلی رو نمیدن.
این سری مدلهای جدید با اسم “gpt-oss” اومدن و در دو سایز مختلف هم هستن. کاراییشون تقریباً مثل مدلهای معروف OpenAI یعنی o3-mini و o4-mini هست (این دوتا مدلای ریزتر ChatGPT هستن که برای کارهای سبک ساخته شدن). ولی فرق اصلی اینه که gpt-oss باز و قابل دانلود برای همهست! تازه با حداقل ۱۶ گیگ رم (RAM) هم رو لپتاپهای عادی اجرا میشه — دقیقاً همون مقدار رمی که اکثر مکبوکهای جدید اپل دارن. البته اگه سایز بزرگتر رو بخواین باید یه لپتاپ قویتر یا دستگاه حرفهایتر داشته باشین.
تا قبل از این حرکت OpenAI، خیلیا بهش میگفتن “ClosedAI” (یعنی بچهها شوخی میکردن که اسمش رو بذاره بسته). چون آخرین بار ۲۰۱۹ بود که مدل وزنی باز داد. مخصوصاً این اواخر که دو بار قول مدل باز دادن رو عقب انداخت، کلاً همه کلافه شده بودن.
حالا چرا اینقدر مدل باز مهمه؟
- خیلی از شرکتها و استارتآپها میخوان مدلی داشته باشن که خودشون بتونن توش تغییر بدن، یا هزینه سروراش براشون کمتر دربیاد.
- مثلاً بیمارستانها، شرکتهای حقوقی، یا حتی دولتها باید دادههاشون رو لوکال نگه دارن و نمیخوان اطلاعاتشون از طریق اینترنت به بیرون درز کنه (پس مدل باز میبرن داخل شبکه خودشون).
- محققها هم عاشق مدل باز هستن؛ چون میتونن دقیق بررسی کنن که مدل چجوری یاد میگیره و کار میکنه، حتی توش تغییرات آزمایشی بدن.
مدل gpt-oss با لایسنس Apache 2.0 اومده. یعنی چی؟ یعنی میتونین راحت برای پروژه تجاری هم استفاده کنین، بدون اینکه محدود بشین. این برخلاف بعضی مدلهای دیگهست؛ مثلاً مدل Llama از شرکت Meta یه لایسنس اختصاصی و محدودتر داشت.
حالا یه نکته جالب دیگه! تازگیا مدلهای باز ساخت چین مثل DeepSeek، Qwen آلیبابا و Kimi K2 کلی طرفدار پیدا کردن (حتی جلوتر از مدلای آمریکایی رفتن). ولی چندتا مشکل هست. مثلاً این مدلها معمولاً درباره موضوعاتی که دولت چین دوست نداره (مثل میدان تیانآنمن)، حرف نمیزنن یا سانسور میکنن. همون موقع بعضیا گفتن که وقتی مدل باز شد، اینا تبدیل میشن به قدرت نرم کشورا (soft power یعنی ابزاری برای رساندن فرهنگ و نفوذ سیاسی به صورت غیرمستقیم).
خب حالا چرا OpenAI یهو یاد مدل باز افتاد؟ چندتا دلیل هست:
۱. اینکه دوباره قدرتنمایی کنه و تو رقابت بزرگ مدلهای زبانی عقب نمونه. Meta با Llama و چینیا با مدلهاشون جلو افتاده بودن.
۲. سیاستهای دولت آمریکا هم فشار آورده، مخصوصاً با برنامه AI Action Plan که به شرکتها گفته مدل باز بسازین.
۳. جامعه محققها (دانشگاهها، استارتآپها و…) کلی براشون مهمه بتونن مدل باز خود آمریکاییها رو داشته باشن، نه اینکه برن سمت چین یا Meta.
خلاصه، OpenAI این حرکت رو زد تا دوباره اعتماد بازار و جامعه تحقیقات رو بدست بیاره، جلوی سلطه مدلهای چینی رو بگیره، و سیاستمدارا رو هم راضی کنه که حمایت کنن از زیرساختهاشون. تازه اینطوری هر کسی که دنبال مدل باز بود، دیگه لازم نیست بره سمت Meta یا آلیبابا، میتونه با خیال راحت محصولات خود OpenAI رو بچسبه.
این حرکت میتونه باعث شه کلی نوآوری جدید تو تیمهای مختلف بیاد، مخصوصاً وقتی هر کسی بتونه مدل رو تغییر بده و چیزای جدید روی اون امتحان کنه. به نظر خیلیا، باز شدن بیشتر مدلهای زبانی هم شفافیت میاره، هم قدرت رقابت رو بالا میبره و هم روند رشد هوش مصنوعی رو سریعتر میکنه.
در کل، اگه تو تیمی هستین که دنبال مدل هوش مصنوعی باز و بومی (و نه صرفاً مدلهای وارداتی)، OpenAI بالاخره برگشت به میدون—هرچند کمی دیر، ولی با دست پر! 😉
منبع: +