بالاخره OpenAI هم مدل‌های زبانی باز رو داد بیرون!

خب بچه‌ها یکی از خبرای داغ تکنولوژی اینه که OpenAI (همون شرکتی که ChatGPT رو ساخته) بعد از مدت‌ها، بالاخره اولین مدل‌های زبانی با وزن بازش رو داد بیرون! یعنی چی؟ بذارین براتون توضیح بدم.

وزن باز یا Open-weight یعنی شما می‌تونین خود مدل رو کامل دانلود کنین، روی لپ‌تاپ خودتون اجراش کنین، حتی توش دست ببرید و هرجور دوست دارین تغییرش بدین. این برخلاف همون مدل‌های بسته‌ایه که فقط تو سایت خودشون اجرا میشه و بهتون کد و وزن اصلی رو نمی‌دن.

این سری مدل‌های جدید با اسم “gpt-oss” اومدن و در دو سایز مختلف هم هستن. کارایی‌شون تقریباً مثل مدل‌های معروف OpenAI یعنی o3-mini و o4-mini هست (این دوتا مدلای ریزتر ChatGPT هستن که برای کارهای سبک ساخته شدن). ولی فرق اصلی اینه که gpt-oss باز و قابل دانلود برای همه‌ست! تازه با حداقل ۱۶ گیگ رم (RAM) هم رو لپ‌تاپ‌های عادی اجرا میشه — دقیقاً همون مقدار رمی که اکثر مک‌بوک‌های جدید اپل دارن. البته اگه سایز بزرگ‌تر رو بخواین باید یه لپ‌تاپ قوی‌تر یا دستگاه حرفه‌ای‌تر داشته باشین.

تا قبل از این حرکت OpenAI، خیلیا بهش می‌گفتن “ClosedAI” (یعنی بچه‌ها شوخی می‌کردن که اسمش رو بذاره بسته‌). چون آخرین بار ۲۰۱۹ بود که مدل وزنی باز داد. مخصوصاً این اواخر که دو بار قول مدل باز دادن رو عقب انداخت، کلاً همه کلافه شده بودن.

حالا چرا اینقدر مدل باز مهمه؟

خیلی از شرکت‌ها و استارت‌آپ‌ها می‌خوان مدلی داشته باشن که خودشون بتونن توش تغییر بدن، یا هزینه سروراش براشون کمتر دربیاد.
مثلاً بیمارستان‌ها، شرکت‌های حقوقی، یا حتی دولت‌ها باید داده‌هاشون رو لوکال نگه دارن و نمی‌خوان اطلاعاتشون از طریق اینترنت به بیرون درز کنه (پس مدل باز می‌برن داخل شبکه خودشون).
محقق‌ها هم عاشق مدل باز هستن؛ چون می‌تونن دقیق بررسی کنن که مدل چجوری یاد می‌گیره و کار می‌کنه، حتی توش تغییرات آزمایشی بدن.

مدل gpt-oss با لایسنس Apache 2.0 اومده. یعنی چی؟ یعنی می‌تونین راحت برای پروژه تجاری هم استفاده کنین، بدون اینکه محدود بشین. این برخلاف بعضی مدل‌های دیگه‌ست؛ مثلاً مدل Llama از شرکت Meta یه لایسنس اختصاصی و محدودتر داشت.

حالا یه نکته جالب دیگه! تازگیا مدل‌های باز ساخت چین مثل DeepSeek، Qwen آلی‌بابا و Kimi K2 کلی طرفدار پیدا کردن (حتی جلوتر از مدلای آمریکایی رفتن). ولی چندتا مشکل هست. مثلاً این مدل‌ها معمولاً درباره موضوعاتی که دولت چین دوست نداره (مثل میدان تیان‌آن‌من)، حرف نمی‌زنن یا سانسور می‌کنن. همون موقع بعضیا گفتن که وقتی مدل باز شد، اینا تبدیل می‌شن به قدرت نرم کشورا (soft power یعنی ابزاری برای رساندن فرهنگ و نفوذ سیاسی به صورت غیرمستقیم).

خب حالا چرا OpenAI یهو یاد مدل باز افتاد؟ چندتا دلیل هست:
۱. اینکه دوباره قدرت‌نمایی کنه و تو رقابت بزرگ مدل‌های زبانی عقب نمونه. Meta با Llama و چینیا با مدل‌هاشون جلو افتاده بودن.
۲. سیاست‌های دولت آمریکا هم فشار آورده، مخصوصاً با برنامه AI Action Plan که به شرکت‌ها گفته مدل باز بسازین.
۳. جامعه محقق‌ها (دانشگاه‌ها، استارت‌آپ‌ها و…) کلی براشون مهمه بتونن مدل باز خود آمریکایی‌ها رو داشته باشن، نه اینکه برن سمت چین یا Meta.

خلاصه، OpenAI این حرکت رو زد تا دوباره اعتماد بازار و جامعه تحقیقات رو بدست بیاره، جلوی سلطه مدل‌های چینی رو بگیره، و سیاست‌مدارا رو هم راضی کنه که حمایت کنن از زیرساخت‌هاشون. تازه اینطوری هر کسی که دنبال مدل باز بود، دیگه لازم نیست بره سمت Meta یا آلی‌بابا، می‌تونه با خیال راحت محصولات خود OpenAI رو بچسبه.

این حرکت می‌تونه باعث شه کلی نوآوری جدید تو تیم‌های مختلف بیاد، مخصوصاً وقتی هر کسی بتونه مدل رو تغییر بده و چیزای جدید روی اون امتحان کنه. به نظر خیلیا، باز شدن بیشتر مدل‌های زبانی هم شفافیت میاره، هم قدرت رقابت رو بالا می‌بره و هم روند رشد هوش مصنوعی رو سریع‌تر می‌کنه.

در کل، اگه تو تیمی هستین که دنبال مدل هوش مصنوعی باز و بومی (و نه صرفاً مدل‌های وارداتی)، OpenAI بالاخره برگشت به میدون—هرچند کمی دیر، ولی با دست پر! 😉

منبع: +