بیا یه داستان باحال برات تعریف کنم! چند روز پیش کلی هیجان تو دنیای هوش مصنوعی بود چون دو تا مدل شاخ هوش مصنوعی، یکی از OpenAI به اسم o3 و یکی از xAI ایلان ماسک به اسم Grok 4، اومدن تو یه تورنمنت شطرنج جلوی هم بازی کنن و حسابی سروصدا کردن.
این مسابقه تو یه جایی به اسم Kaggle’s Game Arena برگزار شد (این مثل یه استادیوم دیجیتالیه که مدلهای هوش مصنوعی رو به جون هم میندازن که تو بازیهایی مثل شطرنج با هم کلکل کنن!). کلی مدل معروف حضور داشتن: مثلا o3 و o4-mini از OpenAI، دو تا مدل گمینی (Gemini) از گوگل، کیلود اوپوس از Anthropic، دیپسیک و کیمی از Moonshot و البته همین Grok 4 که از xAI ایلان ماسکه.
ولی خب بیاید رک باشیم؛ فینال اصلاً زورآزمایی نزدیکی نبود! o3 چهار تا بازی پشت سر هم گروک رو له کرد و قشنگ نشون داد کی باسه شطرنج بازی، باسه! و جالبتر اینکه مگنوس کارلسن، قهرمان معروف شطرنج جهان و دیوید هاول استادبزرگ (Grandmaster یعنی شطرنجباز حرفهای در سطح جهانی)، هر دو نشسته بودن بازیها رو تماشا و حسابی به اشتباهات Grok میخندیدن و تیکه مینداختن!
مثلاً کارلسن درباره Grok گفت: «این مثل اون بچههایی تو تورنمنتهای محلیه که فقط تئوری رو یاد گرفتن و دیگه هیچ چیزی بلد نیستن»! یا تو یه جای دیگه گفت: «حرکتهاش مربوط به شطرنجه ولی زمان و ترتیبشون کلاً اشتباهه!»
گروک ۴ واقعاً ضعیف عمل کرد، تو همون بازی اول سریع فیلش رو حراجی کرد و بعدش شروع کرد هی مهرهها رو بیدلیل عوض کردن، انگار فقط میخواست زودتر بازی تموم شه و بره خونه! در مقابل، o3 مطمئن و آروم بازی میکرد: اشتباه فاحش نداشت و هر وقت برتری پیدا میکرد، قشنگ ازش استفاده میکرد.
جالب بدونی کارلسن، o3 رو اندازه یه شطرنجباز آماتور ولی متوسط با رتبه ۱۲۰۰ ELO دونست (رتبه ELO سیستمیه برای محاسبه سطح بازیکنان شطرنج؛ مثلاً یه آماتور تازهکار ۸۰۰ هست، حرفهایها بالای ۲۵۰۰!). ولی Grok رو عملاً تازهکار دونست، یجورایی، گفت در حد ۸۰۰ ELO باید باشه!
داستان فقط شطرنج نبود، ماجرا این بود که ببینن هوش مصنوعیهای همهکاره (یعنی همون مدلهایی که برای کلی کار ساخته شدن و فقط مخصوص شطرنج نیستن) چطوری تو بازیهایی با قانونهای سفت و سخت عمل میکنن. جوابش اینه: زیاد هم عالی نیستن! مخصوصاً Grok حسابی تو زدن مهرهها و تصمیمگیری ضعیف ظاهر شد. ولی o3 نشون داد تو تشخیص الگوها و دنبال کردن قوانین و برنامهریزی دست بالا رو داره. اصلاً شطرنج دقیقاً همینه: باید قشنگ موقعیت رو بسنجی، اشتباه احمقانه نکنی و بدونی هر کاری کِی و کجا به چه دردی میخوره.
یه نکته جالب این بود که تقابل OpenAI و xAI، یعنی دو شرکتی که CEOهاشون یعنی سم آلتمن و ایلان ماسک تو دنیای هوش مصنوعی حسابی رقیب و دعواییان، یه خورده هم به جنجال مسابقه اضافه کرد. شاید نتیجه این تورنمنت نشون بده حداقل برای کارهایی مثل شطرنج، OpenAI فعلاً رو دست نداره. حتی کارلسن هم (با اون همه سختگیری) یه «ایول» کوچیک داد به o3!
راستی یه نکته؛ این مدلها LLM یا همون Large Language Model هستن. اینا مدلهای هوش مصنوعی خیلی بزرگ و پیچیدهان که میتونن متن بفهمن، تحلیل کنن و جواب بدن، ولی گویا تو شطرنج هنوز راه دارن تا مثل استادبزرگها بشن!
در کل، مسابقه بیشتر از اینکه یه تورنمنت شطرنج عادی باشه، پنجرهای بود به این که چطوری مدلهای هوش مصنوعی میتونن برای کارهای منطقی، برنامهریزی و رعایت قواعد آزمون بشن. وگرنه اگه همون کاری که Grok با وزیرش کرد تو یه متن حقوقی یا رزرو سفر پیش بیاد، واقعاً دردسر میشه!
خلاصه که حسابی برنده این جدال o3 بود و سربلند از زمین اومد بیرون. حالا ببینیم سری بعد AIها چطوری عمل میکنن!
منبع: +