جدال شطرنجی: وقتی o3 از OpenAI حسابی گروک ایلان ماسک رو مات کرد!

بیا یه داستان باحال برات تعریف کنم! چند روز پیش کلی هیجان تو دنیای هوش مصنوعی بود چون دو تا مدل شاخ هوش مصنوعی، یکی از OpenAI به اسم o3 و یکی از xAI ایلان ماسک به اسم Grok 4، اومدن تو یه تورنمنت شطرنج جلوی هم بازی کنن و حسابی سروصدا کردن.

این مسابقه تو یه جایی به اسم Kaggle’s Game Arena برگزار شد (این مثل یه استادیوم دیجیتالیه که مدل‌های هوش مصنوعی رو به جون هم میندازن که تو بازی‌هایی مثل شطرنج با هم کل‌کل کنن!). کلی مدل معروف حضور داشتن: مثلا o3 و o4-mini از OpenAI، دو تا مدل گمینی (Gemini) از گوگل، کیلود اوپوس از Anthropic، دیپ‌سیک و کیمی از Moonshot و البته همین Grok 4 که از xAI ایلان ماسکه.

ولی خب بیاید رک باشیم؛ فینال اصلاً زورآزمایی نزدیکی نبود! o3 چهار تا بازی پشت سر هم گروک رو له کرد و قشنگ نشون داد کی باسه شطرنج بازی، باسه! و جالب‌تر اینکه مگنوس کارلسن، قهرمان معروف شطرنج جهان و دیوید هاول استادبزرگ (Grandmaster یعنی شطرنج‌باز حرفه‌ای در سطح جهانی)، هر دو نشسته بودن بازی‌ها رو تماشا و حسابی به اشتباهات Grok می‌خندیدن و تیکه می‌نداختن!

مثلاً کارلسن درباره Grok گفت: «این مثل اون بچه‌هایی تو تورنمنت‌های محلیه که فقط تئوری رو یاد گرفتن و دیگه هیچ چیزی بلد نیستن»! یا تو یه جای دیگه گفت: «حرکت‌هاش مربوط به شطرنجه ولی زمان و ترتیبشون کلاً اشتباهه!»

گروک ۴ واقعاً ضعیف عمل کرد، تو همون بازی اول سریع فیل‌ش رو حراجی کرد و بعدش شروع کرد هی مهره‌ها رو بی‌دلیل عوض کردن، انگار فقط می‌خواست زودتر بازی تموم شه و بره خونه! در مقابل، o3 مطمئن و آروم بازی می‌کرد: اشتباه فاحش نداشت و هر وقت برتری پیدا می‌کرد، قشنگ ازش استفاده می‌کرد.

جالب بدونی کارلسن، o3 رو اندازه یه شطرنج‌باز آماتور ولی متوسط با رتبه ۱۲۰۰ ELO دونست (رتبه ELO سیستمیه برای محاسبه سطح بازیکنان شطرنج؛ مثلاً یه آماتور تازه‌کار ۸۰۰ هست، حرفه‌ای‌ها بالای ۲۵۰۰!). ولی Grok رو عملاً تازه‌کار دونست، یجورایی، گفت در حد ۸۰۰ ELO باید باشه!

داستان فقط شطرنج نبود، ماجرا این بود که ببینن هوش مصنوعی‌های همه‌کاره (یعنی همون مدل‌هایی که برای کلی کار ساخته شدن و فقط مخصوص شطرنج نیستن) چطوری تو بازی‌هایی با قانون‌های سفت و سخت عمل می‌کنن. جوابش اینه: زیاد هم عالی نیستن! مخصوصاً Grok حسابی تو زدن مهره‌ها و تصمیم‌گیری ضعیف ظاهر شد. ولی o3 نشون داد تو تشخیص الگوها و دنبال کردن قوانین و برنامه‌ریزی دست بالا رو داره. اصلاً شطرنج دقیقاً همینه: باید قشنگ موقعیت رو بسنجی، اشتباه احمقانه نکنی و بدونی هر کاری کِی و کجا به چه دردی می‌خوره.

یه نکته جالب این بود که تقابل OpenAI و xAI، یعنی دو شرکتی که CEOهاشون یعنی سم آلتمن و ایلان ماسک تو دنیای هوش مصنوعی حسابی رقیب و دعوایی‌ان، یه خورده هم به جنجال مسابقه اضافه کرد. شاید نتیجه این تورنمنت نشون بده حداقل برای کارهایی مثل شطرنج، OpenAI فعلاً رو دست نداره. حتی کارلسن هم (با اون همه سختگیری) یه «ایول» کوچیک داد به o3!

راستی یه نکته؛ این مدل‌ها LLM یا همون Large Language Model هستن. اینا مدل‌های هوش مصنوعی خیلی بزرگ و پیچیده‌ان که می‌تونن متن بفهمن، تحلیل کنن و جواب بدن، ولی گویا تو شطرنج هنوز راه دارن تا مثل استادبزرگ‌ها بشن!

در کل، مسابقه بیشتر از اینکه یه تورنمنت شطرنج عادی باشه، پنجره‌ای بود به این که چطوری مدل‌های هوش مصنوعی می‌تونن برای کارهای منطقی، برنامه‌ریزی و رعایت قواعد آزمون بشن. وگرنه اگه همون کاری که Grok با وزیرش کرد تو یه متن حقوقی یا رزرو سفر پیش بیاد، واقعاً دردسر میشه!

خلاصه که حسابی برنده این جدال o3 بود و سربلند از زمین اومد بیرون. حالا ببینیم سری بعد AIها چطوری عمل می‌کنن!

منبع: +