وقتی هوش مصنوعی گوگل و OpenAI بهترین نوجوون‌های دنیا رو تو المپیاد ریاضی شکست دادن!

خب رفیق، بذار یه داستان خفن برات تعریف کنم! یه مدت پیش، مدل‌های هوش مصنوعی که توسط تیم‌های DeepMind گوگل و OpenAI ساخته شدن، اومدن و تو یکی از سخت‌ترین مسابقه‌های ریاضی دنیا یعنی «المپیاد جهانی ریاضی» ۲۰۲۵ یا همون International Mathematical Olympiad (IMO)، تونستن به اندازه‌ی باحال بدرخشن که حتی بهترین دانش‌آموزای دبیرستانی دنیا رو هم جا گذاشتن!

تا حالا اسم المپیاد جهانی ریاضی به گوشت خورده؟ این رقابت رو دانش‌آموزای بااستعداد از سراسر دنیا شرکت می‌کنن و واقعاً چیزیه که هر کسی جرات ورود بهش رو نداره، چون باید دو روز پیاپی تو دو تا آزمون چهار ساعت و نیمه بشینی و فقط شش تا سوال فوق‌سخت رو حل کنی! امسال، ششصد و سی تا دانش‌آموز قوی توی مسابقه بودن و اگه کسی از ۴۲ امتیاز ممکن، ۳۵ امتیاز می‌گرفت، مدال طلا می‌گرفت.

حالا نکته‌ی خفن اینجاست که مدل‌های هوش مصنوعی گوگل DeepMind و OpenAI تونستن پنج تا از شش سوال سخت رو حل کنن، یعنی درست همون عملکرد بهترین شرکت‌کننده‌های انسانی! در کل ۶۷ تا دانش‌آموز هم تونستن طلا بگیرن – و خب هوش مصنوعی‌ها هم بهشون اضافه شدن! جالبی ماجرا اینه که الگوریتم‌ها و مدل‌هایی که این موفقیت رو داشتن، اصلاً مدل تخصصی حل ریاضی نبودن؛ یعنی همون سیستم‌های عمومی که برای کارای دیگه هم ساخته شدن، همین طوری توی حل معمای ریاضی هم شاهکار کردن!

اما این وسط یه حاشیه هم داشتیم که داستان رو بامزه‌تر می‌کنه: گوگل رسماً از طرف المپیاد دعوت شد که هوش مصنوعی‌ش تو مسابقه شرکت کنه، اما OpenAI دعوت نشده بود. با این حال OpenAI یواشکی سوال‌ها رو به مدل خودش داد و بعد ادعا کرد مدال طلا گرفته! از اون طرف، گوگل صبر کرد تا نتیجه رسمی اعلام بشه و دوشنبه توی یه پست وبلاگی اومد برد خودش رو گفت. ولی OpenAI شنبه قبلش خبر داده بود و یجورایی قوانین رو رعایت نکرد. مسئولای المپیاد قبلاً به شرکت‌ها گفته بودن که تا قبل از پایان رسمی مسابقه، خبری اعلام نکنن؛ پس یه جور شیطنت از طرف OpenAI اتفاق افتاد. حتی رئیس DeepMind، دمیش هسابیس، تو توییتی اشاره کرد که اونا قانون رو رعایت کردن تا دانش‌آموزا هم فرصت دیده‌شدن داشته باشن.

یه نکته باحال و شاید یه کم ترسناک اینه که این مدل‌هایی که توی مسابقه طلا گرفتن، فعلاً برای مردم عادی در دسترس نیستن! محقق‌ها اومدن و همین سوالات المپیاد رو به مدل‌های عمومی و در دسترس مثل Gemini 2.5 Pro، Grok-4 و GPT-4 (OpenAI 04) دادن – ولی هیچ‌کدومشون حتی بالای ۱۳ امتیاز نگرفتن! یعنی مدل‌های عمومی عملاً سطحشون با مدل‌هایی که داخل شرکت‌ها هست اصلاً قابل مقایسه نیست.

اینجاش عجیبه که بعضی وقتا فکر می‌کنیم این ربات‌هایی که داریم تو سایت‌ها باهاشون حرف می‌زنیم (مثل ChatGPT یا بقیه)، قوی‌ترین چیز موجوده. ولی واقعیت اینه که پشت درهای بسته، مدل‌های خیلی پیشرفته‌تری دارن کار می‌کنن! حتی جالب‌تر اینکه این مدل‌ها مخصوص ریاضی نبودن و با همون نسخه‌های عمومی‌شون تونستن دانش‌آموزای نابغه دنیا رو تو درس خودشون ببرن. یعنی آینده‌ای که فقط یه مدل هوش مصنوعی باشه و بتونه هرکاری بکنه (حتی بهتر از هر متخصص)، زیاد هم دور از ذهن نیست!

خلاصه بخوام جمع‌بندی کنم: اگه هنوز فکر می‌کنی هوش مصنوعی فقط بلده شعر بنویسه یا جواب‌های از پیش آماده بده، باید بدونی الان دیگه به مرحله‌ای رسیده که می‌تونه یکی از سخت‌ترین امتحان‌های ریاضی دنیا رو با نمره طلا رد کنه! البته هنوز این نسخه‌ها در دسترس ما نیست، ولی شاید به زودی خیلی چیزها رو زیر و رو کنه.

منبع: +