دو مغز متفکر پشت آینده اوپن‌اِی‌آی رو بشناس!

همه‌ی ما اسم سم آلتمن (Sam Altman) رو شنیدیم؛ همون مدیرعامل معروف و کاریزماتیک OpenAI که با استایل خاص و کارهای هیجانی‌ش باعث شده همه فکر کنن فقط اون داره کمپانی رو می‌چرخونه. ولی واقعاً پشت تکنولوژی خفن OpenAI دو نفر هستن که شاید اسم‌شون به گوش‌تون نخورده باشه: مارک چن (Mark Chen)، مدیر تحقیقات، و یاکوب پاچوکی (Jakub Pachocki)، دانشمند ارشد. این دوتا نفرات اصلی‌ای هستن که دارن آینده مدل‌های هوش مصنوعی OpenAI رو شکل می‌دن و مسئولیتشون اینه که همیشه چند قدم از غول‌هایی مثل گوگل جلوتر باشن.

دفتر اصلی OpenAI تو لندن پارسال افتتاح شد، نزدیک Buckingham Palace، البته وقتی من این دوتا رو دیدم تو یه فضای کار اشتراکی کنار King’s Cross بودن؛ جایی دقیقاً وسط دل محله تکنولوژی لندن. خود مارک چن ظاهراً خیلی مرتب و با تیپ دانشجویی میاد، اهل رسانه و خیلی راحت جواب می‌ده؛ حتی یه ویدیو هم هست که داره با چت‌بات OpenAI لاس می‌زنه! پاچوکی بیشتر قیافه هکرهای فیلم‌ها رو داره و موقع صحبت همش به دستاش زُل می‌زنه ولی خیییلی باهوشه. البته تیم‌شون خیلی با هم مچ هست.

نقش هرکدوم چیه؟ پاچوکی می‌گه: مارک قراره تیم‌های تحقیق رو مدیریت کنه و من مسیر فنی و چشم‌انداز بلندمدت رو تعیین می‌کنم. البته خودشون می‌گن این تقسیم‌بندی منعطفه و هر جا لازم باشه هر دو دست به آچار می‌شن و یه تیکه‌ای از کار رو جلو می‌برن.

یه کوچولو درباره هرکدومشون بگم:
مارک چن قبل از ۲۰۱۸ تو بورس آمریکا مشغول بوده و مدل‌های یادگیری ماشین واسه معامله‌ی آتی (Futures Trading) می‌ساخته؛ یعنی از هوش مصنوعی برای پیش‌بینی قیمت‌ها تو بورس استفاده می‌کرده. بعد که میاد OpenAI، موسس اصلی پروژه DALL-E می‌شه (همون مدلی که می‌تونه تصویر از توضیحات متنی بسازه)، بعد هم روی اضافه کردن شناخت تصویر به GPT-4 و توسعه Codex کار می‌کنه (Codex: همون مدلی که پشت گیت‌هاب Copilot ـه، یعنی مدل هوش مصنوعی که به برنامه‌نویس‌ها تو نوشتن کد کمک می‌کنه).

پاچوکی سال ۲۰۱۷ از دنیای دانشگاه و نظریه کامپیوتر بیرون اومد و اخیراً اومده جای ایلیا ساتسکِور (Ilya Sutskever)، دانشمند معروف OpenAI رو گرفته. نقش اصلیش تو ساخت مدل‌های تفکر و استدلال OpenAI بوده مخصوصاً مدل‌های o1 و o3 (مدل‌های استدلال یعنی AIهایی که می‌تونن برای حل مسائل پیچیده، مثل مسایل علمی و ریاضی و برنامه‌نویسی، قدم‌به‌قدم فکر کنن).

راستی اخیراً OpenAI با مدل زبان خود دوم شد تو مسابقه AtCoder World Tour Finals (که یه رقابت خیلی سنگین برنامه‌نویسی تو دنیاست) و همین مدلشون تو المپیاد جهانی ریاضی ۲۰۲۵ هم سطح مدال طلا نتیجه گرفت. جالب‌ترش اینه که دو روز بعدش گوگل دیپ‌مایند هم اعلام کرد مدل اون‌ها دقیقاً همین نتیجه رو گرفته! منتهی گوگل صبر کرد تا نتایج رسمی کنکور اعلام شه، ولی OpenAI خودش به خودش نمره داد :)).

اما هیجان اصلی مارک و یاکوب سر همون مسابقه برنامه‌نویسی AtCoder بود چون اونجا مدلشون رتبه دوم رو تو دنیا آورد (در حالی که اونی که اول شد «Psyho» – یه افسانه تو برنامه‌نویسی رقابتی – دوست و همکار سابق پاچوکی بود!). جا داره اینجا بگم AtCoder، یکی از سخت‌ترین مسابقات برنامه‌نویسی جهانه که شرکت‌کننده‌ها باید ۱۰ ساعت بدون توقف مسائل عجیب و خفن رو حل کنن.

خود چن و پاچوکی هم کلی سابقه مسابقه برنامه‌نویسی دارن و اصلاً چن الان مربی تیم المپیاد کامپیوتر آمریکا هم هست. خودشونم می‌گن خیلی علاقه شخصی دارن که هوش مصنوعی تو این جور رقابت‌ها قوی شه و حتی شوخی می‌کنن که مدل‌هاشون دارن از خودشون هم بهتر کار می‌کنن – درست مثل اون اتفاق تاریخی که AlphaGo دیپ‌مایند استاد بازی «Go» (یک بازی استراتژیک فکری شرقی) رو شکست داد.

اصلاً چرا این‌قدر به ریاضی و برنامه‌نویسی بها می‌دن؟ خودشون می‌گن اینها پایه‌ و اساس هوش عمومی واقعیه – یعنی اگه یه مدل بتونه مسائل ریاضی و الگوریتمی حل کنه، دیگه می‌تونه خلاقیت و ایده‌پردازی داشته باشه و کلی مسائل غیرمنتظره رو هم حل کنه. پاچوکی می‌گه وقتی مدل تو مسابقه برنامه‌نویسی مقابل Psyho شرکت کرد، آره مدل ما کلی خوب بود ولی Psyho راه‌حل کاملاً نوآورانه داد که نشون داد هنوز راه برای کشف ایده‌های جدید بازه. (اینجا منظورشون از هوش عمومی و AGI همونه: “Artificial General Intelligence” یعنی هوشی که مثل انسان می‌تونه خیلی کارها رو با هم بکنه و محدود به یه حوزه خاص نباشه.)

حالا درباره آینده AGI چی فکر می‌کنن؟ برخلاف هیاهو و عجیب جلوه دادنش توسط بعضیا، این دوتا خیلی منطقی نگاه می‌کنن. پاچوکی می‌گه: “ما هنوز خیلی سرِ ابتدای مسیر Reasoning هستیم – یعنی هنوزم این مدل‌ها نمی‌تونن مثل آدم‌ها اطلاعات و مراحل رو به هم وصل کنن و خودشون کار تحقیقاتی طولانی انجام بدن.” چن هم تأکید داره که “هنوز استدلال واقعی در مدل‌ها حل نشده و باید خیلی بیشتر کار کنیم”. جالبه که اعتقاد دارن هرچی دیتای بیشتر و سخت‌افزار قوی‌تر به مدل بدی (که بهش می‌گن Scaling Laws یعنی قوانین مقیاس‌پذیری)، مدل‌ها بازم بهتر می‌شن. یعنی برخلاف بعضیا که فکر می‌کنن دیگه مدل‌ها از لحاظ کیفیت به ته خط رسیدن، این دوتا می‌گن ظرفیت هنوز بالاست!

یکی از بحث‌های داغ تو OpenAI تیم “سوپر الاینمنت” بود؛ یعنی گروهی که دو سال پیش توسط ساتسکِور و Jan Leike راه افتاد تا بتونن هوش مصنوعی خیلی قدرتمند (هوش فراانسانی یا همون hypothetical superintelligence) رو مطمئن کنن که مطابق اهداف انسان‌ها رفتار می‌کنه. (Alignment یعنی همسو شدن اهداف AI با ارزش‌های انسانی). کلی از منابع OpenAI می‌خواست بره به این تیم، ولی الآن بیشتر اعضا از جمله خود ساتسکِور و لایک رفتن و تیم منحل شده! لایک موقع رفتن نوشت: “ساخت ماشین‌هایی که از انسان باهوش‌تر باشن ذاتاً خطرناکه؛ ولی OpenAI تو این مدت بیشتر دنبال محصولات جذاب بوده تا تمرکز روی ایمنی و فرهنگ ایمنی.”

ولی چن و پاچوکی می‌گن حالا دیگه بحث همسو کردن مدل‌ها با اهداف انسانی (Alignment) جزو هسته اصلی طراحی محصولاته؛ یعنی مدل‌ها فقط وقتی به درد می‌خورن که دقیقاً طبق انتظار ما کار کنن و همین الان هم مسیر همسویی مدل‌ها خیلی عملی‌تر و جدی‌تره و تمرکز روی خطرات فرضی آینده کمتر شده.

حالا همه حرف اینه که OpenAI دیگه فقط یک لابراتوار تحقیقاتی نیست، بلکه الآن یه غول تکنولوژیه با ارزش ۳۰۰ میلیارد دلار که هر هفته ۴۰۰ میلیون کاربر داره و هر روز ۲.۵ میلیارد پرسش به مدل‌هاش ارسال می‌شه! تو همین چند ماه گذشته، مدل‌های جدید GPT-4 رو داد بیرون، تصاویر و ویدیوهای تولیدی (یعنی Genrative تصاویر و ویدیوها؛ توضیح: مثل مدلی به اسم Sora که می‌تونه با هوش مصنوعی ویدیو بسازه)، ارتباط صوتی مستقیم با ChatGPT و حتی مامور آژانسی به اسم “Operator” که خودش می‌تونه واسه شما با کامپیوتر کار کنه هم عرضه کرد. (Operator همون Agent AI ـه؛ یعنی یه هوش مصنوعی که مثل آدم می‌تونه واسه شما تو اینترنت بچرخه و کار انجام بده!)

فیجی سیمو (Fidji Simo)، مدیرعامل جدید بخش محصولات هم حسابی بَرنامه داره و گفته می‌خواد تکنولوژی OpenAI رو به دست همه مردم دنیا برسونه. یعنی اگه منتظر شگفتی‌های جدید باشید، خیلی طول نمی‌کشه که چیزای تازه ببینیم؛ مثلاً شایعات می‌گن مدل GPT-5 احتمالاً اوت ۲۰۲۴ معرفی می‌شه. البته خود آلتمن گفته این مدل هنوز آزمایشیه و بیشتر واسه تحقیقاته تا یه بمب خبری.

در کل، بین تحقیق و محصول (Research & Product)، همیشه یه تعادل ناپیدا هست و این دو نفر (چن و پاچوکی) مسئول ایجاد همین تعادلن. پاچوکی می‌گه: “من بیشتر فکرم مشغوله آینده و جهت تکنولوژیه، اما مارک باید هوای مردم و نیازهای کوتاه‌مدت شرکت رو داشته باشه- همیشه کمی کشمکش این وسط هست ولی در نهایت تعادله که مهمه.”

یک نکته جالب آخر: هر دو اعتقاد دارن مدل‌های AI وقتی واقعاً عجیب و جالب می‌شن که بتونن مدت‌ها خودشون، بدون دخالت ما، مسائل بزرگ رو حل کنن یا حتی پروژه تحقیقاتی مستقل راه بندازن. این یعنی یه هوشی که می‌تونه خودش بدونه توقف و گیر کردن، واسه خودش یه عالمه کار باحال و مفید انجام بده. از نظر چن، این تقریباً تعریف واقعیه AGI ـه. حالا این ایده خیلی از وضع فعلی فاصله داره، اما قطعاً دارن سمتش می‌رن و خودشون اصلاً باور دارن که پیشرفت تو این حوزه هنوز تمومی نداره.

خلاصه اگه از این به بعد درباره شگفتی‌های OpenAI شنیدید، یادتون باشه فقط اسم سم آلتمن صدا نزنید! پشت صحنه، مارک چن و یاکوب پاچوکی دارن همه برنامه‌ها و محصولات آینده رو رقم می‌زنن؛ دو آدمی که حسابی عاشق کد، ریاضی و آینده هوش مصنوعی هستن و زندگی‌شون رو گذاشتن روی اینکه AI، هر روز به سطح جدیدی از خلاقیت و توانایی برسه.

منبع: +