همهی ما اسم سم آلتمن (Sam Altman) رو شنیدیم؛ همون مدیرعامل معروف و کاریزماتیک OpenAI که با استایل خاص و کارهای هیجانیش باعث شده همه فکر کنن فقط اون داره کمپانی رو میچرخونه. ولی واقعاً پشت تکنولوژی خفن OpenAI دو نفر هستن که شاید اسمشون به گوشتون نخورده باشه: مارک چن (Mark Chen)، مدیر تحقیقات، و یاکوب پاچوکی (Jakub Pachocki)، دانشمند ارشد. این دوتا نفرات اصلیای هستن که دارن آینده مدلهای هوش مصنوعی OpenAI رو شکل میدن و مسئولیتشون اینه که همیشه چند قدم از غولهایی مثل گوگل جلوتر باشن.
دفتر اصلی OpenAI تو لندن پارسال افتتاح شد، نزدیک Buckingham Palace، البته وقتی من این دوتا رو دیدم تو یه فضای کار اشتراکی کنار King’s Cross بودن؛ جایی دقیقاً وسط دل محله تکنولوژی لندن. خود مارک چن ظاهراً خیلی مرتب و با تیپ دانشجویی میاد، اهل رسانه و خیلی راحت جواب میده؛ حتی یه ویدیو هم هست که داره با چتبات OpenAI لاس میزنه! پاچوکی بیشتر قیافه هکرهای فیلمها رو داره و موقع صحبت همش به دستاش زُل میزنه ولی خیییلی باهوشه. البته تیمشون خیلی با هم مچ هست.
نقش هرکدوم چیه؟ پاچوکی میگه: مارک قراره تیمهای تحقیق رو مدیریت کنه و من مسیر فنی و چشمانداز بلندمدت رو تعیین میکنم. البته خودشون میگن این تقسیمبندی منعطفه و هر جا لازم باشه هر دو دست به آچار میشن و یه تیکهای از کار رو جلو میبرن.
یه کوچولو درباره هرکدومشون بگم:
مارک چن قبل از ۲۰۱۸ تو بورس آمریکا مشغول بوده و مدلهای یادگیری ماشین واسه معاملهی آتی (Futures Trading) میساخته؛ یعنی از هوش مصنوعی برای پیشبینی قیمتها تو بورس استفاده میکرده. بعد که میاد OpenAI، موسس اصلی پروژه DALL-E میشه (همون مدلی که میتونه تصویر از توضیحات متنی بسازه)، بعد هم روی اضافه کردن شناخت تصویر به GPT-4 و توسعه Codex کار میکنه (Codex: همون مدلی که پشت گیتهاب Copilot ـه، یعنی مدل هوش مصنوعی که به برنامهنویسها تو نوشتن کد کمک میکنه).
پاچوکی سال ۲۰۱۷ از دنیای دانشگاه و نظریه کامپیوتر بیرون اومد و اخیراً اومده جای ایلیا ساتسکِور (Ilya Sutskever)، دانشمند معروف OpenAI رو گرفته. نقش اصلیش تو ساخت مدلهای تفکر و استدلال OpenAI بوده مخصوصاً مدلهای o1 و o3 (مدلهای استدلال یعنی AIهایی که میتونن برای حل مسائل پیچیده، مثل مسایل علمی و ریاضی و برنامهنویسی، قدمبهقدم فکر کنن).
راستی اخیراً OpenAI با مدل زبان خود دوم شد تو مسابقه AtCoder World Tour Finals (که یه رقابت خیلی سنگین برنامهنویسی تو دنیاست) و همین مدلشون تو المپیاد جهانی ریاضی ۲۰۲۵ هم سطح مدال طلا نتیجه گرفت. جالبترش اینه که دو روز بعدش گوگل دیپمایند هم اعلام کرد مدل اونها دقیقاً همین نتیجه رو گرفته! منتهی گوگل صبر کرد تا نتایج رسمی کنکور اعلام شه، ولی OpenAI خودش به خودش نمره داد :)).
اما هیجان اصلی مارک و یاکوب سر همون مسابقه برنامهنویسی AtCoder بود چون اونجا مدلشون رتبه دوم رو تو دنیا آورد (در حالی که اونی که اول شد «Psyho» – یه افسانه تو برنامهنویسی رقابتی – دوست و همکار سابق پاچوکی بود!). جا داره اینجا بگم AtCoder، یکی از سختترین مسابقات برنامهنویسی جهانه که شرکتکنندهها باید ۱۰ ساعت بدون توقف مسائل عجیب و خفن رو حل کنن.
خود چن و پاچوکی هم کلی سابقه مسابقه برنامهنویسی دارن و اصلاً چن الان مربی تیم المپیاد کامپیوتر آمریکا هم هست. خودشونم میگن خیلی علاقه شخصی دارن که هوش مصنوعی تو این جور رقابتها قوی شه و حتی شوخی میکنن که مدلهاشون دارن از خودشون هم بهتر کار میکنن – درست مثل اون اتفاق تاریخی که AlphaGo دیپمایند استاد بازی «Go» (یک بازی استراتژیک فکری شرقی) رو شکست داد.
اصلاً چرا اینقدر به ریاضی و برنامهنویسی بها میدن؟ خودشون میگن اینها پایه و اساس هوش عمومی واقعیه – یعنی اگه یه مدل بتونه مسائل ریاضی و الگوریتمی حل کنه، دیگه میتونه خلاقیت و ایدهپردازی داشته باشه و کلی مسائل غیرمنتظره رو هم حل کنه. پاچوکی میگه وقتی مدل تو مسابقه برنامهنویسی مقابل Psyho شرکت کرد، آره مدل ما کلی خوب بود ولی Psyho راهحل کاملاً نوآورانه داد که نشون داد هنوز راه برای کشف ایدههای جدید بازه. (اینجا منظورشون از هوش عمومی و AGI همونه: “Artificial General Intelligence” یعنی هوشی که مثل انسان میتونه خیلی کارها رو با هم بکنه و محدود به یه حوزه خاص نباشه.)
حالا درباره آینده AGI چی فکر میکنن؟ برخلاف هیاهو و عجیب جلوه دادنش توسط بعضیا، این دوتا خیلی منطقی نگاه میکنن. پاچوکی میگه: “ما هنوز خیلی سرِ ابتدای مسیر Reasoning هستیم – یعنی هنوزم این مدلها نمیتونن مثل آدمها اطلاعات و مراحل رو به هم وصل کنن و خودشون کار تحقیقاتی طولانی انجام بدن.” چن هم تأکید داره که “هنوز استدلال واقعی در مدلها حل نشده و باید خیلی بیشتر کار کنیم”. جالبه که اعتقاد دارن هرچی دیتای بیشتر و سختافزار قویتر به مدل بدی (که بهش میگن Scaling Laws یعنی قوانین مقیاسپذیری)، مدلها بازم بهتر میشن. یعنی برخلاف بعضیا که فکر میکنن دیگه مدلها از لحاظ کیفیت به ته خط رسیدن، این دوتا میگن ظرفیت هنوز بالاست!
یکی از بحثهای داغ تو OpenAI تیم “سوپر الاینمنت” بود؛ یعنی گروهی که دو سال پیش توسط ساتسکِور و Jan Leike راه افتاد تا بتونن هوش مصنوعی خیلی قدرتمند (هوش فراانسانی یا همون hypothetical superintelligence) رو مطمئن کنن که مطابق اهداف انسانها رفتار میکنه. (Alignment یعنی همسو شدن اهداف AI با ارزشهای انسانی). کلی از منابع OpenAI میخواست بره به این تیم، ولی الآن بیشتر اعضا از جمله خود ساتسکِور و لایک رفتن و تیم منحل شده! لایک موقع رفتن نوشت: “ساخت ماشینهایی که از انسان باهوشتر باشن ذاتاً خطرناکه؛ ولی OpenAI تو این مدت بیشتر دنبال محصولات جذاب بوده تا تمرکز روی ایمنی و فرهنگ ایمنی.”
ولی چن و پاچوکی میگن حالا دیگه بحث همسو کردن مدلها با اهداف انسانی (Alignment) جزو هسته اصلی طراحی محصولاته؛ یعنی مدلها فقط وقتی به درد میخورن که دقیقاً طبق انتظار ما کار کنن و همین الان هم مسیر همسویی مدلها خیلی عملیتر و جدیتره و تمرکز روی خطرات فرضی آینده کمتر شده.
حالا همه حرف اینه که OpenAI دیگه فقط یک لابراتوار تحقیقاتی نیست، بلکه الآن یه غول تکنولوژیه با ارزش ۳۰۰ میلیارد دلار که هر هفته ۴۰۰ میلیون کاربر داره و هر روز ۲.۵ میلیارد پرسش به مدلهاش ارسال میشه! تو همین چند ماه گذشته، مدلهای جدید GPT-4 رو داد بیرون، تصاویر و ویدیوهای تولیدی (یعنی Genrative تصاویر و ویدیوها؛ توضیح: مثل مدلی به اسم Sora که میتونه با هوش مصنوعی ویدیو بسازه)، ارتباط صوتی مستقیم با ChatGPT و حتی مامور آژانسی به اسم “Operator” که خودش میتونه واسه شما با کامپیوتر کار کنه هم عرضه کرد. (Operator همون Agent AI ـه؛ یعنی یه هوش مصنوعی که مثل آدم میتونه واسه شما تو اینترنت بچرخه و کار انجام بده!)
فیجی سیمو (Fidji Simo)، مدیرعامل جدید بخش محصولات هم حسابی بَرنامه داره و گفته میخواد تکنولوژی OpenAI رو به دست همه مردم دنیا برسونه. یعنی اگه منتظر شگفتیهای جدید باشید، خیلی طول نمیکشه که چیزای تازه ببینیم؛ مثلاً شایعات میگن مدل GPT-5 احتمالاً اوت ۲۰۲۴ معرفی میشه. البته خود آلتمن گفته این مدل هنوز آزمایشیه و بیشتر واسه تحقیقاته تا یه بمب خبری.
در کل، بین تحقیق و محصول (Research & Product)، همیشه یه تعادل ناپیدا هست و این دو نفر (چن و پاچوکی) مسئول ایجاد همین تعادلن. پاچوکی میگه: “من بیشتر فکرم مشغوله آینده و جهت تکنولوژیه، اما مارک باید هوای مردم و نیازهای کوتاهمدت شرکت رو داشته باشه- همیشه کمی کشمکش این وسط هست ولی در نهایت تعادله که مهمه.”
یک نکته جالب آخر: هر دو اعتقاد دارن مدلهای AI وقتی واقعاً عجیب و جالب میشن که بتونن مدتها خودشون، بدون دخالت ما، مسائل بزرگ رو حل کنن یا حتی پروژه تحقیقاتی مستقل راه بندازن. این یعنی یه هوشی که میتونه خودش بدونه توقف و گیر کردن، واسه خودش یه عالمه کار باحال و مفید انجام بده. از نظر چن، این تقریباً تعریف واقعیه AGI ـه. حالا این ایده خیلی از وضع فعلی فاصله داره، اما قطعاً دارن سمتش میرن و خودشون اصلاً باور دارن که پیشرفت تو این حوزه هنوز تمومی نداره.
خلاصه اگه از این به بعد درباره شگفتیهای OpenAI شنیدید، یادتون باشه فقط اسم سم آلتمن صدا نزنید! پشت صحنه، مارک چن و یاکوب پاچوکی دارن همه برنامهها و محصولات آینده رو رقم میزنن؛ دو آدمی که حسابی عاشق کد، ریاضی و آینده هوش مصنوعی هستن و زندگیشون رو گذاشتن روی اینکه AI، هر روز به سطح جدیدی از خلاقیت و توانایی برسه.
منبع: +