بالاخره GPT-5 اومد! خب حالا چی میشه؟

خب رفقا، خبر داغ این که بالاخره OpenAI نسخه جدید مدل معروف خودش یعنی GPT-5 رو منتشر کرد! خیلیا منتظرش بودن، اما داستانش فقط آپدیت ساده نیست؛ یه سری جزییات جالب داره که میخوام به سبک خودمون براتون باز کنم.

اول از همه بگم که دیگه اون تفاوت معروف بین مدل‌های اصلی OpenAI و مدل‌های سری o (که قبلاً مخصوص کارهای استدلالی بودن)، کنار گذاشته شده. حالا خود GPT-5 تصمیم می‌گیره برای کار شما، از مدل سریع و ساده استفاده کنه یا بره سراغ مدل استدلالی و دقیق‌تر، بسته به اینکه سوال‌تون چقدر پیچیدست. یعنی دیگه لازم نیست خودتون تصمیم بگیرین که از کدوم ورژن استفاده کنین! حس می‌کنم خیلیا همینو می‌خواستن.

در حال حاضر دسترسی به GPT-5 برای همه باز شده. البته اگه کاربر رایگان هستین، ممکنه چند روزی طول بکشه تا مزه کاملش رو بچشین!

یه نکته باحال اینه که بعضیا میارنش کنار GPT-4 مقایسه می‌کنن، اما اگه واقعاً می‌خواین تفاوتش رو بفهمین باید با o1 مقایسه کنین. o1 همون اولین مدل استدلالی OpenAI بود که سال پیش فقط واسه کاربرای Plus و Team باز شد. اون موقع این ویژگی جدید ارائه شد که مدل می‌تونه برای هر جوابش، پیش‌نویس‌های بیشتری بنویسه و عملاً قبل از جواب نهایی، فکر کنه. این باعث میشد جواب‌ها حتی توی مسائل سخت هم خیلی بهتر باشن نسبت به مدل‌های قدیمی‌تر.

ولی حالا GPT-5 نسبت به o1 یه سر و گردن بالاتره، چون خیلی صیقلی‌تر و کاربرپسندتر شده. سم آلتمن (مدیرعامل OpenAI) توی کنفرانس مطبوعاتی یه مثال جالب زد و GPT-5 رو با نمایشگر Retina اپل مقایسه کرد (همون صفحه‌نمایشا که خیلی شارپ و قلنبه‌ن!). منظور این بود که تجربه کاربری واقعاً لذت‌بخش‌تر شده. البته با همه این تعریف‌ها، GPT-5 هنوز اون انقلاب هوش مصنوعی غول‌آسایی که آلتمن قولش رو داده بود، نیست. خودش گفت این یه «قدم مهم به سمت AGI»ـه.

آهان بذارید بگم AGI یعنی هوش مصنوعی عمومی، همونی که مثل یه آدم می‌تونه همه کار انجام بده، نه فقط جواب بده به سوال یا متن تولید کنه.

یکی از دموی جالبی که از مدل نشون دادن، این بود که Yann Dubois (یکی از اعضای تیم OpenAI) از GPT-5 خواسته بود یه وب‌اپلیکیشن طراحی کنه تا دوستش بتونه راحت‌تر فرانسوی یاد بگیره و با خانواده اون ارتباط بگیره. اپ رو خیلی خوشگل و کاربردی درست کرد. نکته بامزه اینه که وقتی همین درخواست رو به GPT-4o دادیم، تقریباً همون کار رو کرد، فقط ظاهرش زیاد جذاب نبود!

یه پیشرفت مهم دیگه اینه که حالا خود مدل تصمیم می‌گیره که چه جوری به سوالتون جواب بده؛ یعنی خودش می‌فهمه کِی باید جواب سطحی بده یا استدلال کنه. این واقعاً برای کاربرای معمولی که زیاد درگیر جزئیات تکنولوژی هوش مصنوعی نیستن (یعنی ماها!)، عالیه!

به گفته آلتمن، GPT-5 خیلی سریع‌تر از مدل‌های سری o فکر می‌کنه. حتی خبر خوب برای کاربرای رایگان: ظاهراً اجرای این مدل‌ها برای شرکت هم کم‌هزینه‌تر شده. چرا این خوبه؟ چون هزینه بالا سرعت پایین رو توی مدلای قوی همیشه داشتیم، و الان اگه حل شه، حتی از نظر تاثیرات زیست‌محیطی (کاهش مصرف انرژی هوش مصنوعی!) هم خیلی کمک می‌کنه.

یه معضل دیگه‌ای که همیشه این مدل‌ها داشتن پدیده «هالوسینیشن» بوده. یعنی مدل گاهی میاد یه چیز نادرست رو با اطمینان کامل میگه! (هالوسینیشن یعنی توهم زدن؛ اینجا منظور اشتباه گفتنه طوری که فکر می‌کنی درسته). OpenAI میگه تو آزمونای خودش، GPT-5 خیلی کمتر از مدل‌های قبلی مثل o3 و GPT-4o گاف میده. اگه واقعاً اینجوری باشه، می‌تونه باعث بشه هوش مصنوعیا قابل اعتمادتر و ایمن‌تر بشن. Dawn Song، استاد دانشگاه UC Berkeley، گفته که همین اشتباهات گاهی باعث مشکلات امنیتی جدی میشه، مثلاً چت‌بات بیاد نرم‌افزار مخرب رو به سیستم شما پیشنهاد بده!

از لحاظ فنی هم رکوردای جدیدی ثبت کرده: مثلاً تو آزمون‌های کور AI و تست‌های کدنویسی مثل SWE-Bench و Aider Polyglot (این دوتا مجموعه تست‌هاییه برای بررسی کیفیت کد نوشتن مدل‌ها، مخصوصا برنامه‌نویسی تو محیط واقعی)، بهترین نتایج رو آورده. ولی جالبه بدونین Clémentine Fourrier، محقق HuggingFace (که خودشون توی این زمینه حسابی فعالن) گفته که این تست‌ها دیگه داره اشباع میشه، یعنی مدل‌ها تقریباً به سقف عملکردشون نزدیک شدن.

یه تشبیه بامزه کرد: مثل اینه که دانش‌آموز دبیرستانی رو مجبور کنی امتحان راهنمایی بده! اگه رد شه می‌فهمی شکسته، اما اگه قبول شه چیز جدیدی نمیفهمی. از دید اون، اگه GPT-5 توی SWE-Bench مثلا ۸۰ یا ۸۵ درصد بزنه عجیبه، اما فعلاً رسیده به حدود ۷۵ درصد (دقیق‌ترش ۷۴.۹ درصد)!

در کل پیغام اصلی OpenAI اینه که کار با GPT-5 خیلی حال میده! نیک تورلی (رئیس ChatGPT) گفته «ویب مدل واقعاً خوبه و فکر می‌کنم همه خصوصاً کاربران معمولی که زیاد پیگیر مدل‌ها نبودن اینو حس می‌کنن.»

البته فقط vibes و حس خوب، اون آینده خودکار هوش مصنوعی رو که آلتمن قول داده، نمیاره. خیلیا هنوز منتظر اون جهش واقعی بعدی توی استدلال و هوش عمومی هستن. باید ببینیم قدم بعدی چی میشه!

منبع: +