خب رفقا، خبر داغ این که بالاخره OpenAI نسخه جدید مدل معروف خودش یعنی GPT-5 رو منتشر کرد! خیلیا منتظرش بودن، اما داستانش فقط آپدیت ساده نیست؛ یه سری جزییات جالب داره که میخوام به سبک خودمون براتون باز کنم.
اول از همه بگم که دیگه اون تفاوت معروف بین مدلهای اصلی OpenAI و مدلهای سری o (که قبلاً مخصوص کارهای استدلالی بودن)، کنار گذاشته شده. حالا خود GPT-5 تصمیم میگیره برای کار شما، از مدل سریع و ساده استفاده کنه یا بره سراغ مدل استدلالی و دقیقتر، بسته به اینکه سوالتون چقدر پیچیدست. یعنی دیگه لازم نیست خودتون تصمیم بگیرین که از کدوم ورژن استفاده کنین! حس میکنم خیلیا همینو میخواستن.
در حال حاضر دسترسی به GPT-5 برای همه باز شده. البته اگه کاربر رایگان هستین، ممکنه چند روزی طول بکشه تا مزه کاملش رو بچشین!
یه نکته باحال اینه که بعضیا میارنش کنار GPT-4 مقایسه میکنن، اما اگه واقعاً میخواین تفاوتش رو بفهمین باید با o1 مقایسه کنین. o1 همون اولین مدل استدلالی OpenAI بود که سال پیش فقط واسه کاربرای Plus و Team باز شد. اون موقع این ویژگی جدید ارائه شد که مدل میتونه برای هر جوابش، پیشنویسهای بیشتری بنویسه و عملاً قبل از جواب نهایی، فکر کنه. این باعث میشد جوابها حتی توی مسائل سخت هم خیلی بهتر باشن نسبت به مدلهای قدیمیتر.
ولی حالا GPT-5 نسبت به o1 یه سر و گردن بالاتره، چون خیلی صیقلیتر و کاربرپسندتر شده. سم آلتمن (مدیرعامل OpenAI) توی کنفرانس مطبوعاتی یه مثال جالب زد و GPT-5 رو با نمایشگر Retina اپل مقایسه کرد (همون صفحهنمایشا که خیلی شارپ و قلنبهن!). منظور این بود که تجربه کاربری واقعاً لذتبخشتر شده. البته با همه این تعریفها، GPT-5 هنوز اون انقلاب هوش مصنوعی غولآسایی که آلتمن قولش رو داده بود، نیست. خودش گفت این یه «قدم مهم به سمت AGI»ـه.
آهان بذارید بگم AGI یعنی هوش مصنوعی عمومی، همونی که مثل یه آدم میتونه همه کار انجام بده، نه فقط جواب بده به سوال یا متن تولید کنه.
یکی از دموی جالبی که از مدل نشون دادن، این بود که Yann Dubois (یکی از اعضای تیم OpenAI) از GPT-5 خواسته بود یه وباپلیکیشن طراحی کنه تا دوستش بتونه راحتتر فرانسوی یاد بگیره و با خانواده اون ارتباط بگیره. اپ رو خیلی خوشگل و کاربردی درست کرد. نکته بامزه اینه که وقتی همین درخواست رو به GPT-4o دادیم، تقریباً همون کار رو کرد، فقط ظاهرش زیاد جذاب نبود!
یه پیشرفت مهم دیگه اینه که حالا خود مدل تصمیم میگیره که چه جوری به سوالتون جواب بده؛ یعنی خودش میفهمه کِی باید جواب سطحی بده یا استدلال کنه. این واقعاً برای کاربرای معمولی که زیاد درگیر جزئیات تکنولوژی هوش مصنوعی نیستن (یعنی ماها!)، عالیه!
به گفته آلتمن، GPT-5 خیلی سریعتر از مدلهای سری o فکر میکنه. حتی خبر خوب برای کاربرای رایگان: ظاهراً اجرای این مدلها برای شرکت هم کمهزینهتر شده. چرا این خوبه؟ چون هزینه بالا سرعت پایین رو توی مدلای قوی همیشه داشتیم، و الان اگه حل شه، حتی از نظر تاثیرات زیستمحیطی (کاهش مصرف انرژی هوش مصنوعی!) هم خیلی کمک میکنه.
یه معضل دیگهای که همیشه این مدلها داشتن پدیده «هالوسینیشن» بوده. یعنی مدل گاهی میاد یه چیز نادرست رو با اطمینان کامل میگه! (هالوسینیشن یعنی توهم زدن؛ اینجا منظور اشتباه گفتنه طوری که فکر میکنی درسته). OpenAI میگه تو آزمونای خودش، GPT-5 خیلی کمتر از مدلهای قبلی مثل o3 و GPT-4o گاف میده. اگه واقعاً اینجوری باشه، میتونه باعث بشه هوش مصنوعیا قابل اعتمادتر و ایمنتر بشن. Dawn Song، استاد دانشگاه UC Berkeley، گفته که همین اشتباهات گاهی باعث مشکلات امنیتی جدی میشه، مثلاً چتبات بیاد نرمافزار مخرب رو به سیستم شما پیشنهاد بده!
از لحاظ فنی هم رکوردای جدیدی ثبت کرده: مثلاً تو آزمونهای کور AI و تستهای کدنویسی مثل SWE-Bench و Aider Polyglot (این دوتا مجموعه تستهاییه برای بررسی کیفیت کد نوشتن مدلها، مخصوصا برنامهنویسی تو محیط واقعی)، بهترین نتایج رو آورده. ولی جالبه بدونین Clémentine Fourrier، محقق HuggingFace (که خودشون توی این زمینه حسابی فعالن) گفته که این تستها دیگه داره اشباع میشه، یعنی مدلها تقریباً به سقف عملکردشون نزدیک شدن.
یه تشبیه بامزه کرد: مثل اینه که دانشآموز دبیرستانی رو مجبور کنی امتحان راهنمایی بده! اگه رد شه میفهمی شکسته، اما اگه قبول شه چیز جدیدی نمیفهمی. از دید اون، اگه GPT-5 توی SWE-Bench مثلا ۸۰ یا ۸۵ درصد بزنه عجیبه، اما فعلاً رسیده به حدود ۷۵ درصد (دقیقترش ۷۴.۹ درصد)!
در کل پیغام اصلی OpenAI اینه که کار با GPT-5 خیلی حال میده! نیک تورلی (رئیس ChatGPT) گفته «ویب مدل واقعاً خوبه و فکر میکنم همه خصوصاً کاربران معمولی که زیاد پیگیر مدلها نبودن اینو حس میکنن.»
البته فقط vibes و حس خوب، اون آینده خودکار هوش مصنوعی رو که آلتمن قول داده، نمیاره. خیلیا هنوز منتظر اون جهش واقعی بعدی توی استدلال و هوش عمومی هستن. باید ببینیم قدم بعدی چی میشه!
منبع: +