هوش مصنوعی جدید که از مغز آدم‌ها الهام گرفته و تو منطق و حل مسئله ChatGPT رو شکست داده!

خب بچه‌ها، اخیراً دانشمندای سنگاپوری از شرکت Sapient یه مدل هوش مصنوعی خفن درست کردن که اسمش HRM یا Hierarchical Reasoning Model ـه. ترجمه ساده‌ش میشه مدل استدلال سلسله‌مراتبی. این مدل، همون‌طور که از اسمش پیداست، از مغز خودمون الهام گرفته! یعنی چی؟ یعنی مغز آدم اطلاعات رو تو قسمت‌های مختلفش و تو بازه‌های زمانی مختلف – مثلاً از یه چشمک کوتاه تا یه فکر طولانی – پردازش می‌کنه.

حالا HRM هم همین سبک رو پیاده کرده. به جای این‌که راه حل رو تیکه تیکه و مرحله به مرحله بره جلو (که بهش می‌گن Chain of Thought یا CoT ـ یعنی زنجیره فکر، روشی که اکثر مدل‌های زبون بزرگ مثل ChatGPT ازش استفاده می‌کنن و مسائل رو ریز ریز و با جملات طبیعی حل می‌کنن)، HRM اومده با دو تا ماژول مختلف، استدلال رو تو یه حرکت رو به جلو انجام می‌ده. یکی از ماژول‌ها کار برنامه‌ریزی و فکرای انتزاعی رو می‌کنه (یعنی همون فکرای کلی و بلندمدت)، یکی دیگه کارهای سریع و جزئی. یه جورایی مثل مغز خودمون که بخش‌هاش هر کدوم وظیفه‌ای دارن.

یه نکته خفن اینکه این مدل فقط ۲۷ میلیون پارامتر داره و تنها با ۱۰۰۰ نمونه یاد گرفته؛ پارامتر یعنی اون داده‌هایی که مغز هوش مصنوعی باهاش tweak ـ میشه و یاد می‌گیره. مقایسه کن با مدل‌هایی مثل GPT-5 که می‌گن شاید بین ۳ تا ۵ تریلیون! پارامتر داشته باشه ـ واقعاً عجیبه.

خب ولی قدرت واقعی HRM موقعیه که بریم سراغ مسابقه‌های منطقی و کیفیت حل مسئله. این بچه رو گذاشتن پای یه آزمون سخت که اسمش ARC-AGI benchmark ـه (این آزمون می‌خواد ببینه مدل‌ها چقدر به هوش عمومی مصنوعی یا AGI نزدیک شدن؛ هوش عمومی مصنوعی یعنی هوشی که مثل آدم‌ها می‌تونه تو هر زمینه‌ای فکر کنه و نه فقط یه کار خاص رو انجام بده). نتیجه عجب غریبی گرفت: HRM تو نسخه اول این آزمون ۴۰.۳٪ امتیاز اورد؛ حالا مقایسه کن با اوپن‌ای‌آی O3-mini-high که ۳۴.۵٪، Anthropic Claude 3.7 که فقط ۲۱.۲٪ و Deepseek R1 که تنها ۱۵.۸٪ اورده بودن.

حتی تو نسخه دوم آزمون که سخت‌تر هم بود، HRM تونست ۵٪ بگیره. در حالی که نزدیک‌ترین رقیبش ۳٪ و بقیه خیلی پایین‌تر بودن. تازه گفته می‌شه HRM تو کارهایی مثل حل سودوکوای سخت – همون بازی جدولی که باید اعداد رو درست بچینی، و پیدا کردن مسیر بهینه تو مازها (همون مارپیشه‌های سرگرم‌کننده) فوق‌العاده عمل کرده؛ کاری که مدل‌های زبون بزرگ اصلاً از پسش برنیومدن.

حتماً شنیدی که اکثر هوش مصنوعی‌های مدرن کلی نیاز به داده و آموزش دارند، اما HRM اینجا هم بازی رو عوض کرده. نیاز به داده و پارامتر خیلی کمتری داره و سریع‌تر هم کار رو راه می‌اندازه. یکی از دلایلشم اینه که HRM به جای اینکه واسه هر قدم از کار کلی توضیح بخواد (که لازمه مدل‌های زنجیره فکر یا CoT ـه)، می‌تونه تو یه حرکت قدمای منطقی رو خودش پیش ببره و جواب نهایی رو بده – بدون این‌که مجبور باشه وسط کار هی راهنمایی بگیره یا مسیر رو تکه‌تکه توضیح بده.

البته هنوز یه نکته جالب وجود داره. مقاله‌ای که نتایج HRM رو نشون داده هنوز داوری نشده (peer-review یعنی چندتا دانشمند خبره دیگه هم مطالعه کنن ببینن همه چیز درسته یا نه). اما جالب اینجاست که سازنده‌هاش مدل HRM رو روی Github اپن سورس کردن (یعنی همه می‌تونن کدهارو ببینن و استفاده کنن). کسایی که برگزارکننده همین آزمون سخت بودن، سعی کردن خودشون هم نتایج رو تکرار کنن. اونا تونستن نتایج مشابه دربیارن ولی فهمیدن یه ترفند اضافه – که اسمش refinement process یا فرآیند بهبود تدریجی ـه – بوده که خیلی تاثیر داشته. اینم یه روش کامپیوتریه که هی راه‌حل رو اصلاح می‌کنه تا دقیق‌تر بشه.

در نهایت باید گفت فعلاً HRM یکی از جالب‌ترین مدل‌هایی هست که سعی کرده به مغز انسان شبیه‌تر بشه و نشون داده می‌شه می‌تونیم با ساختارهای کوچیک‌تر و داده‌های کمتر، هوش‌مصنوعی‌های قوی‌تر خلق کنیم.

اگه کنجکاوی بدونی تو دنیای هوش مصنوعی چه اتفاقاتی داره می‌افته، بد نیست بدونی الان بحث گرفتن سکان هوش مافوق‌انسانی یا همون سوپراینتلجنس حسابی داغه، مثلاً پروژه متا (همون فیس‌بوک سابق)، یا مطالعات جدیدی که می‌گه چت‌بات‌ها ممکنه تویه تهدید شدن دروغ بگن، یا اینکه واقعاً چقدر باید حرف این میلیاردرها درباره هوش عمومی مصنوعی رو جدی بگیریم! خلاصه اینکه دنیا داره عوض میشه و هوش مصنوعی‌های آینده خیلی هوشمندتر و پر رمز و رازترن.

منبع: +