خب بچهها، اخیراً دانشمندای سنگاپوری از شرکت Sapient یه مدل هوش مصنوعی خفن درست کردن که اسمش HRM یا Hierarchical Reasoning Model ـه. ترجمه سادهش میشه مدل استدلال سلسلهمراتبی. این مدل، همونطور که از اسمش پیداست، از مغز خودمون الهام گرفته! یعنی چی؟ یعنی مغز آدم اطلاعات رو تو قسمتهای مختلفش و تو بازههای زمانی مختلف – مثلاً از یه چشمک کوتاه تا یه فکر طولانی – پردازش میکنه.
حالا HRM هم همین سبک رو پیاده کرده. به جای اینکه راه حل رو تیکه تیکه و مرحله به مرحله بره جلو (که بهش میگن Chain of Thought یا CoT ـ یعنی زنجیره فکر، روشی که اکثر مدلهای زبون بزرگ مثل ChatGPT ازش استفاده میکنن و مسائل رو ریز ریز و با جملات طبیعی حل میکنن)، HRM اومده با دو تا ماژول مختلف، استدلال رو تو یه حرکت رو به جلو انجام میده. یکی از ماژولها کار برنامهریزی و فکرای انتزاعی رو میکنه (یعنی همون فکرای کلی و بلندمدت)، یکی دیگه کارهای سریع و جزئی. یه جورایی مثل مغز خودمون که بخشهاش هر کدوم وظیفهای دارن.
یه نکته خفن اینکه این مدل فقط ۲۷ میلیون پارامتر داره و تنها با ۱۰۰۰ نمونه یاد گرفته؛ پارامتر یعنی اون دادههایی که مغز هوش مصنوعی باهاش tweak ـ میشه و یاد میگیره. مقایسه کن با مدلهایی مثل GPT-5 که میگن شاید بین ۳ تا ۵ تریلیون! پارامتر داشته باشه ـ واقعاً عجیبه.
خب ولی قدرت واقعی HRM موقعیه که بریم سراغ مسابقههای منطقی و کیفیت حل مسئله. این بچه رو گذاشتن پای یه آزمون سخت که اسمش ARC-AGI benchmark ـه (این آزمون میخواد ببینه مدلها چقدر به هوش عمومی مصنوعی یا AGI نزدیک شدن؛ هوش عمومی مصنوعی یعنی هوشی که مثل آدمها میتونه تو هر زمینهای فکر کنه و نه فقط یه کار خاص رو انجام بده). نتیجه عجب غریبی گرفت: HRM تو نسخه اول این آزمون ۴۰.۳٪ امتیاز اورد؛ حالا مقایسه کن با اوپنایآی O3-mini-high که ۳۴.۵٪، Anthropic Claude 3.7 که فقط ۲۱.۲٪ و Deepseek R1 که تنها ۱۵.۸٪ اورده بودن.
حتی تو نسخه دوم آزمون که سختتر هم بود، HRM تونست ۵٪ بگیره. در حالی که نزدیکترین رقیبش ۳٪ و بقیه خیلی پایینتر بودن. تازه گفته میشه HRM تو کارهایی مثل حل سودوکوای سخت – همون بازی جدولی که باید اعداد رو درست بچینی، و پیدا کردن مسیر بهینه تو مازها (همون مارپیشههای سرگرمکننده) فوقالعاده عمل کرده؛ کاری که مدلهای زبون بزرگ اصلاً از پسش برنیومدن.
حتماً شنیدی که اکثر هوش مصنوعیهای مدرن کلی نیاز به داده و آموزش دارند، اما HRM اینجا هم بازی رو عوض کرده. نیاز به داده و پارامتر خیلی کمتری داره و سریعتر هم کار رو راه میاندازه. یکی از دلایلشم اینه که HRM به جای اینکه واسه هر قدم از کار کلی توضیح بخواد (که لازمه مدلهای زنجیره فکر یا CoT ـه)، میتونه تو یه حرکت قدمای منطقی رو خودش پیش ببره و جواب نهایی رو بده – بدون اینکه مجبور باشه وسط کار هی راهنمایی بگیره یا مسیر رو تکهتکه توضیح بده.
البته هنوز یه نکته جالب وجود داره. مقالهای که نتایج HRM رو نشون داده هنوز داوری نشده (peer-review یعنی چندتا دانشمند خبره دیگه هم مطالعه کنن ببینن همه چیز درسته یا نه). اما جالب اینجاست که سازندههاش مدل HRM رو روی Github اپن سورس کردن (یعنی همه میتونن کدهارو ببینن و استفاده کنن). کسایی که برگزارکننده همین آزمون سخت بودن، سعی کردن خودشون هم نتایج رو تکرار کنن. اونا تونستن نتایج مشابه دربیارن ولی فهمیدن یه ترفند اضافه – که اسمش refinement process یا فرآیند بهبود تدریجی ـه – بوده که خیلی تاثیر داشته. اینم یه روش کامپیوتریه که هی راهحل رو اصلاح میکنه تا دقیقتر بشه.
در نهایت باید گفت فعلاً HRM یکی از جالبترین مدلهایی هست که سعی کرده به مغز انسان شبیهتر بشه و نشون داده میشه میتونیم با ساختارهای کوچیکتر و دادههای کمتر، هوشمصنوعیهای قویتر خلق کنیم.
اگه کنجکاوی بدونی تو دنیای هوش مصنوعی چه اتفاقاتی داره میافته، بد نیست بدونی الان بحث گرفتن سکان هوش مافوقانسانی یا همون سوپراینتلجنس حسابی داغه، مثلاً پروژه متا (همون فیسبوک سابق)، یا مطالعات جدیدی که میگه چتباتها ممکنه تویه تهدید شدن دروغ بگن، یا اینکه واقعاً چقدر باید حرف این میلیاردرها درباره هوش عمومی مصنوعی رو جدی بگیریم! خلاصه اینکه دنیا داره عوض میشه و هوش مصنوعیهای آینده خیلی هوشمندتر و پر رمز و رازترن.
منبع: +