خب امروز قراره یکم قاطیِ هوش مصنوعی (Artificial General Intelligence یا همون AGI که یعنی هوش مصنوعیای که خودش میتونه بفهمه و تصمیم بگیره و فقط تو یه کار خاص حرفهای نباشه) حرف بزنیم، ولی نه معمولیش! میخوام باهاتون یه ایده خیلی جالب و جدید در مورد ساختارش به اشتراک بذارم که تازگی تو یه مقاله اومده.
تا حالا همه مدلهای زبونی مثل ChatGPT و دوستاش غالباً بر اساس پیشبینی آماری کلمه بعدی کار میکنن. یعنی فقط حدس میزنن الان وقتشه بعدش چه کلمهای بیاد. به اینا میگن روشهای “آماری” ـ و تقریباً همهشون بر پایه مدل Transformer ساخته شدن. ولی ایدهی این مقاله اینه که این فقط بازی با احتمالاته و خبری از “درک واقعی معنی” نیست!
اینجا یه مفهومی داریم به اسم “جذبکننده معنایی” (Semantic Attractor). یعنی چی؟ فرض کن تو ذهنت هر کلمه و جمله شبیه یک نقطه یا آبجکت تو یه فضای خیالی بزرگ از معنیهاست. حالا این جذبکنندهها همون نقطههایی هستن که معنیا دوست دارن بهش جمع شن! اگه بخوای مثالی بزنی، مثل آهنربایی هست که معنیها رو جذب خودش میکنه و باعث میشه حرفها و جملات یکدستتر و واضحتر بشن.
حالا میرسیم به فضای معنایی با اعداد مختلط. اعداد مختلط (Complex Numbers) اونایی هستن که هم قسمت حقیقی دارن، هم قسمت موهومی. مثلاً عدد موهومی “i” رو اگه یادت باشه، عددیه که مجذورش میشه منفی یک. ایده اینه که تو فضای معنایی هم میتونیم با همین اعداد مختلط بازی کنیم… اینطوری معنیا میتونن دَوَرن، بچرخن یا حتی تو خودشون پیچ بخورن!
یه چیز باحال دیگه که این مدل ادعا میکنه میتونه هندلش کنه، طنز (Irony)، چندمعنایی (Homonymy، یعنی یه کلمه چندتا معنی داشته باشه)، و ابهام (Ambiguity) هست. چون وقتی معنیا میتونن با حرکت دورانی و ترکیب شدن تو فضاهای عجیبغریب جابهجا بشن، دیگه لازم نیست فقط کلمه به کلمه جلو بریم. کل داستان بر اساس عملیاتهای سیکلی با عدد موهومی i انجام میشه (یعنی عملیات چرخشی)
اما اصل قضیه اونجاست که این مدل دیگه فقط “دنبال احتمال بالاتر” نمیره، بلکه یه جور نیت و هدف داره! تو این مقاله اسم این عامل هدایتکننده رو گذاشتن Microvitum، که یه جور عامل کوچیک ولی دارای هدفه (انگار یه آدم کوچیک تو مغز AGI گرفته و معنیها رو هدایت میکنه).
این جذبکننده معنایی – یا همون teleological operator – وظیفهش اینه که حرفها و جملهها رو طوری بچینه و بچرخونه که هم معنیشون پایدار باشه، هم شفاف، هم عمیق. این دیگه صرفاً شبیهسازی معنی و تقلید حرف آدمها نیست، بلکه خودش داره “معنی رو شکل میده”. چون داستان سر همین ساختار دورانی و جریان گرادیانیه (Gradient Flow یعنی حرکت کردن به سمت پایینترین نقطه یه تابع، شبیه یه توپ که از کوه قل میخوره تا ته دره)، و تغییر شکل ماتریسی (یعنی هر معنی میتونه تو این فضا جا به جا یا حتی تحریف بشه).
در کل نویسندهها معتقدن فقط با پیشبینی و تقلید نمیشه به عمق معنی رسید. یعنی اگه میخوایم AGI واقعی بسازیم، باید یه معماری جدید خلق کنیم که قدرت شکل دادن به زبان و معنا رو داشته باشه، نه فقط پیشبینی و حرف زدن بدون فکر!
اگه بخوام کل داستان رو جمعبندی کنم: این مدل جدید داره یه دنیای عجیب و متفاوت برای هوش مصنوعی میسازه که توش معنیها جذب میشن، میرقصن، و جایی با ثبات و شفاف جمع میشن؛ یعنی فقط تقلید معنی نیست، بلکه خودش داره معنی رو درست میکنه و جلو میبره. ذهنیته توشه، چرخش توشه و حتی یه عامل نیتدار هوشمند کوچولو هم توشه! مطمئناً این مدل، میتونه بحثهای فلسفی و علمی زیادی رو راه بندازه و دنیای هوش مصنوعی رو کلی تغییر بده.
منبع: +