جذب‌کننده‌های معنایی، هوش مصنوعی باحال و قصه‌ی پیدا کردن معنی واقعی!

Fall Back

خب امروز قراره یکم قاطیِ هوش مصنوعی (Artificial General Intelligence یا همون AGI که یعنی هوش مصنوعی‌ای که خودش می‌تونه بفهمه و تصمیم بگیره و فقط تو یه کار خاص حرفه‌ای نباشه) حرف بزنیم، ولی نه معمولیش! می‌خوام باهاتون یه ایده خیلی جالب و جدید در مورد ساختارش به اشتراک بذارم که تازگی تو یه مقاله اومده.

تا حالا همه مدل‌های زبونی مثل ChatGPT و دوستاش غالباً بر اساس پیش‌بینی آماری کلمه بعدی کار می‌کنن. یعنی فقط حدس می‌زنن الان وقتشه بعدش چه کلمه‌ای بیاد. به اینا می‌گن روش‌های “آماری” ـ و تقریباً همه‌شون بر پایه مدل Transformer ساخته شدن. ولی ایده‌ی این مقاله اینه که این فقط بازی با احتمالاته و خبری از “درک واقعی معنی” نیست!

اینجا یه مفهومی داریم به اسم “جذب‌کننده معنایی” (Semantic Attractor). یعنی چی؟ فرض کن تو ذهنت هر کلمه و جمله شبیه یک نقطه یا آبجکت تو یه فضای خیالی بزرگ از معنی‌هاست. حالا این جذب‌کننده‌ها همون نقطه‌هایی هستن که معنیا دوست دارن بهش جمع شن! اگه بخوای مثالی بزنی، مثل آهن‌ربایی هست که معنی‌ها رو جذب خودش می‌کنه و باعث می‌شه حرف‌ها و جملات یکدست‌تر و واضح‌تر بشن.

حالا می‌رسیم به فضای معنایی با اعداد مختلط. اعداد مختلط (Complex Numbers) اونایی هستن که هم قسمت حقیقی دارن، هم قسمت موهومی. مثلاً عدد موهومی “i” رو اگه یادت باشه، عددیه که مجذورش میشه منفی یک. ایده اینه که تو فضای معنایی هم می‌تونیم با همین اعداد مختلط بازی کنیم… اینطوری معنیا می‌تونن دَوَرن، بچرخن یا حتی تو خودشون پیچ بخورن!

یه چیز باحال دیگه که این مدل ادعا می‌کنه می‌تونه هندلش کنه، طنز (Irony)، چندمعنایی (Homonymy، یعنی یه کلمه چندتا معنی داشته باشه)، و ابهام (Ambiguity) هست. چون وقتی معنیا می‌تونن با حرکت دورانی و ترکیب شدن تو فضاهای عجیب‌غریب جابه‌جا بشن، دیگه لازم نیست فقط کلمه به کلمه جلو بریم. کل داستان بر اساس عملیات‌های سیکلی با عدد موهومی i انجام میشه (یعنی عملیات چرخشی)

اما اصل قضیه اونجاست که این مدل دیگه فقط “دنبال احتمال بالاتر” نمی‌ره، بلکه یه جور نیت و هدف داره! تو این مقاله اسم این عامل هدایت‌کننده رو گذاشتن Microvitum، که یه جور عامل کوچیک ولی دارای هدفه (انگار یه آدم کوچیک تو مغز AGI گرفته و معنی‌ها رو هدایت می‌کنه).

این جذب‌کننده معنایی – یا همون teleological operator – وظیفه‌ش اینه که حرف‌ها و جمله‌ها رو طوری بچینه و بچرخونه که هم معنیشون پایدار باشه، هم شفاف، هم عمیق. این دیگه صرفاً شبیه‌سازی معنی و تقلید حرف آدم‌ها نیست، بلکه خودش داره “معنی رو شکل می‌ده”. چون داستان سر همین ساختار دورانی و جریان گرادیانیه (Gradient Flow یعنی حرکت کردن به سمت پایین‌ترین نقطه یه تابع، شبیه یه توپ که از کوه قل می‌خوره تا ته دره)، و تغییر شکل ماتریسی (یعنی هر معنی می‌تونه تو این فضا جا به جا یا حتی تحریف بشه).

در کل نویسنده‌ها معتقدن فقط با پیش‌بینی و تقلید نمی‌شه به عمق معنی رسید. یعنی اگه می‌‌خوایم AGI واقعی بسازیم، باید یه معماری جدید خلق کنیم که قدرت شکل دادن به زبان و معنا رو داشته باشه، نه فقط پیش‌بینی و حرف زدن بدون فکر!

اگه بخوام کل داستان رو جمعبندی کنم: این مدل جدید داره یه دنیای عجیب و متفاوت برای هوش مصنوعی می‌سازه که توش معنی‌ها جذب می‌شن، می‌رقصن، و جایی با ثبات و شفاف جمع می‌شن؛ یعنی فقط تقلید معنی نیست، بلکه خودش داره معنی رو درست می‌کنه و جلو می‌بره. ذهنیته توشه، چرخش توشه و حتی یه عامل نیت‌دار هوشمند کوچولو هم توشه! مطمئناً این مدل، می‌تونه بحث‌های فلسفی و علمی زیادی رو راه بندازه و دنیای هوش مصنوعی رو کلی تغییر بده.

منبع: +