خلاقیت مصنوعی: هوش مصنوعی فقط پیش‌بینی نمی‌کنه، می‌تونه واقعاً خلاق باشه!

خب بچه‌ها، تا حالا زیاد درباره مدل‌های زبانی بزرگ مثل ChatGPT شنیدین که می‌تونن متن‌های روون تولید کنن. ولی یه مشکلی هست: خیلی وقتا نمی‌تونن تو مدت طولانی چیزای واقعاً نوآورانه، مرتبط با تسک و متنوع بسازن. یعنی بعد از یه مدت، حرفاشون تکراری و کم‌حال میشه. انگار کم میارن از نظر خلاقیت واقعی.

تو این مقاله میخوام براتون بگم چرا این شکل از هوش مصنوعی هنوز به پای خلاقیت آدمیزاد نمی‌رسه و چی لازمه تا هوش مصنوعی واقعاً خلاق بشه، نه فقط یه پیش‌بینی‌کننده باحال!

ماجرا چیه؟ محقق‌ها گفتن که تقصیر رو باید گردن یه حلقه‌ی سه‌تایی بندازیم که تو مغز ما باعث خلاقیت میشه، اما تو سیستم‌های فعلی فقط بخش‌هایی از اون اجرا شده. این حلقه سه قسمت داره:

۱. ایده‌پردازی خودجوش (یا همون Default-Mode Network یا DMN): این شبیه سیستم ۱ ذهن ماست؛ یعنی اون قسمتی که خود به خود ایده می‌ده، مثل وقتی که حواست نیست و یهو یه ایده خفن به ذهنت می‌رسه.
۲. ارزیابی هدفمند (Central-Executive Network یا CEN): این همون شبیه سیستم ۲ هست که منطقی و منظم فکر می‌کنه و ایده‌ها رو بررسی می‌کنه ببینه به درد می‌خورن یا نه.
۳. یک کنترل‌گر متاکاگنیتیو (System 3 یا سیستم ۳ خودمون!): این یکی رو کمتر می‌شناسیم؛ چیزی که بین اون دو تا قبلی سوئیچ می‌کنه و تعادل برقرار می‌کنه، یعنی می‌دونه کی وقت خلاقیت و باز بودن ذهنه و کی وقت تمرکز و کنترل بیشتر.

حالا اکثر مدل‌های هوش مصنوعی، فقط تیکه‌هایی از حلقه رو دارن. اینجاست که محقق‌ها یه معماری جدید معرفی کردن با اسم باکلاس Generative System 3 یا GS-3 که قراره این کمبودها رو جبران کنه. GS-3 یعنی یه سیستمی که مستقل از نوع معماری کلی، سه نقش اصلی رو بازی می‌کنه:

یه ژنراتور با انتروپی بالا: یعنی یه قسمت که می‌تونه خروجی‌های غیرقابل پیش‌بینی و متنوع بسازه. انتروپی تو اینجا یعنی میزان غیرمنتظره بودن یا همون شگفت‌انگیزی جواب‌ها.
یه منتقد یادگرفته‌شده (Learned Critic): یعنی هوش مصنوعی خودش یه بخشی داره که خروجی‌هاش رو قضاوت، بررسی و نقد می‌کنه؛ مثل یه منتقد داخلی.
یه کنترل‌گر گین (Adaptive Gain Controller): این یکی کنترل می‌کنه که کی باید بیشتر خلاق باشه و کی باید متمرکزتر یا محدودتر جواب بده (گین تو اینجا یعنی شدت تاثیرگذاری، کنترل تطبیقی هم یعنی بسته به شرایط تنظیم میشه).

فرق GS-3 با مدل‌های پیش‌بینی قبلی اینه که فقط “پاسخ درست بده” یا با یه دستور سوال جواب نده، بلکه چند عنصر جدید به هوش مصنوعی اضافه می‌کنه:

یه داور داخلی برای ارزیابی ایده‌هاش
کنترل خودخواسته روی میزان غیرمنتظره بودن جواب‌ها
داشتن انتظارات و پیش‌فرض‌های قابل تنظیم که با شرایط مختلف عوض می‌شن

مقاله چند تا تعریف عملی هم میاره تا بفهمیم “خلاقیت” یعنی چی:

نوآوری (یعنی چیز جدید بودن)
کارآمدی (یعنی به درد بخور بودن برای یه وظیفه)
تنوع (یعنی خروجی‌های متفاوت داشته باشه، نه یه جواب تکراری)

برای همین، سه سیاست مختلف برای کنترل گین و انتروپی معرفی می‌کنن، مثلاً:

نمایی (Exponential)، یعنی شدت تغییرات بصورت سریع رشد می‌کنه
خطی (Linear)، یعنی تغییرات با نرخ ثابت میرن جلو
لجستیک (Logistic)، نوعی رشد که اول آروم، بعد سریع، بعد دوباره آروم میشه

تازه، خودشون راه‌هایی پیشنهاد دادن تا بفهمیم یه سیستم واقعاً خلاق شده یا نه:

چگالی فاصله‌های ارتباطی (Associative-distance density): یعنی خروجی‌ها چقدر از نظر فکری با هم متفاوتن
نسبت راستی‌آزمایی تحلیلی (Analytic-verification ratio): یعنی چند درصد جواب‌هاش واقعاً منطقی بررسی می‌شن
تاخیر همگرایی (Convergence latency): یعنی چقدر زمان می‌بره تا به یه جواب قابل قبول برسه

یه پروتکل هم ساختن برای آزمایش و بررسی این ایده: شامل تسک‌ها و آمارهایی که میشه باهاشون فهمید سیستم چقدر موفق بوده، حتی جزییات حذف و تکرار بخش‌ها و یه جعبه ابزار برای انجام دادن دوباره آزمایش توسط هرکسی.

در آخر، GS-3 رو گذاشتن کنار دوتا چارچوب دیگه به اسم Computational Creativity (یعنی مدلسازی خلاقیت با رایانه) و Co-creative Frameworks (یعنی سیستم‌هایی که با کمک انسان خلاق میشن)، و توضیح دادن که ایده مشابه مغز انسان بودنش تا کجا درست و کجا فقط یه تشبیه ظاهریه.

یه موضوع خیلی مهم اخلاقی هم دارن: خلاصه، گفتن باید مواظب باشیم مدل دچار bias (همون سوگیری)، یا یکدست شدن فرهنگی یا حتی reward gaming نشه. Reward gaming یعنی مدلی که صرفاً دنبال بردن جایزه‌ها و رسیدن به امتیازات کمکیه (معروف به “dopamine hacking”). راه‌حلشون اینه که:

داورهای متعدد بذارن
گزارش‌های شفاف بدن
محدودیت روی انتروپی خروجی‌ها بذارن تا نتیجه‌ها خلاق ولی امن باقی بمونن.

جمع‌بندی؟ یه نقشه راه عملی دادن که از هوش مصنوعی‌هایی که فقط پیش‌بینی می‌کنن (مثلاً برداشتن حرف آخر مکالمه‌ها)، برسیم به سیستم‌هایی که واقعاً می‌تونن خلاق، نوآور، متنوع و حتی باحال باشن! همین مسیره که هوش مصنوعی‌ها رو به مرحله خلاقیت واقعی می‌رسونه.

منبع: +