WaveForms و رمزگشایی هوش عمومی عاطفی (EGI) با صداهای مبتنی بر هوش مصنوعی

هوش عمومی عاطفی (EGI)

WaveForms، استارتاپی که توسط الکسیس کونئو، پژوهشگر سابق OpenAI بنیان‌گذاری شده، با جذب ۴۰ میلیون دلار سرمایه اولیه، در مسیری هیجان‌انگیز برای توسعه هوش عمومی عاطفی (EGI) قدم گذاشته است. این شرکت با بهره‌گیری از صداهای مبتنی بر هوش مصنوعی، می‌کوشد تا انقلابی در نحوه درک و واکنش هوش مصنوعی به احساسات انسانی ایجاد کند و دریچه‌های جدیدی به سوی EGI بگشاید.

الکسیس کونئو، معمار قابلیت صوتی ChatGPT، اکنون سرمایه‌گذاری جدیدی را آغاز کرده است. استارتاپ او، WaveForms، با هدف دمیدن روح احساس در کالبد هوش مصنوعی، مفهومی که او آن را هوش عمومی عاطفی (EGI) می‌نامد، فعالیت می‌کند. WaveForms که به تازگی ۴۰ میلیون دلار سرمایه اولیه به رهبری a16z دریافت کرده، آماده است تا انقلابی در نحوه تعامل هوش مصنوعی با انسان‌ها رقم بزند و از فرامین صوتی ساده فراتر رفته و به درک عمیق‌تری از ظرافت‌های عاطفی دست یابد.

از صدای ChatGPT تا هوش مصنوعی سرشار از احساس

سفر کونئو در OpenAI آغاز شد، جایی که او سکان‌دار توسعه قابلیت صوتی ChatGPT بود. این تجربه، در حالی که موفقیت‌آمیز بود، به دلیل شباهت ادراکی یک صدا به صدای بازیگر اسکارلت جوهانسون، با حواشی نیز همراه شد. کونئو تصریح می‌کند که تقلید از جوهانسون هرگز هدف نبوده است، اگرچه او ارتباط ذهنی عموم را با فیلم Her تأیید می‌کند. این فیلم، در عین الهام‌بخش بودن، همچون هشداری نیز عمل می‌کند و خطرات بالقوه روابط بیش از حد نزدیک با هوش مصنوعی را گوشزد می‌کند، سناریویی که کونئو قصد دوری از آن را دارد.

چشم‌انداز WaveForms: هوش عمومی عاطفی (EGI)

مأموریت WaveForms نه بازسازی روابط انسانی، بلکه بهبود و ارتقای آن‌ها از طریق هوش مصنوعی عاطفی است. کونئو، صدا را به عنوان “بُعد اجتماعی-عاطفی” هوش عمومی مصنوعی (Artificial General Intelligence: AGI) می‌داند. او بر این باور است که با تمرکز بر صدا، هوش مصنوعی می‌تواند پیچیدگی‌های ارتباطات انسانی، از جمله لحن، آهنگ و لهجه را بهتر درک کرده و به آن‌ها پاسخ دهد.

مدل‌های زبانی بزرگ صوتی (Audio LLMs): قلب تپنده هوش مصنوعی عاطفی

فناوری محوری که چشم‌انداز WaveForms را هدایت می‌کند، مدل‌های زبانی بزرگ صوتی (Large Language Models: LLMs) است. این مدل‌ها به گونه‌ای طراحی شده‌اند تا نشانه‌های عاطفی نامحسوس در گفتار انسان را دریافت کنند، چیزی که دستیارهای صوتی فعلی مانند Alexa و Siri از آن بی‌بهره‌اند. این درک عمیق‌تر به هوش مصنوعی امکان می‌دهد تا با همدلی و با توجه به بافت موقعیت، پاسخ مناسب‌تری ارائه دهد. یک دستیار آموزشی را تصور کنید که می‌تواند احساس سرخوردگی دانش‌آموز را تشخیص داده و رویکرد خود را بر اساس آن تنظیم کند و صبر و حمایت بیشتری از خود نشان دهد.

چرا WaveForms؟ یک رویکرد متمرکز

جدایی کونئو از OpenAI ناشی از اشتیاق او برای تمرکز ویژه بر هوش مصنوعی عاطفی است. در حالی که غول‌هایی مانند OpenAI، گوگل و متا اهداف گسترده‌تری از هوش عمومی مصنوعی (AGI) را دنبال می‌کنند، کونئو معتقد است که هوش عمومی عاطفی (EGI) نیازمند تلاشی اختصاصی است. او WaveForms را به عنوان پلی برای پر کردن شکاف مهمی در چشم‌انداز هوش مصنوعی می‌بیند که مرزهای هوش صوتی را به گونه‌ای گسترش می‌دهد که شرکت‌های بزرگ‌تر و عمومی‌تر ممکن است آن را در اولویت قرار ندهند.

شکل‌گیری یک ایده: از فیسبوک تا OpenAI

مسیر کونئو به OpenAI با یک ایمیل جسورانه به ایلیا سوتسکور، الگوی هوش مصنوعی او، آغاز شد. کونئو با شناخت پتانسیل نهفته ادغام هوش صوتی در مدل‌های زبانی بزرگ (LLMs)، چشم‌انداز خود را به سوتسکور ارائه داد که منجر به یک شام کاری و در نهایت یک پیشنهاد شغلی شد. در آن زمان، این یک حوزه چالش‌برانگیز و تا حد زیادی ناشناخته از تحقیقات هوش مصنوعی بود، اما کونئو مصمم بود به آن بپردازد. کار او در OpenAI شالوده سرمایه‌گذاری فعلی او، WaveForms، را بنا نهاد.

آینده هوش مصنوعی عاطفی: تکمیل تعامل انسانی

کونئو تأکید می‌کند که هدف هوش مصنوعی عاطفی جایگزینی تعاملات انسانی نیست، بلکه غنی‌سازی آن است. او آینده‌ای را متصور است که در آن هوش مصنوعی مکمل زندگی اجتماعی ما باشد و ارتباطات و درک متقابل را بهبود بخشد. کونئو به جای ایجاد یک سناریوی هراس‌انگیز از وابستگی به هوش مصنوعی، همانطور که در برخی از داستان‌های علمی تخیلی به تصویر کشیده شده است، هوش مصنوعی عاطفی را ابزاری برای تقویت ارتباطات انسانی می‌بیند.

نتیجه‌گیری: فصلی نوین از تعامل با هوش مصنوعی

WaveForms نشان دهنده گامی مهم در تکامل هوش مصنوعی است. کونئو و تیمش با تمرکز بر ظرافت‌های عاطفی ارتباطات انسانی، راه را برای شکلی همدلانه‌تر و شهودی‌تر از تعامل با هوش مصنوعی هموار می‌کنند. این فناوری پتانسیل دگرگونی حوزه‌های مختلف، از آموزش و خدمات مشتری گرفته تا مراقبت‌های بهداشتی و کمک‌های شخصی را دارد و در نهایت منظره‌ای فناورانه انسان-محورتر ایجاد می‌کند.

اگر به خواندن کامل این مطلب علاقه‌مندید، روی لینک مقابل کلیک کنید: fortune