قدم‌زنی صوتی با هوش مصنوعی: وقتی با هم و با چت‌جی‌پی‌تی رویاپردازی صوتی می‌کنیم!

بذارین یه روش خفن و جدید رو براتون تعریف کنم که چطوری توی دانشگاه‌ها، بچه‌ها با کمک چت‌جی‌پی‌تی، یعنی همون هوش مصنوعی معروفِ مکالمه‌ای که همه می‌شناسیمش، می‌تونن با هم صداسازی کنن و خلاقیت دسته‌جمعی رو تجربه کنن!

اصل داستان اینه که توی بهار ۲۰۲۳، یه گروه ۴ نفره از دانشجویان دانشگاه ایالتی کالیفرنیا (تو شهر سن برناردینو) یه پروژه آموزشی خیلی متفاوت داشتن. هدفشون این بود که با کمک هوش مصنوعی، مثلاً چت‌جی‌پی‌تی، با همدیگه یه سناریوی صدایی (یعنی یه متن که صداهای مختلف شهر رو توش توصیف می‌کرد) طراحی کنن و بعد هر کدومشون بره همون رو توی واقعیت اجرا و صدابرداری کنه.

حالا، اولش چی شد؟ دانشجوها دور هم جمع شدن، شروع کردن هرچی صدای خاص و شاخص از شهرشن یادشون میاد (مثلاً آژیر آمبولانس، صدای مرغ دریایی، یا حتی موسیقی خیابون) رو می‌گفتن. بعد با کمک چت‌جی‌پی‌تی، این خاطره‌های صوتی جمع‌آوری شد و به یه سناریوی متنی تبدیل شد. چت‌جی‌پی‌تی این وسط نقش راهنما و رفیق رو بازی می‌کرد، یعنی هم سؤال می‌پرسید، هم کمک می‌کرد همه چیز جمع‌بندی شه. (Interlocutor یعنی همین کسی که وسط بحث خیلی خوب حرفو می‌چرخه و همه رو به حرف درمیاره!)

تو قدم بعدی، گروه با هم روش کار کردن تا سناریوشون دقیق‌تر، بهتر و خلاصه‌تر شه. این وسط یه فرآیند به اسم «پرومپت انجینیرینگ» داشتن یعنی با کمک کردن به هوش مصنوعی، دستورها یا درخواست‌هاشون رو درست تنظیم می‌کردن تا جوابایی که می‌گیرن دقیقاً همونی بشه که می‌خوان. (Prompt Engineering یعنی فوت و فن نوشتن دستور برای هوش مصنوعی تا خروجی دلخواه بدست بیاد!)

بعدش هر نفر یه هفته وقت داشت بره بیرون تو شهر، واقعاً بره دنبال همون صداهایی که تو اون سناریو با هم ساختن. با موبایل یا دستگاه ضبط صداها رو شکار کرد، بعد اومد همه رو روی لپ‌تاپ تو نرم‌افزارهای مخصوص صدا (Digital Audio Workstation یعنی همون برنامه‌هایی که آهنگسازها و تنظیم‌کننده‌ها باهاش موسیقی و صدا درست می‌کنن) چید و مونتاژ کرد و در نهایت تو کلاس کارش رو ارائه داد.

می‌دونین چی جالب بود؟ این کار نشون داد که اصلاً مرز بین تخیل جمعی و شخصی چقدر می‌تونه سیال باشه! از یه طرف، همه با کمک تکنولوژی و هوش مصنوعی، یه صدای جمعی ساختن. بعد هرکدوم، همون رو با برداشت و سلیقه خودش شخصی‌سازی کرد. این یه تمرین فوق‌العاده برای خلاقیت گروهی بود که واقعاً قشنگ با دنیای واقعی و مهارت‌های فنی هم گره خورد.

استفاده از هوش مصنوعی اینجا دوتا نقش مهم داشت: ۱) کمک کرد بچه‌ها سریع‌تر و راحت‌تر سناریوی صداشون رو بنویسن و همفکری کنن، ۲) یه جور همکار بود که دائم ایده می‌داد. ولی خود دانشجوها گفتن که هنوز هوش مصنوعی نمی‌تونه اون عمق و احساسات رو مثل انسان توی فیلم‌نامه یا سناریو بیاره. یعنی فقط با کمک چت‌جی‌پی‌تی یه متن احساسی یا واقعی درنمیاد؛ حضور آدم‌ها لازمه تا چیز درست و حسابی ساخته شه.

جالبه بدونین هدف نویسنده‌های این تحقیق، فقط دادن یه روش خشک و خالی نبوده. بلکه بحثشون این بود که چطور با کمک هوش مصنوعی می‌شه یادگیری گروهی و انفرادی و خلاقیت رو تو کار هنری و رسانه‌ای راحت‌تر و جذاب‌تر کرد؟ همچنین، هم به مزایا پرداخته بودن، هم محدودیت‌ها، حتی درباره اخلاق هم صحبت شد. (Ethics یعنی فکر کردن به اینکه کار با تکنولوژی چه مسئولیت‌ها و چالش‌هایی داره.)

خب شاید با خودتون بگین ۴ دانشجو که آمار حساب نمی‌شه! درسته، ولی همین تمرین کوچیک نشون داد چطور تکنولوژی اگر درست استفاده شه، آموزش رو می‌تونه متحول کنه و خلاقیت جمعی رو حسابی قلقلک بده!

تو دنیای هنر و رسانه که خلاقیت و همکاری اصل ماجراس، این مدل آموزش با هوش مصنوعی واقعاً الهام‌بخشه. خلاصه اینکه این تحقیق نشون داد ترکیب هوش مصنوعی، کار گروهی و یادگیری عملی (Embodied Practice یعنی یادگیری همراه با عمل و تجربه واقعی، نه فقط تئوری!) چه تاثیر باحالی می‌تونه بذاره و اصلاً تجربه یه Soundwalk یا قدم‌زنی صوتی با هوش مصنوعی می‌تونه شگفت‌انگیز و متفاوت باشه!

منبع: +