مدل هوشمندِ نسل جدید برای حفظ و ساخت موزیک ناین: قصه پاپا و دیتاست عجیبش!

Fall Back

دوست داری بدونی چجوری یک مدل هوش مصنوعی داره موزیک‌های سنتی و باحال ناین (Nanyin) رو نه فقط نگه می‌داره، بلکه می‌تونه خودش تولیدشون کنه؟ خب این دقیقاً موضوع همین تحقیقیه که برات دارم تعریف می‌کنم!

اول اصلاً ناین چیه؟ ناین یکی از انواع موزیک‌های سنتی چینیه که یونسکو (همون سازمانیه که میراث فرهنگی دنیا رو ثبت و محافظت می‌کنه) گفته جزو میراث فرهنگی ناملموس حساب میشه. یعنی چیزیه که نسل‌ها با عشق و حوصله سینه‌به‌سینه و با کلی جزئیات منتقل شده. مثلاً بخش‌هایی از موزیک با «نت‌نویسی سنتی» نوشته شده ولی اون بخش‌های تزئینی و جزئی خاص رو فقط با گوش دادن و استاد-شاگردی یاد می‌گیرن (به این میگن “oral tradition” یعنی انتقال شفاهی).

خب، این انتقال شفاهی کلی چالش داره. چون خیلی از اون تزئینات ممکنه از بین بره و حتی مدل‌های معمول هوش مصنوعی هم نمی‌تونن راحت اینا رو تولید کنن یا حفظشون کنن.

اینا اومدن یه کار باحال کردن: اول یه دیتاست درست کردن که توش بیشتر تمرکز روی “پاپا”ه. پاپا هم یه مدل سازیه که صدای خیلی خاصی داره و توی ناین نقش اصلی رو بازی می‌کنه. همه چی پاپائیه (!) و حالا این دیتاست به فرمت MIDI آماده شده (MIDI یعنی فایلی که اطلاعات نت موسیقی رو دیجیتال ذخیره می‌کنه).

بعدش یه روش خاص برای تبدیل اطلاعات این موزیک به «توکن» ساختن که اسمش رو گذاشتن ناین‌توک NanyinTok. توکنای هر قطعه هم بعداً تبدیل میشه به یک ساختار گرافی (گراف، ساختاریه که توش اطلاعات به شکل نقطه و ارتباط بین نقطه‌ها نشون داده میشه. مثل شبکه‌های اجتماعی!)

حالا اصل قضیه! اینا یه مدل به اسم NanyinHGNN ساختن. HGNN یعنی Heterogeneous Graph Neural Network و کارش اینه که با داده‌های متنوع کار کنه (اینجا منظور ساختار گرافیه که از مولفه‌های مختلف موزیک ساخته شده). ولی فرق این مدل با بقیه اینه که می‌تونه اون تزئینات مهم و حال‌بخش ناین رو هم یاد بگیره و خودش بسازه.

جالبیش اینجاست که مرحله اول، مدل میاد ملودی ساده رو در قالب گراف درست می‌کنه، بعد تو قدم دوم، یه سیستم که بر اساس قواعد نوازندگی ناین طراحی شده «تزئینات» رو روی اون ملودی اضافه می‌کنه. نکته خفن؟ برای آموزش به مدل لازم نیست اطلاعات دقیق از همه تزئینات داشته باشی. خودش کم‌کم یاد می‌گیره چی رو چطور تزئین کنه، فقط با دونستن قوانین کلی!

وقتی تستش کردن، دیدن واقعاً نتیجه عالی بوده. مدل NanyinHGNN تونسته موزیکایی بسازه که نه تنها اصیل و هتروفونیک (یعنی ملودی اصلی رو همه تقریباً با هم، اما کمی متفاوت می‌نوازن – یه جور هارمونی پیچیده!) باقی بمونن، بلکه می‌تونه چهار تا ساز سنتی اصلی رو با هم هماهنگ تولید کنه.

این تحقیق نشون داد که اگه تجربه واقعی و قوانین تخصصی یه سبک هنری رو توی معماری مدل هوش مصنوعی لحاظ کنی، خیلی راحت‌تر میشه با کمبود داده‌های خاص و سنتی (مثل موزیک‌های ناین اصیل) کنار اومد و حتی نوآوری کرد. خلاصه که هوش مصنوعی هم اگه آداب سنتی رو بلد باشه، می‌تونه موسیقی، اونم از نوع میراث فرهنگی، بسازه و نجات بده!

منبع: +