دوست داری بدونی چجوری یک مدل هوش مصنوعی داره موزیکهای سنتی و باحال ناین (Nanyin) رو نه فقط نگه میداره، بلکه میتونه خودش تولیدشون کنه؟ خب این دقیقاً موضوع همین تحقیقیه که برات دارم تعریف میکنم!
اول اصلاً ناین چیه؟ ناین یکی از انواع موزیکهای سنتی چینیه که یونسکو (همون سازمانیه که میراث فرهنگی دنیا رو ثبت و محافظت میکنه) گفته جزو میراث فرهنگی ناملموس حساب میشه. یعنی چیزیه که نسلها با عشق و حوصله سینهبهسینه و با کلی جزئیات منتقل شده. مثلاً بخشهایی از موزیک با «نتنویسی سنتی» نوشته شده ولی اون بخشهای تزئینی و جزئی خاص رو فقط با گوش دادن و استاد-شاگردی یاد میگیرن (به این میگن “oral tradition” یعنی انتقال شفاهی).
خب، این انتقال شفاهی کلی چالش داره. چون خیلی از اون تزئینات ممکنه از بین بره و حتی مدلهای معمول هوش مصنوعی هم نمیتونن راحت اینا رو تولید کنن یا حفظشون کنن.
اینا اومدن یه کار باحال کردن: اول یه دیتاست درست کردن که توش بیشتر تمرکز روی “پاپا”ه. پاپا هم یه مدل سازیه که صدای خیلی خاصی داره و توی ناین نقش اصلی رو بازی میکنه. همه چی پاپائیه (!) و حالا این دیتاست به فرمت MIDI آماده شده (MIDI یعنی فایلی که اطلاعات نت موسیقی رو دیجیتال ذخیره میکنه).
بعدش یه روش خاص برای تبدیل اطلاعات این موزیک به «توکن» ساختن که اسمش رو گذاشتن ناینتوک NanyinTok. توکنای هر قطعه هم بعداً تبدیل میشه به یک ساختار گرافی (گراف، ساختاریه که توش اطلاعات به شکل نقطه و ارتباط بین نقطهها نشون داده میشه. مثل شبکههای اجتماعی!)
حالا اصل قضیه! اینا یه مدل به اسم NanyinHGNN ساختن. HGNN یعنی Heterogeneous Graph Neural Network و کارش اینه که با دادههای متنوع کار کنه (اینجا منظور ساختار گرافیه که از مولفههای مختلف موزیک ساخته شده). ولی فرق این مدل با بقیه اینه که میتونه اون تزئینات مهم و حالبخش ناین رو هم یاد بگیره و خودش بسازه.
جالبیش اینجاست که مرحله اول، مدل میاد ملودی ساده رو در قالب گراف درست میکنه، بعد تو قدم دوم، یه سیستم که بر اساس قواعد نوازندگی ناین طراحی شده «تزئینات» رو روی اون ملودی اضافه میکنه. نکته خفن؟ برای آموزش به مدل لازم نیست اطلاعات دقیق از همه تزئینات داشته باشی. خودش کمکم یاد میگیره چی رو چطور تزئین کنه، فقط با دونستن قوانین کلی!
وقتی تستش کردن، دیدن واقعاً نتیجه عالی بوده. مدل NanyinHGNN تونسته موزیکایی بسازه که نه تنها اصیل و هتروفونیک (یعنی ملودی اصلی رو همه تقریباً با هم، اما کمی متفاوت مینوازن – یه جور هارمونی پیچیده!) باقی بمونن، بلکه میتونه چهار تا ساز سنتی اصلی رو با هم هماهنگ تولید کنه.
این تحقیق نشون داد که اگه تجربه واقعی و قوانین تخصصی یه سبک هنری رو توی معماری مدل هوش مصنوعی لحاظ کنی، خیلی راحتتر میشه با کمبود دادههای خاص و سنتی (مثل موزیکهای ناین اصیل) کنار اومد و حتی نوآوری کرد. خلاصه که هوش مصنوعی هم اگه آداب سنتی رو بلد باشه، میتونه موسیقی، اونم از نوع میراث فرهنگی، بسازه و نجات بده!
منبع: +