CML-Bench: وقتی هوش مصنوعی برات فیلم‌نامه می‌نویسه!

تا حالا شده فکر کنی اگه هوش مصنوعی (همون AI باحالی که همه جا حرفش هست) بتونه فیلم‌نامه بنویسه، فیلمامون چه شکلی میشن؟ تا چند وقت پیش معمولاً هوش‌های مصنوعی (مثل همون مدل‌های بزرگ زبانی یا Large Language Models که می‌تونن متن تولید کنن) فقط می‌تونستن متن‌های ساختاریافته و منظم بنویسن. اما فیلم‌نامه؟ یه چیز دیگه‌ست، چون صرفاً نظم کافی نیست! باید داستان جذاب، احساسات درست و اون حس خاصی که باعث میشه داستان به دل بشینه رو هم داشته باشه؛ چیزی که خیلی وقتا مدل‌های زبانی هنوز نمی‌تونن درست در بیارن.

حالا یه گروه از محقق‌ها اومدن یه چیز باحال درست کردن: CML-Bench. خب اول توضیح بدم CML یعنی چی؟ CML مخفف Cinematic Markup Language ـه، که درواقع یه قالب خاص برای نوشتن فیلم‌نامه‌ است. ولی مهم‌تر از اسمش، اون دیتاستی هست که ساختن. اینا یه دیتاست جمع کردن به اسم CML-Dataset که کلی جفت خلاصه و محتوای فیلم‌نامه از فیلم‌های معروف و باکیفیت داره. خلاصه یعنی یه توضیح کوتاه از اون بخش فیلم‌نامه و محتوا هم همون دیالوگ‌ها یا صحنه‌های مهمه.

هدف این مجموعه این بود که دقیق بررسی کنن فیلم‌نامه‌های واقعی و انسانی چه ویژگی‌هایی دارن که باعث میشه این‌قدر خوب از آب دربیان. اومدن سه تا معیار اصلی واسه ارزیابی فیلم‌نامه‌ها در نظر گرفتن:

۱. همبستگی دیالوگ‌ها (Dialogue Coherence یا DC): یعنی دیالوگ‌های بین شخصیت‌ها باید به هم بخورن و مرتب و منطقی باشن، نه اینکه هردفعه یکی یه چیزی بگه که هیچ ربطی نداره.

۲. ثبات شخصیتی (Character Consistency یا CC): یعنی هر شخصیت باید رفتار و حرفاش با خودش بخونه. مثلا اگه یکی یه بار شجاعه نباید دفعه بعد بدون دلیل بترسه!

۳. منطق داستان (Plot Reasonableness یا PR): یعنی اتفاقاتی که توی داستان میفته خنده‌دار غیرمنطقی یا بی‌دلیل نباشه. مثلاً یهویی طرف وسط بیابون بدون دلیل بره مریخ!

این مدل بچ مارک (Benchmark یعنی یه ابزار که باهاش مدل‌ها رو می‌سنجن و مقایسه می‌کنن)، یعنی همون CML-Bench، این سه تا بعد رو با عدد و رقم حساب می‌کنه و خیلی خوب می‌تونه فیلم‌نامه‌های واقعی و قوی رو از نمونه‌های ضعیف (که توسط مدل‌های زبانی تولید شدن) جدا کنه. خلاصه، وقتی یه مدل هوش مصنوعی فیلم‌نامه می‌نویسه، این ابزار دقیق نشون میده نقطه ضعف‌هاش کجاست.

یه چیز جالب دیگه اینکه برای بهتر کردن کیفیت فیلم‌نامه‌های تولیدی توسط AI، محقق‌ها یه روش پیشنهادی هم معرفی کردن به اسم CML-Instruction. این CML-Instruction همون دستورالعمل یا راهنماییه که با جزئیات زیاد به مدل میگه چی کار بکنه؛ مثلاً توی دیالوگ بین کاراکترها یا منطق اتفاقات داستان دقیق‌تر باشه. این باعث میشه خروجی مدل واقعاً داستانی‌تر و حرفه‌ای‌تر از آب دربیاد.

در انتها، کلی آزمایش هم انجام دادن و نشون دادن که وقتی با این benchmark و دستورالعمل ها کار کنی، فیلم‌نامه‌هایی که هوش مصنوعی تولید می‌کنه خیلی معقول‌تر، خلاقانه‌تر و نزدیک‌تر به سلیقه و انتظار انسان‌ها درمیاد.

خلاصه اگه یه روز دیدی فیلمی دیدی و گفتی عجب هوش مصنوعی فیلم‌نامه‌شو نوشته باشه! الان با ابزارهایی مثل CML-Bench میشه فهمید چقدر این فیلم‌نامه واقعاً به فیلم‌نامه‌های انسانی نزدیک شده و ارزش داره یا نه.

منبع: +