اگه اهل گشت و گذار تو اینستاگرام و فیسبوک باشی، حتماً ریلزها رو دیدی؛ همون ویدئوهای کوتاه خفن که این روزا حسابی تو بورسان. حالا یه خبر خفنتر! متا (همون کمپانی مادر اینستاگرام و فیسبوک) با هوش مصنوعی خودش، کاری کرده که دیگه حرف زدن با زبونای جورواجور تو ریلزها، خیلی راحتتر و باحالتر شده.
الان، اگه یه ویدیو از یه آشپز برزیلی ببینی، میتونی اون رو به فارسی یا مثلاً انگلیسی گوش بدی و حس کنی تو آشپزخونه خودت داره حرف میزنه! متا هوش مصنوعیش رو وارد کار کرده و میتونه هم ترجمه کنه، هم صدای ویدیوها رو دوبله (یعنی با صدای جدید تو یه زبون دیگه بازسازی کنه)، و حتی حرکات لب رو با زبون ترجمهشده هماهنگ کنه؛ این کار رو بهش lip-sync یا همخوانی لب میگن. جالبتر اینکه حتی لحن، تُن صدا و سبک حرف زدن خود سازنده ویدیو رو هم حفظ میکنه که ویدیو طبیعی جلوه کنه و تو ذوق نزنه.
فعلاً این قابلیت برای چهارتا زبان اصلی فعال شده: انگلیسی، اسپانیایی، هندی، و پرتغالی، ولی اگه خوب پیش بره احتمالاً رشدش خیلی بیشتر میشه و زبانهای دیگه رو هم ساپورت میکنه.
حالا شاید بپرسی “منم میتونم ریلزهای خودمو با این قابلیت بذارم؟” باید بگم اگه تو فیسبوک بالای ۱۰۰۰ تا فالوئر داشته باشی یا پیجت تو اینستاگرام پابلیک باشه (یعنی همه بتونن ببینن)، احتمالاً این گزینه واست فعاله؛ البته فقط تو کشورهایی که این قابلیت فعاله و Meta AI اونجا آپشن داده.
یکی از چیزای باحال این داستان اینه که ویدیوهایی که ترجمه و دوبله شدن، همون گوشهشون یه برچسب میخورن که روش نوشته: “Translated with Meta AI”؛ یعنی با هوش مصنوعی متا ترجمه و دوبله شده. اگه دوست نداشتی، میتونی از تنظیمات زبان و لبخوانی رو خاموش کنی و نسخه اصلی ویدیو رو هم ببینی. کامل دست خودته که به چه زبونی گوش بدی.
قبلاً متا کلی قابلیت برا رد کردن مرزهای زبانی گذاشته بود؛ مثل زیرنویس اتوماتیک یا هشتگهای بینالمللی. اما این اولین باره که با کمک هوش مصنوعی میتونن صدا رو تقلید کنن و حرکات لب رو با ترجمه منطبق کنن – به این میگن voice cloning (یعنی شبیهسازی صدا) و lip-sync. این یعنی تا حالا هیچ پلتفرمی اینقدر دقیق ترجمه و همگامسازی صدا و تصویر رو با هم نداشته.
خب، رقبا چی؟ یوتیوب سالهاست زیرنویس و کپشن داره، اما هنوز قابلیت دوبله همزمان با حرکت لب رو پیاده نکرده. تیکتاک هم با ترجمه رو تصویر تستهایی زده، اما هنوز به شبیهسازی صدا و لبخوانی نرسیده. متا الان یه قدم جلوتره و اگه بتونه زبانهای بیشتری رو پوشش بده، پلتفرم مرجع واسه ویدیوهای بینالمللی میشه.
پس اگه یهویی دیدی چندتا ویدیوی رقص یا آشپزی هندی و آمریکای لاتین سر از ریلزت درآورده و همه دارن سلیس انگلیسی حرف میزنن، شک نکن پای AI متا وسطه! فقط کافیه اون برچسب تپلی گوشه ویدیو رو دنبال کنی تا مطمئن بشی این جادو با هوش مصنوعی متا انجام شده. به نظرت اینکار باعث میشه محتواها جهانیتر و قابل فهمتر بشن یا ممکنه یه کمی حس عجیب و غریب بهت بده؟
منبع: +