قابلیت جدید: ریلز های اینستاگرام و فیسبوک رو تو هر زبونی که دوست داری ببین!

اگه اهل گشت و گذار تو اینستاگرام و فیسبوک باشی، حتماً ریلزها رو دیدی؛ همون ویدئوهای کوتاه خفن که این روزا حسابی تو بورس‌ان. حالا یه خبر خفن‌تر! متا (همون کمپانی مادر اینستاگرام و فیسبوک) با هوش مصنوعی خودش، کاری کرده که دیگه حرف زدن با زبونای جورواجور تو ریلزها، خیلی راحت‌تر و باحال‌تر شده.

الان، اگه یه ویدیو از یه آشپز برزیلی ببینی، می‌تونی اون رو به فارسی یا مثلاً انگلیسی گوش بدی و حس کنی تو آشپزخونه خودت داره حرف می‌زنه! متا هوش مصنوعی‌ش رو وارد کار کرده و می‌تونه هم ترجمه کنه، هم صدای ویدیوها رو دوبله (یعنی با صدای جدید تو یه زبون دیگه بازسازی کنه)، و حتی حرکات لب رو با زبون ترجمه‌شده هماهنگ کنه؛ این کار رو بهش lip-sync یا هم‌خوانی لب می‌گن. جالب‌تر اینکه حتی لحن، تُن صدا و سبک حرف زدن خود سازنده ویدیو رو هم حفظ می‌کنه که ویدیو طبیعی جلوه کنه و تو ذوق نزنه.

فعلاً این قابلیت برای چهارتا زبان اصلی فعال شده: انگلیسی، اسپانیایی، هندی، و پرتغالی، ولی اگه خوب پیش بره احتمالاً رشدش خیلی بیشتر میشه و زبان‌های دیگه رو هم ساپورت می‌کنه.

حالا شاید بپرسی “منم می‌تونم ریلزهای خودمو با این قابلیت بذارم؟” باید بگم اگه تو فیسبوک بالای ۱۰۰۰ تا فالوئر داشته باشی یا پیجت تو اینستاگرام پابلیک باشه (یعنی همه بتونن ببینن)، احتمالاً این گزینه واست فعاله؛ البته فقط تو کشورهایی که این قابلیت فعاله و Meta AI اونجا آپشن داده.

یکی از چیزای باحال این داستان اینه که ویدیوهایی که ترجمه و دوبله شدن، همون گوشه‌شون یه برچسب می‌خورن که روش نوشته: “Translated with Meta AI”؛ یعنی با هوش مصنوعی متا ترجمه و دوبله شده. اگه دوست نداشتی، می‌تونی از تنظیمات زبان و لب‌خوانی رو خاموش کنی و نسخه اصلی ویدیو رو هم ببینی. کامل دست خودته که به چه زبونی گوش بدی.

قبلاً متا کلی قابلیت برا رد کردن مرزهای زبانی گذاشته بود؛ مثل زیرنویس اتوماتیک یا هشتگ‌های بین‌المللی. اما این اولین باره که با کمک هوش مصنوعی می‌تونن صدا رو تقلید کنن و حرکات لب رو با ترجمه منطبق کنن – به این می‌گن voice cloning (یعنی شبیه‌سازی صدا) و lip-sync. این یعنی تا حالا هیچ پلتفرمی اینقدر دقیق ترجمه و همگام‌سازی صدا و تصویر رو با هم نداشته.

خب، رقبا چی؟ یوتیوب سال‌هاست زیرنویس و کپشن داره، اما هنوز قابلیت دوبله هم‌زمان با حرکت لب رو پیاده نکرده. تیک‌تاک هم با ترجمه رو تصویر تست‌هایی زده، اما هنوز به شبیه‌سازی صدا و لب‌خوانی نرسیده. متا الان یه قدم جلوتره و اگه بتونه زبان‌های بیشتری رو پوشش بده، پلتفرم مرجع واسه ویدیوهای بین‌المللی میشه.

پس اگه یهویی دیدی چندتا ویدیوی رقص یا آشپزی هندی و آمریکای لاتین سر از ریلزت درآورده و همه دارن سلیس انگلیسی حرف می‌زنن، شک نکن پای AI متا وسطه! فقط کافیه اون برچسب تپلی گوشه ویدیو رو دنبال کنی تا مطمئن بشی این جادو با هوش مصنوعی متا انجام شده. به نظرت اینکار باعث میشه محتواها جهانی‌تر و قابل فهم‌تر بشن یا ممکنه یه کمی حس عجیب و غریب بهت بده؟

منبع: +