وقتی هوش مصنوعی بعد از ۱۸ سال به یه خانم فلج، دوباره صداش رو برگردوند!

خب، بذارین یه داستان عجیب و فوق‌العاده رو براتون تعریف کنم. فرض کنین یه نفر بعد از یه سکته مغزی شدید، ۱۸ سال عملاً نمی‌تونه هیچ حرکتی کنه، حتی صداش رو هم از دست داده… ولی حالا به لطف علم و هوش مصنوعی، تونسته دوباره صدای خودش رو بشنوه!

خانم آن جانسون، وقتی که ۳۰ سالش بود و توی مدرسه معلم و مربی ورزش بود (تو کانادا زندگی می‌کرد)، تو سال ۲۰۰۵ دچار یه سکته مغزی شد. این سکته باعث یه وضعیت خیلی نادر شد به اسم Locked-in syndrome، یعنی “سندروم قفل‌شدگی” (یه جور بیماری که آدم هوشیاره، همه چیز رو می‌فهمه ولی نه می‌تونه تکون بخوره نه حرف بزنه!).

این خانم تقریباً همه چیزش رو از دست داد و فقط با چشم‌هاش و یه دستگاه ردیاب چشم ارتباط برقرار می‌کرد، اونم فقط با سرعت ۱۴ کلمه در دقیقه! (یعنی کُندتر از مکالمه عادی که سرعتش حدود ۱۶۰ کلمه در دقیقه‌س)

تا اینکه تو سال ۲۰۲۲ یه اتفاق جدید براش افتاد: دانشگاه برکلی و دانشگاه کالیفرنیای سانفرانسیسکو یه تیم تحقیقاتی راه انداختن تا برای افراد فلج، حرف زدن رو به یه روش جدید ممکن کنن. آن جانسون نفر سوم بود که تو این آزمایش‌ها شرکت کرد.

حالا، اصل ماجرا چیه؟ دانشمندا براش یه وسیله درست کردن که بهش می‌گن Neuroprosthesis یا “عصب‌افزار” (یعنی یه رابط مغزی-کامپیوتری که سیگنال‌های مغز رو می‌گیره و مستقیم به کامپیوتر می‌فرسته تا کار خاصی انجام بده). این وسیله رو روی بخشی از مغز که مسئول حرف زدن هست گذاشتن. اون لحظه که خانم جانسون فکر می‌کرد حرف بزنه، ایمپلنت سیگنال مغزش رو می‌گرفت و بعدش می‌فرستاد به یه کامپیوتر مخصوص.

حالا اینجا نقش هوش مصنوعی یا همون AI خیلی مهمه. یه مدل هوش مصنوعی (AI Decoder) باحال، سیگنال مغزی رو به صدا یا حتی انیمیشن چهره (یعنی یه آواتار دیجیتال که می‌تونه لبخند بزنه یا اخم کنه!) تبدیل می‌کرد. تازه جالب‌تر اینکه، دانشمندا با یه تیکه صدا که از سخنرانی عروسی خانم جانسون سال ۲۰۰۴ داشتن، تونستن صدای اصلی خودشو شبیه‌سازی کنن، تا اینجوری حس طبیعی‌تر و شخصی‌تری داشته باشه.

اوایل مدل AI اینجوری بود که باید کل جمله تموم می‌شد تا جمله رو پخش کنه (یه تاخیر ۸ ثانیه‌ای داشت!). ولی اخیراً یه مدل جدید به اسم streaming architecture یا ساختار جریانی (یعنی همزمان با گفتن، جواب می‌ده) جایگزین کردن که الان فقط حدود ۱ ثانیه تاخیر داره و واقعاً لحظه‌ای عمل می‌کنه.

تیم تحقیقاتی که شامل پروفسور گوپالا آنومانچی‌پالی (استاد مهندسی برق دانشگاه برکلی)، دکتر ادوارد چنگ (جراح مغز و اعصاب UCSF) و کیلو لیتلجان (دانشجوی دکتری برکلی) می‌شه می‌گن هدفشون اینه که این جور وسایل واقعاً دم دستی و “پلاگ‌اند-پلی” بشن (یعنی راحت وصل شی و استفاده کنی؛ تخصصی و پیچیده نباشه). حتی دارن فکر می‌کنن که تو آینده این ایمپلنت‌ها بی‌سیم بشن تا دیگه آدم نیاز نباشه خودش رو با سیم ببنده به کامپیوتر! یا حتی آواتارهایی درست کنن که خیلی واقعی‌تر باشه.

یه نکته باحال اینه که این سیستم فقط وقتی کار می‌کنه که اون شخص واقعاً بخواد حرف بزنه و فکر کنه به گفتن؛ پس خیالتون راحت که حریم خصوصی و اختیار خود آدم حفظ می‌شه.

به طور کلی این کشف می‌تونه یه جمعیت نسبتاً کوچیک ولی خیلی آسیب‌پذیر – مثلاً کسایی که بعد سکته مغزی، بیماری ALS (اون بیماری که سلول‌های عصبی رو از کار می‌اندازه) یا آسیب جدی، توان حرف زدن رو از دست دادن – رو دوباره به زندگی و ارتباط برگردونه.

خود آن جانسون گفته: “می‌خوام بقیه بیمارا منو ببینن و بفهمن که ته دنیا نیست! زندگی تموم نشده!” تازه امید داره بتونه به عنوان مشاور توی مرکز توانبخشی، با همین سیستم جدید به مردم کمک کنه و حرف بزنه.

حالا که تاخیر انتقال کم شده و مدل‌های هوش مصنوعی مدام بهتر می‌شن، تیم تحقیقاتی معتقده شاید چند سال دیگه واقعاً بتونیم تو دنیای واقعی، آدمایی که صداشون رو از دست دادن رو با سرعت و طبیعی مثل قبل به حرف زدن برگردونیم. واقعاً علم داره معجزه می‌کنه!

منبع: +