فیفی لی، پیشگام هوش مصنوعی، با حمایت از «هوش فضایی سهبعدی» انقلابی در بینایی کامپیوتر ایجاد میکند. این فناوری، توانایی هوش مصنوعی در ساخت، تحلیل و تعامل با محیطهای سهبعدی را تعریف میکند. استارتآپ او، World Labs، در خط مقدم این تحول قرار دارد و صحنههای سهبعدی فراگیری میسازد که میتواند صنایعی از رباتیک گرفته تا واقعیت مجازی را متحول کند.
“`markdown
میراث فیفی لی در هوش مصنوعی و تولد World Labs
فیفی لی، استاد دانشگاه استنفورد، از پیشگامان هوش مصنوعی است. او مدتهاست که نیروی محرکهای در این حوزه به شمار میرود. لی بیشتر به خاطر نقش مهمش در ایجاد مجموعه داده ImageNet شناخته میشود. ImageNet انقلاب یادگیری عمیق را در سال ۲۰۱۲ شتاب بخشید. این پیشرفت، سیستمهای هوش مصنوعی را قادر ساخت تا اشیا را با دقتی بیسابقه تشخیص دهند. همین امر، زمینه را برای پیشرفت در بینایی کامپیوتر فراهم کرد.
بیش از یک دهه از آن زمان میگذرد و لی همچنان به پیشروی خود ادامه میدهد. آخرین سرمایهگذاری او، World Labs، بر روی «هوش فضایی» برای ماشینها متمرکز است. این قابلیت جدید به هوش مصنوعی اجازه میدهد محیطهای سهبعدی را بسازد. همچنین، هوش مصنوعی میتواند در مورد این محیطها تحلیل کند و با آنها تعامل داشته باشد. لی در کنفرانس NeurIPS، چشمانداز خود را برای آینده بینایی ماشین ترسیم کرد. او بر اهمیت گذار از «دیدن» به «انجام دادن» تأکید کرد.
تکامل هوش بصری
لی از این ایده الهام میگیرد که هوش به صورت لایه لایه، همانند «نردبان علیت» جودیا پرل، تکامل مییابد. در دهه گذشته، هوش مصنوعی به دستاوردهای چشمگیری در هوش بصری رسیده است. اما لی معتقد است که زمان آن رسیده است تا با یک چالش اساسی روبرو شویم: درک جهان به صورت سهبعدی. هوش مصنوعی مبتنی بر زبان بر ارتباطات تمرکز دارد. در مقابل، هوش بصری عمیقاً با تعامل و عمل در هم آمیخته است. برای انسانها و ماشینها، درک محیط برای تصمیمگیری و انجام کارهای هدفمند ضروری است.
لی توضیح میدهد که ادراک، محرک اصلی تکامل بوده است. حیواناتی که میتوانند محیط اطراف خود را حس کنند، از مزیت بقا برخوردارند. این حس کردن به آنها اجازه میدهد به طور فعال واکنش نشان دهند، نه اینکه منفعلانه عمل کنند. به همین ترتیب، سیستمهای هوش مصنوعی که میتوانند فضاهای سهبعدی را درک و با آنها تعامل داشته باشند، سطوح جدیدی از توانایی و پیچیدگی را ایجاد میکنند.
چرا هوش فضایی سهبعدی اهمیت دارد
به گفته لی، جهان ذاتاً سهبعدی است و هوش مصنوعی باید با این واقعیت تطبیق پیدا کند. از رباتهایی که در فضاهای فیزیکی حرکت میکنند تا محیطهای مجازی، توانایی درک و تعامل با محیطهای سهبعدی بسیار مهم است. محیطهای مجازی روز به روز فراگیرتر میشوند. هنرمندان، معماران، توسعهدهندگان بازی و متخصصان پزشکی از قبل به ابزارهای سهبعدی متکی هستند. لی معتقد است که هوش مصنوعی نیز باید از این رویکرد پیروی کند.
World Labs با ایجاد صحنههای سهبعدی که دوام اشیاء را حفظ میکنند و از قوانین فیزیک پیروی میکنند، پیشگام این تغییر است. این محیطها فقط تصاویر پیکسلی نیستند، بلکه فضاهایی کاملاً قابل پیمایش هستند. به عنوان مثال، در یک نسخه نمایشی، توپهای بسکتبال به طور طبیعی در یک صحنه رها میشوند. این نشان میدهد که چگونه توجه به «سهبعدی بودن» جهان، تعاملات واقعیتر را ممکن میسازد. این امر با ابزارهای سنتی تولید ویدیو که اغلب با سازگاری و واقعگرایی مشکل دارند، بسیار متفاوت است.
غلبه بر چالشهای فنی
ایجاد هوش فضایی سهبعدی کار سادهای نیست. لی اذعان میکند که موانع فنی زیادی وجود دارد. این موانع از تضمین هماهنگی نور و رنگ در محیطهای تولید شده تا مدیریت نیازهای محاسباتی چنین سیستمهای پیچیدهای را شامل میشود. به عنوان مثال، یک نسخه نمایشی World Labs، یک نقاشی ون گوگ را به یک صحنه سهبعدی فراگیر تبدیل میکند. در عین حال، سبک خاص هنرمند در نورپردازی، معماری و محیط حفظ میشود.
بار محاسباتی برای این پروژهها قابل توجه است و به منابعی فراتر از آنچه عموم مردم به آن دسترسی دارند نیاز دارد. این چالش، حمایت لی از ابتکاراتی مانند منبع ملی تحقیقات هوش مصنوعی (NAIRR) را برجسته میکند. هدف NAIRR ارائه ابزارهای لازم برای نوآوری به محققان بخش عمومی است.
کاربردهای عملی هوش سهبعدی
لی آیندهای را پیشبینی میکند که در آن هوش فضایی سهبعدی، خلاقیت و بهرهوری را در حوزههای مختلف دگرگون میکند:
- طراحی خانه: ابزارهای هوش مصنوعی میتوانند در طراحی خانه کمک کنند. این ابزارها، طرحبندیهای فضایی و زیباییشناسی را درک میکنند.
- پزشکی: هوش فضایی پیشرفته میتواند تشخیص و درمان را بهبود بخشد. این کار با افزایش درک ما از بدن انسان به عنوان یک سیستم سهبعدی انجام میشود.
- رباتیک: رباتهای مجهز به هوش فضایی میتوانند در محیطهای پیچیده بهتر حرکت کنند. آنها میتوانند وظایفی را انجام دهند که نیاز به استدلال فضایی دارند.
- آموزش و سرگرمی: تجربیات واقعیت مجازی و افزوده میتواند فراگیرتر شود. این فناوری کاربران را قادر میسازد تا مکانها را کاوش کنند، مهارتها را بیاموزند یا از سرگرمی به روشهای کاملاً جدید لذت ببرند.
لی همچنین به کاربردهای روزمره اشاره میکند، مانند استفاده از عینک واقعیت افزوده برای دریافت راهنمایی برای تعویض لاستیک پنچر یا پختن یک غذای جدید. این ابزارها میتوانند کارهای پیچیده را برای همه آسانتر کنند.
آیندهای که به سرعت در حال نزدیک شدن است
لی نسبت به سرعت پیشرفت فناوری خوشبین است. با نگاهی به پیشرفتهای دهه گذشته، او معتقد است که پیشرفت در هوش فضایی سهبعدی در طول زندگی ما رخ خواهد داد. پیامدهای آن بسیار زیاد است، از افزایش خلاقیت انسان گرفته تا رباتهای هوشمندتر و دنیای مجازی فراگیرتر.
همانطور که لی به رهبری خود در این زمینه ادامه میدهد، کار او یادآور پتانسیل تحولآفرین هوش مصنوعی است. هوش مصنوعی نه تنها جهان را آنطور که هست درک میکند، بلکه آن را آنطور که میتواند باشد، بازآفرینی میکند.
“`
اگر به خواندن کامل این مطلب علاقهمندید، روی لینک مقابل کلیک کنید: ieee spectrum