ترکیب هوش مصنوعی با راهنمای مسیریابی AR: یه تجربه خیلی باحال و هوشمند!

Fall Back

خب بیا راجع‌به یه ایده خفن توی دنیای مسیریابی با واقعیت افزوده (همون AR که چیزای مجازی رو می‌ندازه رو دنیای واقعی!) گپ بزنیم. حتماً تاحالا نرم‌افزارها یا اپ‌هایی دیدی که توشون یه نقشه یا فلش بهت نشون میدن تا مسیرت رو پیدا کنی. اما مشکل اینجاست که بیشتر این سیستم‌ها خیلی خشک و محدودن: یا باید یه سری دستورهای مشخص بدی، یا اصلاً نمی‌فهمن سوالاتت چیه و اطلاعات زیاد ساختمون‌ها رو نمی‌تونن خوب استفاده کنن.

اما الان یه تیم اومده یه سیستم جدید معرفی کرده که واقعاً هوشمند و باحاله. داستانش چیه؟ تو این سیستم، چندتا فناوری جذاب رو کنار هم گذاشتن – مثلاً Building Information Modeling یا همون BIM، که یه جور داده‌ی دیجیتال از ساختمون‌هاست (یعنی انگار نقشه و همه جزئیات ساختمون رو تو کامپیوتر داری!)، رو با هوش مصنوعی ترکیب کردن.

حالا داستان به این سادگی هم نیست! اینا از یه متد به اسم Retrieval-Augmented Generation استفاده کردن. یعنی چی؟ یعنی وقتی یه کاربر یه سوال عجیب‌غریب یا یه هدف باز می‌پرسه، سیستم میره دیتاها رو می‌گرده، اطلاعات لازم رو پیدا می‌کنه، بعد با هوش مصنوعی و مدل‌های زبانی بزرگ یا همون LLM (Large Language Model) جواب مناسب می‌سازه و به کاربر میگه.

تو این سیستم، سه تا عامل زبانی یا همون language agent دارن با هم همکاری می‌کنن: اولینش “Triage” (یعنی سریع می‌فهمه کاربر چی می‌خواد)، دومیش “Search” (اون اطلاعات لازم رو می‌گرده و پیدا می‌کنه)، و آخریش “Response” (یعنی جواب رو آماده می‌کنه و میگه). خب این یعنی چی؟ یعنی دیگه لازم نیست کاربر فقط طبق کدوم فرمان از پیش تعریف‌شده عمل کنه؛ می‌تونه هرجور دلش می‌خواد سوال بپرسه!

یکی دیگه از نکات باحال این سیستم اینه که یه “عامل مجسم AR” یا Embodied AR Agent داره، که هم با صدای کاربر کار می‌کنه هم می‌تونه حرکت کنه (لوکوموشن). یعنی تجربه راهنمای کاربر خیلی طبیعی‌تر و انسانی‌تر میشه. انگار واقعاً یکی رو داری که داره باهات حرف می‌زنه و راه رو نشون میده.

حالا بریم سراغ اینکه واقعاً کار می‌کنه یا نه! اومدن تو دنیای واقعی، با آدمای معمولی این سیستم رو تست کردن و طبق یه شاخص معروف به اسم System Usability Scale یا همون SUS (که یه معیار برای سنجش راحتی و خوبی کارکرد سیستمه)، نمره‌ی ۸۰.۵ گرفتن! این فوق‌العاده‌ است و نشون میده کاربرا راضی بودن.

جالب‌تر اینکه، وقتی شرکت‌کننده‌ها این سیستم جدید رو با سیستم‌های خشکتر قبلی مقایسه کردن، متوجه شدن که این یکی خیلی هوشمندتر و کاربرپسندتره. این نشون میده ترکیب مدل زبانی با سیستم واقعی و داده‌های ساختمون‌ها، و البته اون حالت مجسم یا embodied، باعث شده تجربه کاربری خیلی بهتر بشه.

در نهایت میشه گفت این کار نشون داد که استفاده از هوش مصنوعی و سیستم‌هایی که می‌تونن زبان آدم‌ها رو بفهمن (که بهش میگن language-grounded reasoning) و داشتن عامل مجسم (که واقعا یه چیزی مثل کمک‌یار دیجیتالی هست جلوی چشت)، آینده‌ی ساخت سیستم‌های مسیریابی با واقعیت افزوده رو خیلی جذاب‌تر و کارامدتر می‌کنه. خلاصه، قراره دنیای مسیریابی تو فضای AR حسابی متحول بشه!

منبع: +