خب بیا راجعبه یه ایده خفن توی دنیای مسیریابی با واقعیت افزوده (همون AR که چیزای مجازی رو میندازه رو دنیای واقعی!) گپ بزنیم. حتماً تاحالا نرمافزارها یا اپهایی دیدی که توشون یه نقشه یا فلش بهت نشون میدن تا مسیرت رو پیدا کنی. اما مشکل اینجاست که بیشتر این سیستمها خیلی خشک و محدودن: یا باید یه سری دستورهای مشخص بدی، یا اصلاً نمیفهمن سوالاتت چیه و اطلاعات زیاد ساختمونها رو نمیتونن خوب استفاده کنن.
اما الان یه تیم اومده یه سیستم جدید معرفی کرده که واقعاً هوشمند و باحاله. داستانش چیه؟ تو این سیستم، چندتا فناوری جذاب رو کنار هم گذاشتن – مثلاً Building Information Modeling یا همون BIM، که یه جور دادهی دیجیتال از ساختمونهاست (یعنی انگار نقشه و همه جزئیات ساختمون رو تو کامپیوتر داری!)، رو با هوش مصنوعی ترکیب کردن.
حالا داستان به این سادگی هم نیست! اینا از یه متد به اسم Retrieval-Augmented Generation استفاده کردن. یعنی چی؟ یعنی وقتی یه کاربر یه سوال عجیبغریب یا یه هدف باز میپرسه، سیستم میره دیتاها رو میگرده، اطلاعات لازم رو پیدا میکنه، بعد با هوش مصنوعی و مدلهای زبانی بزرگ یا همون LLM (Large Language Model) جواب مناسب میسازه و به کاربر میگه.
تو این سیستم، سه تا عامل زبانی یا همون language agent دارن با هم همکاری میکنن: اولینش “Triage” (یعنی سریع میفهمه کاربر چی میخواد)، دومیش “Search” (اون اطلاعات لازم رو میگرده و پیدا میکنه)، و آخریش “Response” (یعنی جواب رو آماده میکنه و میگه). خب این یعنی چی؟ یعنی دیگه لازم نیست کاربر فقط طبق کدوم فرمان از پیش تعریفشده عمل کنه؛ میتونه هرجور دلش میخواد سوال بپرسه!
یکی دیگه از نکات باحال این سیستم اینه که یه “عامل مجسم AR” یا Embodied AR Agent داره، که هم با صدای کاربر کار میکنه هم میتونه حرکت کنه (لوکوموشن). یعنی تجربه راهنمای کاربر خیلی طبیعیتر و انسانیتر میشه. انگار واقعاً یکی رو داری که داره باهات حرف میزنه و راه رو نشون میده.
حالا بریم سراغ اینکه واقعاً کار میکنه یا نه! اومدن تو دنیای واقعی، با آدمای معمولی این سیستم رو تست کردن و طبق یه شاخص معروف به اسم System Usability Scale یا همون SUS (که یه معیار برای سنجش راحتی و خوبی کارکرد سیستمه)، نمرهی ۸۰.۵ گرفتن! این فوقالعاده است و نشون میده کاربرا راضی بودن.
جالبتر اینکه، وقتی شرکتکنندهها این سیستم جدید رو با سیستمهای خشکتر قبلی مقایسه کردن، متوجه شدن که این یکی خیلی هوشمندتر و کاربرپسندتره. این نشون میده ترکیب مدل زبانی با سیستم واقعی و دادههای ساختمونها، و البته اون حالت مجسم یا embodied، باعث شده تجربه کاربری خیلی بهتر بشه.
در نهایت میشه گفت این کار نشون داد که استفاده از هوش مصنوعی و سیستمهایی که میتونن زبان آدمها رو بفهمن (که بهش میگن language-grounded reasoning) و داشتن عامل مجسم (که واقعا یه چیزی مثل کمکیار دیجیتالی هست جلوی چشت)، آیندهی ساخت سیستمهای مسیریابی با واقعیت افزوده رو خیلی جذابتر و کارامدتر میکنه. خلاصه، قراره دنیای مسیریابی تو فضای AR حسابی متحول بشه!
منبع: +