داستان جذاب اتصال خودکار اسامی با کمک مدل‌های زبانی هوشمند!

تا حالا شده توی یه متن بلند بخوای بفهمی فلان اسم یا عبارت داره به چی اشاره می‌کنه؟ مثلاً توی یه مقاله پزشکی می‌خونی “MRI” و می‌خوای بدونی دقیقاً منظورش کدوم نوع ام‌آر‌آی‌ه یا توی یه خبر اسمی مثل “Apple” میاد و باید بفهمی شرکت اپل رو گفته یا سیب معمولی! کاری که بهش میگن Entity Linking یا به فارسی “اتصال اسامی به منابع”.

Entity Linking یعنی اینکه خودکار مشخص کنیم یه کلمه یا عبارت تو متن واقعاً داره به چی اشاره می‌کنه و اون رو به پایگاه داده‌ای به اسم Knowledge Graph (این همون بانک داده هوشمنده که کلی اطلاعات سازمان‌دهی‌شده توش هست!) وصل کنیم.

قدیما واسه این کار معمولاً یه پروسه دو مرحله‌ای داشتن: اول با یه مدل تشخیص اسم‌ها (یعنی Named Entity Recognition یا NER، ابزاری که اسم‌ها و موجودیت‌ها رو از تو متن پیدا می‌کنه) و بعد با یه مدل دیگه رفع ابهام می‌کردن (یعنی Entity Disambiguation؛ یعنی مثلاً از بین چند تا معنی Apple، دقیق بفهمه منظور کدومه). این روش‌ها هم زمان‌بر بودن، هم خیلی انرژی مصرف می‌کردن و هم همیشه دقیق نبودن.

توی این مقاله یه حرکت جالب زدن: اومدن یه مدل بزرگ یادگیری عمیق (یعنی همون Large Language Modelها مثل ChatGPT!) رو فاین‌تیون کردن (یعنی مدل رو با داده‌های خاص آموزش دادن تا روی کار خاص بهتر عمل کنه) و کاری کردن که همزمان کار NER و Entity Disambiguation رو با هم انجام بده. اینجوری مدل نه‌تنها سریع‌تر کار میکنه، بلکه دقیق‌تر هم هست.

یه ترفند قشنگ دیگه هم داشتن: اومدن با کمک همین مدل زبانی هوشمند، متن و کانتکست اطراف اسم‌ها رو غنی‌تر کردن. یعنی هر جا لازم بوده، مدل یه سری توضیحات یا سرنخ اضافه از خودش تولید می‌کنه تا کمک کنه معنای درست رو پیدا کنه. کانتکست در واقع همون متن و اطلاعات اطراف یه عبارت خاص توی یه جمله یا پاراگرافه که خیلی کمک می‌کنه مدل کمتر اشتباه کنه.

برای اینکه حرفشون رو ثابت کنن، اومدن روی یه سری دیتاست مخصوص (مثلاً مجموعه‌متن‌هایی که قبلاً باهاشون مدل‌ها رو تست می‌کردن–به اینا میگن benchmark datasets یعنی داده‌های مقایسه‌ای و معروف بین محققان!) مدل‌شون رو امتحان کردن.

نتیجه چی شد؟ مدل پیشنهادی‌شون تونسته توی دیتاست‌هایی که اصلاً مدل باهاشون آشنا نبوده (که بهش میگن out-of-domain datasets یعنی داده‌هایی خارج از محدوده آموزش قبلی)، نتایج به شدت خوبی بگیره و حتی بهتر از مدل‌های مرسوم و سابق عمل کنه! یعنی الان مدلشون هم دقیق‌تره، هم بهینه‌تر، هم با زمینه‌های جدید مشکلی نداره.

در کل، این مقاله نشون میده با کمی خلاقیت و استفاده از قدرت مدل‌های زبانی بزرگ، میشه کلی کارهای هوشمندانه مثل تشخیص اسامی و اتصالشون به منابع رو نه تنها ساده‌تر، بلکه خیلی خیلی دقیق‌تر انجام داد. واقعاً آینده جذابی در انتظار دنیای پردازش زبان و هوش مصنوعی هست!

منبع: +