تا حالا شده توی یه متن بلند بخوای بفهمی فلان اسم یا عبارت داره به چی اشاره میکنه؟ مثلاً توی یه مقاله پزشکی میخونی “MRI” و میخوای بدونی دقیقاً منظورش کدوم نوع امآرآیه یا توی یه خبر اسمی مثل “Apple” میاد و باید بفهمی شرکت اپل رو گفته یا سیب معمولی! کاری که بهش میگن Entity Linking یا به فارسی “اتصال اسامی به منابع”.
Entity Linking یعنی اینکه خودکار مشخص کنیم یه کلمه یا عبارت تو متن واقعاً داره به چی اشاره میکنه و اون رو به پایگاه دادهای به اسم Knowledge Graph (این همون بانک داده هوشمنده که کلی اطلاعات سازماندهیشده توش هست!) وصل کنیم.
قدیما واسه این کار معمولاً یه پروسه دو مرحلهای داشتن: اول با یه مدل تشخیص اسمها (یعنی Named Entity Recognition یا NER، ابزاری که اسمها و موجودیتها رو از تو متن پیدا میکنه) و بعد با یه مدل دیگه رفع ابهام میکردن (یعنی Entity Disambiguation؛ یعنی مثلاً از بین چند تا معنی Apple، دقیق بفهمه منظور کدومه). این روشها هم زمانبر بودن، هم خیلی انرژی مصرف میکردن و هم همیشه دقیق نبودن.
توی این مقاله یه حرکت جالب زدن: اومدن یه مدل بزرگ یادگیری عمیق (یعنی همون Large Language Modelها مثل ChatGPT!) رو فاینتیون کردن (یعنی مدل رو با دادههای خاص آموزش دادن تا روی کار خاص بهتر عمل کنه) و کاری کردن که همزمان کار NER و Entity Disambiguation رو با هم انجام بده. اینجوری مدل نهتنها سریعتر کار میکنه، بلکه دقیقتر هم هست.
یه ترفند قشنگ دیگه هم داشتن: اومدن با کمک همین مدل زبانی هوشمند، متن و کانتکست اطراف اسمها رو غنیتر کردن. یعنی هر جا لازم بوده، مدل یه سری توضیحات یا سرنخ اضافه از خودش تولید میکنه تا کمک کنه معنای درست رو پیدا کنه. کانتکست در واقع همون متن و اطلاعات اطراف یه عبارت خاص توی یه جمله یا پاراگرافه که خیلی کمک میکنه مدل کمتر اشتباه کنه.
برای اینکه حرفشون رو ثابت کنن، اومدن روی یه سری دیتاست مخصوص (مثلاً مجموعهمتنهایی که قبلاً باهاشون مدلها رو تست میکردن–به اینا میگن benchmark datasets یعنی دادههای مقایسهای و معروف بین محققان!) مدلشون رو امتحان کردن.
نتیجه چی شد؟ مدل پیشنهادیشون تونسته توی دیتاستهایی که اصلاً مدل باهاشون آشنا نبوده (که بهش میگن out-of-domain datasets یعنی دادههایی خارج از محدوده آموزش قبلی)، نتایج به شدت خوبی بگیره و حتی بهتر از مدلهای مرسوم و سابق عمل کنه! یعنی الان مدلشون هم دقیقتره، هم بهینهتر، هم با زمینههای جدید مشکلی نداره.
در کل، این مقاله نشون میده با کمی خلاقیت و استفاده از قدرت مدلهای زبانی بزرگ، میشه کلی کارهای هوشمندانه مثل تشخیص اسامی و اتصالشون به منابع رو نه تنها سادهتر، بلکه خیلی خیلی دقیقتر انجام داد. واقعاً آینده جذابی در انتظار دنیای پردازش زبان و هوش مصنوعی هست!
منبع: +