چه جوری تنوع زبانی سواحیلی رو تو هوش مصنوعی بسنجیم؟ یه نگاه باحال و جورواجور!

Fall Back

خب بچه‌ها، بذارید یه موضوع جذاب رو با هم بررسی کنیم: چطوری میشه مطمئن شد هوش مصنوعی واقعاً می‌تونه همه پیچ‌وخم‌های زبان سواحیلی رو بفهمه و خوب پردازش کنه؟ یه تیم از محققای خفن اومدن و اولین «ارزیابی هدایت‌شده با دسته‌بندی» تو حوزه سواحیلی رو درست کردن که خلاصه یعنی اینکه با یه روش خاص، دارن بررسی می‌کنن ماشین‌ها چقدر تو شناسایی تنوع‌های زبانیِ این زبان پیچیده موفق هستن.

حالا داستان از اینجا شروع شد که دیدن هوش مصنوعی‌ها (مثل همونا که توی ChatGPT یا گوگل ترنسلیت استفاده می‌شن) معمولاً با زبونای انگلیسی و چندتا زبان معروف دیگه خوب کار میکنن، اما برن سراغ سواحیلی که دنیا دنیای گویش‌ها و لهجه‌ها و تفاوت فرهنگیه، می‌زنن تو جاده خاکی!

واسه اینکه بتونن این موضوع رو دقیق‌تر بسنجن، یه دیتاست درست کردن که توش ۲۱۷۰ تا جواب متنیِ آزاد از سخنگویای اهل کنیا جمع‌آوری شده. دیتاست یعنی مجموعه‌داده، یه جور مخزن داده‌های خام. این پاسخ‌ها پر از خلاقیت بود؛ مثل اثرات قبیله‌ای (مثلاً بعضی کلمات و ساختارها مربوط به یک قوم خاصه)، کلمات امروزی شهری، کد-میکسینگ (یعنی قاطی‌پاطی انگلیسی و سواحیلی حرف زدن که بین جوونا مد شده)، و همچنین لغات قرضی از زبونای دیگه.حتماً دیدین این سبک کلام رو که یکی یه جمله می‌گه و وسطش یه کلمه انگلیسی مثلاً پرت می‌کنه!

نکته جالب‌تر اینکه تیم تحقیق یه «طبقه‌بندی ساختاریافته» واسه این ویژگی‌های زبون درست کردن؛ یه جور راهنمای دسته‌بندی که نشون میده چطور باید هرنوع تنوع اجتماعی-زبانی رو تشخیص بدیم. طبقه‌بندی ساختاریافته یعنی یه جور کادر و معیار که باهاش قشنگ میشه دسته‌بندی کرد داده‌ها رو.

حالا با این ابزار باحال، اومدن هوش مصنوعی‌های مختلف رو تست کردن؛ بعضیاش فقط آموزش دیده بودن (pre-trained) و بعضیاشون مخصوص دستور گرفتن و اجراکردن کار خاصی تنظیم شدن (instruction-tuned). مثلاً مدل Pre-trained یعنی مدلی که یه عالمه داده رو خورده و یه دانش عمومی داره، ولی instruction-tuned یعنی بهش گفتن یه کار مشخص رو خیلی دقیق انجام بده. دیگه اونا رو با پاسخ‌های این دیتاست سنجیدن و دیدن کی بهتر می‌تونه این تنوع‌ها رو بفهمه و کی بیشتر خطا می‌زنه.

نتیجه‌ها خیلی بامزه بود: فهمیدن ارزیابی‌هایی که عمق فرهنگی رو در نظر بگیره، خیلی ضروریه چون این تفاوت‌های زبانی واقعاً روی کارایی هوش مصنوعی‌ها تاثیر مهم داره. خلاصه حرفشون اینه که نباید فقط با داده‌های تمیز و ساده مدل‌ها رو بسنجیم؛ تنوع واقعی زبان توی زندگی خیلی بیشتر و پیچیده‌تره و مدل‌ها باید واقعاً با اینجور موارد هم سر و کار داشته باشن.

این کار می‌تونه راه رو باز کنه برای این که بقیه هم تو بقیه زبونا، مخصوصاً زبونای آفریقایی و باحالِ کمترشناخته‌شده، همین روش رو پیاده کنن و بفهمن کدوم مدل واقعاً مردم رو می‌فهمه 🙂

منبع: +