چطور هوش مصنوعی می‌تونه کمک کنه مهارت‌های آینده رو کشف کنیم؟ یه نگاه رفاقتی به ساخت یه سیستم باحال کشف مهارت

سلام رفقا! بیاید یه کم درباره بازار کار آینده گپ بزنیم. حتماً شنیدید چقدر همه چی توی دنیا داره سریع پیش میره و شغل‌ها و مهارت‌هایی که چند سال پیش مهم بودن، الان شاید حتی دیگه به درد نخورن. مشکل اینجاست که کلی آدم با دانسته‌ها و مهارت‌های فعلیشون ممکنه نتونن راحت با نیازهای شغل‌های آینده هماهنگ بشن. این موضوع رو سازمان‌هایی مثل World Economic Forum و OECD (اگه نمی‌دونی اینا چین: WEF یعنی مجمع جهانی اقتصاد و OECD هم سازمان همکاری و توسعه اقتصادیه که از بزرگترین نهادهای دنیا واسه رصد و پیش‌بینی روندهای اقتصادی و شغلی‌ان) هم بارها گفتن و تاکید کردن باید یه راهی پیدا کنیم که بشه دینامیک و لحظه به لحظه بفهمیم چی قراره مهارت فردا باشه.

برای همین، توی این مقاله یه سیستمی اختراع شده که با استفاده از NLP یعنی همون «پردازش زبان طبیعی» (یه جور هوش مصنوعی که می‌تونه متون انسانی رو بفهمه و تحلیل کنه)، سعی می‌کنه مهارت‌های جدید و آینده‌دار شغل‌ها رو شناسایی کنه. اما چطوری؟ خب با ترکیب دو تا تکنیک خیلی باحال: NER و RE. حالا نگران نشی توضیح میدم چی‌ان!

– NER مخفف Named Entity Recognition هست. یعنی سیستمی که می‌تونه چیزهای مهم توی متن مثل نام شغل، مهارت یا دانش خاص رو پیدا کنه و برچسب بزنه. مثلاً می‌فهمه تو یه متن شغلی چی داریم راجع به برنامه‌نویسی گفته میشه یا چه مهارت‌هایی مطرحه.

– RE هم یعنی Relation Extraction؛ یعنی بعد از اینکه اون «چیزای مهم» پیدا شدن، حالا ارتباط بینشون رو درمیاره. مثلاً فهمیدن اینکه کدوم مهارت برای چه شغلی لازمه.

توی این تحقیق، کلی گزارش و فایل از بازار کار (بیشتر از ۱۷۰۰ تا سند!) جمع کردن و بعدش یه جور خط لوله (Pipeline) شخصی‌سازی‌شده درست کردن تا همه این داده‌ها رو از PDF بیرون بکشه، متنش رو تمیز کنه (اینم با واژه‌هایی مثل توکنیزاسیون و Lemmatization که یعنی تبدیل کردن کلمات به ریشه‌شون و شکستن متن به قطعات کوچیک‌تر)، و بعد بچسبونتش به مدل NER و RE برای آموزش.

برگردیم سر نتیجه‌ها! مدل NER تونسته با امتیاز F1 حدود ۶۵.۳۸٪ شغل‌ها، مهارت‌ها و دانش رو از داخل این همه سند استخراج کنه (F1 یه واحد اندازه‌گیری عملکرده، که هرچی به ۱۰۰ نزدیک‌تر باشه، بهتره). مدل RE هم تونسته با ۸۲.۲٪ F1 بین این چیزا رابطه‌های درست برقرار کنه. یعنی نه تنها فهمیده چه مهارتایی داریم، بلکه خیلی خوبم فهمیده هر مهارت دقیقا به کدوم شغل یا دانش مربوطه.

بعد با این داده‌ها، یه دایرکتوری یا Taxonomy دینامیک ساختن (Taxonomy یعنی همون دسته‌بندی سازمان‌یافته که مثل درخت رابطه‌های بین مفاهیم رو نشون میده). این دسته‌بندی رو با استفاده از گراف‌ها (یعنی شکل‌هایی که توش گره‌ها و اتصال بینشون هست) به تصویر کشیدن تا راحت‌تر بشه دید تو هر حوزه چه مهارتایی داره رشد می‌کنه و فردا مردم باید چی بلد باشن.

یه نکته خیلی باحال دیگه هم اینکه این سیستم دینامیکه. یعنی هر روز می‌تونن سند جدید بهش بدن و اون خودبه‌خود به‌روز میشه و مسیر رشد مهارت‌ها رو دنبال می‌کنه. این یعنی مثلاً اگه یه مهارت جدید داغ شد، خیلی سریع تو سیستم ثبت میشه و همه زود ازش باخبر میشن.

البته هنوز کار تموم نیست. آمارها نشون میدن که مدل تو پیدا کردن کلی مهارت و شغل خوب عمل می‌کنه (یعنی Recall بالاست و چیزهای درست رو از دست نمیده)، اما هنوز Precision یعنی دقت پایین‌تره و بعضیاش رو اشتباهی هم علامت می‌زنه. برای همین، نیاز داره هم اطلاعات بیشتری بخوره (اسناد بیشتر و حوزه‌های مختلف‌تر) و هم با کمک متخصص‌ها دقیق‌تر بشه.

در نهایت، اینجور سیستم‌ها می‌تونن خیلی کاربردی باشن واسه مدیرای منابع انسانی، برنامه‌ریزان آموزشی و حتی دانشجوها و آدمایی که می‌خوان آینده شغلی‌شون رو بسازن. چون دیگه نیاز نیست حدس بزنن فردا باید چی یاد بگیرن؛ این سیستم خودش مهارت‌های ترندی و جدید رو براشون درمیاره و حتی میگه به کدوم شغل ربط داره.

تا اینجا خلاصه‌ی ماجرا این بود: هوش مصنوعی و پردازش زبان طبیعی اومدن وسط تا شکاف بین مهارت‌های الآن و نیازهای فردای بازار کار رو پر کنن، همون لحظه به روز بمونن و راه رو برای برنامه‌ریزی راحت‌تر شغلی باز کنن. فکر کنید چقدر میشه باحال باشه اگه یه همچین چیزی همیشه دم دستمون باشه تا بتونیم هیچ‌وقت از بازار کار جا نمونیم!
منبع: +