سلام رفقا! بیاید یه کم درباره بازار کار آینده گپ بزنیم. حتماً شنیدید چقدر همه چی توی دنیا داره سریع پیش میره و شغلها و مهارتهایی که چند سال پیش مهم بودن، الان شاید حتی دیگه به درد نخورن. مشکل اینجاست که کلی آدم با دانستهها و مهارتهای فعلیشون ممکنه نتونن راحت با نیازهای شغلهای آینده هماهنگ بشن. این موضوع رو سازمانهایی مثل World Economic Forum و OECD (اگه نمیدونی اینا چین: WEF یعنی مجمع جهانی اقتصاد و OECD هم سازمان همکاری و توسعه اقتصادیه که از بزرگترین نهادهای دنیا واسه رصد و پیشبینی روندهای اقتصادی و شغلیان) هم بارها گفتن و تاکید کردن باید یه راهی پیدا کنیم که بشه دینامیک و لحظه به لحظه بفهمیم چی قراره مهارت فردا باشه.
برای همین، توی این مقاله یه سیستمی اختراع شده که با استفاده از NLP یعنی همون «پردازش زبان طبیعی» (یه جور هوش مصنوعی که میتونه متون انسانی رو بفهمه و تحلیل کنه)، سعی میکنه مهارتهای جدید و آیندهدار شغلها رو شناسایی کنه. اما چطوری؟ خب با ترکیب دو تا تکنیک خیلی باحال: NER و RE. حالا نگران نشی توضیح میدم چیان!
– NER مخفف Named Entity Recognition هست. یعنی سیستمی که میتونه چیزهای مهم توی متن مثل نام شغل، مهارت یا دانش خاص رو پیدا کنه و برچسب بزنه. مثلاً میفهمه تو یه متن شغلی چی داریم راجع به برنامهنویسی گفته میشه یا چه مهارتهایی مطرحه.
– RE هم یعنی Relation Extraction؛ یعنی بعد از اینکه اون «چیزای مهم» پیدا شدن، حالا ارتباط بینشون رو درمیاره. مثلاً فهمیدن اینکه کدوم مهارت برای چه شغلی لازمه.
توی این تحقیق، کلی گزارش و فایل از بازار کار (بیشتر از ۱۷۰۰ تا سند!) جمع کردن و بعدش یه جور خط لوله (Pipeline) شخصیسازیشده درست کردن تا همه این دادهها رو از PDF بیرون بکشه، متنش رو تمیز کنه (اینم با واژههایی مثل توکنیزاسیون و Lemmatization که یعنی تبدیل کردن کلمات به ریشهشون و شکستن متن به قطعات کوچیکتر)، و بعد بچسبونتش به مدل NER و RE برای آموزش.
برگردیم سر نتیجهها! مدل NER تونسته با امتیاز F1 حدود ۶۵.۳۸٪ شغلها، مهارتها و دانش رو از داخل این همه سند استخراج کنه (F1 یه واحد اندازهگیری عملکرده، که هرچی به ۱۰۰ نزدیکتر باشه، بهتره). مدل RE هم تونسته با ۸۲.۲٪ F1 بین این چیزا رابطههای درست برقرار کنه. یعنی نه تنها فهمیده چه مهارتایی داریم، بلکه خیلی خوبم فهمیده هر مهارت دقیقا به کدوم شغل یا دانش مربوطه.
بعد با این دادهها، یه دایرکتوری یا Taxonomy دینامیک ساختن (Taxonomy یعنی همون دستهبندی سازمانیافته که مثل درخت رابطههای بین مفاهیم رو نشون میده). این دستهبندی رو با استفاده از گرافها (یعنی شکلهایی که توش گرهها و اتصال بینشون هست) به تصویر کشیدن تا راحتتر بشه دید تو هر حوزه چه مهارتایی داره رشد میکنه و فردا مردم باید چی بلد باشن.
یه نکته خیلی باحال دیگه هم اینکه این سیستم دینامیکه. یعنی هر روز میتونن سند جدید بهش بدن و اون خودبهخود بهروز میشه و مسیر رشد مهارتها رو دنبال میکنه. این یعنی مثلاً اگه یه مهارت جدید داغ شد، خیلی سریع تو سیستم ثبت میشه و همه زود ازش باخبر میشن.
البته هنوز کار تموم نیست. آمارها نشون میدن که مدل تو پیدا کردن کلی مهارت و شغل خوب عمل میکنه (یعنی Recall بالاست و چیزهای درست رو از دست نمیده)، اما هنوز Precision یعنی دقت پایینتره و بعضیاش رو اشتباهی هم علامت میزنه. برای همین، نیاز داره هم اطلاعات بیشتری بخوره (اسناد بیشتر و حوزههای مختلفتر) و هم با کمک متخصصها دقیقتر بشه.
در نهایت، اینجور سیستمها میتونن خیلی کاربردی باشن واسه مدیرای منابع انسانی، برنامهریزان آموزشی و حتی دانشجوها و آدمایی که میخوان آینده شغلیشون رو بسازن. چون دیگه نیاز نیست حدس بزنن فردا باید چی یاد بگیرن؛ این سیستم خودش مهارتهای ترندی و جدید رو براشون درمیاره و حتی میگه به کدوم شغل ربط داره.
تا اینجا خلاصهی ماجرا این بود: هوش مصنوعی و پردازش زبان طبیعی اومدن وسط تا شکاف بین مهارتهای الآن و نیازهای فردای بازار کار رو پر کنن، همون لحظه به روز بمونن و راه رو برای برنامهریزی راحتتر شغلی باز کنن. فکر کنید چقدر میشه باحال باشه اگه یه همچین چیزی همیشه دم دستمون باشه تا بتونیم هیچوقت از بازار کار جا نمونیم!
منبع: +