احتمالاً تا حالا اسم هوش مصنوعی (AI) و مدلهای زبانی بزرگ مثل ChatGPT به گوشت خورده. این روزها این هوشها کمکم دارن مستقلتر میشن و خودشون تصمیم میگیرن. حالا یه سوال مهم پیش میاد: اگه قراره این سیستمها خودشون تصمیم بگیرن، چطور باید مطمئن بشیم تصمیمی میگیرن که با ارزشهای آدمها جور دربیاد؟ منظورمون از ارزشها همون چیزهاییه که به نظر ما انسانها خوب، مهم یا درست میان.
توی مقالهای که امروز دربارهش حرف میزنیم (واسه اینکه رسمی نشه اسمشو گذاشتن “Value Lens” یعنی لنز ارزشها!)، نویسندهها یه روشی پیشنهاد دادن که به کمک مدلهای زبانی بزرگ (Large Language Model یا به اختصار LLM، همون مدلهایی که پایهی ChatGPT و Bard و این چیزان) بتونه تشخیص بده که آیا متنی که جلوی روشه، ارزشهای انسانی رو نشون میده یا نه.
خود پروژه Value Lens دوتا مرحله مهم داره:
مرحله اولش میاد یه نظریه کاملاً رسمی درباره ارزشها درست میکنه. یعنی با کمک همون مدل زبانی (LLM) یه توصیف دقیقِ علمی و منطقی از اون ارزشهایی که مد نظرمونه تولید میکنه. البته همینجوری هم قبول نمیکنن! بعدش کارشناسهای خبره اون توضیح LLM رو چک میکنن تا مطمئن بشن نتیجه درست دراومده. خلاصه، میخوان مطمئن باشن تعریفشون از ارزش رو اشتباه نگرفته.
توی مرحله دوم کار جالبتر میشه: اینجا دوتا مدل LLM وارد بازی میشن! یکی به عنوان کاشف ارزش (یعنی اونکه سعی میکنه توی متن دقت کنه و ارزشها رو پیدا کنه)، یکی هم به عنوان منتقد و داور. یعنی یه LLM میگه: “تو این متن ارزش X وجود داره”، بعد اون یکی میاد بررسی میکنه میگه آره درست گفتی یا نه، یه جوری نقش معلم سختگیر رو بازی میکنه.
حالا نتیجه چی شد؟ مدل Value Lens تونسته از خیلی از مدلهای دیگه که کار مشابهی انجام میدن هم بهتر جواب بده یا حداقل به خوبی اونا باشه. یعنی شما واسه تشخیص ارزشهای انسانی بین مدلها، رو Value Lens میتونید حساب باز کنید!
یه نکته باحال هم اینه که مدلهای Generative AI (هوش مصنوعی مولد – یعنی همونایی که خودشون میتونن متن، عکس یا جواب تولید کنن) روز به روز دارن مهمتر میشن. پس اینکه بتونن ارزشهای انسانی رو هم بفهمن و رعایت کنن، واسه آینده واقعاً مهمه.
در کل، اگه از الان دغدغه داریم سیستمهایی که برامون تصمیم میگیرن، همراه باهوش و منطقیشون، با ارزشهامون هم هماهنگ باشن، پروژههایی مثل Value Lens یه قدم مهم واسه رسیدن به اون هدفه. خلاصه، حالا هوش مصنوعیها هم کمکم یاد میگیرن values یعنی چی!
منبع: +