PlotCraft: وقتی هوش مصنوعی وارد بساط نمودارهای پیچیده میشه!

Fall Back

احتمالاً شنیدید که مدل‌های زبان بزرگ یا همون LLMها (یعنی هوش مصنوعی‌هایی که می‌تونن متن بنویسن، کد بزنن و کلی کار خفن دیگه انجام بدن) توی ساختن کد غوغا کردن. ولی واقعیت اینه که وقتی پای ساختن نمودارهای خیلی پیچیده و تعاملی میاد وسط، هنوز خیلی راه دارن تا فول بشن. یعنی چی؟ یعنی مثلاً اگه به یکی از این هوش مصنوعیا بگین یه نمودار قشنگ و خفن برای داده‌های مالی یا علمی درست کنه، خیلی وقت‌ها گیر میکنن یا نتیجه‌شون دلچسب نیست.

حالا چندتا محقق باحال اومدن و یه چالش درست کردن به اسم PlotCraft. این کار یه بنچمارک جدیده (بنچمارک یعنی یه جور آزمون و معیار که باهاش عملکرد مدل‌ها رو می‌سنجن) که حدود هزار تا تسک بصورت واقعاً سخت داره! موضوعاتش هم خیلی متنوعه؛ مثلاً از نمودارهای مالی گرفته تا داده‌های علمی و جامعه‌شناسی رو شامل میشه. توی این بنچمارک، هفت مدل کلی از وظایف تصویری هست و بچه‌ها ۴۸ نوع مختلف چارت (نمودار) رو هم پوشش دادن. تازه؛ فرقش با بقیه اینه که هم یه مرحله‌ای (یعنی دفعه اول درستش کن) و هم چندمرحله‌ای (یعنی هی اصلاحش کن) بودنِ خروجی رو می‌سنجه.

تا حالا ۲۳ تا از معروف‌ترین مدل‌های LLM رو با این چالش سنجیدن و خب، نتیجه جالب بود: بیشترشون توی ساختن نمودارهای پیچیده یا وقتی کار چالش‌برانگیزتر میشه، کم میارن و خروجی جالبی ندارن.

برای اینکه این مشکل رو حل کنن، تیم محقق‌ها اومدن یه دیتاست جدید ساختن به اسم SynthVis-30K. این دیتاست چیه؟ یه مجموعه خیلی بزرگ و باکیفیت از نمونه کدهای نمودار بسیار پیچیده‌ست که به‌صورت مصنوعی توسط چندتا هوش مصنوعی با همدیگه ساخته شده. (اینجا بهش میگن collaborative agent framework یعنی چندتا هوش باهم همکاری کردن که دیتا تولید کنن)

بعدشم رفتن سراغ ساختن یه مدل جدید به اسم PlotCraftor. این مدل رسماً طوری آموزش دیده که روی ساخت کد برای نمودارهای پیچیده و کاربردی حرف نداره – اونم با اندازه‌ای خیلی جمع و جور! یعنی دیگه لازم نیست مدل خیلی گنده باشه تا هوشمند عمل کنه.

توی آزمون‌هایی مثل VisEval و PandasPlotBench (که هر دوشون معمولاً برای سنجش قدرت هوش مصنوعی در دیتاویژوالایزیشن یعنی مصورسازی داده استفاده میشه) و همین PlotCraft، مدل PlotCraftor خیلی خوب جواب داده! در واقع میگن عملکردش در حد مدل‌های تجاری و گرون‌قیمتِ ماشینای خصوصیه. جالب‌تر اینکه توی تسک‌های خیلی سخت، بیش از ۵۰ درصد بهبود کارایی داشته!

ضمناً قول دادن همه این چیزا (یعنی دیتاست، بنچمارک و کدها) رو رایگان بذارن تو گیت‌هاب. اگه با دیتاساینس یا هوش مصنوعی سر و کار داری، پیشنهاد می‌کنم سری به https://github.com/Speakn0w/PlotCraft-Benchmark بزنی.

خلاصه که PlotCraft داره نشون میده هوش مصنوعی راه زیادی برای تبدیل شدن به یه ویژوالایزر حرفه‌ای داره، ولی با چیزی مثل PlotCraftor، سرعت پیشرفت بیشتر از قبل شده و آینده‌ نمودارهای خودکار خیلی هیجان‌انگیزه!

منبع: +