دیپ‌رایتر: دستیار نویسندگی حرفه‌ای که با اطلاعات درست و آفلاین کار می‌کنه!

Fall Back

تا حالا شده بخوای یه متن تخصصی بنویسی، مثلاً درباره مسائل مالی یا پزشکی یا حتی حقوقی، اما حس کنی اطلاعات دقیق کم داری یا اصلاً نمی‌دونی از کجا شروع کنی؟ خب، الان کلی مدل معروف هوش مصنوعی هستن که اسمشون Large Language Models یا همون LLMsـه (یعنی مدل‌های زبانی بزرگ که می‌تونن متن تولید کنن)، ولی مشکلشون اینه که تو حوزه‌های خیلی تخصصی معمولاً کم میارن یا حتی ممکنه یه سری اطلاعات اشتباه تحویلت بدن (این اتفاق رو بهش می‌گن hallucination، یعنی مدل یه چیزایی از خودش درمیاره که واقعیت نداره!).

برای حل این قضیه، تا حالا چندتا راه‌حل مختلف پیشنهاد شده. مثلاً Retrieval-Augmented Generation یا به اختصار RAG که یعنی مدل می‌ره حین تولید متن، یه سری اطلاعات رو از قبل جمع‌آوری می‌کنه و بعد متن رو بر اساس اون می‌نویسه. این روش باحالِ ولی وقتی retrieval یا همون بازیابی چند مرحله‌ای می‌شه، ممکنه یه جورایی اطلاعات با هم جور درنیاد و نتیجه نهایی یک‌دست و منسجم نباشه. از اون طرف، یه روش دیگه هم هست که مدل می‌ره آنلاین سرچ می‌کنه و بر اساس نتیجه سرچ متن تولید می‌کنه؛ اما خب محتوا‌های اینترنت همیشه مطمئن و باکیفیت نیستن و گاهی می‌تونه دردسرساز بشه.

حالا این وسط DeepWriter اومده وارد میدون شده! دیپ‌رایتر یک دستیار نویسندگی چندرسانه‌ای ـه (Multimodal یعنی فقط با متن کار نمی‌کنه، بلکه می‌تونه تصویر و سایر اطلاعات رو هم به کار ببره). این مدل با این هدف ساخته شده که تو نوشتن متن‌های بلند و مرتبط با حوزه‌هایی که نیاز به اطلاعات دقیق دارن، مثل امور مالی، حسابی کمک کنه. فرق اصلی دیپ‌رایتر اینه که به جای اینکه بره از اینترنت و منابع ناشناس اطلاعات بگیره، با یه پایگاه دانش آفلاین و حسابی ساماندهی‌شده کار می‌کنه (Offline Knowledge Base یعنی یه بانک اطلاعاتی که از قبل جمع‌آوری و گلچین شده و به اینترنت وابسته نیست!).

اما بیاین یه نگاهی به این بندازیم که دیپ‌رایتر چجوری کار می‌کنه:

  • اول، مساله رو به کارهای کوچیک‌تر تقسیم می‌کنه (به این کار می‌گن task decomposition، یعنی شکستن پروژه به بخش‌های قابل مدیریت‌تر).
  • بعد، یه فهرست یا طرح کلی از بخش‌های مختلف متن درمیاره (Outline Generation).
  • بعدش با یه سیستمی پیشرفته، اطلاعات متنی و تصویری مورد نیازش رو می‌گرده و پیدا می‌کنه (Multimodal Retrieval یعنی همزمان هم تو متن‌ها و هم تو عکس‌ها و نمودارها دنبال اطلاعات می‌گرده).
  • بعد، هر بخش رو جداگانه می‌نویسه و روش فکر می‌کنه و بازتاب می‌ده که همه‌چی دقیق و منسجم باشه (Section-by-section Composition with Reflection یعنی نوشتن هر قسمت با بازنگری و اصلاح).

از طرفی، دیپ‌رایتر یه مدل ویژه برای ساختاردهی دانش داره که اسمش Hierarchical Knowledge Representation ـه، یعنی اطلاعات رو به‌صورت سلسله‌مراتبی می‌چینه تا موقع جستجو دقیق‌تر به جواب برسه و هم سرعتش بیشتر باشه، هم خطاها کمتر.

محقق‌ها دیپ‌رایتر رو تست کردن و مخصوصاً برای نوشتن گزارش‌های مالی امتحانش کردن. نتیجه هم واقعاً جالب بوده: متنی که دیپ‌رایتر تولید کرده نه تنها دقیق‌تر و قابل استنادتر بوده، بلکه از نمونه‌های قبلی و حتی مدل‌های معروف دیگه هم حرفه‌ای‌تر و باکیفیت‌تر دراومده! یعنی هم از لحاظ فکت‌محور بودن (Factually grounded یعنی تکیه بر اطلاعات واقعی و مستند) و هم کیفیت ساختاری، خیلی بهتر عمل کرده.

در کل، دیپ‌رایتر داره نشون می‌ده که برای کارهای تخصصی و مهم، فقط کافی نیست مدل هوش مصنوعی قوی باشه؛ باید منبع اطلاعاتش هم درست و حسابی، آفلاین و قابل اطمینان باشه تا بشه بهش اعتماد کرد و نتایجش رو تو دنیای واقعی استفاده کرد! این یعنی شاید آینده نویسندگی تخصصی، حسابی به همچین ابزارهای دقیقی وابسته باشه.

منبع: +