تا حالا شده بخوای یه متن تخصصی بنویسی، مثلاً درباره مسائل مالی یا پزشکی یا حتی حقوقی، اما حس کنی اطلاعات دقیق کم داری یا اصلاً نمیدونی از کجا شروع کنی؟ خب، الان کلی مدل معروف هوش مصنوعی هستن که اسمشون Large Language Models یا همون LLMsـه (یعنی مدلهای زبانی بزرگ که میتونن متن تولید کنن)، ولی مشکلشون اینه که تو حوزههای خیلی تخصصی معمولاً کم میارن یا حتی ممکنه یه سری اطلاعات اشتباه تحویلت بدن (این اتفاق رو بهش میگن hallucination، یعنی مدل یه چیزایی از خودش درمیاره که واقعیت نداره!).
برای حل این قضیه، تا حالا چندتا راهحل مختلف پیشنهاد شده. مثلاً Retrieval-Augmented Generation یا به اختصار RAG که یعنی مدل میره حین تولید متن، یه سری اطلاعات رو از قبل جمعآوری میکنه و بعد متن رو بر اساس اون مینویسه. این روش باحالِ ولی وقتی retrieval یا همون بازیابی چند مرحلهای میشه، ممکنه یه جورایی اطلاعات با هم جور درنیاد و نتیجه نهایی یکدست و منسجم نباشه. از اون طرف، یه روش دیگه هم هست که مدل میره آنلاین سرچ میکنه و بر اساس نتیجه سرچ متن تولید میکنه؛ اما خب محتواهای اینترنت همیشه مطمئن و باکیفیت نیستن و گاهی میتونه دردسرساز بشه.
حالا این وسط DeepWriter اومده وارد میدون شده! دیپرایتر یک دستیار نویسندگی چندرسانهای ـه (Multimodal یعنی فقط با متن کار نمیکنه، بلکه میتونه تصویر و سایر اطلاعات رو هم به کار ببره). این مدل با این هدف ساخته شده که تو نوشتن متنهای بلند و مرتبط با حوزههایی که نیاز به اطلاعات دقیق دارن، مثل امور مالی، حسابی کمک کنه. فرق اصلی دیپرایتر اینه که به جای اینکه بره از اینترنت و منابع ناشناس اطلاعات بگیره، با یه پایگاه دانش آفلاین و حسابی ساماندهیشده کار میکنه (Offline Knowledge Base یعنی یه بانک اطلاعاتی که از قبل جمعآوری و گلچین شده و به اینترنت وابسته نیست!).
اما بیاین یه نگاهی به این بندازیم که دیپرایتر چجوری کار میکنه:
- اول، مساله رو به کارهای کوچیکتر تقسیم میکنه (به این کار میگن task decomposition، یعنی شکستن پروژه به بخشهای قابل مدیریتتر).
- بعد، یه فهرست یا طرح کلی از بخشهای مختلف متن درمیاره (Outline Generation).
- بعدش با یه سیستمی پیشرفته، اطلاعات متنی و تصویری مورد نیازش رو میگرده و پیدا میکنه (Multimodal Retrieval یعنی همزمان هم تو متنها و هم تو عکسها و نمودارها دنبال اطلاعات میگرده).
- بعد، هر بخش رو جداگانه مینویسه و روش فکر میکنه و بازتاب میده که همهچی دقیق و منسجم باشه (Section-by-section Composition with Reflection یعنی نوشتن هر قسمت با بازنگری و اصلاح).
از طرفی، دیپرایتر یه مدل ویژه برای ساختاردهی دانش داره که اسمش Hierarchical Knowledge Representation ـه، یعنی اطلاعات رو بهصورت سلسلهمراتبی میچینه تا موقع جستجو دقیقتر به جواب برسه و هم سرعتش بیشتر باشه، هم خطاها کمتر.
محققها دیپرایتر رو تست کردن و مخصوصاً برای نوشتن گزارشهای مالی امتحانش کردن. نتیجه هم واقعاً جالب بوده: متنی که دیپرایتر تولید کرده نه تنها دقیقتر و قابل استنادتر بوده، بلکه از نمونههای قبلی و حتی مدلهای معروف دیگه هم حرفهایتر و باکیفیتتر دراومده! یعنی هم از لحاظ فکتمحور بودن (Factually grounded یعنی تکیه بر اطلاعات واقعی و مستند) و هم کیفیت ساختاری، خیلی بهتر عمل کرده.
در کل، دیپرایتر داره نشون میده که برای کارهای تخصصی و مهم، فقط کافی نیست مدل هوش مصنوعی قوی باشه؛ باید منبع اطلاعاتش هم درست و حسابی، آفلاین و قابل اطمینان باشه تا بشه بهش اعتماد کرد و نتایجش رو تو دنیای واقعی استفاده کرد! این یعنی شاید آینده نویسندگی تخصصی، حسابی به همچین ابزارهای دقیقی وابسته باشه.
منبع: +