مدلی جدید برپایه معماری کدگذار-کدگشا و سازوکار توجه برای خلاصه سازی چکیده ای خودکار متون

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 48

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_AICTI-14-51_002

تاریخ نمایه سازی: 29 آذر 1402

چکیده مقاله:

با گسترش وب و در دسترس قرار گرفتن حجم زیادی از اطلاعات در قالب اسناد متنی ، توسعه سیستم های خودکار خلاصه سازی متون به عنوان یکی از موضوعات مهم در پردازش زبان های طبیعی در مرکز توجه محققان قرار گرفته است. البته با معرفی روش های یادگیری عمیق در حوزه پردازش متن، خلاصه سازی متون نیز وارد فاز جدیدی از توسعه شده و در سال های اخیر نیز استخراج خلاصه چکیده ای از متن با پیشرفت قابل توجهی مواجه شده است. اما می توان ادعا کرد که تاکنون از همه ظرفیت شبکه های عمیق برای این هدف استفاده نشده است و نیاز به پیشرفت در این حوزه توامان با در نظر گرفتن ویژگی های شناختی همچنان احساس می شود. در این راستا، در این مقاله یک مدل دنباله ای مجهز به سازوکار توجه کمکی برای خلاصه سازی چکیده ای متون معرفی شده است که نه تنها از ترکیب ویژگی های زبانی و بردارهای تعبیه به عنوان ورودی مدل یادگیری بهره می برد بلکه برخلاف مطالعات پیشین که همواره از سازوکار توجه در بخش کد گذار استفاده می کردند، از سازوکار توجه کمکی در بخش کدگذار استفاده می کند. به کمک سازوکار توجه کمکی معرفی شده که از سازوکار ذهن انسان هنگام تولید خلاصه الهام می گیرد، بجای اینکه کل متن ورودی کدگذاری شود، تنها قسمت های مهم تر متن کدگذاری شده و در اختیار کدگشا برای تولید خلاصه قرار می گیرند. مدل پیشنهادی همچنین از یک سوئیچ به همراه یک حد آستانه در کدگشا برای غلبه بر مشکل با کلمات نادر بهره می برد. مدل پیشنهادی این مقاله روی دو مجموعه داده CNN/Daily Mail و DUC-۲۰۰۴ مورد آزمایش قرار گرفت. بر اساس نتایج حاصل از آزمایش ها و معیار ارزیابی ROUGE، مدل پیشنهادی از دقت بالاتری نسبت به سایر روش های موجود برای تولید خلاصه چکیده ای روی هر دو مجموعه داده برخوردار است.

نویسندگان

امیرمسعود رحمانی

دانشیار دانشکده مهندسی کامپی