استفاده از کرنل rbf rbf ماشین بردار پشتیبان برای بهبود سیستم دسته بندی متون

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,353

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ03_196

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

روشن است که حجم اطلاعات فارسی روی اینترنت در حال افزایش است . این رشد عظیم اطلاعاتی، محققان را وادار می کند تا به فکر ایجاد و توسعه ابزارهایی برای مدیریت بهتر، پالایش و دسته بندی اطلاعات باشند تا بدین ترتیب، کاربر بتواند به راحتی نیازهای اطلاعاتی خود را در حداقل زمان ممکن برآورده سازد . برای مثال، کاربران اینترنت در هر زمان، نیاز به ابزارهایی دارند که ایمیل های دریافتیشان را مرتب و ایمیل های قدیمی و تکراری را پاک کنند . این ها مثال هایی از سیستم های دسته بندی متون می باشند . در این رساله، هدف اولیه ایجاد زیرساختی برای ارزیابی کارایی ماشین برداری پشتیبان به کمک الگوریتم ریشه یابی و بهبود عملکرد آن بود . برای رسیدن به این هدف، ابتدا مجموعه داده همشهری که یک مجموعه استاندارد در زبان فارسی است دانلود و برای انجام آزمایش ها آماده شد . از این مجموعه هم به عنوان مجموعه تست و هم به عنوان مجموعه آموزش استفاده شد . در ابتدا مجموعه آموزش با اعمال تقریب ا تمام تکنیک های پیش پردازش موجود از قبیل شاخص گذاری اسناد، الگوریتم ریشه یابی، حذف کلمات توقف، اعداد و همچنین استفاده از ماشین برداری پشتیبان آموزش داده شد. سپس برای ارزیابی دقت این مدل، از مجموعه تست در سه حالت تمام متن، حذف کلمات توقف و همچنین ریشه کلمات استفاده کردیم . نتایج آزمایش ها نشان داد که دقت، فراخوانی و کارایی ماشین برداری پشتیبان در حالتی که کلمات توقف از اسناد حذف شده باشند و همچنین ریشه کلمات به دست آمده باشد، نسبت به حالتی که اسناد در حالت تمام متن هستند بهبود داشته است

کلیدواژه ها:

نویسندگان

مریم یوسفیان

دانشجو، کارشناسی ارشد نرم افزار کامپیوتر، دانشگاه آزاد اسلامی خرم آباد

حسام فولادوند

استادیار، دانشکده فنی مهندسی، گروه کامپیوتر، دانشگاه آزاد اسلامی خرم آباد