استفاده از کرنل rbf rbf ماشین بردار پشتیبان برای بهبود سیستم دسته بندی متون

مریم یوسفیان; حسام فولادوند

استفاده از کرنل rbf rbf ماشین بردار پشتیبان برای بهبود سیستم دسته بندی متون

محل انتشار: سومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,353

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/657991

شناسه ملی سند علمی:

BPJ03_196

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

روشن است که حجم اطلاعات فارسی روی اینترنت در حال افزایش است . این رشد عظیم اطلاعاتی، محققان را وادار می کند تا به فکر ایجاد و توسعه ابزارهایی برای مدیریت بهتر، پالایش و دسته بندی اطلاعات باشند تا بدین ترتیب، کاربر بتواند به راحتی نیازهای اطلاعاتی خود را در حداقل زمان ممکن برآورده سازد . برای مثال، کاربران اینترنت در هر زمان، نیاز به ابزارهایی دارند که ایمیل های دریافتیشان را مرتب و ایمیل های قدیمی و تکراری را پاک کنند . این ها مثال هایی از سیستم های دسته بندی متون می باشند . در این رساله، هدف اولیه ایجاد زیرساختی برای ارزیابی کارایی ماشین برداری پشتیبان به کمک الگوریتم ریشه یابی و بهبود عملکرد آن بود . برای رسیدن به این هدف، ابتدا مجموعه داده همشهری که یک مجموعه استاندارد در زبان فارسی است دانلود و برای انجام آزمایش ها آماده شد . از این مجموعه هم به عنوان مجموعه تست و هم به عنوان مجموعه آموزش استفاده شد . در ابتدا مجموعه آموزش با اعمال تقریب ا تمام تکنیک های پیش پردازش موجود از قبیل شاخص گذاری اسناد، الگوریتم ریشه یابی، حذف کلمات توقف، اعداد و همچنین استفاده از ماشین برداری پشتیبان آموزش داده شد. سپس برای ارزیابی دقت این مدل، از مجموعه تست در سه حالت تمام متن، حذف کلمات توقف و همچنین ریشه کلمات استفاده کردیم . نتایج آزمایش ها نشان داد که دقت، فراخوانی و کارایی ماشین برداری پشتیبان در حالتی که کلمات توقف از اسناد حذف شده باشند و همچنین ریشه کلمات به دست آمده باشد، نسبت به حالتی که اسناد در حالت تمام متن هستند بهبود داشته است

کلیدواژه ها:

ماشین بردار پشتیبان ، دسته بندی اسناد ، سیستم های دسته بندی

نویسندگان

مریم یوسفیان

دانشجو، کارشناسی ارشد نرم افزار کامپیوتر، دانشگاه آزاد اسلامی خرم آباد

حسام فولادوند

استادیار، دانشکده فنی مهندسی، گروه کامپیوتر، دانشگاه آزاد اسلامی خرم آباد