طبقه بندی خودکار متون فارسی
محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 5,312
متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI13_180
تاریخ نمایه سازی: 25 آبان 1386
چکیده مقاله:
طبقه بندی خودکار متون از موارد کاربرد الگوریتمهای یادگیری ماشینی در مبحث بازیابی اطلاعات میباشد. در این مقاله نیز نتایج طبقه بندی خودکار متون فارسی با استفاده از معیارهای شاخصگذاری3 -gram, ٤-gram و کلمه ارائه شدهاست . در ضمن نتایج در دو حالت با حذفstop word و بدون حذف stop word های متون نیز مقایسه شدهاند. به منظور دستهبندی متون از الگوریتم یادگیری ماشینی نزدیکترینk همسایه همسایه استفاده شده است و در نهایت به منظور ارزیابی و مقایسه نتایج، دو معیار دقت و یادآوری برای هر روش شاخصگذاری نیز محاسبه شدهاند. نتایج بدست آمده نشان داد که بهترین روش شاخصگذاری متون فارسیgram میباشد و حذف stop word ها نتایج را اندکی بهبود میبخشد.
کلیدواژه ها:
نویسندگان
بهاره بینا
قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک
مسعود رهگذر
قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک
آذین ده موبد
قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :