طبقه بندی خودکار متون فارسی

بهاره بینا; مسعود رهگذر; آذین ده موبد

طبقه بندی خودکار متون فارسی

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 5,312

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری ماشین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/41774

شناسه ملی سند علمی:

ACCSI13_180

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

طبقه بندی خودکار متون از موارد کاربرد الگوریتمهای یادگیری ماشینی در مبحث بازیابی اطلاعات میباشد. در این مقاله نیز نتایج طبقه بندی خودکار متون فارسی با استفاده از معیارهای شاخصگذاری3 -gram, ٤-gram و کلمه ارائه شدهاست . در ضمن نتایج در دو حالت با حذفstop word و بدون حذف stop word های متون نیز مقایسه شدهاند. به منظور دستهبندی متون از الگوریتم یادگیری ماشینی نزدیکترینk همسایه همسایه استفاده شده است و در نهایت به منظور ارزیابی و مقایسه نتایج، دو معیار دقت و یادآوری برای هر روش شاخصگذاری نیز محاسبه شدهاند. نتایج بدست آمده نشان داد که بهترین روش شاخصگذاری متون فارسیgram میباشد و حذف stop word ها نتایج را اندکی بهبود میبخشد.

کلیدواژه ها:

طبقه بندی متن فارسی ، شاخص گذاری n-gram ، الگوریتم یادگیری ماشینی ، نزدیکترینk همسایه

نویسندگان

بهاره بینا

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

مسعود رهگذر

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

آذین ده موبد

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Alireza Mokhtaripour, Saber Jahanpour "Introduction to ACM اه15 _ nevv ...
Fabriz Sebastiani, Machine Learning in Text Catego rization, ACM Computing ...
Kjersti Aas, Line Eikvil, Text Catego rization: _ Survey , ...
Laila Khreisat, Arabic Text Classification Using N-Gram Frequency Statistics, Tech. ...
Teresa Goncalves, Paulo Quaresma, Evaluating preprocessing techniques in a text ...
Yang, Y., Pedersen J.P. A Comparative Study on Feature Selection ...
Peter Nather, N-gram Based Text Ca tegorization, Diploma thesis, 2005 ...
W. B. Cavnar and J. M. Trenkle, N-gram-based text categorization. ...
Andras Kornai, J.Micheal Richards, Linear Discriminant Text Classification in High ...
Helmut Berger, Dieter Merkl, A Comparision of Text- Ca tegorization ...
Darrudi, E., Hejazi, M. R, Oroumchian, F. Assessment of a ...
Hadi Amiri, Abolfazl AleAhmad, Farhad Oroumchian, Caro Lucas, Masoud Rahgozar, ...
Abolfazl Aleahmad, Parsia Hakimian, Farzad Mahdikhani and Farhad O roumchian. ...
G. K. Zipf, ،Huran Behavior and the Principle of Least ...
Ciya Liao, Shamim Alpha, Paul Dixon, Feature Preparation in Text ...
Thorsten Joachims, Text Ca tegorization with Support Vector Machines ...

نمایش کامل مراجع