CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی روش های LDA و LSA و PLSA در متن کاوی

عنوان مقاله: بررسی روش های LDA و LSA و PLSA در متن کاوی
شناسه ملی مقاله: COMCONF04_047
منتشر شده در چهارمین کنفرانس بین المللی مهندسی برق و کامپیوتر در سال 1395
مشخصات نویسندگان مقاله:

مهدی نظری - گروه کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی، کرمانشاه، ایران
مریم حبیبی - عضو هیات علمی دانشگاه آزاد اسلامی واحد کرمانشاه، کرمانشاه، ایران

خلاصه مقاله:
امروزه اسناد و مقالات حجم عظیمی از اطلاعات در اینترنت را تشکیل می دهند. می توان گفت استفاده و بهره مندی کامل از تمام این اطلاعات تقریبا غیر ممکن می باشد. متن کاوی روشی برای استخراج اطلاعاتی است که به صورتغیر ساخت یافته نامرتب و نیمه ساخت یافته از این حجم اطلاعات می باشد. تشخیص طبقه، رده یا موضوع یک متن ناشناخته و تخصیص آن به دسته ی تشخیص داده شده را دسته بندی متون می گویند. دست بندی متون یکی ازنمودهای داده کاوی متون می باشد. بحث های زیادی در ارتباط با سازماندهی متون و بایگانی برای مقاصد شخصی، سازمانی، یا ساختارهای حقوقی مبتنی بر متن از طریق تکنیکهای دسته بندی متون انجام شده است. ما در این مقاله می خواهیم متن کاوی را بررسی کنیم و همچنین به بررسی روش هایی که کار کاوش متن را به صورت سریعتری انجام می دهند می پردازیم و که این روش های متن کاوی با توابع ریاضی کار کاوش متن را انجام می دهند

کلمات کلیدی:
متن کاوی، دسته بندی متن، LDA ، LSA ، PLSA

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/608919/