CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارایه یک روش در طبقه بندی نظرات کاربران با استفاده از یادگیری ماشین و الگوریتم رای گیری

عنوان مقاله: ارایه یک روش در طبقه بندی نظرات کاربران با استفاده از یادگیری ماشین و الگوریتم رای گیری
شناسه ملی مقاله: CMTS01_263
منتشر شده در اولین کنفرانس بین المللی فناوری های نوین در علوم در سال 1396
مشخصات نویسندگان مقاله:

الهام مجیدی - گروه کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران
ایوب باقری - استادیار گروه مهندسی کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران

خلاصه مقاله:
با پیشرفت تکنولوژی و گسترش شبکه جهانی وب، وب بستر مناسبی برای آگاهی از یک محصول یا خدمات یا خرید محصول یا خدمات شده است. در بسیاری از شبکه های اجتماعی مثل اینستاگرام یا بلاگ های شخصی یا وبسایت کمپانی ها کاربران نظرات خود را راجع به یک محصول یا خدمات درج نموده اند. این نظرات از آن جهت با ارزش است که باعث جذب یا دفع مشتری بالقوه می شود یا می تواند کمپانی را در گرفتن بازخورد از یک محصول و ارایه یک محصول بهتر یا استراتژی تولید محصول جدید یاری دهد. در نتیجه حجم زیادی اطلاعات به صورت غیر ساخت یافته وجود دارد که استخراج اطلاعات دلخواه از آنها کار دشواری است. عقیده کاوی فرآیند تحلیل نظرات، عقاید و احساسات کاربران است که از نقد ها و نظراتی که در مورد یک موضوع خاص نوشته اند استخراج می شود. بیشترین و موفق ترین روش هایی که انجام شده با استفاده از روش های یادگیری ماشین است. در این مقاله، در بین انواع روش های مختلف یادگیری ماشین، از الگوریتمی ابداعی به نام رای دهی استفاده شده است. این الگوریتم از تلفیق الگوریتم های موجود و رای گرفتن از تمام آنها اقدام به جمع آوری رای ها کرده و رای خود را مطابق رای اکثریت تعیین می کند. در این الگوریتم یک سری مجموعه استاندارد نظرات کاربران در مورد فیلم ها، برای آموزش و ارزیابی الگوریتم به کار گرفته شده و این نمونه ها پیش پردازش و کلمات زاید آن ها حذف شده است. ویژگی های اساسی این نظرات به کمک روش های انتخاب واژگان انتخاب می شود و با توجه به داده های آموزشی که برچسب مثبت یا منفی دارند مشخص می گردد که کدام کلمات بار مثبت و منفی دارند سپس با استفاده از الگوریتم های پردازش زبان طبیعی همچون بیز مدل آموزشی ساخته می شود. الگوریتم هایی که با این داده های آموزشی مدل می سازند 7 مورد هستند که عبارتند از 1- بیز ساده شامل گاوسین ، مالتی نو مینال و برنولی 2- ماشین بردار پشتیبان شامل svc و svc خطی 3- مدل های خطی شامل رگرسیون منطقی و کلاسیفایر گرادیان نزولی تصادفی . حالا الگوریتم ارایه شده با نام الگوریتم رای دهی برای هر قلم داده بررسی می کند که رای اکثریت با چیست و رای خود را رای اکثریت قرار می دهد. هدف از روش پیشنهادی ارایه یک الگوریتم جدید برای شناسایی نظرات مثبت و منفی با بهترین مقادیر ارزیابی نسبت به سایر روش ها می-باشد.

کلمات کلیدی:
داده کاوی، متن کاوی، کلاس بندی متن، عقیده کاوی، نظرات آنلاین، کلاسیفایر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/673420/