استفاده از LSTM-RNN جهت تشخیص مکالمه

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 26

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SMARTCITYC03_112

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

فرآیند تبدیل سیگنال های گفتار به متن به عنوان تشخیص خودکار گفتار (ASR) شناخته می شود از گذشته روش های بسیاری برای ASR ابداع شده است. و مزیت هر یک از این روش های بر دیگری به دقت آن روش و منابع مورد نیاز برای به کار بستن آن روش می باشد. اخیرا رویکردهای یادگیری عمیق برای این کار به کار گرفته شده است و ثابت شده است که از رویکردهای یادگیری ماشین سنتی مانند شبکه عصبی مصنوعی(ANN) بهتر عمل می کند. به طور خاص، روش های یادگیری عمیق مانند LSTM عملکرد ASR را بهبود بخشیده اند . LSTM سنتی به چهار (۴) لایه خطی (لایه پرسپترون چند لایه (MLP)) در هر سلول با پهنای باند حافظه بزرگ برای هر مرحله زمانی توالی نیاز دارد و به همین دلیل LSTM نمی تواند بسیاری از واحدهای محاسباتی مورد نیاز برای پردازش جریان های ورودی پیوسته را در خود جای دهد زیرا سیستم پهنای باند حافظه کافی برای تغذیه واحدهای محاسباتی ندارد. در این مطالعه، یک مدل شبکه عصبی بازگشتی LSTM (RNN) برای رفع این نقص پیشنهاد شد. در مدل پیشنهادی، RNN به عنوان یک «دروازه فراموشی» در بلوک حافظه گنجانده شده است تا امکان تنظیم مجدد حالت های سلولی در ابتدای زیر دنباله ها را فراهم کند. این سیستم را قادر می سازد تا جریان های ورودی پیوسته را بدون افزایش پهنای باند مورد نیاز به طور موثر پردازش کند. در مدل پیشنهادی، معماری استاندارد شبکه LSTM برای استفاده موثر از پارامترهای مدل اصلاح شده است. برخی از مدل های مبتنی بر CNN و مدل های معادل بر روی همان مجموعه داده مورد استفاده قرار گرفتند و مدل ها با مدل پیشنهادی مقایسه شدند. LSTM-RNN درتشخیص اعداد در مجوعه داده (Data Set) اعداد انگلیسی گفتاری معیار عمومی دقت ۹۹.۳۶ درصد را ثبت کرده است و از سایر مدل های یادگیری عمیق عمکرد بهتری داشته است.

کلیدواژه ها:

تشخیص خوکار گفتار ، یادگیری تحت نظارت عمیق ، شبکه عصبی مکرر (RNN) ، LSTM ، LSTM-RNN

نویسندگان

حسن بهرادپور

دانشجوی ارشد هوش مصنوعی و رباتیکز موسسه آموزش عالی آپادانا، ایران

هاله همایونی

عضو هیئت علمی موسسه آموزش عالی آپادانا، ایران

شیما اکبری

مربی بخش کامپیوتر ، موسسه آموزش عای آپادانا، ایران