استخراج اطلاعات

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 38

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SMARTCITYC03_134

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

روزانه میلیون ها سند ساختاریافته، نیمه ساختاریافته و بدون ساختار در سراسر جهان تولید می شود. استخراج اطلاعات (IE) به عنوان یک کار اصلی و یک پیوند مهم در زمینه های درک زبان طبیعی و بازیابی اطلاعات، می تواند اطلاعات چندوجهی بدون ساختار را ساختار دهی و معنایی کند.استخراج اطلاعات اشاره به استخراج خودکار اطلاعات ساختار یافته همچون موجودیت ها، روابط بین موجودیت ها، و موجودیت های توصیف ویژگی از منابع غیرساختاریافته دارد. هنگامی که داده های ساختاریافته و غیرساختاریافته با هم موجود هستند، استخراج اطلاعات، یکپارچه سازی این دو نوع منبع و اعمال جستجو بین آنها را امکان پذیر می سازد. فرآیند استخراج با ترکیبی از قوانین زبانی و تکنیک های یادگیری ماشین هدایت می شود. رویکردهای مبتنی بر قانون شامل ایجاد مجموعه ای از قوانین دست ساز برای شناسایی و استخراج اطلاعات است. از سوی دیگر، رویکردهای مبتنی بر یادگیری ماشین، بر الگوریتم های آموزشی با استفاده از مقادیر زیادی متن حاشیه نویسی تکیه می کنند تا به طور خودکار نحوه انجام استخراج را کشف کنند.استخراج خودکار اطلاعات از منابع غیر ساختار یافته راه های جدیدی را برای جستجو، سازمان دهی و تجزیه و تحلیل داده ها با بهره گیری از علم معناشناسی از پایگاه داده های ساختار یافته و داده های غیرساختاریافته گشوده است. در این مقاله، تشخیص نهادهای نام دار و موارد مشابه به طور دقیق توضیح داده و خلاصه شده است، همچنین چشم انداز استخراج اطلاعات مورد بررسی قرارگرفته است.

کلیدواژه ها:

شناسایی موجودیت نام گذاری شده ، استخراج رابطه ، استخراج رویداد

نویسندگان

میترا زارع

دانشجو کارشناسی ارشد هوش مصنوعی و رباتیکز موسسه آموزش عالی آپادانا، شیراز، ایران