CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج اطلاعات

عنوان مقاله: استخراج اطلاعات
شناسه ملی مقاله: SMARTCITYC03_134
منتشر شده در سومین کنفرانس بین المللی شهر هوشمند، چالش ها و راهبردها در سال 1402
مشخصات نویسندگان مقاله:

میترا زارع - دانشجو کارشناسی ارشد هوش مصنوعی و رباتیکز موسسه آموزش عالی آپادانا، شیراز، ایران

خلاصه مقاله:
روزانه میلیون ها سند ساختاریافته، نیمه ساختاریافته و بدون ساختار در سراسر جهان تولید می شود. استخراج اطلاعات (IE) به عنوان یک کار اصلی و یک پیوند مهم در زمینه های درک زبان طبیعی و بازیابی اطلاعات، می تواند اطلاعات چندوجهی بدون ساختار را ساختار دهی و معنایی کند.استخراج اطلاعات اشاره به استخراج خودکار اطلاعات ساختار یافته همچون موجودیت ها، روابط بین موجودیت ها، و موجودیت های توصیف ویژگی از منابع غیرساختاریافته دارد. هنگامی که داده های ساختاریافته و غیرساختاریافته با هم موجود هستند، استخراج اطلاعات، یکپارچه سازی این دو نوع منبع و اعمال جستجو بین آنها را امکان پذیر می سازد. فرآیند استخراج با ترکیبی از قوانین زبانی و تکنیک های یادگیری ماشین هدایت می شود. رویکردهای مبتنی بر قانون شامل ایجاد مجموعه ای از قوانین دست ساز برای شناسایی و استخراج اطلاعات است. از سوی دیگر، رویکردهای مبتنی بر یادگیری ماشین، بر الگوریتم های آموزشی با استفاده از مقادیر زیادی متن حاشیه نویسی تکیه می کنند تا به طور خودکار نحوه انجام استخراج را کشف کنند.استخراج خودکار اطلاعات از منابع غیر ساختار یافته راه های جدیدی را برای جستجو، سازمان دهی و تجزیه و تحلیل داده ها با بهره گیری از علم معناشناسی از پایگاه داده های ساختار یافته و داده های غیرساختاریافته گشوده است. در این مقاله، تشخیص نهادهای نام دار و موارد مشابه به طور دقیق توضیح داده و خلاصه شده است، همچنین چشم انداز استخراج اطلاعات مورد بررسی قرارگرفته است.

کلمات کلیدی:
شناسایی موجودیت نام گذاری شده ، استخراج رابطه ، استخراج رویداد

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1950387/