CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تاثیر خصوصیات فایل شاخص بردقت بازیابی اطلاعات

عنوان مقاله: تاثیر خصوصیات فایل شاخص بردقت بازیابی اطلاعات
شناسه ملی مقاله: IDMC03_002
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

سهیلا کرباسی - استادیار گروه کامپیوتر دانشگاه گلستان
مهدی یعقوبی - مربی کامپیوتر دانشگاه گلستان

خلاصه مقاله:
با توجه به افزایش حجم داده ها در عصر اطلاعات وقت و هزینهه قابل توجهی جهت دسته بندی و جستجوی داده ها صرف می گردد که نیاز به روش ها و مدلهای جدید داده کاوی بیش از پیش مشهود است خصوصا این نیاز در مورد وب که بزرگترین پایگاه اطلاعات عمومی است ضروری تر می نماید دراین خصوص دو عامل حجم و تنوع اطلاعات به همراه تعداد رو به رشد کاربران چالش بزرگی را در زمینه فرایند داده کاوی بوجود اورده است شایان ذکر است که یکی از فرایندهای اصلی در سیستمهای جستجوگر شاخص گذاری اطلاعات است که ارتباط مستقیم با تعداد اسناد موجوددر پایگاه دارد تحقیقات اخیر نشان میدهد که زمان شاخص گذاری با افزایش تعداد اسناد موجود در پایگاه داده به شدت افزایش می یابد تحقیق حاضر به بررس یخصوصیات اسناد یک پایگاه داده بزرگ و استاندارد شامل پرونده های جمع اوری شده از وب پرداخته است این خصوصیات شامل تعداد، نوع، و اندازه اسناد که تاثیر آنها بر ساختار فایل شاخص و فرایند شاخص گذاری مورد بررسی قرارگرفته است.

کلمات کلیدی:
داده کاوی، بازیابی اطلاعات، شاخص گذاری، ساختار فایل معکوس، حجم پایگاه داده

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108874/