تشخیص ناهنجاریهای اطلاعاتی بااستفاده از یک الگوریتم خوشه بندی موازی

محمد خودی زاده نهاری; محمدکاظم اکبری

تشخیص ناهنجاریهای اطلاعاتی بااستفاده از یک الگوریتم خوشه بندی موازی

محل انتشار: دومین کنفرانس داده کاوی ایران

سال انتشار: 1387

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,174

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/70535

شناسه ملی سند علمی:

IDMC02_145

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

ناهنجاری اطلاعاتی به آن دسته از اطلاعات گفته می شود که بنحو بارزی با بقیه اطلاعات متفاوت باشد. تشخیص ناهنجاریها کاربردهای مختلفی دارد: مانند تشخیص تقلبهای کارتهای اعتباری و پولشویی، تحقیقات پزشکی ، پیش بینی وضع هوا، بازاریابی و تقسیم بندی مشتریان، برای تشخیص ناهنجاریها ابزارهای متفاوتی وجود دارد: از جمله می توان به داده کاوی اشاره کرد که سعی در استخراج دانشهای مفید از میان انبوه اطلاعات دارد. یکی از مهمترین تکنیکهای داده کاوی، خوشه بندی است که مجموع داده ها را به گروه هایی تقسیم می کند بطوریکه عناصر داخل هر گروه بیشترین شباهت را با هم و کمترین شباهت را با سایر اعضای گروههای دیگر داشته باشند. خوشه های با چگالی کم و فاصله زیاد از بقیه ناهنجاری محسوب می شوند. حجم زیاد و توزیع شدگی اطلاعات از جمله مسائلی هستند که همواره مشکلاتی برای الگوریتم های تشخیص ناهنجاری ایجاد می کنند. در این مقاله ابتدا یک الگوریتم خوشه بندی موازی بنام «K-window» موازی را معرفی کرده و سپس آن را بمنظور مقابله با حجم زیاد و توزیع شدگی اطلاعات و در جهت تشخیص ناهنجاریها بهبود می دهیم. برای این منظور گره های پردازشگر را در یک ساختار سلسله مراتبی سازماندهی می کنیم تا ترافیک اطلاعاتی را کنترل کنیم. از آنجایی که هدف تشخیص داده های غیر طبیعی است. داده های طبیعی را در هر مرحله تشخیص داده و حذف می کنیم تا ترافیک اطلاعاتی را کاهش دهیم از طرف دیگر انتخاب هوشمندانه پنجره های اولیه و نیز تشخیص خوشه هایی با اشکال نامنظم توان الگوریتم را بالا برده است. با استفاده از یک مکانیزم جدید از همپوشانی بیش از حد خوشه ها جلوگیری می کنیم و با ادغام خوشه ها اساس نزدیکی مرز خوشه ها با همدیگر، سرعت مرحله ادغام را نیز بالا برده ایم. نتایج آزمایشات مانشان میدهد که کلیه تغییر ات انجام یافته در الگوریتم پایه، باعث بالارفتن کارایی گشته است بطوریکه با حذف آنها نتایج بسیار ضعیفی حاصل می شود.

کلیدواژه ها:

الگوریتم های موازی ، تشخیص ناهنجاریهای اطلاعاتی ، خوشه بندی ، داده کاوی

نویسندگان

محمد خودی زاده نهاری

محمدکاظم اکبری