A Weighted Approach for Feature Selection in High-Dimensional and Incomplete Data

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 24

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG05_131

تاریخ نمایه سازی: 9 اردیبهشت 1403

چکیده مقاله:

A recently encountered challenge in data science and more specifically in machine learning is growing amount of data. Exclusion of superfluous data and thereby focusing on essential variables, known as feature selection, proves vital for model performance optimization. This study undertakes a thorough investigation into pivotal feature selection strategies. The benefits and limitations of each method is clearly stated. An advanced methodology is also presented for tackling incomplete datasets, alongside introducing an innovative hybrid model that unites the Partial Mutual Information Criterion (PMIC), state-of-the-art null value completion strategies and neural network synergies to improve feature selection processes. Moreover, a newly defined benchmark, rational success weight is defined to certify the efficiency of our proposed algorithm in selecting relevant features. Finally, the suggested strategy is implemented in Python and numerical test results are reported on randomly generated data sets.

نویسندگان

Behrang Ebrahimi

Department of Engineering Sciences, University of Tehran, Tehran, Iran

Negin Bagherpour

Department of Engineering Sciences, University of Tehran, Tehran, Iran