Optimalisasi Akurasi Naïve Bayes Menggunakan Seleksi Atribut Relief-F dan Gain Ratio

Agung RM  Alam; Wanayumini Wanayumini; Lili Tanti

doi:10.33395/jmp.v15i2.16112

Authors

Agung RM Alam Universitas Potensi Utama
Wanayumini Wanayumini Universitas Potensi Utama
Lili Tanti Universitas Potensi Utama

DOI:

10.33395/jmp.v15i2.16112

Keywords:

Algoritma Klasifikasi, Data Mining, Gain Ratio, Naive Bayes Classifier, Relief-F, Seleksi Atribut

Abstract

Naïve Bayes Classifier (NBC) merupakan salah satu algoritma klasifikasi probabilistik yang paling banyak digunakan dalam data mining karena kesederhanaan dan efisiensinya. Namun, performa NBC cenderung menurun ketika dataset mengandung atribut yang tidak relevan atau mengandung noise. Penelitian ini bertujuan menganalisis pengaruh seleksi atribut menggunakan metode Relief-F dan Gain Ratio terhadap peningkatan akurasi NBC. Dua dataset dari UCI Machine Learning Repository digunakan sebagai bahan pengujian: dataset House Vote (435 data, atribut simbolik) dan dataset Bank Marketing (45.211 data, atribut numerik dan kategorikal). Tiga skenario eksperimen diterapkan pada masing-masing dataset: (1) NBC tanpa seleksi atribut sebagai baseline, (2) NBC dengan seleksi atribut Relief-F, dan (3) NBC dengan seleksi atribut Gain Ratio. Evaluasi performa menggunakan 10-fold cross-validation dengan metrik akurasi, presisi, recall, F1-score, dan confusion matrix. Hasil penelitian menunjukkan bahwa pada dataset House Vote, Relief-F berhasil meningkatkan akurasi NBC dari 90,11% menjadi 93,79% (+3,68%), sedangkan Gain Ratio justru menurunkan akurasi menjadi 89,43%. Pada dataset Bank Marketing, Relief-F meningkatkan akurasi menjadi 89,36% dan memperbaiki recall kelas minoritas dari 29,34% menjadi 35,71%, sementara Gain Ratio hanya memberikan peningkatan marginal. Secara keseluruhan, Relief-F terbukti lebih efektif dibandingkan Gain Ratio dalam meningkatkan performa NBC, khususnya pada dataset dengan pola klasifikasi yang jelas dan distribusi kelas yang tidak seimbang.

GS Cited Analysis