Optimalisasi Akurasi Naïve Bayes Menggunakan Seleksi Atribut Relief-F dan Gain Ratio
DOI:
10.33395/jmp.v15i2.16112Keywords:
Algoritma Klasifikasi, Data Mining, Gain Ratio, Naive Bayes Classifier, Relief-F, Seleksi AtributAbstract
Naïve Bayes Classifier (NBC) merupakan salah satu algoritma klasifikasi probabilistik yang paling banyak digunakan dalam data mining karena kesederhanaan dan efisiensinya. Namun, performa NBC cenderung menurun ketika dataset mengandung atribut yang tidak relevan atau mengandung noise. Penelitian ini bertujuan menganalisis pengaruh seleksi atribut menggunakan metode Relief-F dan Gain Ratio terhadap peningkatan akurasi NBC. Dua dataset dari UCI Machine Learning Repository digunakan sebagai bahan pengujian: dataset House Vote (435 data, atribut simbolik) dan dataset Bank Marketing (45.211 data, atribut numerik dan kategorikal). Tiga skenario eksperimen diterapkan pada masing-masing dataset: (1) NBC tanpa seleksi atribut sebagai baseline, (2) NBC dengan seleksi atribut Relief-F, dan (3) NBC dengan seleksi atribut Gain Ratio. Evaluasi performa menggunakan 10-fold cross-validation dengan metrik akurasi, presisi, recall, F1-score, dan confusion matrix. Hasil penelitian menunjukkan bahwa pada dataset House Vote, Relief-F berhasil meningkatkan akurasi NBC dari 90,11% menjadi 93,79% (+3,68%), sedangkan Gain Ratio justru menurunkan akurasi menjadi 89,43%. Pada dataset Bank Marketing, Relief-F meningkatkan akurasi menjadi 89,36% dan memperbaiki recall kelas minoritas dari 29,34% menjadi 35,71%, sementara Gain Ratio hanya memberikan peningkatan marginal. Secara keseluruhan, Relief-F terbukti lebih efektif dibandingkan Gain Ratio dalam meningkatkan performa NBC, khususnya pada dataset dengan pola klasifikasi yang jelas dan distribusi kelas yang tidak seimbang.
How to Cite
Issue
Section
License
Copyright (c) 2026 Agung RM Alam, Wanayumini, Lili Tanti

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.










