Prediksi Kelulusan Siswa Sekolah Menengah Menggunakan XGBoost dan Analisis Feature Importance
DOI:
10.33395/jmp.v15i2.15782Keywords:
educational data mining, feature importance, prediksi kelulusan siswa, student performance, XGBoostAbstract
Prediksi performa akademik (student performance) siswa sekolah menengah merupakan bagian penting dalam kajian educational data mining untuk mendukung pengambilan keputusan pendidikan dan perancangan intervensi dini bagi siswa berisiko gagal. Pendekatan machine learning telah banyak digunakan untuk prediksi kelulusan siswa, namun sebagian besar penelitian masih berfokus pada akurasi model dan kurang menekankan aspek interpretabilitas hasil prediksi. Padahal, pemahaman faktor-faktor yang memengaruhi kelulusan sangat dibutuhkan oleh praktisi pendidikan. Penelitian ini bertujuan membangun model prediksi kelulusan siswa sekolah menengah menggunakan algoritma XGBoost serta mengidentifikasi fitur-fitur paling berpengaruh melalui analisis feature importance sebagai dasar rekomendasi intervensi pendidikan. Metode penelitian ini berada dalam konteks educational data mining dengan memanfaatkan dataset Student Performance dari UCI Machine Learning Repository yang terdiri dari 395 siswa dan mencakup variabel akademik, sosial, serta demografis. Data diproses melalui encoding fitur kategorikal dan pembagian data secara stratified dengan rasio 80:20. Model XGBoost dilatih dan dievaluasi menggunakan metrik accuracy, precision, recall, dan F1-score, dengan perhatian khusus pada kelas minoritas siswa berisiko gagal. Hasil evaluasi menunjukkan bahwa model mencapai accuracy sebesar 0,71 dan Macro F1-score sebesar 0,63. Analisis feature importance mengidentifikasi jumlah kegagalan sebelumnya, status wali, dukungan pendidikan tambahan, dan jumlah ketidakhadiran sebagai faktor paling berpengaruh terhadap prediksi kelulusan siswa. Kesimpulan yang diperoleh model XGBoost mampu memberikan prediksi kelulusan siswa yang memadai dalam analisis student performance, sekaligus menyediakan interpretasi fitur yang informatif. Integrasi pendekatan educational data mining dengan analisis feature importance menjadikan model ini aplikatif sebagai alat bantu pengambilan keputusan dan perancangan intervensi pendidikan berbasis data.
Downloads
How to Cite
Issue
Section
License
Copyright (c) 2026 Luthfia Nurma Hapsari, Dziky Ridhwanullah, Miftakhurrokhmat Miftakhurrokhmat

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.










