Prediksi Kelulusan Siswa Sekolah Menengah Menggunakan XGBoost dan Analisis Feature Importance

Authors

  • Luthfia Nurma Hapsari Universitas Tiga Serangkai
  • Dziky Ridhwanullah Universitas Tiga Serangkai
  • Miftakhurrokhmat Miftakhurrokhmat STMIK AMIKOM Surakarta

DOI:

10.33395/jmp.v15i2.15782

Keywords:

educational data mining, feature importance, prediksi kelulusan siswa, student performance, XGBoost

Abstract

Prediksi performa akademik (student performance) siswa sekolah menengah merupakan bagian penting dalam kajian educational data mining untuk mendukung pengambilan keputusan pendidikan dan perancangan intervensi dini bagi siswa berisiko gagal. Pendekatan machine learning telah banyak digunakan untuk prediksi kelulusan siswa, namun sebagian besar penelitian masih berfokus pada akurasi model dan kurang menekankan aspek interpretabilitas hasil prediksi. Padahal, pemahaman faktor-faktor yang memengaruhi kelulusan sangat dibutuhkan oleh praktisi pendidikan. Penelitian ini bertujuan membangun model prediksi kelulusan siswa sekolah menengah menggunakan algoritma XGBoost serta mengidentifikasi fitur-fitur paling berpengaruh melalui analisis feature importance sebagai dasar rekomendasi intervensi pendidikan. Metode penelitian ini berada dalam konteks educational data mining dengan memanfaatkan dataset Student Performance dari UCI Machine Learning Repository yang terdiri dari 395 siswa dan mencakup variabel akademik, sosial, serta demografis. Data diproses melalui encoding fitur kategorikal dan pembagian data secara stratified dengan rasio 80:20. Model XGBoost dilatih dan dievaluasi menggunakan metrik accuracy, precision, recall, dan F1-score, dengan perhatian khusus pada kelas minoritas siswa berisiko gagal. Hasil evaluasi menunjukkan bahwa model mencapai accuracy sebesar 0,71 dan Macro F1-score sebesar 0,63. Analisis feature importance mengidentifikasi jumlah kegagalan sebelumnya, status wali, dukungan pendidikan tambahan, dan jumlah ketidakhadiran sebagai faktor paling berpengaruh terhadap prediksi kelulusan siswa. Kesimpulan yang diperoleh model XGBoost mampu memberikan prediksi kelulusan siswa yang memadai dalam analisis student performance, sekaligus menyediakan interpretasi fitur yang informatif. Integrasi pendekatan educational data mining dengan analisis feature importance menjadikan model ini aplikatif sebagai alat bantu pengambilan keputusan dan perancangan intervensi pendidikan berbasis data.

GS Cited Analysis

Downloads

How to Cite

Hapsari, L. N. ., Ridhwanullah, D. ., & Miftakhurrokhmat, M. (2026). Prediksi Kelulusan Siswa Sekolah Menengah Menggunakan XGBoost dan Analisis Feature Importance. Jurnal Minfo Polgan, 15(2), 954-960. https://doi.org/10.33395/jmp.v15i2.15782