Klasifikasi Status Mahasiswa Berisiko Drop Out Menggunakan Decision Tree C5.0 dengan Seleksi Fitur

Classification of Student Drop Out Risk Using Decision Tree C5.0 with Feature Selection

Authors

  • Farisyah Lutfiah Hanis Universitas Jambi
  • Ulfa Khaira Universitas Jambi
  • Daniel Arsa Universitas Jambi

DOI:

https://doi.org/10.57152/malcom.v5i4.2239

Keywords:

C5.0, Decision Tree, Drop Out, Klasifikasi, Mutual Information, Seleksi Fitur

Abstract

Penelitian ini bertujuan untuk membandingkan performa algoritma Decision Tree C5.0 dengan dan tanpa seleksi fitur Mutual Information dalam klasifikasi mahasiswa berisiko drop out. Data yang digunakan mencakup mahasiswa S1 angkatan 2018–2023 dengan atribut performa akademik tiap semester serta aktivitas tugas akhir mahasiswa. Tahapan pengolahan data meliputi seleksi data, pembersihan, pelabelan, dan penanganan data tidak seimbang menggunakan Random Undersampling. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan f1-score. Hasil penelitian menunjukkan bahwa pada mahasiswa angkatan 2022–2023, model tanpa seleksi fitur menghasilkan akurasi sebesar 87,14%, dan meningkat menjadi 88,57% setelah penerapan seleksi fitur. Sementara itu, pada mahasiswa angkatan 2018–2021, akurasi model tanpa seleksi fitur mencapai 93,04% dan meningkat menjadi 94,30% dengan penerapan seleksi fitur. Faktor dominan yang memengaruhi klasifikasi berbeda pada masing-masing kelompok, di mana jumlah absen menjadi indikator utama pada mahasiswa angkatan 2022–2023, sedangkan durasi pengerjaan tugas akhir lebih berpengaruh pada mahasiswa angkatan 2018–2021.

Downloads

Download data is not yet available.

References

A. Kurniasih and K. Isyara, “Penggunaan Metode SMOTE pada Naïve Bayes Gaussian untuk Klasifikasi Mahasiswa Drop Out,” 2023, Accessed: Dec. 16, 2024. [Online]. Available: https://conference.upnvj.ac.id/index.php/senamika/article/view/2585/1937

BANPT, BANPT. 2019. Accessed: Dec. 16, 2024. [Online]. Available: https://www.banpt.or.id/wp-content/uploads/2019/09/Lampiran-02-PerBAN-PT-3-2019-Kriteria-dan-Prosedur-IAPT-3_0.pdf

Permendikbud No. 49 Tahun 2014 tentang Standar Nasional Pendidikan Tinggi (SNPT). 2014. Accessed: Dec. 02, 2024. [Online]. Available: https://peraturan.go.id/id/permendikbud-no-49-tahun-2014

https://dashboard.unja.ac.id/.” Accessed: Feb. 19, 2025. [Online]. Available: https://dashboard.unja.ac.id/

M. C. Pascoe, S. E. Hetrick, and A. G. Parker, “The impact of stress on students in secondary school and higher education,” Int J Adolesc Youth, vol. 25, no. 1, pp. 104–112, Dec. 2020, doi: 10.1080/02673843.2019.1596823.

A. W. Abdullah and A. Muhid, “Social Support, Academic Satisfaction, and Student Drop Out Tendency/ Dukungan Sosial, Academic Satisfaction, dan Kecenderungan Drop Out pada Mahasiswa,” Psikoislamika?: Jurnal Psikologi dan Psikologi Islam, vol. 18, no. 1, pp. 174–187, Jun. 2021, doi: 10.18860/psikoislamika.v18i1.11546.

N. Ulinnuha and A. Fanani, “Klasifikasi Status Drop Out Mahasiswa Menggunakan Naïve Bayes dengan Seleksi Fitur Information Gain,” Techno.Com, vol. 22, no. 4, pp. 1014–1025, Nov. 2023, doi: 10.33633/tc.v22i4.9004.

P. W. Rahayu et al., “Buku Ajar Data Mining,” 2024. [Online]. Available: https://www.researchgate.net/publication/377415198

E. Prasetyo, Data mining mengolah data menjadi informasi menggunakan matlab. 2014.

L. Karlitasari, I. W. Sriyasa, I. Wahyudi, and H. B. Santosi, “Prediksi Morfologi Jamur Menggunakan Algoritma C5.0,” 2023.

N. L. W. S. R. Ginantra, F. N. Arifah, and A. H. Wijaya, Data Mining dan Penerapan Algoritma. Yayasan Kita Menulis, 2021. Accessed: Jan. 01, 2025. [Online]. Available: http://repo.handayani.ac.id/148/1/1.2%20FullBook%20Data%20Mining%20dan%20Penerapan%20Algoritma.pdf

J. R. Vergara and P. Estévez, “A review of feature selection methods based on mutual information,” Jan. 2014. doi: 10.1007/s00521-013-1368-0.

E. Hariyanti, D. P. Hostiadi, Anggreni, Yohanes Priyo Atmojo, I Made Darma Susila, and I. Tangkawarow, “Analisis Perbandingan Metode Seleksi Fitur pada Model Klasifikasi Decission Tree untuk Deteksi Serangan di Jaringan Komputer,” Jurnal Sistem dan Informatika (JSI), vol. 18, no. 2, pp. 208–217, May 2024, doi: 10.30864/jsi.v18i2.615.

I. G. N. D. Adnyana, R. M. Arjuna, A. N. Indraini, and D. S. Pasvita, Pengaruh Seleksi Fitur Pada Algoritma Machine Learning Untuk Memprediksi Pembatalan Pesanan Hotel. 2021.

Putri, E. Sulistianingsih, N. Imro’ah, and N. N. Debataraja, “Application Of C4.5 Algorithm With Feature Selection In Classification Of Discharge Status Of Head Injury Patients,” VARIANCE: Journal of Statistics and Its Applications, vol. 6, no. 2, pp. 165–174, Oct. 2024, doi: 10.30598/variancevol6iss2page165-174.

Kusrini and E. T. Luthfi, Algoritma Data Mining. Penerbit Andi, 2009.

N. A. Azhar, M. S. Mohd Pozi, A. Mohamed Din, and A. Jatowt, “An Investigation of SMOTE based Methods for Imbalanced Datasets with Data Complexity Analysis,” IEEE Trans Knowl Data Eng, pp. 1–1, 2022, doi: 10.1109/TKDE.2022.3179381.

V. H. Barella, L. P. F. Garcia, M. C. P. de Souto, A. C. Lorena, and A. C. P. L. F. de Carvalho, “Assessing the data complexity of imbalanced datasets,” Inf Sci (N Y), vol. 553, pp. 83–109, Apr. 2021, doi: 10.1016/j.ins.2020.12.006.

A. F. Pulungan and D. Selvida, “Kombinasi Metode Sampling pada Pengklasifikasian Data Tidak Seimbang Menggunakan Algoritma Support Vector Machine (SVM),” 2022.

I. Colanus, R. Drajana, and A. Bode, “Prediksi Status Penderita Stunting Pada Balita Provinsi Gorontalo Menggunakan K-Nearest Neighbor Berbasis Seleksi Fitur Chi Square,” Jurnal Nasional Komputasi dan Teknologi Informasi, vol. 5, no. 2, 2022.

A. Hanafi, A. Adiwijaya, and W. Astuti, “Klasifikasi Multi Label pada Hadis Bukhari Terjemahan Bahasa Indonesia Menggunakan Mutual Information dan k-Nearest Neighbor,” Jurnal Sisfokom (Sistem Informasi dan Komputer), vol. 9, no. 3, pp. 357–364, Sep. 2020, doi: 10.32736/sisfokom.v9i3.980.

J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques. Elsevier Science, 2011.

M. Zainuri, M. H. Fahmi, and R. A. Hamdhana, “Komparasi Metode Klasifikasi Algoritma C5.0 dan Naïve Bayes untuk Menentukan Jurusan Siswa,” Jurnal Sistem Informasi dan Informatika (JUSIFOR), vol. 1, no. 1, pp. 1–8, May 2022, doi: 10.33379/jusifor.v1i1.1277.

M. R. Galela, “Tidak perlu confused dengan Confusion Matrix.” Accessed: Jan. 01, 2025. [Online]. Available: https://klc2.kemenkeu.go.id/kms/knowledge/tidak-perlu-confused-dengan-confusion-matrix-728befa0/detail/

N. Nurainun, E. Haerani, F. Syafria, and L. Oktavia, “Penerapan Algoritma Naïve Bayes Classifier Dalam Klasifikasi Status Gizi Balita dengan Pengujian K-Fold Cross Validation,” Journal of Computer System and Informatics (JoSYC), vol. 4, no. 3, pp. 578–586, May 2023, doi: 10.47065/josyc.v4i3.3414.

J. Fredricka, L. Elfianty, and J. Wahyudi, “Implementasi Algortima C-Means dan Algoritma Mixture dalam Pengclusteran Data Mahasiswa Drop Out,” JUKI?: Jurnal Komputer dan Informatika, vol. 4, 2022.

B. G. Sudarsono and A. U. Bani, “Prediksi Mahasiswa Berpotensi Berhenti Kuliah Secara Sepihak Menggunakan Data Mining Algoritma C4.5,” 2020.

D. M. A. M. Sanjaya, A. A. I. I. Paramitha, and N. W. Utami, “Penerapan Data Mining untuk Prediksi Mahasiswa Berpotensi Non-Aktif Menggunakan Algoritma C4.5: Studi Kasus STMIK Primakara,” 2022.

Univesitas Jambi, Peraturan Rektor No 31 Tahun 2024 tentang Peraturan Akademik. 2024.

A. Ramadhani, R. F. Noor, D. Vernanda, and T. Herdiawan, “Klasifikasi Mahasiswa Berpotensi Drop Out Menggunakan Algoritma C4.5 di Politeknik Negeri Subang,” Jurnal Tekno Kompak, vol. 18, no. 1, p. 101, Feb. 2024, doi: 10.33365/jtk.v18i1.3439.

A. S. B. Lomi, A. A. Pekuwali, and R. T. Abineno, “Pengelompokan Mahasiswa Berpotensi Drop Outpada Program Studi Teknik Infromatika Menggunakan Metode K-Means Clustering,” pp. 340–351, Aug. 2024.

H. Hermanto, “Prediksi Kelulusan dan Putus Studi Mahasiswa dengan Pendekatan Bertingkat pada Perguruan Tinggi,” SIMADA (Jurnal Sistem Informasi dan Manajemen Basis Data), vol. 3, no. 2, pp. 140–148, Jan. 2021, doi: 10.30873/simada.v3i2.2359.

T. A. Marzuqi, E. Kristiani, and Marcel, “Prediksi Mahasiswa Drop-Out Di Universitas XYZ,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 6, pp. 1345–1350, Dec. 2024, doi: 10.25126/jtiik.2024118689.

N. Y. L. Gaol, “Prediksi Mahasiswa Berpotensi Non Aktif Menggunakan Data Mining dalam Decision Tree dan Algoritma C4.5,” Jurnal Informasi & Teknologi, pp. 23–29, Mar. 2020, doi: 10.37034/jidt.v2i1.22.

A. Andri and P. Paulus, “Prediksi Mahasiswa Berisiko Drop Out (DO) dengan ADTree dan NNge,” Jurnal SIFO Mikroskil, vol. 22, no. 1, pp. 47–58, Aug. 2021, doi: 10.55601/jsm.v22i1.794.

N. Wakhidah and Saemuri, “Faktor Terlambatnya Penyelesaian Studi Di Perguruan Tinggi Keagamaan Islam: Studi Penerapan Kebijakan Masa Studi Mahasiswa Di Indonesia,” vol. 6, Mar. 2025.

Downloads

Published

2025-10-30

How to Cite

Hanis, F. L., Khaira, U., & Arsa, D. (2025). Klasifikasi Status Mahasiswa Berisiko Drop Out Menggunakan Decision Tree C5.0 dengan Seleksi Fitur: Classification of Student Drop Out Risk Using Decision Tree C5.0 with Feature Selection . MALCOM: Indonesian Journal of Machine Learning and Computer Science, 5(4), 1318-1330. https://doi.org/10.57152/malcom.v5i4.2239