Klasifikasi Kelayakan Penerima Beasiswa Menggunakan Naive Bayes dengan Optimasi Atribut Berbasis K-Means Clustering
Classification of Scholarship Eligibility Using Naïve Bayes with Attribute Optimization Based on K-Means Clustering
DOI:
https://doi.org/10.57152/malcom.v5i4.2312Keywords:
beasiswa, Confusion Matrix, Davies-Bouldin Index, K-Means, Naïve BayesAbstract
Penelitian ini bertujuan untuk mengklasifikasikan kelayakan penerima beasiswa di Kecamatan Tabir dengan menggunakan algoritma Naïve Bayes yang dioptimasi melalui K-Means Clustering. Dataset berjumlah 4.155 siswa diproses melalui tahap pra-pemrosesan, mencakup seleksi atribut relevan, pembersihan data, serta transformasi kategori ke bentuk numerik. Proses clustering dilakukan dengan K-Means pada K = 2, 3, dan 5, lalu dievaluasi menggunakan Davies-Bouldin Index (DBI). Hasil terbaik diperoleh pada K = 2 dengan nilai DBI = 0,909, yang selanjutnya digunakan untuk mengelompokkan data menjadi dua klaster, yaitu “Layak” dan “Tidak Layak”. Klaster yang dihasilkan kemudian digunakan untuk mengoptimasi atribut pada tahap klasifikasi menggunakan algoritma Naïve Bayes.. Evaluasi performa menggunakan confusion matrix dengan skema split data 70:30, 80:20, dan 10-fold cross validation. Hasil menunjukkan akurasi masing-masing 96,15%, 96,75%, dan 97,91%; precision 99,90%, 99,85%, dan 99,97%; recall 95,39%, 96,18%, dan 97,47%; serta F1-score 97,60%, 97,97%, dan 98,71%. Berdasarkan hasil tersebut, metode 10-fold cross validation memberikan performa terbaik karena mampu menjaga keseimbangan antara akurasi, precision, recall, dan F1-score. Dengan demikian, integrasi antara K-Means Clustering dan Naïve Bayes terbukti efektif dalam mengoptimasi atribut, serta menghasilkan sistem klasifikasi yang akurat, konsisten, dan andal untuk mendukung keputusan seleksi penerima beasiswa.
Downloads
References
R. Sitompul and I. Iskandar, Evaluasi Program Indonesia Pintar: Permasalahan dan Tantangan. Jakarta: Pusat Penelitian Kebijakan Pendidikan, 2024.
J. Jumanah and H. Rosita, “Evaluasi program indonesia pintar dalam upaya pemerataan pendidikan,” The Indonesian Journal of Public Administration (IJPA), vol. 8, no. 2, pp. 72–84, 2022.
I. Zamjani, “Pelaksanaan Program Indonesia Pintar bagi penerima Kartu Indonesia Pintar Reguler: Studi di empat daerah kunjungan kerja presiden tahun 2017,” Jurnal Penelitian Kebijakan Pendidikan, vol. 11, no. 2, pp. 64–82, 2019.
S. Sulistiyanto, “Metode Data Mining dalam Kasus Seleksi Beasiswa,” Jurnal Teknologi dan Sistem Komputer, vol. 12, no. 1, pp. 45–54, 2024.
J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques, 3rd ed. San Francisco: Morgan Kaufmann, 2011.
M. Suyal and S. Sharma, “A Review on Analysis of K-Means Clustering Machine Learning Algorithm based on Unsupervised Learning,” Journal of Artificial Intelligence and Systems, vol. 6, pp. 8–95, 2024.
B. Bustami, “Penerapan algoritma Naive Bayes untuk mengklasifikasi data nasabah asuransi,” TECHSI-Jurnal Teknik Informatika, vol. 5, no. 2, 2013.
R. D. Romadhona, “Algoritma K-Means Clustering Sebagai Penentuan Beasiswa PIP pada SMPN 9 Kota Blitar,” Jurnal Aplikasi Sains, Informasi, Elektronika dan Komputer, vol. 5, no. 1, Jun. 2023.
A. M. Nur, W. Nursali, N. Nurhidayati, and I. Fathurrahman, “Penerapan Metode Naïve Bayes Untuk Penentuan Penerima Beasiswa Program Indonesia Pintar (PIP),” Infotek: Jurnal Informatika dan Teknologi, vol. 7, no. 1, pp. 1–9, Jan. 2024.
L. Pandeeswari, K. Umamaheswari, and P. Thangavelu, “K-Means Clustering and Naive Bayes Classifier — combined approach,” International Journal of Innovative Science, Engineering & Technology, vol. 2, no. 1, pp. 182–187, 2015.
Y. Zhang and L. Wang, “An AdaBoost Method with K?K-Means Bayes Classifier for Imbalanced Data,” Mathematics, vol. 11, no. 8, p. 1878, Apr. 2023.
E. T. L. Kusrini and E. Taufiq, “Algoritma data mining,” Yogyakarta: Andi Offset, 2009.
A. Arbelaitz, I. Gurrutxaga, J. Muguerza, J. M. Pérez, and I. Perona, “An extensive comparative study of cluster validity indices,” Pattern Recognition, vol. 46, no. 1, pp. 243–256, 2013.
P.-N. Tan, M. Steinbach, A. Karpatne, and V. Kumar, Introduction to Data Mining, 2nd ed., London: Pearson, 2018.
A. Saxena, M. Prasad, A. Gupta, N. Bharill, O. P. Patel, A. Tiwari, M. J. Er, W. Ding, and C.-T. Lin, “A review of clustering techniques and developments,” Neurocomputing, vol. 267, pp. 664–681, 2017.
F. Azzahra, N. Suarna, and Y. A. Wijaya, “Penerapan Algoritma Random Forest dan Cross Validation Untuk Prediksi Data Stunting,” Scientific Journal of Informatics Management and Computer (KOPERTIP), vol. 8, no. 1, pp. 45–54, 2024.
V. Ayumi, D. Ramayanti, H. Noprisson, A. Ratnasari, and U. Salamah, “The Effect of Parameter Tuning and Cross Validation on Indonesian Complaint Text Classification Using the Support Vector Machine Algorithm,” Journal Scientific and Applied Informatics (JSAI), vol. 6, no. 3, pp. 179–188, 2023.
P. Domingos, “A few useful things to know about machine learning,” Commun ACM, vol. 55, no. 10, pp. 78–87, 2012.
R. N. J. S. Intam, A. A. N. Risal, and D. F. Surianto, “Klasifikasi Mahasiswa Berprestasi Menggunakan Fuzzy C-Means Dan Naive Bayes,” Jurnal Ilmiah Informatika Global, vol. 15, no. 1, pp. 9–16, 2024.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Azhiah Putri, Jasmir Jasmir, Benni Purnama

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Copyright © by Author; Published by Institut Riset dan Publikasi Indonesia (IRPI)
This Indonesian Journal of Machine Learning and Computer Science is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

















