Perbandingan Data Prediksi Diabetes Menggunakan Machine Learning
Comparison of Diabetes Prediction Data Using Machine Learning
DOI:
https://doi.org/10.57152/malcom.v5i4.2301Keywords:
Diabetes, Gradient Boosting, Logistic Regression, Random Forest, Support Vector ClassifierAbstract
Diabetes merupakan penyakit metabolisme jangka panjang yang berdampak pada tubuh manusia dengan cara mengubah glukosa darah menjadi energi. Individu yang telah didiagnosis dengan diabetes tidak dapat mengontrol level gula dalam darah, yang akan menyebabkan peningkatan kadar gula darah dan tekanan darah. Penelitian ini bertujuan untuk menganalisis dan membandingkan visualisasi data dari empat model machine learning (Random Forest, Logistic Regression, SVC, dan Gradient Boosting ) dalam prediksi penyakit diabetes. Hasil penelitian ini diharapkan dapat memberikan panduan dalam pemilihan teknik visualisasi yang optimal untuk mendukung interpretasi hasil prediksi diabetes berbasis machine learning, serta meningkatkan efektivitas komunikasi hasil prediksi kepada praktisi medis dan pasien. Hasil penelitian memperlihatkan bahwa Gradient Boosting menempati posisi teratas dengan skor ROC AUC sebesar 0,97, disusul oleh Random Forest (0,94) dan Logistic Regression (0,93), sementara SVC mencatatkan nilai 0,84. Walaupun tingkat akurasi keseluruhan model cukup tinggi (?97%), nilai recall pada kelas positif masih rendah (0,39–0,49), yang menunjukkan adanya kendala dalam mengidentifikasi kasus minoritas pada dataset yang tidak seimbang. Variabel fisiologis, seperti BMI dan HbA1c, terbukti berperan signifikan sebagai prediktor, namun kinerja model diperkirakan dapat meningkat lebih jauh dengan mengintegrasikan faktor perilaku dan riwayat medis yang lebih terperinci.
Downloads
References
H. E. Ardiani, T. A. E. Permatasari, and S. Sugiatmi, “Obesitas, pola diet, dan aktifitas fisik dalam penanganan diabetes melitus pada masa pandemi COVID-19,” Muhammadiyah J. Nutr. Food Sci., vol. 2, no. 1, pp. 1–12, 2021, doi: https://doi.org/10.24853/mjnf.2.1.1-12.
E. Setiyorini, N. A. Wulandari, and A. Efyuwinta, “Hubungan kadar gula darah dengan tekanan darah pada lansia penderita Diabetes Tipe 2,” J. Ners Dan Kebidanan (Journal Ners Midwifery), vol. 5, no. 2, pp. 163–171, 2018, doi: https://doi.org/10.26699/jnk.v5i2.ART.p163-171.
D. P. Putra, A. Rahmiwati, Y. Windusari, and N. A. Fajar, “Program Pengelolaan Penyakit Kronis Diabetes Mellitus Sebagai Pencegahan Penyakit Degenerative Diabetes Mellitus, dan Dampaknya Bagi Pekerja Di Indonesia,” J. Syntax Lit., vol. 8, no. 12, 2023, doi: https://doi.org/10.36418/syntax-literate.v7i9.13935.
H. Y, IDF Diabetes Atlas 8th Edition. 2017.
F. A. Siregar, Asfriyati, T. Makmur, R. Bestari, I. A. Lubis, and U. Zein, “Identifying Adult Population at Risk for Undiagnosed Diabetes Mellitus in Medan City, Indonesia Targeted on Diabetes Prevention.,” Med. Arch. (Sarajevo, Bosnia Herzegovina), vol. 77, no. 6, pp. 455–459, 2023, doi: 10.5455/medarh.2023.77.455-459.
M. Z. Stojanoski, Kalendar, and H. Gjoreski, Comparative Analysis of Machine Learning Models for Diabetes Prediction.
I. Tasin, T. U. Nabil, S. Islam, and R. Khan, “Diabetes prediction using machine learning and explainable AI techniques,” Healthc. Technol. Lett., vol. 10, no. 1–2, pp. 1–10, 2023, doi: https://doi.org/10.1049/htl2.12039.
H. El-Sofany, S. A. El-Seoud, O. H. Karam, Y. M. Abd El-Latif, and I. A. T. F. Taj-Eddin, “A proposed technique using machine learning for the prediction of diabetes disease through a mobile app,” Int. J. Intell. Syst., vol. 2024, no. 1, p. 6688934, 2024, doi: https://doi.org/10.1155/2024/6688934.
S. K. S. Modak and V. K. Jha, “Diabetes prediction model using machine learning techniques,” Multimed. Tools Appl., vol. 83, no. 13, pp. 38523–38549, 2024, doi: 10.1007/s11042-023-16745-4.
S. Amaliah, M. Nusrang, and A. Aswi, “Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng,” VARIANSI J. Stat. Its Appl. Teach. Res., vol. 4, no. 3, pp. 121–127, 2022.
T. R. Sanusi, F. Andreas, B. N. Sari, and U. Singaperbangsa, “Implementasi Algoritma Support Vector Classifier (SVC) dengan Data Training Numerik dan Teks untuk Mengklasifikasi SMS Spam,” J. Ilm. Wahana Pendidik., no. 14, pp. 346–354, 2022.
R. Hendayana, B. B. Pengkajian, D. Pengembangan, T. Pertanian, and J. T. Pelajar, PENERAPAN METODE REGRESI LOGISTIK DALAM MENGANALISIS ADOPSI TEKNOLOGI PERTANIAN Application Method of Logistic Regression Analyze the Agricultural Technology Adoption.
A. D. Siburian et al., “Laptop Price Prediction with Machine Learning Using Regression Algorithm,” J. Sist. Inf. dan Ilmu Komput. Prima(JUSIKOM PRIMA), vol. 6, no. 1, pp. 87–91, 2022, doi: 10.34012/jurnalsisteminformasidanilmukomputer.v6i1.2850.
M. Mustafa, “Diabetes prediction dataset.”
C. Bentéjac, A. Csörg?, and G. Martínez-Muñoz, “A comparative analysis of gradient boosting algorithms,” Artif. Intell. Rev., vol. 54, no. 3, pp. 1937–1967, 2021, doi: https://doi.org/10.1007/s10462-020-09896-5.
B. S. Cahya Putra, I. Tahyudin, B. A. Kusuma, and K. N. Isnaini, “Efektivitas Algoritma Random Forest, XGBoost, dan Logistic Regression dalam Prediksi Penyakit Paru-paru.,” Techno. com, vol. 23, no. 4, pp. 909–922, 2024, doi: https://doi.org/10.62411/tc.v23i4.11705.
S. Arikunto, Prosedur Penelitian: Suatu Pendekatan Praktik. Jakarta: Rineka Cipta, 2018.
P. Sampath et al., “Robust diabetic prediction using ensemble machine learning models with synthetic minority over-sampling technique,” Sci. Rep., vol. 14, no. 1, p. 28984, 2024, doi: 10.1038/s41598-024-78519-8.
I. J. Kakoly, M. R. Hoque, and N. Hasan, “Data-driven diabetes risk factor prediction using machine learning algorithms with feature selection technique,” Sustainability, vol. 15, no. 6, p. 4930, 2023, doi: https://doi.org/10.3390/su15064930.
M. Tariq, V. Palade, and Y. Ma, “Transfer learning based classification of diabetic retinopathy on the Kaggle EyePACS dataset,” in International Conference on Medical Imaging and Computer-Aided Diagnosis, Springer, 2022, pp. 89–99.
D. Leni, “Analisis Heatmap Korelasi dan Scatterplot untuk Mengidentifikasi Faktor-Faktor yang Mempengaruhi Pelabelan AC efisiensi Energi,” J. Rekayasa Mater. Manufaktur dan Energi, vol. 6, no. 1, pp. 41–47, 2023, doi: https://doi.org/10.30596/rmme.v6i1.13133.
T. H. Pinem and Z. P. Putra, “Evaluasi Kinerja Algoritma Klasifikasi Deep Learning dalam Prediksi Diabetes,” J. Ilm. Fifo, vol. 17, no. 1, pp. 17–28, 2025, doi: https://dx.doi.org/10.22441/fifo.2025.v17i1.003.
R. Pramudita, N. Safitri, and V. Z. Nazah, “Studi Komparatif Algoritma Machine Learning dengan Teknik Bagging dan AdaBoost pada Klasifikasi Kanker Payudara,” TEMATIK, vol. 12, no. 1, pp. 101–108, 2025, doi: https://doi.org/10.38204/tematik.v12i1.2435.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Mikhail Claudio Ibrahim, Fachruddin Fachruddin, Nurhadi Nurhadi

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Copyright © by Author; Published by Institut Riset dan Publikasi Indonesia (IRPI)
This Indonesian Journal of Machine Learning and Computer Science is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

















