Klasifikasi Penyakit Diabetes Melitus Menggunakan Algoritma C4.5, Support Vector Machine (SVM) dan Regresi Linear
Classification Diabetes Mellitus Using C4.5 Algorithm, Support Vector Machine (SVM) and Linear Regression
Keywords:
C4.5 , Diabetes , Klasifikasi , Regresi Linear, Support Vector Machine (SVM)Abstract
WHO memprediksi jumlah penderita diabetes di Indonesia akan meningkat dari 8 juta pada tahun 2000 menjadi sekitar 21,3 juta pada tahun 2030. IDF juga memprediksi jumlah penderita diabetes akan meningkat dari 7 juta pada tahun 2009 menjadi 12 juta pada tahun 2030. Tidak dikenal, dokter percaya bahwa penyakit ini terkait dengan gaya hidup dan pola makan, yang berperan penting dalam penyakit tersebut. Data mining dapat dijadikan acuan untuk memprediksi dan mendiagnosa sifat penyakit dengan metode yang tepat. Tujuan dari penelitian ini adalah melakukan proses klasifikasi penyakit diabetes dengan menggunakan algoritma C4.5, support vector machine dan metode regresi linier. Setelah data diolah dengan teknik klasifikasi dengan algoritma data mining C4.5, hasil yang diperoleh dengan membagi data dengan metode holdout diperoleh dengan membagi data latih dengan 90 data uji dengan 10%, yaitu hasilnya dalam akurasi 75,324%. Pada algoritma SVM didapatkan hasil 82,01% dan untuk penggolahan menggunakan Regresi Linear didapat hasil MSE 0,216.Kemudian jika dibandingkan maka Algoritma SVM lebih baik dari pada algoritma C4.5 pada data yang digunakan pada penelitian kali ini.
References
M. Alehegn, R. Joshi, and P. Mulay, “Analysis and prediction of diabetes mellitus using machine learning algorithm,” Int. J. Pure Appl. Math., vol. 118, no. 9, pp. 871–878, 2018.
H. S. W. Hovi, A. I. Hadiana, and F. R. Umbara, “Prediksi Penyakit Diabetes Menggunakan Algoritma Support Vector Machine (SVM),” Informatics Digit. Expert, vol. 4, no. 1, pp. 40–45, 2022.
S. Larabi-Marie-Sainte, L. Aburahmah, R. Almohaini, and T. Saba, “Current techniques for diabetes prediction: review and case study,” Appl. Sci., vol. 9, no. 21, p. 4604, 2019.
D. R. Ente, S. A. Thamrin, S. Arifin, H. Kuswanto, and A. Andreza, “Klasifikasi Faktor-Faktor Penyebab Penyakit Diabetes Melitus Di Rumah Sakit Unhas Menggunakan Algoritma C4. 5,” Indones. J. Stat. Its Appl., vol. 4, no. 1, pp. 80–88, 2020.
B. Bertalina and P. Purnama, “Hubungan lama sakit, pengetahuan, motivasi pasien dan dukungan keluarga dengan kepatuhan diet pasien Diabetes Mellitus,” J. Kesehat., vol. 7, no. 2, pp. 329–340, 2016.
F. I. Kurniadi and V. K. Putri, “Penggunaan Heaviside Activation Function pada Regresi Linear untuk Klasifikasi Diabetes,” Ultim. J. Tek. Inform., vol. 10, no. 1, pp. 7–10, 2018.
J. J. Purnama, S. Rahayu, S. Nurdiani, T. Haryanti, and N. A. Mayangky, “Analisis Algoritma Klasifikasi Neural Network Untuk Diagnosis Penyakit Diabetes,” Indones. J. Comput. Inf. Technol. Retrieved from http//ejournal. bsi. ac. id/ejurnal/index. php/ijcit, 2019.
F. Elfaladonna and A. Rahmadani, “Analisa Metode Classification-Decission Tree dan Algoritma C. 45 untuk Memprediksi Penyakit Diabetes dengan Menggunakan Aplikasi Rapid Miner,” SINTECH (Science Inf. Technol. J., vol. 2, no. 1, pp. 10–17, 2019.
S. Haryati, A. Sudarsono, and E. Suryana, “implementasi data mining untuk memprediksi masa studi mahasiswa menggunakan algoritma c4. 5 (studi kasus: universitas dehasen bengkulu),” J. Media Infotama, vol. 11, no. 2, 2015.
P. D. Rinanda, B. Delvika, S. Nurhidayarnis, N. Abror, and A. Hidayat, “Perbandingan Klasifikasi Antara Naive Bayes dan K-Nearest Neighbor Terhadap Resiko Diabetes pada Ibu Hamil: Comparison of Classification Between Naive Bayes and K-Nearest Neighbor on Diabetes Risk in Pregnant Women,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 2, no. 2, pp. 68–75, 2022.
S. I. Ayon and M. M. Islam, “Diabetes prediction: a deep learning approach,” Int. J. Inf. Eng. Electron. Bus., vol. 12, no. 2, p. 21, 2019.
Y. Cheng-Hong et al., “Prediction of mortalityinthe hemodialysis patient with diabetes using support vector machine,” Rev. Argentina Clínica Psicológica, vol. 29, no. 4, p. 219, 2020.
A. Dagliati et al., “Machine learning methods to predict diabetes complications,” J. Diabetes Sci. Technol., vol. 12, no. 2, pp. 295–302, 2018.
D. Sisodia and D. S. Sisodia, “Prediction of diabetes using classification algorithms,” Procedia Comput. Sci., vol. 132, pp. 1578–1585, 2018.
R. P. Fadhillah, R. Rahma, A. Sepharni, R. Mufidah, B. N. Sari, and A. Pangestu, “Klasifikasi Penyakit Diabetes Mellitus Berdasarkan Faktor-Faktor Penyebab Diabetes menggunakan Algoritma C4. 5,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 7, no. 4, pp. 1265–1270, 2022.
M. D. Purbolaksono, M. I. Tantowi, A. I. Hidayat, and A. Adiwijaya, “Perbandingan Support Vector Machine dan Modified Balanced Random Forest dalam Deteksi Pasien Penyakit Diabetes,” J. RESTI (Rekayasa Sist. Dan Teknol. Informasi), vol. 5, no. 2, pp. 393–399, 2021.
R. Rusbandi, F. A. Ma’ruf, A. Pratama, I. Sholihin, and A. R. Rinaldi, “Penerapan Model Prediksi Menggunakan Algoritma C. 45 Untuk Prediksi Kelulusan Siswa SMK Wahidin,” J. DATA Sci. Inform., vol. 1, no. 1, pp. 16–20, 2021.
A. S. H. Basari, B. Hussin, I. G. P. Ananta, and J. Zeniarja, “Opinion mining of movie review using hybrid method of support vector machine and particle swarm optimization,” Procedia Eng., vol. 53, pp. 453–462, 2013.
J.-S. Chou, M.-Y. Cheng, Y.-W. Wu, and A.-D. Pham, “Optimizing parameters of support vector machine using fast messy genetic algorithm for dispute classification,” Expert Syst. Appl., vol. 41, no. 8, pp. 3955–3964, 2014.
M. Masruroh, “Perbandingan Metode Regresi Linear Dan Neural Network Backpropagation Dalam Prediksi Nilai Ujian Nasional Siswa Smp Menggunakan Software R,” Joutica, vol. 5, no. 1, pp. 331–336, 2020.
D. F. Sengkey, F. D. Kambey, S. P. Lengkong, S. R. Joshua, and H. V. F. Kainde, “Pemanfaatan Plaform Pemrograman Daring dalam Pembelajaran Probabilitas dan Statistika di Masa Pandemi CoVID-19,” J. Tek. Inform., vol. 15, no. 4, pp. 257–264, 2020.
S. H. Situmorang, I. Muda, M. Doli, and F. S. Fadli, Analisis data untuk riset manajemen dan bisnis. USUpress, 2010.
B. Hermanto, “Sistem Informasi Manajemen Keuangan pada PT. Hulu Balang Mandiri Menggunakan Framework Laravel,” J. Komputasi, vol. 7, no. 1, pp. 17–26, 2019.
A. Darmawan, N. Kustian, and W. Rahayu, “Implementasi data mining menggunakan model svm untuk prediksi kepuasan pengunjung taman tabebuya,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 2, no. 3, pp. 299–307, 2018.
S. Suryani and M. Mustakim, “Estimasi Keberhasilan Siswa dalam Pemodelan Data Berbasis Learning Menggunakan Algoritma Support Vector Machine,” Bull. Informatics Data Sci., vol. 1, no. 2, pp. 81–88, 2022.
P. Mayadewi and E. Rosely, “Prediksi Nilai Proyek Akhir Mahasiswa Menggunakan Algoritma Klasifikasi Data Mining,” SESINDO 2015, vol. 2015, 2015.
T. M. Rahayu, B. A. Ningsi, I. Isnurani, and I. Arofah, “KLASIFIKASI KETEPATAN WAKTU KELULUSAN MAHASISWA DENGAN METODE NAÏVE BAYES,” MEDIA BINA Ilm., vol. 15, no. 8, pp. 4993–5000, 2021.
B. Novianti, T. Rismawan, and S. Bahri, “Implementasi Data Mining Dengan Algoritma C4. 5 Untuk Penjurusan Siswa (Studi Kasus: Sma Negeri 1 Pontianak),” Coding J. Komput. dan Apl., vol. 4, no. 3, 2016.
A. M. Puspitasari, D. E. Ratnawati, and A. W. Widodo, “Klasifikasi penyakit gigi dan mulut menggunakan metode Support Vector Machine,” J. Pengemb. Teknol. Inf. dan Ilmu Komput. e-ISSN, vol. 2548, p. 964X, 2018.
T. I. Andini, W. Witanti, and F. Renaldi, “Prediksi Potensi Pemasaran Produk Baru dengan Metode Naïve Bayes Classifier dan Regresi Linear,” 2016.
A. A. Suryanto and A. Muqtadir, “Penerapan metode mean absolute error (MEA) dalam algoritma regresi linear untuk prediksi produksi padi,” Saintekbu, vol. 11, no. 1, pp. 78–83, 2019.