Penerapan Algoritma Decesion Tree C4.5 untuk Memprediksi Tingkat Kelangsungan Hidup Pasien Kanker Tiroid

The Application of C4.5 Decision Tree Algorithm for Predicting the Survival Rate of Thyroid Cancer Patients

Authors

  • Adinda Dwi Putri Universitas Sains dan Teknologi Indonesia
  • Fitriana Sholekhah Universitas Sains dan Teknologi Indonesia
  • Eric Dadynata Universitas Sains dan Teknologi Indonesia
  • Lusiana Efrizoni Universitas Sains dan Teknologi Indonesia
  • Rahmaddeni Rahmaddeni Universitas Sains dan Teknologi Indonesia
  • Nur Sapina Universitas Sains dan Teknologi Indonesia

DOI:

https://doi.org/10.57152/malcom.v4i4.1532

Keywords:

Area Under Curve (AUC), Confusion Matrix, Decision Tree C4.5, Kanker Tiroid, Kelangsungan Hidup

Abstract

Salah satu penyakit yang memiliki tingkat kelangsungan hidup yang bervariasi di antara pasien adalah kanker tiroid. Untuk memprediksi tingkat kelangsungan hidup pasien berdasarkan karakteristik klinis, penelitian ini menggunakan algoritma Decision Tree C4.5. Metode ini memanfaatkan pengolahan bahasa alami (NLP) dengan Count Vectorizer untuk mengubah teks menjadi data numerik. Dalam penilaian keakuratan prediksi, evaluasi dilakukan dengan matriks kebingungan (confusion matrix) untuk mengukur kinerja model dalam klasifikasi. Selain itu, Area Under Curve (AUC) juga dihitung untuk mengevaluasi performa model. Hasil eksperimen menunjukkan bahwa metode ini memberikan prediksi yang akurat tentang tingkat kelangsungan hidup pasien dengan kanker tiroid, mencapai akurasi sebesar 97% dan AUC sebesar 0.95, menunjukkan kinerja yang sangat baik. Penelitian ini penting untuk memperdalam pemahaman tentang penerapan Decision Tree dalam konteks medis dan potensi algoritma ini dalam mendukung pengambilan keputusan klinis di masa depan.

References

R. A. Saputra et al., “Detecting Alzheimer’s Disease by the Decision Tree Methods Based on Particle Swarm Optimization,” J. Phys. Conf. Ser., vol. 1641, no. 1, pp. 61–67, 2020, doi: 10.1088/1742-6596/1641/1/012025.

F. M. Hana, “Klasifikasi Penderita Penyakit Diabetes Menggunakan Algoritma Decision Tree C4.5,” J. SISKOM-KB (Sistem Komput. dan Kecerdasan Buatan), vol. 4, no. 1, pp. 32–39, 2020, doi: 10.47970/siskom-kb.v4i1.173.

A. Siswandi, N. Fitriyani, I. Artini, and K. Monitira, “Karakteristik Penderita Kanker Tiroid Di Bagian Bedah Onkologi Di Rumah Sakit Umum Daerah Dr. H. Abdul Moeloek Provinsi Lampung Tahun 2017-2019,” J. Med. Malahayati, vol. 4, no. 3, pp. 244–248, 2021, doi: 10.33024/jmm.v4i3.2530.

Y. M. Pius Cardia, E. D. Martadiani, and F. P. Sitanggang, “Karakteristik Ultrasonografi Pada Kecurigaan Klinis Kanker Tiroid Di Rsup Sanglah Denpasar Periode Januari 2015-Desember 2015,” E-Jurnal Med. Udayana, vol. 10, no. 7, p. 45, 2021, doi: 10.24843/mu.2021.v10.i7.p09.

D. Pembimbing, J. Dwi, T. Purnomo, S. Si, and M. Si, “Analisis Regresi Logistik Ordinal pada Faktor-Faktor yang Memperngaruhi Stadium Kanker Tiroid,” 2020.

S. Agustiani, A. Mustopa, A. Saryoko, W. Gata, and S. K. Wildah, “Penerapan Algoritma J48 Untuk Deteksi Penyakit Tiroid,” Paradig. - J. Komput. dan Inform., vol. 22, no. 2, pp. 153–160, 2020, doi: 10.31294/p.v22i2.8174.

I. Khoeri and D. Iskandar Mulyana, “Implementasi Machine Learning dengan Decision Tree Algoritma C4.5 dalam Penerimaan Karyawan Baru pada PT. Gitareksa Dinamika Jakarta,” J. Sos. Teknol., vol. 1, no. 7, pp. 615–623, 2021, doi: 10.59188/jurnalsostech.v1i7.126.

K. Rahayu, V. Fitria, D. Septhya, R. Rahmaddeni, and L. Efrizoni, “Klasifikasi Teks untuk Mendeteksi Depresi dan Kecemasan pada Pengguna Twitter Berbasis Machine Learning,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 2, pp. 108–114, 2023, doi: 10.57152/malcom.v3i2.780.

A. Supriyadi, “Perbandingan Algoritma Naive Bayes dan Decision Tree(C4.5) dalam Klasifikasi Dosen Berprestasi,” Gener. J., vol. 7, no. 1, pp. 39–49, 2023, doi: 10.29407/gj.v7i1.19797.

I. P. Putri, T. Terttiaavini, and N. Arminarahmah, “Analisis Perbandingan Algoritma Machine Learning untuk Prediksi Stunting pada Anak,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 1, pp. 257–265, 2024, doi: 10.57152/malcom.v4i1.1078.

F. Alghifari and D. Juardi, “Penerapan Data Mining Pada Penjualan Makanan Dan Minuman Menggunakan Metode Algoritma Naïve Bayes,” J. Ilm. Inform., vol. 9, no. 02, pp. 75–81, 2021, doi: 10.33884/jif.v9i02.3755.

F. Fadli and B. B. Butar, “Penerapan Decision Tree Menggunakan Algoritma C4.5 Untuk Deteksi Demam Berdarah Pada RS. IMC Bintaro,” Indones. J. Softw. Eng., vol. 5, no. 1, pp. 75–86, 2019, doi: 10.31294/ijse.v5i1.5866.

Gde Agung Brahmana Suryanegara, Adiwijaya, and Mahendra Dwifebri Purbolaksono, “Peningkatan Hasil Klasifikasi pada Algoritma Random Forest untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 1, pp. 114–122, 2021, doi: 10.29207/resti.v5i1.2880.

B. Prasojo and E. Haryatmi, “Analisa Prediksi Kelayakan Pemberian Kredit Pinjaman dengan Metode Random Forest,” J. Nas. Teknol. dan Sist. Inf., vol. 7, no. 2, pp. 79–89, 2021, doi: 10.25077/teknosi.v7i2.2021.79-89.

N. Azwanti and E. Elisa, “Analisis Pola Penyakit Hipertensi Menggunakan Algoritma C4.5,” InfoTekJar (Jurnal Nas. Inform. dan Teknol. Jaringan), vol. 3, no. 2, pp. 116–123, 2019, doi: 10.30743/infotekjar.v3i2.944.

M. D. Purbolaksono, M. Irvan Tantowi, A. Imam Hidayat, and A. Adiwijaya, “Perbandingan Support Vector Machine dan Modified Balanced Random Forest dalam Deteksi Pasien Penyakit Diabetes,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 2, pp. 393–399, 2021, doi: 10.29207/resti.v5i2.3008.

F. Pradana Rachman, H. Santoso, and A. History, “Jurnal Teknologi dan Manajemen Informatika Perbandingan Model Deep Learning untuk Klasifikasi Sentiment Analysis dengan Teknik Natural Languange Processing Article Info ABSTRACT,” J. Teknol. dan Manaj. Inform., vol. 7, no. 2, pp. 103–112, 2021, [Online]. Available: http://http//jurnal.unmer.ac.id/index.php/jtmi

Adhitya Karel Maulaya and Junadhi, “Analisis Sentimen Menggunakan Support Vector Machine Masyarakat Indonesia Di Twitter Terkait Bjorka,” J. CoSciTech (Computer Sci. Inf. Technol., vol. 3, no. 3, pp. 495–500, 2022, doi: 10.37859/coscitech.v3i3.4358.

W. Musu, A. Ibrahim, and Heriadi, “Pengaruh Komposisi Data Training dan Testing terhadap Akurasi Algoritma C4 . 5,” Pros. Semin. Ilm. Sist. Inf. Dan Teknol. Inf., vol. X, no. 1, pp. 186–195, 2021.

D. A. Nasution, H. H. Khotimah, and N. Chamidah, “Perbandingan Normalisasi Data untuk Klasifikasi Wine Menggunakan Algoritma K-NN,” Comput. Eng. Sci. Syst. J., vol. 4, no. 1, p. 78, 2019, doi: 10.24114/cess.v4i1.11458.

M. Azhari, Z. Situmorang, and R. Rosnelly, “Perbandingan Akurasi, Recall, dan Presisi Klasifikasi pada Algoritma C4.5, Random Forest, SVM dan Naive Bayes,” J. Media Inform. Budidarma, vol. 5, no. 2, p. 640, 2021, doi: 10.30865/mib.v5i2.2937.

B. G. Sudarsono, M. I. Leo, A. Santoso, and F. Hendrawan, “Analisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner,” JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 1, pp. 13–21, 2021, doi: 10.30813/jbase.v4i1.2729.

A. Riski, “Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi Penderita Penyakit Jantung,” J. Tek. Inform. Kaputama, vol. 3, no. 1, pp. 22–28, 2019, [Online]. Available: https://jurnal.kaputama.ac.id/index.php/JTIK/article/view/141/156

A. H. Nasrullah, “Implementasi Algoritma Decision Tree Untuk Klasifikasi Data Peserta Didik,” J. Pilar Nusa Mandiri, vol. 7, no. 2, p. 217, 2021.

J. Pangaribuan, C. Tedja, and S. Wibowo, “Perbandingan Metode Algoritma C4.5 dan Extreme Learning Machine untuk Mendiagnosis Penyakit Jantng Korner,” Informatics Eng. Res. Technol., vol. 1, no. 1, pp. 1–7, 2019.

A. Rohman and A. Rufiyanto, “Implementasi Data Mining Dengan Algoritma Decision Tree C4 . 5 Untuk Prediksi Kelulusan Mahasiswa Di Universitas Pandaran,” Proceeding SINTAK 2019, pp. 134–139, 2019, [Online]. Available: https://www.unisbank.ac.id/ojs/index.php/sintak/article/view/7577

A. I. Putri et al., “Implementation of K-Nearest Neighbors, Naïve Bayes Classifier, Support Vector Machine and Decision Tree Algorithms for Obesity Risk Prediction,” Public Research Journal of Engineering, Data Technology and Computer Science, vol. 2, no. 1, pp. 26–33, Apr. 2024, doi: 10.57152/predatecs.v2i1.1110.

M. R. Anugrah, N. A. Al-Qadr, N. Nazira, and N. Ihza, “Implementation of C4.5 and Support Vector Machine (SVM) Algorithm for Classification of Coronary Heart Disease,” Public Research Journal of Engineering, Data Technology and Computer Science, vol. 1, no. 1, pp. 20–25, Jul. 2023, doi: 10.57152/predatecs.v1i1.805.

Downloads

Published

2024-09-13