Perbandingan Metode Data Mining untuk Prediksi Curah Hujan dengan Algoritma C4.5, Naïve Bayes, dan KNN
Comparison of Data Mining Methods for Predition of Rainfall with C4.5, Naïve Bayes, and KNN Algorithm
Keywords:
BMKG, Perbandingan, Accuracy, ErrorAbstract
Hujan adalah salah satu hal yang harus diamati karena tergolong curah hujan. Badan Metereologi Klimatologi dan Geofisika (BMKG) adalah salah satu lembaga pemerintahan yang bertugas menyampaikan informasi cuaca. Untuk curah hujan terdapat standar yang akan dicapai oleh BMKG yaitu suhu, kelembaban dan kecepatan angin. Dataset curah hujan ini diambil dari database BMKG Jatiwangi, Majalengka mulai tanggal 01/2/2008 sampai tanggal 26/12/2018 yang diambil dari www.bmkg.go.id. Untuk memperkirakan curah hujan tersebut dipakai metode data mining dengan fungsi klasifikasi. Proses Discovery Knowledge of Databases (KDD) biasanya diawali dari langkah seleksi data, pre-processing (cleaning data), mengubah data, data mining dan evaluasi. Pada penelitian ini digunakan 3 (tiga) metode algoritma yaitu C4.5 atau Decision tree, k-nearest neigbor (kNN,) dan Naïve Bayes. Software yang dipakai untuk memproses data adalah Rapid Miner. Kesimpulan dari ketiga algoritma yang dipakai didapatkan algoritma C4.5 adalah algoritma terbaik untuk memperkirakan curah hujan dengan nilai accuracy (88,03%) dan error (11,97%).
References
M. L. Laia and Y. Setyawan, “Perbandingan hasil klasifikasi curah hujan menggunakan metode SVM dan NBC,” J. Stat. Ind. dan Komputasi, vol. 5, no. 02, pp. 51–61, 2020.
S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4, 5, Naïve Bayes, Knn Dan Svm,” J. Tekno Insentif, vol. 13, no. 1, pp. 16–25, 2019.
S. M. Gorade, A. Deo, and P. Purohit, “A study of some data mining classification techniques,” Int. Res. J. Eng. Technol., vol. 4, 2017.
A. B. Annasaheb and V. K. Verma, “Data mining classification techniques: A recent survey,” Int. J. Emerg. Technol. Eng. Res., vol. 4, no. 8, pp. 51–54, 2016.
M. Suyatno, M. Jumintono, D. I. Pambudi, and A. Mardati, “Design of Values Education in School For Adolescents,” in 2nd International Conference on Innovative Research Across Disciplines (ICIRAD 2017), 2017, pp. 6–9.
F. Gorunescu, Data Mining: Concepts, models and techniques, vol. 12. Springer Science & Business Media, 2011.
M. Al-Batah, B. Zaqaibeh, S. A. Alomari, and M. S. Alzboon, “Gene Microarray Cancer Classification using Correlation Based Feature Selection Algorithm and Rules Classifiers.,” Int. J. Online Biomed. Eng., vol. 15, no. 8, 2019.
E. S. R. B. Situmorang, M. K. Anam, R. Rahmaddeni, and A. N. Ulfah, “Perbandingan Algoritma Svm Dan Nbc Dalam Analisa Sentimen Pilkada Pada Twitter,” CSRID (Computer Sci. Res. Its Dev. Journal), vol. 13, no. 3, pp. 169–179, 2021.
R. Rahmaddeni, M. K. Anam, Y. Irawan, S. Susanti, and M. Jamaris, “Comparison of Support Vector Machine and XGBSVM in Analyzing Public Opinion on Covid-19 Vaccination,” Ilk. J. Ilm., vol. 14, no. 1, 2022.