Comparison of K-Means and K-Medoids Algorithms for Grouping Video Game Sales Data in North America

Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Data Penjualan Video Game di Amerika Utara

Authors

  • Aditya Rezky Pratama UIN Suska Riau
  • Bima Maulana Universitas Islam Negeri Sultan Syarif kasim Riau
  • Rahmad Didho Rianda Universitas Islam Negeri Sultan Syarif kasim Riau
  • Syaid El Hasyim Universitas Islam Negeri Sultan Syarif kasim Riau

DOI:

https://doi.org/10.57152/ijirse.v3i2.898

Keywords:

Penjualan video game, Clustering, Data Mining, Davies-Bouldin Index, K-Means

Abstract

Analisis cluster merupakan proses spesifik pengelompokan kumpulan objek ke dalam kelas yang serupa. Kluster adalah sekumpulan objek yang mirip satu sama lain di dalam kluster yang sama dan berbeda dari objek di kluster lain. Deskriptif berarti data mining digunakan untuk menemukan pola yang bisa dipahami orang yang menggambarkan sifat-sifat informasi. Di samping itu data prediktif digunakan dalam membangun model data yang berguna dalam melakukan prediksi. Algoritma K-Means Clustering adalah algoritma yang penting dalam bidang data mining dan mudah untuk diimplementasikan dan dijalankan. Selain itu, metode pengelompokan K-Means memiliki varian pengembangan yaitu K-Medoids. Algoritma K-Medoids membantu mengatasi kelemahan dari algoritma K-Means. Banyak data yang akan diambil sebagai sampel adalah 2000 record data. Data tersebut akan diproses yang nantinya akan diperoleh pola rata-rata penjualan video game di Amerika Utara. Dari percobaan yang dilakukan, didapatkan hasil pengolahan K-means menggunakan Rapidminer dengan waktu yang diperlukan hanya rata-rata 1 detik sebaliknya pengolahan data dengan K-medoids memerlukan waktu 2 menit 21 detik. Nilai Davies-Bouldin Index (DBI) pada K-Means  lebih rendah dibandingkan K-Medoids yaitu masing-masing 0.727  dan 1.148 yang berarti penggunaan K-means lebih tepat untuk pengolahan data penjualan video game di Amerika Utara.

References

Arora P, D. D. (2016). Analysis of K-Means and K-Medoids Algorithm For Big Data. International Conference on Information Security & Privacy (ICISP2015), (pp. 507-512).

Aryani, M., & dkk. (2018). Costumer Segmentation in XYZ Bank using K-Means and K-Medoids Clustering. International Conference on Information Management and Technology (ICIMTech), (pp. 412-416). Jakarta.

Balabantaray RC, S. C. (2013). Document clustering using K-Means and K-Medoids. International Journal of Knowledge Based Computer System, 7-13.

Batra, D. A. (2011). Analysis and Approach: K-Means and K-Medoids Data Mining Algorithms. India.

Han J, K. M. (2006). Data Mining: Concept and Techniques. Morgan Kauffman.

Han J, K. M. (2012). Data Mining : Concepts and techniques. USA: Elsevier Inc.

Han, M. &. (2009). Geographic Data Mining and Knowledge Discovery. Boca Raton.

Herviany, M ., & dkk. (2021). Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokkan Daerah Rawan Tanah Longsor di Provinsi Jawa Barat, Indonesian Journal of Machine Learning and Computer Science (MALCOM), 34-40

Kaur, N. K. (2014). K-Medoids Clustering Algorithm.

Kurmiati, D., & dkk (2021) Klasterisasi Daerah Rawan Gempa Bumi di Indonesia Menggunakan Algoritma K-Medoids, Indonesian Journal of Machine Learning and Computer Science (MALCOM), 47-57

Luchia, T. N., & dkk (2022) Perbandingan K-Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia, Indonesian Journal of Machine Learning and Computer Science (MALCOM), 35-41

MT., U. H. (2017). Students Academic Performance Using Partitioning Clustering Algorithms. International Journal of Advanced Research in Computer Science, 640-644.

Nanda, A. (2016). Comparative Study between Parallel K-Means and Parallel K-Medoids using Message Passing Interface (MPI). International Journal on Information and Communication of Technology, 27-36.

Okfalisa, M. G. (2017). Comparative Analysis Of K-Nearest Neighbor. Information Technology, Information Systems and Electrical Engineering (ICITISEE), 294-298.

Singh K, M. D. (2011). Evolving Limitations in K-Means Algorithm in Data Mining and Their Removal. International Journal of Computational Engineering & Management (IJCEM), 105-109.

Suyanto. (2017). Data Mining Untuk Klasifikasi dan Klasterisasi Data. Bandung: INFORMATIKA.

TS, M. (2011). Comparison Between K-Means and K-Medoids Clustering Algorithms. International Journal of Advanced Computing (IJAC), 65-69.

WA, T. (2015). Algoritma K-Medoids Untuk Penentuan Strategi Pemasaran Produk. Jurnal Teknik Industri, Mesin, Elektro, dan Ilmu Komputer, 183-188.

Wu, X. &. (2009). The Top Ten Algorithms in Data Mining. London: CRC Press.

Downloads

Published

2023-09-29