Evaluasi Komparatif Kinerja Algoritma Naïve Bayes dan Logistic Regression dalam Klasifikasi Sentimen Komentar YouTube Berbahasa Indonesia

Comparative Performance Evaluation of Naïve Bayes and Logistic Regression for Indonesian YouTube Comment Sentiment Classification

Authors

  • Meisa Monica STMIK IM Bandung
  • Asto Purwanto STMIK IM Bandung

DOI:

https://doi.org/10.57152/malcom.v6i2.2639

Keywords:

Analisis Sentimen, Klasifikasi Teks, Naïve Bayes, Regresi Logistik, TF-IDF

Abstract

Komentar pengguna pada platform YouTube merupakan sumber informasi yang dapat dimanfaatkan untuk memahami kecenderungan opini publik terhadap berbagai layanan digital. Namun, komentar tersebut umumnya berbentuk teks tidak terstruktur sehingga proses analisis secara manual menjadi kurang efektif ketika jumlah data sangat besar. Oleh karena itu, diperlukan pendekatan berbasis machine learning untuk mengolah serta mengklasifikasikan opini pengguna secara otomatis. Penelitian ini melakukan analisis sentimen terhadap komentar YouTube berbahasa Indonesia yang dikumpulkan menggunakan beberapa kata kunci terkait layanan digital. Data yang diperoleh kemudian diproses melalui tahapan pembersihan teks, normalisasi, serta pembentukan representasi fitur menggunakan metode TF-IDF. Untuk meningkatkan kualitas model klasifikasi, dilakukan optimasi parameter serta penyeimbangan distribusi data menggunakan teknik SMOTE. Hasil evaluasi berdasarkan metrik accuracy, precision, recall, dan F1-score menunjukkan bahwa model klasifikasi mampu menghasilkan performa yang baik dengan tingkat akurasi tertinggi mencapai 84,88%. Selain itu, distribusi hasil klasifikasi memperlihatkan bahwa kategori sentimen positif lebih dominan dibandingkan dengan kategori netral dan negatif pada data komentar yang dianalisis.

Downloads

Download data is not yet available.

References

I. G. B. A. Budaya and I. K. P. Suniantara, “Comparison of Sentiment Analysis Algorithms with SMOTE Oversampling and TF-IDF Implementation on Google Reviews for Public Health Centers,” MALCOM: Indonesian Journal of Machine learning and Computer Science, vol. 4, no. 3, pp. 1077–1086, Jul. 2024, doi: 10.57152/malcom.v4i3.1459.

A. R. Abdillah and F. N. Hasan, “Analisis Sentimen Terhadap Kandidat Calon Presiden Berdasarkan Tweets Di Sosial Media Menggunakan Naive Bayes Classifier,” SMATIKA JURNAL, vol. 13, no. 01, pp. 117–130, Jul. 2023, doi: 10.32664/smatika.v13i01.750.

A. Asro, N. Azizah, and Sudaryono, “Public Sentiment Analysis onthe2024 Presidential Election Using Naive Bayes Classifier (NBC) and Support Vector Machine (SVM) On Social Media Data,” vol. 1, p. 0226, Jun. 2024.

J. Zoti, M. Rahman, S. Ahmed, A.-A. Akib, and S. Khan, Sentiment Analysis of YouTube Comments: A Comprehensive Study of Machine learning Models. 2025.

Asro, A. Sulaiman, Henderi, and Sudaryono, “Performance Comparison of Naive Bayes and Logistic Regression for Sentiment Analysis of YouTube Comments on Indonesia’s Education System,” in 2025 13th International Conference on Awareness Science and Technology (iCAST), IEEE, Nov. 2025, pp. 1–6. doi: 10.1109/iCAST68191.2025.11300032.

N. Sulistianingsih and I. N. Switrayana, “Enhancing Sentiment Analysis for the 2024 Indonesia Election Using SMOTE-Tomek Links and Binary Logistic Regression,” International Journal of Education and Management Engineering, vol. 14, no. 3, pp. 22–32, Jun. 2024, doi: 10.5815/ijeme.2024.03.03.

O. El?Azzouzy, T. Chanyour, and S. J. Andaloussi, “Transformer-based models for sentiment analysis of YouTube video comments,” Sci. Afr., vol. 29, p. e02836, Sep. 2025, doi: 10.1016/j.sciaf.2025.e02836.

C. A. Nurhaliza Agustina, R. Novita, Mustakim, and N. E. Rozanda, “The Implementation of TF-IDF and Word2Vec on Booster Vaccine Sentiment Analysis Using Support Vector Machine Algorithm,” Procedia Comput. Sci., vol. 234, pp. 156–163, 2024, doi: 10.1016/j.procs.2024.02.162.

I. G. B. A. Budaya and I. K. P. Suniantara, “Comparison of Sentiment Analysis Algorithms with SMOTE Oversampling and TF-IDF Implementation on Google Reviews for Public Health Centers,” MALCOM: Indonesian Journal of Machine learning and Computer Science, vol. 4, no. 3, pp. 1077–1086, Jul. 2024, doi: 10.57152/malcom.v4i3.1459.

H. Henderi, “Utilizing Sentiment Analysis for Reflect and Improve Education in Indonesia,” Journal of Applied Data Sciences, vol. 6, no. 1, pp. 189–200, Jan. 2024, doi: 10.47738/jads.v6i1.527.

S. W. Iriananda, R. W. Budiawan, A. Y. Rahman, and I. Istiadi, “Optimasi Klasifikasi Sentimen Komentar Pengguna Game Bergerak Menggunakan Svm, Grid Search Dan Kombinasi N-Gram,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 4, pp. 743–752, Aug. 2024, doi: 10.25126/jtiik.1148244.

L. Hickman, S. Thapa, L. Tay, M. Cao, and P. Srinivasan, “Text Preprocessing for Text mining in Organizational Research: Review and Recommendations,” Organ. Res. Methods, vol. 25, no. 1, pp. 114–146, Jan. 2022, doi: 10.1177/1094428120971683.

A. Robi Padri, A. Asro, and I. Indra, “Classification of Traffic Congestion in Indonesia Using the Naive Bayes Classification Method,” Journal of World Science, vol. 2, no. 6, pp. 877–888, Jun. 2023, doi: 10.58344/jws.v2i6.285.

X. Jiang and C. Xu, “Deep Learning and Machine learning with Grid Search to Predict Later Occurrence of Breast Cancer Metastasis Using Clinical Data,” J. Clin. Med., vol. 11, no. 19, p. 5772, Sep. 2022, doi: 10.3390/jcm11195772.

A. S. Aribowo, N. H. Cahyana, and Y. Fauziah, “Enhancing Semi-Supervised Sentiment Analysis Through Hyperparameter Tuning Within Iterations: A Comparative Study Using Grid Search and Random Search,” 2024, pp. 248–260. doi: 10.2991/978-94-6463-366-5_23.

A. D. Rachmatsyah, T. Sugihartono, and K. Irfan, “Perbandingan Teknik Optimasi Grid Search Dan Randomized Search Dalam Meningkatkan Akurasi Metode Klasifikasi Svm Pada Sentimen Ulasan Pengguna Aplikasi Jkn Mobile,” SKANIKA: Sistem Komputer dan Teknik Informatika, vol. 8, no. 1, pp. 13–22, Dec. 2024, doi: 10.36080/skanika.v8i1.3328.

Downloads

Published

2026-05-01

How to Cite

Monica, M., & Purwanto, A. (2026). Evaluasi Komparatif Kinerja Algoritma Naïve Bayes dan Logistic Regression dalam Klasifikasi Sentimen Komentar YouTube Berbahasa Indonesia: Comparative Performance Evaluation of Naïve Bayes and Logistic Regression for Indonesian YouTube Comment Sentiment Classification. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 6(2), 934-943. https://doi.org/10.57152/malcom.v6i2.2639