Klasifikasi Teks untuk Mendeteksi Depresi dan Kecemasan pada Pengguna Twitter Berbasis Machine Learning

Text Classification for Detecting Depression and Anxiety among Twitter Users based on Machine Learning

Authors

  • Kharisma Rahayu STMIK AMIK Riau
  • Vindi Fitria STMIK AMIK Riau
  • Dhini Septhya STMIK AMIK Riau
  • Rahmaddeni Rahmaddeni STMIK AMIK Riau
  • Lusiana Efrizoni STMIK AMIK Riau

DOI:

https://doi.org/10.57152/malcom.v3i2.780

Keywords:

depression, naive bayes, k-nearst neighbor, decision tree, random forest, classification

Abstract

Depresi adalah gangguan mental yang mempengaruhi kesejahteraan dan kualitas hidup seseorang.Pengaruh sosial menyebabkan penderita depresi dan gangguan kecemasan mengabaikan orang-orang di sekitarnya. Jadi mereka beralih ke media sosial seperti Twitter untuk mendapatkan dukungan. Penderita depresi pengguna Twitter sulit untuk diidentifikasi berdasarkan tweet. Oleh karena itu pemodelan klasifikasi teks untuk penderita depresi sangat diperlukan agar mengetahui seberapa banyak pengguna twitter yang mengalami depresi dan kecemasan. Klasifikasi teks  merupakan metode untuk mengelompokkan data yang sejenis ke dalam kelompok yang sesuai. Algoritma yang digunakan dalam membuat pola penderita depresi adalah algoritma Decision Tree, Random Forest, Naive Bayes, dan K-Nearest Neighbor (KNN). Penggunaan keempat algoritma bertujuan untuk melihat kinerja algoritma terbaik. Hasil percobaan yang dilakukan diperoleh bahwa algoritma  Random Forest pada splitting data 80:20 memiliki kinerja yang lebih baik, dengan nilai akurasi sebesar 0.957 atau 96%. Hasil penelitian ini dapat digunakan oleh pengguna untuk mengetahui penderita depresi dan kecemasan.

References

A. Rizki and Y. Sibaroni, “Analisis Sentimen Terhadap Universitas Gunadarma Berdasarkan Opini Pengguna twitter menggunakan metode naive Bayes classifier,” Jurnal Ilmiah Komputasi, vol. 19, no. 4, 2021.

C. D. Manning, P. Raghavan, and H. Schutze, Introduction to Information Retrieval. Cambridge: Cambridge University Press, 2008.

U. Khaira, R. Johanda, P. E. Utomo, and T. Suratno, “Sentiment Analysis of cyberbullying on Twitter using sentistrength,” Indonesian Journal of Artificial Intelligence and Data Mining, vol. 3, no. 1, pp. 21–27, 2020.

J. Jia. L. Nie. F. Feng. C. Zhang. T. Hu. T. S. Chua. W. Zhu. Guangyo Shen, "Depresion Detection via Harvesting Media : A Multimodal Dictionary Learning Solution," in Twenty-Sixth International Joint Conference on Aritificial Intelligence.

D. Septhya, K. Rahayu, S. Rabbani, V. Fitria, R. Rahmaddeni, Y. Irawan, and R. Hayami, Implementasi Algoritma Decision Tree dan Support Vector Machine untuk Klasifikasi Penyakit Kanker Paru: Implementation of Decision Tree Algorithm and Support Vector Machine for Lung Cancer Classification. MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol.3, no. 1,pp. 15-19, 2023.

R. Supriyadi, W. Gata, N. Maulidah, and A. Fauzi, Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah. E-Bisnis: Jurnal Ilmiah Ekonomi Dan Bisnis, vol. 13, no. 2, pp. 67-75, 2020.

C. Ratanamahatana, & D. Gunopulos, Selective Bayesian classifier: feature selection for the Naive Bayesian classifier using decision trees. WIT Transactions on Information and Communication Technologies, 2002.

S. F. Khorshid, and A. M. Abdulazeez, Breast cancer diagnosis based on k-nearest neighbors: a review. J Arch.Egyptol, vol. 18, no. 4, pp. 1927-1951, 2021.

A. Go, R. Bhayani, and L. Huang, Twitter sentiment classification using distant supervision. CS224N project report, Stanford, vol. 1, no. 12, pp. 2009.

M. M. Tadesse, H. Lin, B. Xu, and L. Yang, “Detection of depression-related posts in Reddit Social Media Forum,” IEEE Access, vol. 7, pp. 44883–44893, 2019.

F. P. Rachman, and H. Santoso, Perbandingan Model Deep Learning untuk Klasifikasi Sentiment Analysis dengan Teknik Natural Language Processing. Jurnal Teknologi dan Manajemen Informatika, vol. 7, no. 2, pp. 103-112, 2021.

A. Priya, S. Garg, and N. P. Tigga, “Predicting anxiety, depression and stress in modern life using machine learning algorithms,” Procedia Computer Science, vol. 167, pp. 1258–1267, 2020.

B. Mahesh, Machine learning algorithms-a review. International Journal of Science and Research (IJSR).[Internet], vol. 9, no. 1, pp. 381-386, 2020.

L. Breiman, "Random Forests," Machine Learning, vol. 45, pp. 5-32, 2001.

M. Mohammed, M. B. Khan, and B. E. B. Mohammed, Machine Learning: Algorithms and Applications. Boca Raton: CRC Press, Taylor & Francis Group, 2016.

J. Alzubi, A. Nayyar, and A. Kumar, “Machine learning from theory to algorithms: An overview,” Journal of Physics: Conference Series, vol. 1142, p. 012012, 2018.

J. L. Ward and J. Peppard, Strategic Planning for Information Systems. Chichester: Wiley, 2007.

M. Nurkholifah, and Y. Umar, ANALISA PERFORMA ALGORITMA MACHINE LEARNING DALAM PREDIKSI PENYAKIT LIVER. Jurnal Indonesia: Manajemen Informatika dan Komunikasi, vol. 4, no. 1, pp. 164-172, 2023.

C. Anuradha, and T. Velmurugan, A Comparative Analysis on the Evaluation of Classification Algorithms in the Prediction of Students Performance. Indian Journal of Science and Technology, vol. 8, no. 15, pp. 1-12, 2015.

S. Agustiani, Y. Tajul Arifin, A. Junaidi, S. Khotimatul Wildah, and A. Mustopa, “Klasifikasi Penyakit Daun padi Menggunakan random forest dan color histogram,” Jurnal Komputasi, vol. 10, no. 1, 2022.

J. Yang, C. Zhao, H. Yu, and H. Chen, Use GBDT to predict the stock market, Procedia Computer Science, vol. 174, pp. 161–171, 2020.

S. Samsir, A. Ambiyar, U. Verawardina, F. Edi, and R. Watrianthos, “Analisis Sentimen Pembelajaran daring Pada Twitter di masa pandemi COVID-19 Menggunakan metode naïve Bayes,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 5, no. 1, p. 157, 2021.

W. A. Luqyana, I. Cholissodin, and R. S. Perdana, Analisis Sentimen Cyberbullying Pada Komentar Instagram dengan Metode Klasifikasi Support Vector Machine. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 11, pp. 4704-4713, 2018.

I. B. Manuaba, G. R. Dantes, and G. Indrawan, “Analisis sentimen data provider Layanan Internet Pada Twitter menggunakan support vector machine Dengan Penambahan Algoritma Levenshtein distance,” Jurnal SISKOM-KB (Sistem Komputer dan Kecerdasan Buatan), vol. 5, no. 2, pp. 9–17, 2022.

P. Arora and P. Arora, “Mining twitter data for Depression Detection,” 2019 International Conference on Signal Processing and Communication (ICSC), 2019.

M. R. Hidayatullah and Warih Maharani, “Depression detection on twitter social media using decision tree,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 6, no. 4, pp. 677–683, 2022.

Downloads

Published

2023-09-11