MALCOM: Indonesian Journal of Machine Learning and Computer Science
https://journal.irpi.or.id/index.php/malcom
<p><strong>MALCOM: Indonesian Journal of Machine Learning and Computer Science</strong> is a scientific journal published by the Institut Riset dan Publikasi Indonesia (IRPI) in collaboration with several Universities throughout Riau and Indonesia. MALCOM will be published 4 (four) times a year, January, April, July and October, each edition containing more than 20 articles articles (Start at Vol. 3 No. 2 October 2023). Articles may be written in Indonesian or English. articles are original research results with a maximum plagiarism of 15%. Articles submitted to MALCOM will be reviewed by at least 2 (two) reviewers. Papers must be submitted via the Open Journal System (OJS) in .doc or .docx format. The entire process until MALCOM is published will be free of charge. MALCOM is registered in National Library with Number International Standard Serial Number (ISSN) Printed: <a href="https://issn.brin.go.id/terbit/detail/20210528410989325" target="_blank" rel="noopener">2797-2313</a> and Online <a href="https://issn.brin.go.id/terbit/detail/1615088206" target="_blank" rel="noopener">2775-8575</a>. </p>
Institut Riset dan Publikasi Indonesia
en-US
MALCOM: Indonesian Journal of Machine Learning and Computer Science
2797-2313
<p><strong><em>Copyright © by Author; Published by Institut Riset dan Publikasi Indonesia (IRPI)</em></strong></p> <p><a href="https://creativecommons.org/licenses/by-sa/4.0/" rel="license"><img src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" alt="Creative Commons License" /></a></p> <p>This <a href="https://journal.irpi.or.id/index.php/malcom/index" rel="cc:attributionURL">Indonesian Journal of Machine Learning and Computer Science</a> is licensed under a <a href="https://creativecommons.org/licenses/by-sa/4.0/" rel="license">Creative Commons Attribution-ShareAlike 4.0 International License</a>.</p>
-
Smart Prescription Reader: Enhancing Accuracy in Medical Prescriptions
https://journal.irpi.or.id/index.php/malcom/article/view/1934
<p>Reading a doctor's handwritten prescription is a challenge faced by most patients and some pharmacists, which in some cases can lead to negative consequences due to misinterpretation of the prescription. The "Doctor's Handwritten Prescription BD Dataset" on Kaggle contains segmented images of handwritten prescription words from BD (Bangladesh) doctors. This dataset, intended for machine learning applications, includes 4,680 individual words segmented from prescription images. This study introduces a Handwriting Recognition System using Convolutional Neural Network (CNN) developed to identify text in prescription images written by doctors and convert the cursive handwriting into readable text. Two models were evaluated in this study: CNN and MobileNet. Based on the experiments, MobileNet showed better results compared to CNN alone. From the dataset of 4,680 words, 3,120 were used for training, 780 for testing, and 780 for validation. The study achieved a training accuracy of 97%, a testing accuracy of 88%, and a validation accuracy of 83%. The developed model was successfully implemented in a web application</p>
Ragil Yulianto
Copyright (c) 2025 Ragil Yulianto
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
738
745
10.57152/malcom.v5i3.1934
-
Revolutionizing Corporate Event Planning with AI: A Cost-Efficiency Strategy for BuatEvent.id
https://journal.irpi.or.id/index.php/malcom/article/view/1929
<p>BuatEvent.id leverages an AI-driven platform for event planning, powered by Gemini.ai—a sophisticated NLP model with an accuracy rate of 92.5%. The system integrates multiple technologies, including PHP, Python, Golang, Flutter, and MySQL, to automate essential processes, achieving a 25% improvement in planning precision. This study aims to evaluate the role of AI in enhancing budget management and corporate event customization. By addressing the inefficiencies of conventional event planning, this platform optimizes workflows, enhances overall productivity, and offers a seamless user experience customized to cater to a wide range of client requirements. The results demonstrate a 92.5% accuracy in processing user queries and a 25% increase in event planning efficiency, highlighting the platform’s ability to deliver cost-effective and personalized solutions. These figures were obtained through internal testing using a dataset of 200 annotated user queries. The platform primarily targets corporate events, including workshops, product launches, and business meetings.For example, the system was successfully deployed during a corporate training event in Jakarta, where it reduced planning time by 30%.</p>
Muhammad Supriyadi
Yan Rianto
Copyright (c) 2025 Muhammad Supriyadi, Yan Rianto
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
746
754
10.57152/malcom.v5i3.1929
-
AI-Powered: Leveraging Teachable Machine for Real-time Scanner
https://journal.irpi.or.id/index.php/malcom/article/view/1931
<p>Effective inventory control is essential in optimizing profitability through cost control and efficiency expectations. Conventional inventory techniques frequently find it difficult to adjust to the fast-changing restaurant setting, resulting in surplus stock, inventory deficits, and unnecessary food waste. Nonetheless, a notable shift is approaching, as the incorporation of artificial intelligence (AI) may help address this issue. AI-powered inventory management systems help restaurants optimize stock levels, reduce waste, and predict demand more accurately, leading to improved efficiency and increased profitability. This study explores how AI-driven inventory management enhances efficiency, reduces waste, and automates restocking in the restaurant sector, with a particular focus on TastyGo's integration of Teachable Machine and TensorFlow Lite. The suggested solution uses picture recognition for real-time inventory tracking, and machine learning models to predict demand and replenishment automation. TastyGo can expedite supply chain management, save waste through predictive analytics, and improve its inventory by employing these AI techniques. This study shows how AI-driven solutions may boost decision-making, reduce food waste, and greatly increase operational efficiency, all of which can result in higher profitability. The findings highlight how AI technologies have the potential to revolutionize conventional inventory management systems in the restaurant industry.</p>
Frizca Fellicita Marcelly
Yan Rianto
Copyright (c) 2025 Frizca Fellicita Marcelly, Yan Rianto
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
755
765
10.57152/malcom.v5i3.1931
-
Optimization of Customer Segmentation in the Retail Industry Using the K-Medoid Algorithm
https://journal.irpi.or.id/index.php/malcom/article/view/1977
<p>The retail industry faces significant challenges in understanding increasingly complex customer behavior due to massive data growth. One major obstacle is suboptimal customer segmentation, leading to ineffective marketing strategies. This study aims to optimize customer segmentation by implementing the K-Medoid algorithm, which excels in handling outliers and producing more stable clusters compared to K-Means. The dataset consists of over 10,000 customer transactions from a major retail company in Indonesia. The research process includes data collection and preprocessing, K-Medoid algorithm implementation, and performance evaluation using the silhouette score. The results indicate that the K-Medoid algorithm achieves more accurate customer segmentation, with a silhouette score of 0.39. The generated clusters exhibit greater homogeneity, enabling companies to design more targeted marketing strategies, such as specific discount offers and tailored loyalty programs. Based on these findings, the K-Medoid algorithm is recommended to enhance customer management effectiveness in the retail industry. This study contributes to selecting a more suitable algorithm for customer segmentation in the era of big data and opens opportunities for further exploration of hybrid algorithms and additional evaluation metrics.</p>
Endy Wulan Agustin
Kurnia Uthami
Arvan Izzatul Ulfa
Lusiana Efrizoni
Rahmaddeni
Copyright (c) 2025 Endy Wulan Agustin, Kurnia Uthami, Arvan Izzatul Ulfa, Lusiana Efrizoni, Rahmaddeni
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
766
775
10.57152/malcom.v5i3.1977
-
Internet of Things Based Air Quality Monitoring System with Automatic Notification
https://journal.irpi.or.id/index.php/malcom/article/view/1945
<p>Internet of Things (IoT)-based air quality monitoring systems represent a significant advancement in urban environmental management. This research implements a system that integrates PM2.5, PM10, CO2, and NO2 sensors for real-time monitoring of pollutants. The results showed that the integration of IoT technology with cloud computing and machine learning algorithms successfully created a responsive and accurate monitoring system. The model achieved maximum accuracy during the training process, with promising predictive capabilities in real-world implementation. The main findings of the study confirmed that the Weighted Class (WC) approach significantly improved performance in the testing and prediction process by addressing class imbalance in the dataset, while the Data Augmentation (DA) technique did not show the expected improvement due to the intrinsic characteristics of air quality data. The automatic notification system successfully provides early warnings when air quality exceeds specified thresholds, enabling proactive responses from authorities and the public. The implementation of a web-based monitoring dashboard provides comprehensive visualization of data for long-term analysis. This research contributes to the development of smart cities by providing an effective framework for air quality management, supporting data-driven decision-making, and increasing public awareness of environmental conditions.</p>
Devi Nur Azizah
Sri Heranurweni
La Ode Muhamad Idris
Copyright (c) 2025 Devi Nur Azizah, Sri Heranurweni, La Ode Muhamad Idris
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
776
787
10.57152/malcom.v5i3.1945
-
Real-Time Road Damage Detection on Mobile Devices using TensorFlow Lite and Teachable Machine
https://journal.irpi.or.id/index.php/malcom/article/view/1933
<p>This study presents a mobile-based road damage detection system using Teachable Machine and TensorFlow Lite to support real-time monitoring and efficient infrastructure maintenance. The system identifies road damage types such as cracks, potholes, and uneven surfaces. The RDD2020 dataset is used for model training, with preprocessing steps including augmentation, normalization, and resizing. A Convolutional Neural Network (CNN) model is trained through Teachable Machine for ease of customization. TensorFlow Lite is employed for on-device inference, with optimization techniques like quantization and pruning applied to improve speed and reduce model size. The system is evaluated using precision, recall, F1-score, and accuracy metrics under varying lighting and weather conditions. The final model is deployed in a mobile app using TensorFlow Lite Interpreter for efficient performance. Experimental results show high detection accuracy, with a precision of X% and F1-score of Y% (insert actual values). This approach offers a lightweight, cost-effective solution for road maintenance authorities and urban planners. Future enhancements include dataset expansion, integration with mapping tools, and improved robustness in diverse environments. Overall, the proposed system enables real-time, accurate road damage detection and supports smarter, eco-friendly infrastructure management.</p>
Lusindah Nova
Yan Rianto
Copyright (c) 2025 Lusindah Nova, Yan Rianto
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
788
796
10.57152/malcom.v5i3.1933
-
Perbandingan Kinerja Algoritma Clustering K-Means dan K-Medoids dalam Pengelompokan Sekolah di Provinsi Riau Berdasarkan Ketersediaan Sarana dan Prasarana
https://journal.irpi.or.id/index.php/malcom/article/view/1950
<p>Pendidikan yang berkualitas sangat dipengaruhi oleh ketersediaan sarana dan prasarana yang memadai. Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma <em>clustering</em>, yaitu <em>K-Means</em> dan <em>K-Medoids,</em> dalam mengelompokkan 497 sekolah negeri di Provinsi Riau yang terdiri dari jenjang SD, SMP, SMA, dan SMK. Data yang dianalisis meliputi jumlah guru, siswa, ruang kelas, laboratorium, akses internet, sanitasi, dan status akreditasi. Data diperoleh dari Dinas Pendidikan dan Badan Pusat Statistik (BPS) Provinsi Riau, kemudian dianalisis melalui <em>Exploratory Data Analysis (</em>EDA<em>),</em> <em>preprocessing,</em> dan reduksi dimensi dengan <em>Principal Component Analysis (</em>PCA<em>).</em> Hasil evaluasi menggunakan <em>Davies-Bouldin Index (</em>DBI<em>)</em> dengan k=3 menunjukkan bahwa <em>K-Medoids</em> menghasilkan <em>cluster</em> yang lebih terpisah dan lebih baik (0,61) dibandingkan <em>K-Means</em> (0,80). Keunggulan <em>K-Medoids</em> terletak pada ketahanannya terhadap <em>outlier</em> dan distribusi data yang tidak merata. Hasil penelitian ini dapat digunakan sebagai acuan dalam perencanaan kebijakan pendidikan yang lebih merata dan tepat sasaran di Provinsi Riau.</p>
Muhammad Dzaki Salman
Rahmaddeni Rahmaddeni
Nanda Rizki Pratama
M. Nakhlah Farid A
Ahmad Agung Setiawan
Fenisya Zalianti
Isra Bil Huda
Copyright (c) 2025 Muhammad Dzaki Salman, Rahmaddeni, Nanda Rizki Pratama , M. Nakhlah Farid A, Ahmad Agung Setiawan , Fenisya Zalianti, Isra Bil Huda
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
797
806
10.57152/malcom.v5i3.1950
-
Pengunaan Barcode dalam Sistem Inventory Modern untuk Meningkatkan Akurasi dan Kecepatan Operasional
https://journal.irpi.or.id/index.php/malcom/article/view/1943
<p>Pengelolaan stok di gudang sering menghadapi tantangan seperti kesalahan pencatatan, inefisiensi proses, dan kurangnya transparansi data. Untuk mengatasinya, penelitian ini bertujuan merancang dan mengimplementasikan aplikasi inventory berbasis barcode guna meningkatkan efisiensi dan akurasi operasional. Aplikasi dilengkapi dengan fitur seperti pendaftaran produk, pemindaian barcode untuk barang masuk dan keluar, serta pencatatan riwayat transaksi secara real-time dan terintegrasi. Teknologi barcode memungkinkan pencatatan otomatis yang dapat mengurangi kesalahan manusia dan mempercepat proses pengelolaan stok. Metode pengembangan sistem yang digunakan adalah metode <em>Prototyping,</em> yang memungkinkan pengembangan sistem dilakukan secara bertahap melalui pembuatan model awal dan penyempurnaan berkelanjutan berdasarkan umpan balik pengguna. Pendekatan ini sesuai diterapkan dalam kondisi di mana kebutuhan sistem belum sepenuhnya terdefinisi sejak awal. Studi kasus dilakukan pada sebuah gudang distribusi untuk menguji potensi aplikasi dalam meningkatkan keandalan data dan transparansi pelaporan. Penelitian ini diharapkan dapat memberikan kontribusi terhadap pengembangan sistem inventory yang lebih adaptif, akurat, dan efisien di sektor logistik dan distribusi.</p>
Sahidin Achmad Noor Maulana
Esti Wijayanti
Ahmad Abdul Chamid
Copyright (c) 2025 Sahidin Achmad Noor Maulana; Esti Wijayanti, Ahmad Abdul Chamid
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
807
818
10.57152/malcom.v5i3.1943
-
Eksplorasi Variabel Berpengaruh dan Akurasi Algoritma Naive Bayes Classifier untuk Mengklasifikasikan Performa Siswa Sekolah Dasar
https://journal.irpi.or.id/index.php/malcom/article/view/1813
<p>Literasi numerasi memungkinkan seseorang untuk menggunakan angka dan simbol matematika dasar guna menyelesaikan tantangan praktis dalam kehidupan sehari-hari. Data perkembangan kemampuan matematika di antara siswa Indonesia melalui penilaian <em>Program for International Student Assessment</em> (PISA) pada tahun 2022, menunjukkan bahwa Indonesia berada pada posisi ke-71 dari 81 negara. Hasil PISA yang rendah tersebut terkonfirmasi oleh hasil nilai Asesmen Kompetensi Minimum (AKM) literasi numerasi Sumba Timur yang berada di angka 33,37 (skala 0-100) pada tahun 2023. Nilai PISA dan AKM yang sangat rendah menunjukkan rendahnya pondasi kemampuan matematika anak, sehingga perlu adanya pengidentifikasian sejak dini kepada siswa Sekolah Dasar (SD). Perkembangan data dalam konteks pendidikan dan evolusi pendidikan modern telah mendorong penggunaan berbagai teknik data mining untuk memantau performa siswa dengan cara-cara penelusuran yang beragam untuk menganalisis dan menemukan informasi yang tersembunyi dalam sistem pendidikan. Data mining pada data pendidikan biasa disebut dengan educational data mining (EDM). Penelitian dilakukan dengan mengumpulkan data hasil belajar siswa SD kelas 4 untuk mata pelajar matematika dan beberapa data demografis siswa. Melalui penelitian ini diketahui bahwa variabel RT1, RT2, dan PTS memiliki hubungan yang kuat dengan variabel terikat PAS. Model yang dibentuk oleh Algoritme Naive Bayes berhasil mengklasifikasikan performa belajar siswa dengan akurasi sebesar 92%.</p>
Arini Aha Pekuwali
Vidriana Oktoviana Bano
Alfred Domu D. Panja
Fajar Indra Prasetyo
Copyright (c) 2025 Arini Aha Pekuwali, Vidriana Oktoviana Bano, Alfred Domu D. Panja, Fajar Indra Prasetyo
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
819
829
10.57152/malcom.v5i3.1813
-
Perbandingan Algoritma K-Nearest Neighbors dan Random Forest untuk Rekomendasi Gaya Hidup Sehat dalam Mencegah Penyakit Jantung
https://journal.irpi.or.id/index.php/malcom/article/view/1972
<p>Penyakit jantung merupakan salah satu penyebab utama kematian yang disebabkan oleh faktor gaya hidup tidak sehat. Untuk mengatasi permasalahan ini, penelitian ini membandingkan algoritma <em>K-Nearest Neighbors</em> (KNN) dan <em>Random Forest</em> (RF) dalam memberikan rekomendasi gaya hidup sehat guna mencegah penyakit jantung. Dataset yang digunakan terdiri dari 1.025 entri dengan 14 fitur, yang telah melalui tahap <em>preprocessing</em>, termasuk normalisasi, seleksi fitur, dan pembagian data 80:20 serta 70:30. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa <em>Random Forest</em> memiliki akurasi lebih tinggi (99% pada skenario 80:20 dan 98% pada skenario 70:30) dibandingkan KNN (83% dan 86%), serta lebih stabil dalam mengklasifikasikan risiko penyakit jantung. Analisis fitur menunjukkan bahwa <em>Chest Pain Type</em> (CP) atau nyeri dada merupakan faktor paling berpengaruh. Berdasarkan hasil ini, direkomendasikan pola makan sehat, aktivitas fisik teratur, manajemen stres, serta pemeriksaan kesehatan rutin. Kesimpulannya, <em>Random Forest</em> lebih efektif dalam sistem rekomendasi gaya hidup sehat, dan penelitian selanjutnya dapat menggunakan dataset lebih besar dengan variabel tambahan guna meningkatkan akurasi prediksi.</p>
Elza Sahelvi
Putri Cikita
Riska Mela Sapitri
Rahmaddeni Rahmaddeni
Lusiana Efrizoni
Copyright (c) 2025 Elza Sahelvi, Putri Cikita, Riska Mela Sapitri, Rahmaddeni Rahmaddeni, Lusiana Efrizoni
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
830
840
10.57152/malcom.v5i3.1972
-
Implementasi Computer Vision dalam Mendeteksi Penyakit pada Tanaman Cabai dan Tomat Menggunakan Algoritma Convolutional Neural Networks
https://journal.irpi.or.id/index.php/malcom/article/view/1989
<p>Computer Vision banyak diterapkan dalam bidang pertanian untuk mendeteksi penyakit tanaman secara otomatis. Penelitian ini mengembangkan aplikasi berbasis web menggunakan Algoritma Convolutional Neural Networks (CNN) untuk mendeteksi penyakit pada tanaman cabai dan tomat. Aplikasi ini dibangun dengan HyperText Markup Language (HTML), Cascading Style Sheets (CSS), Python, JavaScript, dan Flask, memungkinkan pengguna mengunggah gambar tanaman untuk diklasifikasikan. Model CNN mencapai akurasi pelatihan 91%. Saat diuji menggunakan dataset terpisah, model memperoleh akurasi tinggi. Namun, setelah diterapkan dalam aplikasi untuk deteksi nyata, akurasi menurun menjadi 75%, yang bisa disebabkan oleh kondisi pencahayaan, kualitas gambar, dan perbedaan dataset. Kesalahan untuk deteksi nyata terutama terjadi pada kelas Cabai Leaf Curl 50% dan Tomat Normal 40% dari masing-masing 10 kali uji deteksi sampel. Analisis kinerja model menggunakan precision, recall, dan F1-score menunjukkan bahwa Cabai Leaf Curl memiliki recall tertinggi sebesar 0.9619 dan memiliki precision tertinggi 0.9711. Sementara pada Tomat Late Blight mendapatkan skor terendah pada Recall 0.7594 dan F1-Score 0.8510, menunjukkan tantangan dalam klasifikasi. Analisis heatmap mengungkapkan bahwa model berfokus pada fitur gambar tertentu tetapi tidak selalu pada area penyakit. Peningkatan kinerja melalui optimasi preprocessing data, augmentasi gambar, dan arsitektur model yang lebih kompleks diperlukan untuk meningkatkan akurasi serta mengurangi kesalahan klasifikasi.</p>
Deris Pakiding
Ahmad Selao
Wahyuddin Wahyuddin
Copyright (c) 2025 Deris Pakiding, Ahmad Selao, Wahyuddin Wahyuddin
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
841
850
10.57152/malcom.v5i3.1989
-
Model Prediksi Dampak Perubahan Iklim pada Ketahanan Pangan Menggunakan Algoritma Support Vector Machine and K-Nearest Neighbors
https://journal.irpi.or.id/index.php/malcom/article/view/1975
<p>Perubahan iklim memberikan dampak signifikan terhadap ketahanan pangan global, terutama di wilayah yang sangat bergantung pada sektor agrikultur. Fenomena seperti curah hujan ekstrem, kenaikan suhu, dan perubahan pola angin telah memengaruhi produktivitas pertanian secara signifikan. Urgensi penelitian ini terletak pada pentingnya pengembangan model prediktif berbasis data untuk mengantisipasi dampak perubahan iklim terhadap ketahanan pangan, sehingga strategi adaptasi dapat dirancang secara tepat oleh pembuat kebijakan. Penelitian ini bertujuan mengembangkan model prediksi dampak perubahan iklim terhadap ketahanan pangan dengan memanfaatkan algoritma Support Vector Machine (SVM) dan <em>K-Nearest Neighbors </em>(KNN). <em>Dataset </em>yang digunakan meliputi data meteorologi harian, seperti curah hujan (<em>precipitation</em>), suhu maksimum (<em>temp_max</em>), suhu minimum (<em>temp_min</em>), dan kecepatan angin (<em>wind</em>), yang diperoleh dari <em>Kaggle</em> (<em>Seattle</em> <em>weather</em>). Model SVM diterapkan untuk menangkap hubungan non-linear antara parameter iklim dengan indikator ketahanan pangan, sedangkan KNN digunakan untuk menganalisis pola serupa pada data historis. Hasil penelitian menunjukkan bahwa SVM memiliki akurasi prediksi sebesar 78%, lebih unggul dibandingkan KNN yang mencapai akurasi 74%. Temuan ini membuktikan bahwa SVM lebih efektif dalam memodelkan keterkaitan antara variabel iklim dan ketahanan pangan. Dengan demikian, penelitian ini berhasil mencapai tujuannya dan memberikan kontribusi penting dalam pengembangan sistem prediksi berbasis machine learning untuk mendukung kebijakan pangan yang adaptif terhadap perubahan iklim.</p>
Devi Puspita Sari
Risman Risman
Fitra Maulana
Lusiana Efrizoni
Rahmaddeni Rahmaddeni
Copyright (c) 2025 Devi Puspita Sari, Risman Risman, Fitra Maulana, Lusiana Efrizoni, Rahmaddeni Rahmaddeni
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
851
861
10.57152/malcom.v5i3.1975
-
Perbandingan Performa Random Forest dan Long Short-Term Memory dalam Klasifikasi Teks Multilabel Terjemahan Hadits Bukhari
https://journal.irpi.or.id/index.php/malcom/article/view/2046
<p>Hadits merupakan fondasi utama kedua dalam Islam, yang memandu umat Islam dalam menafsirkan nilai-nilai Islam dan mengimplementasikannya secara nyata dalam berbagai aspek kehidupan. Salah satu perawi hadits yang paling dihormati adalah Imam Bukhari, yang dikenal dengan ketelitian dan ketegasannya dalam memilih hadits-hadits yang otentik. Penelitian ini menggunakan data dari terjemahan hadis dari Sahih Bukhari ke dalam bahasa Indonesia yang telah diklasifikasikan ke dalam tiga kategori utama, yaitu anjuran, larangan, dan informasi. Untuk mengidentifikasi karakteristik masing-masing kategori, klasifikasi teks dilakukan dengan menggunakan dua metode populer, yaitu Random Forest (RF) dan Long Short-Term Memory (LSTM), yang dikenal efektif dalam memproses data teks berskala besar dan kompleks. Tujuan dari penelitian ini adalah untuk menguji perbedaan kinerja antara kedua metode tersebut dalam mengelompokkan hadis yang datanya telah lengkap. Hasil evaluasi menunjukkan bahwa metode RF mencapai akurasi tertinggi sebesar 89,48%, sedikit lebih unggul dari LSTM yang memperoleh 88,52%. Kedua metode mencatat nilai Hamming Loss yang sama, yaitu 0,1048 (89,52%). Temuan ini menunjukkan bahwa kelengkapan dan kualitas data hadis Bukhari berkontribusi dalam meningkatkan akurasi klasifikasi dengan memberikan konteks dan variasi yang lebih baik untuk model.</p>
Rizmah Zakiah Nur Ahmad
Nazruddin Safaat Harahap
Surya Agustian
Iwan Iskandar
Suwanto Sanjaya
Copyright (c) 2025 Rizmah Zakiah Nur Ahmad, Nazruddin Safaat Harahap, Surya Agustian, Iwan Iskandar, Suwanto Sanjaya
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
862
874
10.57152/malcom.v5i3.2046
-
Analisis Faktor-Faktor yang Mempengaruhi Engagement Video di Platform TikTok Menggunakan Multiple Linear Regression
https://journal.irpi.or.id/index.php/malcom/article/view/1987
<p><em>TikTok </em>telah berkembang menjadi salah satu platform interaksi digital terkenal secara luas di seluruh dunia, yang memiliki lebih dari satu miliar orang pengguna aktif. Namun, sebagian video di <em>TikTok</em> memperoleh tingkat engagement yang tinggi meskipun menggunakan pendekatan konten yang serupa. Riset ini dimaksudkan untuk menelusuri unsur-unsur yang memberikan pengaruh terhadap <em>engagement</em> video di TikTok dengan menerapkan algoritma Regresi Linear Berganda. Variabel yang dianalisis meliputi durasi video, jumlah tayangan, komentar, <em>like, share</em>, dan <em>download</em>. Setelah melalui tahap preprocessing data, seleksi fitur, dan pengujian asumsi regresi, ditemukan bahwa <em>video_like_count</em>, <em>video_share_count</em>, dan <em>video_download_count</em> memiliki pengaruh paling signifikan terhadap jumlah tayangan. Hasil evaluasi model membuktikan bahwa model regresi menujukkan kinerja prediktif yang sangat baik, dengan nilai <em>R² Squared</em> sebesar 0,978, <em>RMSE</em> sebesar 0,0742, dan <em>MSE</em> sebesar 0,0055. Riset ini memberikan gambaran praktis kepada konten kreator dan konten marketing dalam merancang produksi konten yang lebih optimal. Model prediksi ini juga dapat dimanfaatkan untuk memperkirakan potensi engagement suatu video sebelum dipublikasikan.</p>
Nur Sapina
Annisa Nanda
Muhammad Amirul Arifin
Rahmaddeni Rahmaddeni
Lusiana Efrizoni
Copyright (c) 2025 Nur Sapina, Annisa Nanda, Muhammad Amirul Arifin, Rahmaddeni Rahmaddeni, Lusiana Efrizoni
https://creativecommons.org/licenses/by-sa/4.0
2025-06-19
2025-06-19
5 3
875
885
10.57152/malcom.v5i3.1987
-
Implementasi Feature Selection Menggunakan Boruta untuk Peningkatan Akurasi Model Lapser Prediction
https://journal.irpi.or.id/index.php/malcom/article/view/1992
<p>Memprediksi pelanggan <em>lapser</em> menjadi tantangan utama di sektor layanan data yang kompetitif, disertai tingginya biaya akuisisi pelanggan baru. Penelitian ini mengusulkan pendekatan <em>feature selection</em> menggunakan <em>Boruta</em> untuk meningkatkan akurasi <em>model lapser</em>, dengan menerapkan teknik <em>wrapper</em> pada <em>Random Forest</em>. Proses <em>modeling lapser prediction </em>menggunakan<em> a</em>lgoritma <em>machine learning Gradient Boosting</em> yang dianalisis sebelum dan sesudah seleksi fitur <em>Boruta</em>. Hasil eksperimen pada data menunjukkan bahwa <em>Boruta</em> efektif dalam meningkatkan metrik utama (akurasi, <em>recall</em>, dan AUC). Model Gradient Boosting meraih akurasi hingga 75.10%, <em>recall</em> 74.42%, dan AUC 82.18% setelah menggunakan <em>Boruta</em>. Sebelum menggunakan B<em>oruta</em> nilai akurasi 71.74%, <em>recall</em> 68.74%, dan AUC hanya 77.77%. Temuan tersebut menegaskan bahwa pendekatan yang diusulkan dapat memprediksi <em>lapser</em> secara lebih dini, serta membantu penyusun kebijakan menyusun strategi retensi pelanggan yang lebih efektif, sehingga meminimalkan potensi kerugian dan memperkuat daya saing di pasar.</p>
Mochamad Gilang Saputra
Bagus Jati Santoso
Copyright (c) 2025 Mochamad Gilang Saputra, Bagus Jati Santoso
https://creativecommons.org/licenses/by-sa/4.0
2025-06-24
2025-06-24
5 3
886
895
10.57152/malcom.v5i3.1992
-
Perbandingan Performa Metode Klasifikasi Teks Multilabel Hadis Terjemahan Bukhari Menggunakan Support Vector Machine dan Long Short Term Memory
https://journal.irpi.or.id/index.php/malcom/article/view/2051
<p>Hadis merupakan sumber hukum kedua dalam Islam, dan salah satu kitab hadis yang paling dikenal adalah Shahih al-Bukhari. Untuk mendukung pemahaman dan pengamalan yang tepat, hadis perlu diklasifikasikan secara akurat. Mengingat satu hadis dapat mengandung lebih dari satu informasi, pendekatan klasifikasi <em>multilabel</em> menjadi sangat relevan. Penelitian ini bertujuan untuk memberikan kontribusi dalam bidang klasifikasi teks dengan mengeksplorasi kombinasi metode dan parameter yang optimal untuk klasifikasi <em>multilabel</em> hadis. Hasil penelitian menunjukkan bahwa Support Vector Machine (SVM) memberikan performa terbaik pada label Larangan dengan Macro F1-score sebesar 82,57%, melalui kombinasi SVM + TF-IDF menggunakan kernel = linear, parameter C (<em>regularization parameter</em>) = 1 tanpa stopword removal dan tanpa balancing. Sementara itu, Long Short Term Memory (LSTM) juga unggul pada label Larangan dengan Macro F1-score 82,66% pada kombinasi parameter Epoch = 20, Dropout = 0.5, Dense = 128 dan Batch Size = 64 tanpa stopword removal dan tanpa balancing kombinasi ini juga menghasilkan nilai Hamming Loss terendah sebesar 10,452%, yang lebih baik dibandingkan dengan penelitian sebelumnya serta menunjukkan bahwa LSTM terbukti lebih efektif secara keseluruhan dengan penyetelan parameter yang tepat. Penelitian ini juga berkontribusi dalam peningkatan kualitas data dengan melengkapi matan hadis yang digunakan, sehingga menghasilkan performa klasifikasi yang lebih baik.</p>
Aulia Ramadhani
Nazruddin Safaat
Surya Agustian
Iwan Iskandar
Suwanto Sanjaya
Copyright (c) 2025 Aulia Ramadhani, Nazruddin Safaat, Surya Agustian, Iwan Iskandar, Suwanto Sanjaya
https://creativecommons.org/licenses/by-sa/4.0
2025-06-24
2025-06-24
5 3
896
907
10.57152/malcom.v5i3.2051
-
Klasifikasi Sentimen Menggunakan Metode Multilayer Perceptron dengan Fitur TF-IDF
https://journal.irpi.or.id/index.php/malcom/article/view/2052
<p>Media sosial, khususnya Twitter (X), telah menjadi platform utama dalam diskusi politik dan kebijakan pemerintah. Istilah dalam pengiriman pesan pada Twitter dikenal sebagai Tweet yang terdiri dari pesan dengan maksimal 280 karakter. Meskipun Tweet seringkali hanya berupateks, juga dapat menyertakan hyperlink, video, dan jenis media lainnya yang dapat digunakan untuk mengukur opini publik. penelitian ini bertujuan mengklasifikasikan sentimen masyarakat terkait pengangkatan Kaesang Pangarep sebagai Ketua Umum Partai Solidaritas Indonesia (PSI) dengan metode Multi-Layer Perceptron (MLP) Classifier dengan pendekatan Term Frequency-Inverse Document Frequency (TF-IDF) menggunakan bahasa pemograman python. Data yang digunakan terdiri dari 300 tweet, dengan 100 tweet perkelas atau opsi untuk hasil yang optimal. Tiga kategori tersebut adalah positif, netral, dan negatif. Berdasarkan penelitian yang telah dilakukan metode terbaik mencapai F1-score sebesar 0,6767 dan akurasi 0,6667. Hasil ini menunjukkan bahwa kombinasi MLP Classifier dan TF-IDF dapat mengatasi keterbatasan dataset hingga tingkat tertentu dibandingkan metode baseline. Penelitian ini juga memberikan wawasan tentang optimasi klasifikasi sentimen dalam kondisi data terbatas, yang dapat diterapkan pada topik lain dengan permasalahan serupa</p>
Abdurrahman Arasy
Surya Agustian
Lestari Handayani
Iwan Iskandar
Copyright (c) 2025 Abdurrahman Arasy, Surya Agustian, Lestari Handayani, Iwan Iskandar
https://creativecommons.org/licenses/by-sa/4.0
2025-06-24
2025-06-24
5 3
908
919
10.57152/malcom.v5i3.2052
-
Implementasi Chatbot Tafsir Al-Qur'an Menggunakan Chainlit dengan Pendekatan Groq
https://journal.irpi.or.id/index.php/malcom/article/view/2082
<p>Pemahaman terhadap tafsir Al-Qur’an sering kali menjadi tantangan dalam dunia pendidikan, khususnya bagi siswa, mahasiswa, atau masyarakat umum yang tidak memiliki latar belakang ilmu tafsir maupun kemampuan bahasa Arab. Keterbatasan akses terhadap tafsir yang mudah dipahami, serta ketiadaan media pembelajaran yang interaktif dan mampu menjawab pertanyaan secara kontekstual, menjadi hambatan dalam proses pembelajaran keislaman. Penelitian ini bertujuan untuk mengembangkan chatbot berbasis kecerdasan buatan (AI) sebagai media pendukung pembelajaran tafsir Al-Qur’an yang responsif dan adaptif. Sistem dirancang menggunakan framework <em>Chainlit</em> sebagai antarmuka web, didukung oleh Groq untuk mempercepat proses inferensi, serta integrasi LangChain dan Large Language Models (LLM) untuk memahami isi tafsir, khususnya Tafsir Jalalain dalam format PDF berbahasa Indonesia. Dokumen yang digunakan berupa satu file digital utuh yang representatif. Proses sistem meliputi ekstraksi teks, pembagian teks (chunking), pembentukan embedding, dan pencarian semantik berbasis vektor. Evaluasi menggunakan BERTScore menghasilkan nilai rata-rata precision sebesar 71,84%, recall 78,11%, dan F1-score 74,80%, menunjukkan kemampuan sistem dalam memberikan jawaban yang baik secara semantik. Hasil penelitian ini berkontribusi dalam menyediakan media pembelajaran tafsir digital berbasis AI yang efisien dan kontekstual, serta menjadi solusi potensial untuk mendukung proses pendidikan Islam yang lebih interaktif dan modern.</p>
Muhammad Rizky Maulana
Nazruddin Safaat Harahap
Okfalisa Okfalisa
Yusra Yusra
Copyright (c) 2025 Muhammad Rizky Maulana, Nazruddin Safaat Harahap, Okfalisa Okfalisa, Yusra Yusra
https://creativecommons.org/licenses/by-sa/4.0
2025-06-25
2025-06-25
5 3
920
929
10.57152/malcom.v5i3.2082
-
Optimasi Extreme Gradient Boosting dengan Particle Swarm Optimization untuk Estimasi Software Effort
https://journal.irpi.or.id/index.php/malcom/article/view/2055
<p>Estimasi upaya perangkat lunak (SEE) sangat penting dalam manajemen proyek, namun akurasi sering terganggu oleh kompleksitas proyek. Untuk mengatasinya, studi ini mengusulkan metode hibrida inovatif <em>Particle Swarm Optimization </em>(PSO) - <em>Extreme Gradient Boosting </em>(XGBoost) untuk SEE. Algoritma PSO mengoptimalkan hiperparameter XGBoost, meningkatkan kemampuannya memodelkan hubungan nonlinier dalam data proyek perangkat lunak, sehingga mengurangi kesalahan estimasi. Hasil eksperimen pada kumpulan data China dan Nasa93 menunjukkan <em>bahwa PSO-XGBoost</em> secara signifikan mengungguli metode tradisional dan model pembelajaran mesin mandiri. Metode yang diusulkan mencapai <em>Root Mean Square Error</em> (RMSE) yang lebih rendah sebesar 0,024 untuk China dan 0,0653 untuk Nasa93 menunjukkan efektivitasnya dalam memberikan estimasi upaya yang presisi. Meskipun memiliki kompleksitas komputasi dan bergantung pada data berkualitas, studi ini berkontribusi pada bidang SEE dengan menyajikan solusi praktis dan andal, membantu manajer perangkat lunak dalam perencanaan sumber daya dan pengambilan keputusan.</p>
Achmad Fahreza Alif Pahlevi
Mokhammad Amin Hariyadi
Agung Teguh Wibowo Almais
Copyright (c) 2025 Achmad Fahreza Alif Pahlevi, Mokhammad Amin Hariyadi, Agung Teguh Wibowo Almais
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
930
941
10.57152/malcom.v5i3.2055
-
Implementasi Sistem Basis Data Terintegrasi pada Aplikasi Dashboard Monitoring Replikasi Bank Tabungan Negara Metode Prototype
https://journal.irpi.or.id/index.php/malcom/article/view/2049
<p>Dalam industri perbankan, ketersediaan dan perlindungan data menjadi aspek krusial. Bank Tabungan Negara (BTN) memerlukan sistem yang mampu memantau proses replikasi data secara <em>real-time</em>. Penelitian ini bertujuan untuk merancang dan mengimplementasikan Aplikasi <em>Dashboard Monitoring</em> Replikasi data menggunakan metode <em>prototyping</em>. Sistem ini menyediakan informasi status replikasi, kinerja, dan peringatan kesalahan secara terintegrasi. Metodologi yang digunakan meliputi analisis kebutuhan, perancangan sistem menggunakan <em>flowchart </em>dan diagram Unified Modeling Language (UML), serta pengembangan sistem secara iteratif dengan melibatkan pengguna. Hasil pengujian sistem dilakukan melalui User Acceptance Testing (UAT) yang melibatkan analis sistem dan tim <em>quality control</em>. Nilai rata-rata pada skala <em>likert</em> 1–5 menunjukkan skor tinggi antara 4,3 hingga 4,7. Aplikasi membantu tim IT mendeteksi keterlambatan replikasi, kesalahan sistem, serta mempercepat waktu tanggap dalam situasi darurat. Kesimpulannya, implementasi <em>dashboard</em> ini mampu meningkatkan efisiensi operasional, mengurangi risiko kehilangan data, dan mendukung pengambilan keputusan strategis. Namun, sistem ini masih dapat dikembangkan lebih lanjut dengan fitur notifikasi otomatis dan visualisasi interaktif.</p>
Hendra Yunianto Ardhi
Asep Muhidin
Tri Ngudi Wiyatno
Copyright (c) 2025 Hendra Yunianto Ardhi, Asep Muhidin, Tri Ngudi Wiyatno
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
942
952
10.57152/malcom.v5i3.2049
-
Analisis Rute Terpendek Menuju Universitas Pamulang dengan Implementasi Algoritma Dijkstra
https://journal.irpi.or.id/index.php/malcom/article/view/1983
<p>Dalam kehidupan sehari-hari, kita sering melakukan perjalanan dari satu tempat ke tempat lain salah satunya yaitu berangkat ke kampus, pencarian rute terpendek sangat diperlukan bagi mahasiswa Universitas Pamulang untuk berangkat ke kampus. Pada banyak kasus, para mahasiswa hanya mengambil rute yang sering dikemudianinya saja tanpa mengetahui apakah rute tersebut adalah rute terpendek menuju kampus. Dan apabila rute tersebut bukanlah rute yang terpendek maka hal ini menyebabkan semakin panjang rute yang ditempuh maka akan memakan biaya yang lebih besar. Untuk menyelesaikan masalah tersebut, maka dibangun sistem pencarian rute terpendek dengan menggunakan <em>algoritma Dijkstra</em> sebagai proses pencariannya. <em>Algoritma Dijkstra</em> adalah algoritma yang digunakan untuk mencari lintasan terpendek dalam sejumlah langkah dengan menggunakan prinsip <em>Greedy</em> yang menyatakan bahwa pada setiap langkah kita memilih sisi yang berbobot minimum dan memasukkannya ke dalam himpunan solusi. <em>Algoritma Dijkstra</em> sangat tepat digunakan untuk mencari rute terpendek menuju Universitas Pamulang. Dari hasil penelitian dan pengujian yang dilakukan dapat disimpulkan bahwa <em>algoritma Dijkstra</em> cukup efektif dalam mencari rute yang terpendek sehingga mengurangi biaya yang diperlukan dengan rata-rata kecepatan eksekusi sebesar 0,057 detik</p>
Angga Pramadjaya
Istiqomah Rohmawati
Copyright (c) 2025 Angga Pramadjaya, Istiqomah Rohmawati
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
953
961
10.57152/malcom.v5i3.1983
-
Systematic Literature Review: Pemanfaatan Video Animasi 3D untuk Edukasi Kebersihan Lingkungan
https://journal.irpi.or.id/index.php/malcom/article/view/2033
<p>Penelitian ini bertujuan untuk mengeksplorasi penerapan media pembelajaran berbasis video animasi 3D sebagai sarana edukatif dalam meningkatkan kesadaran kebersihan lingkungan pada siswa sekolah dasar. Latar belakang penelitian ini didasarkan pada pentingnya pendidikan lingkungan di jenjang sekolah dasar, yang masih didominasi oleh metode ceramah sehingga menyulitkan siswa memahami konsep abstrak. Pengalaman peneliti di PT Stechoq Robotika Indonesia dan di SDN Sungai Miai 5 Banjarmasin turut memperkuat urgensi pengembangan media inovatif. Penelitian ini menggunakan metode <em>Systematic Literature Review (SLR)</em> dengan pendekatan <em>kualitatif</em> melalui tahapan <em>PRISMA</em> dan analisis <em>bibliometrik</em> menggunakan <em>VOSviewer</em> terhadap 15 artikel terpilih. Hasil kajian menunjukkan bahwa video animasi 3D terbukti efektif dalam menyampaikan konsep kebersihan lingkungan karena mampu menarik perhatian, meningkatkan pemahaman, serta mendorong partisipasi aktif siswa. Visualisasi yang menarik dan alur cerita yang kontekstual menjadikan animasi 3D sebagai media yang mampu menyampaikan pesan moral dan edukatif secara lebih mudah dipahami oleh siswa sekolah dasar. Penelitian ini memberikan kontribusi terhadap pengembangan media pembelajaran inovatif yang relevan dengan kebutuhan pembelajaran abad ke-21.</p>
Dhea Khairiyah
Qomario Qomario
Mastur Mastur
Copyright (c) 2025 Dhea Khairiyah, Qomario Qomario, Mastur Mastur
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
962
971
10.57152/malcom.v5i3.2033
-
Penerapan Teknik Ensemble Learning untuk Klasifikasi Jenis-jenis Anemia
https://journal.irpi.or.id/index.php/malcom/article/view/1721
<p>Anemia merupakan kondisi medis yang memerlukan diagnosis yang akurat untuk penanganan yang efektif. Penelitian ini mengeksplorasi penerapan teknik <em>ensemble learning</em>, khususnya <em>stacking classifier</em>, untuk klasifikasi jenis-jenis anemia. Teknik ini menggabungkan tiga model dasar: <em>Random Forest</em>, <em>K-Nearest Neighbors</em> (<em>KNN</em>), dan <em>Gradient Boosting</em>, dengan <em>Logistic Regression</em> sebagai estimator akhir. Data medis yang digunakan melibatkan berbagai fitur hematologi, dan <em>preprocessing</em> meliputi pembersihan, normalisasi, serta pembagian data. Evaluasi model dilakukan menggunakan <em>cross-validation</em> dengan 10 lipatan. Hasil penelitian menunjukkan bahwa <em>stacking classifier</em> mencapai akurasi keseluruhan 98%, dengan <em>precision</em> dan <em>recall</em> yang sangat baik di sebagian besar kelas. Kelas-kelas seperti <em>Iron deficiency anemia</em>, <em>Leukemia</em>, dan <em>Other microcytic anemia</em> menunjukkan <em>precision</em> 100%, sementara beberapa kelas dengan sampel kecil mengalami <em>recall</em> yang lebih rendah. Secara keseluruhan, model ini efektif dalam mengklasifikasikan jenis-jenis anemia dengan akurasi tinggi dan dapat diadaptasi untuk meningkatkan diagnosis medis lebih lanjut. Penelitian ini menyoroti potensi teknik <em>ensemble</em> dalam memperbaiki performa klasifikasi dan menyarankan eksplorasi lebih lanjut pada data dengan distribusi yang tidak merata</p>
Arjuna Priandika
Auliya Rahman Isnain
Copyright (c) 2025 Arjuna Priandika, Auliya Rahman Isnain
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
972
980
10.57152/malcom.v5i3.1721
-
Perbandingan Naïve Bayes dan Support Vector Machine Dalam Analisa Sentimen Tentang Penyitaan Aset Koruptor di Twitter
https://journal.irpi.or.id/index.php/malcom/article/view/2068
<p>Analisis sentimen merupakan salah satu pendekatan dalam memahami persepsi publik terhadap isu-isu sosial dan kebijakan pemerintah melalui data teks. Penelitian ini mengkaji opini masyarakat Indonesia terhadap pernyataan Presiden Prabowo Subianto mengenai penyitaan aset koruptor yang berbunyi “Apakah adil anaknya menderita?”. Data dikumpulkan dari Twitter sebanyak 1.561 <em>tweet</em> dalam rentang waktu 9 hingga 25 April 2025 dengan menggunakan kata kunci yang relevan. Proses analisis dilakukan melalui tahap prapemrosesan, pembobotan <em>TF-IDF</em>, dan klasifikasi menggunakan algoritma <em>Naïve Bayes</em> dan <em>Support Vector Machine</em> (<em>SVM</em>). Evaluasi performa model dilakukan menggunakan <em>confusion matrix</em> serta empat metrik evaluasi, yaitu akurasi, presisi, <em>recall</em>, dan <em>F1-score</em>. Hasil menunjukkan bahwa <em>SVM</em> unggul dengan akurasi 70,51% dan <em>F1-score</em> 0,69, sedangkan <em>Naïve Bayes</em> memperoleh akurasi 66,34% dan <em>F1-score</em> 0,66. Sentimen terbanyak berasal dari kelas positif, mengindikasikan mayoritas publik mendukung penyitaan aset koruptor meskipun berdampak pada keluarganya. Penelitian ini memperlihatkan efektivitas pendekatan <em>machine learning</em> dalam memetakan opini publik terhadap isu kebijakan kontroversial di media sosial.</p>
Ananda sholekhah
Muntahanah Muntahanah
Copyright (c) 2025 Ananda sholekhah, Muntahanah Muntahanah
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
981
989
10.57152/malcom.v5i3.2068
-
Harnessing Machine Learning to Decode YouTube Subscriber Dynamics: Regression Predictive Models and Correlations
https://journal.irpi.or.id/index.php/malcom/article/view/2084
<p>YouTube has grown and become a digital media giant. Content creators continue to struggle with predicting subscriber growth. Due to viewers' changing interests and the vast amount of information, it is challenging to determine which factors most influence subscription behavior. Optimizing content strategy and ensuring channel growth need an understanding of these traits. This study uses linear regression models (LR), neural networks (NN), and Gaussian processes (GP) to predict YouTube subscribers and examine category correlations using video data from various topics. The study of correlation matrix analysis was performed with an absolute root mean square error (RMSE) of 26256351, and the NN prediction model outperformed the LR and GP models. The correlation matrix indicates a slight positive correlation of 0.067 among the YouTube categories. Specifically, the correlation coefficients for population, unemployment rate, and urban population are 0.080, -0.012, and 0.082, respectively. These findings suggest future research to create more intentional content and search for significant factors that increase viewership and marketing audience growth.</p>
Sri Mulyati
Samidi Samidi
Copyright (c) 2025 Sri Mulyati, Samidi Samidi
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
990
999
10.57152/malcom.v5i3.2084
-
Predictive Sales Analysis in Coffee Shops Using the Random Forest Algorithm
https://journal.irpi.or.id/index.php/malcom/article/view/2023
<p>The coffee shop industry has experienced significant growth, evolving into a highly competitive marketplace demanding specialty coffee and personalized experiences. While data-driven strategies are crucial for optimizing operations, many owners still struggle to effectively leverage their sales data to understand dynamic customer behavior and enhance decision-making. Addressing this gap, this study explores the application of machine learning (ML) techniques, specifically the Random Forest Regressor model, to predict sales performance within the coffee shop business environment. By analyzing factors such as transaction timing, store location, product type, and day of the week, this research aims to uncover patterns that can enhance inventory management and customer engagement. The Random Forest model was evaluated through cross-validation, yielding a mean Mean Squared Error (MSE) of 80.97, which indicates moderate predictive accuracy and represents an improvement over traditional forecasting methods commonly employed in the industry. Feature importance analysis revealed that Premium Beans is the most influential predictor, followed by seasonal trends (month), time of day, and weekend sales patterns. These findings underscore the importance of incorporating temporal and contextual factors into forecasting models. </p>
Shella Norma Windrasari
Hendro Margono
Yudistira Ardi Nugraha Setyawan Putra
Copyright (c) 2025 Shella Norma Windrasari, Hendro Margono, Yudistira Ardi Nugraha Setyawan Putra
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
1000
1011
10.57152/malcom.v5i3.2023
-
Risk Management Analysis in Digital Bank XYZ Using the COBIT 2019 Framework
https://journal.irpi.or.id/index.php/malcom/article/view/1876
<p>The digital transformation in the banking sector has driven the emergence of digital banks, offering online services without the need for physical branches. However, this transformation brings various risks, including information security threats and challenges in regulatory compliance. This study aims to evaluate the maturity level of risk management in Digital Bank XYZ using the COBIT 2019 framework. The research methodology employs a qualitative approach with gap analysis to compare the current state with expected standards. The findings reveal significant gaps in the APO13 (Managed Security) and DSS04 (Managed Continuity) domains between current risk management practices and the standards recommended by COBIT 2019. These results highlight the need for a more systematic and structured risk management approach to enhance Digital Bank XYZ's preparedness in addressing cybersecurity threats and other operational risks. Recommendations include strengthening security policies, implementing predictive technologies, and conducting regular training to improve the security team's competencies. This study is expected to serve as a strategic guideline for Digital Bank XYZ to mitigate risks, improve operational efficiency, and achieve international governance standards.</p>
Rudi Purnomo
Ruki Harwahyu
Copyright (c) 2025 Rudi Purnomo, Ruki Harwahyu
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
1012
1018
10.57152/malcom.v5i3.1876
-
Penerapan ChatGPT untuk Rekomendasi Resep Makanan Sehat dan Bergizi pada Anak-Anak
https://journal.irpi.or.id/index.php/malcom/article/view/1601
<p><em>Stunting</em> masih menjadi masalah serius dengan prevalensi tinggi di Indonesia (21,6% pada tahun 2022). Salah satu hambatan utama adalah kurangnya akses mudah dan personalisasi informasi gizi serta resep makanan yang tepat bagi orang tua untuk meningkatkan asupan protein hewani pada anak. Untuk mengatasi masalah ini, aplikasi Menu Resep Makanan (<em>REBU</em><em>) </em>dikembangkan sebagai platform penyedia resep sehat dan bergizi yang mudah diakses oleh orang tua dan pengasuh, spesifik untuk memenuhi kebutuhan nutrisi anak dan meningkatkan konsumsi protein hewani. Mengintegrasikan teknologi modern, termasuk <em>ChatGPT</em>, <em>REBU</em> menawarkan rekomendasi resep personal, menjadikan panduan gizi lebih mudah diakses. Implementasi <em>REBU</em> di RT 10 dan RT 11 Puskesmas menunjukkan peningkatan signifikan kesadaran orang tua tentang gizi seimbang dan protein hewani. Efektivitas aplikasi dievaluasi melalui uji <em>Blackbox</em> (integritas fungsional) dan <em>User Acceptance Testing</em> <em>(UAT)</em> (kegunaan praktis). Evaluasi ini memastikan solusi praktis <em>REBU</em> berhasil membantu menurunkan angka <em>stunting</em> di komunitas percontohan, menjadi model potensial untuk implementasi lebih luas guna mendukung program pemerintah</p>
Anggit Saepul Anwar
Edhi Poerwandhono
Copyright (c) 2025 Anggit Saepul Anwar, Edhi Poerwandhono
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
1019
1028
10.57152/malcom.v5i3.1601
-
Analisis Hubungan Antara Jumlah Bus dan Jumlah Penumpang Menggunakan Unsupervised Learning
https://journal.irpi.or.id/index.php/malcom/article/view/2005
<p>Hubungan antara jumlah bus dan jumlah penumpang merupakan aspek penting dalam analisis transportasi perkotaan. Namun, pola distribusi dan kelompok data yang terbentuk sering kali tidak merata, sehingga menyebabkan ketidakseimbangan dalam hubungan tersebut. Penelitian ini bertujuan untuk mengidentifikasi pola distribusi dan mengelompokkan data jumlah bus dan penumpang menggunakan pendekatan <em>unsupervised learning</em>. Metode yang diuji coba terdiri dari empat model yaitu K-Means, Fuzzy C-Means (FCM), Gaussian Mixture Model (GMM), dan Spectral Clustering. Keempat model tersebut dibandingkan untuk mengukur seberapa baik model dapat mengelompokkan data dan mengungkap hubungan antara jumlah bus dan jumlah penumpang. Keempat model akan dievaluasi menggunakan Calinski-Harabasz Index, Silhouette Score, dan Davies-Bouldin Index untuk menemukan klaster optimal. Berdasarkan uji coba keempat model <em>clustering</em> menggunakan ketiga matriks evaluasi, semua model menunjukkan klaster optimalnya adalah 2 namun model K-Means memberikan kinerja terbaik dalam mengelompokkan data karena model K-Means memiliki nilai terbaik untuk setiap metrik evaluasi tersebut. Skor model K-Means pada Silhouette Score sebesar 0.5175, nilai model K-Means pada Davies-Bouldin Index sebesar 0.7241, dan skor untuk K-Means terhadap Calinski-Harabasz Index sebesar 1414.3874. Klaster 1 merepresentasikan jumlah bus dan jumlah penumpang yang tinggi sedangkan Klaster 2 merepresentasikan jumlah penumpang dan jumlah bus yang rendah. </p>
Aurell Octaviona Sinaga
Rossi Passarella
Copyright (c) 2025 Aurell Octaviona Sinaga, Rossi Passarella
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
1029
1036
10.57152/malcom.v5i3.2005
-
Analisis Sentimen Coretax: Perbandingan Pelabelan Data Manual, Transformers-Based, dan Lexicon-Based pada Performa IndoBERT
https://journal.irpi.or.id/index.php/malcom/article/view/2151
<p>Analisis sentimen terhadap opini publik di media sosial menjadi tantangan signifikan karena kompleksitas bahasa informal dan volume data yang besar. Penelitian ini bertujuan untuk mengevaluasi pengaruh lima pendekatan pelabelan data manual, IndoBERT <em>, </em>IndoBERT <em>weet, </em>RoBERTa , dan InSet Lexicon terhadap performa model <em>Indonesian Bidirectional Encoder Representations from Transformers </em>(IndoBERT) dalam klasifikasi sentimen terkait isu Coretax. Sebanyak 8.035 tweet dikumpulkan, diproses, dan dilabeli menggunakan masing-masing pendekatan. Dataset hasil pelabelan kemudian digunakan untuk melatih ulang model IndoBERT, yang dievaluasi menggunakan metrik akurasi, F1-score, confusion matrix, dan kurva <em>Receiver Operating Characteristic-Area Under the Curve</em> (ROC-AUC). Hasil menunjukkan bahwa pelabelan otomatis menggunakan <em>Indonesian Bidirectional Encoder Representations from Transformers for Tweet</em> (IndoBERTweet) menghasilkan metrik tertinggi <em>F1-Score</em> (0,9802), tetapi mengalami dominasi kelas netral yang menunjukkan overfitting. Pelabelan manual menghasilkan distribusi kelas yang lebih merata meskipun dengan metrik lebih rendah <em>F1-Score</em> (0,8684), sedangkan <em>Robustly Optimized BERT Pretraining Approach</em> (RoBERTa) menunjukkan keseimbangan terbaik antara performa metrik dan distribusi label. InSet Lexicon dan IndoBERT menunjukkan kecenderungan bias terhadap kelas tertentu. Simpulan dari penelitian ini menegaskan bahwa efektivitas pelabelan tidak hanya ditentukan oleh skor metrik, tetapi juga oleh distribusi kelas yang seimbang untuk menghasilkan model yang adil dan dapat digeneralisasi.</p>
Agnia Suci Rizkia
Wufron Wufron
Fikri Fahru Roji
Copyright (c) 2025 Agnia Suci Rizkia, Wufron Wufron, Fikri Fahru Roji
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3
-
Prediksi Laju Inflasi di Jawa Timur Menggunakan Model N-BEATS dan Optimasi Optuna
https://journal.irpi.or.id/index.php/malcom/article/view/2141
<p>Inflasi merupakan indikator penting yang memengaruhi kestabilan dan pertumbuhan ekonomi suatu wilayah. Prediksi inflasi yang akurat sangat dibutuhkan guna mendukung perumusan kebijakan ekonomi yang tepat. Penelitian ini mengusulkan penggunaan model N-BEATS (Neural Basis Expansion Analysis for Time Series) yang dioptimalkan dengan Optuna untuk memprediksi inflasi di Provinsi Jawa Timur. Data yang digunakan berupa deret waktu univariat, yaitu laju inflasi bulanan dari Januari 2005 hingga Desember 2024, yang diperoleh dari Badan Pusat Statistik (BPS). Evaluasi performa model dilakukan menggunakan metrik Mean Absolute Percentage Error (MAPE). Berbeda dengan model tradisional seperti ARIMA dan LSTM, N-BEATS mengandalkan jaringan saraf feedforward dengan arsitektur blok residual yang mampu melakukan rekonstruksi masa lalu (backcast) dan prediksi masa depan (forecast). Optimasi hyperparameter melalui Optuna berhasil meningkatkan akurasi model secara signifikan. Hasil Penelitian menunjukkan bahwa N-BEATS teroptimasi mencapai MAPE sebesar 8,97%, lebih baik dibandingkan N-BEATS dasar (11,05%), ARIMA (16,95%), dan LSTM (12,23%). Temuan ini mengindikasikan bahwa pendekatan N-BEATS dengan Optuna efektif dalam meningkatkan akurasi prediksi inflasi dan dapat menjadi alat bantu penting bagi perencanaan ekonomi di tingkat daerah.</p>
Mohammad Nizar Riswanda
Trimono Trimono
Wahyu Syaifullah Jauharis Saputra
Copyright (c) 2025 Mohammad Nizar Riswanda, Trimono Trimono, Wahyu Syaifullah Jauharis Saputra
https://creativecommons.org/licenses/by-sa/4.0
2025-07-31
2025-07-31
5 3