ANALISIS SENTIMEN OPINI DEBAT CALON PRESIDEN DENGAN MENGGUNAKAN CLASSIFIER MACHINE LEARNING (STUDI KASUS : PADA DATA TWITTER 2024)
(1) Program Studi Magister Teknik Informatika, Universitas Pamulang Tangerang Selatan
(2) Program Studi Magister Teknik Informatika, Universitas Pamulang Tangerang Selatan
(3) Program Studi Magister Teknik Informatika, Universitas Pamulang Tangerang Selatan
(*) Corresponding Author
Abstract
This study aims to analyze public sentiment towards the Indonesian 2024 Presidential Debate using five Machine Learning classification algorithms: Naïve Bayes, Decision Tree, Support Vector Machine, Random Forest, and K-Nearest Neighbors. The data used in this research was sourced from Twitter, a major social media platform with a large and diverse volume of data. The research object is public opinions expressed on Twitter, with the subject of the research being tweets collected using the Twitter API, resulting in 1,300 data points. Data analysis involves text extraction and preprocessing, including data cleaning, tokenization, stemming, and stopword removal. The research results show the following sentiment distribution: 51.55% positive (663 tweets), 14.83% negative (183 tweets), and 34.21% neutral (440 tweets). Among the models, Support Vector Machine and Random Forest demonstrated the highest performance with an accuracy of 81%, while Naïve Bayes had the lowest performance with an accuracy of 62%. Despite variations in performance among the algorithms used, no single method was consistently effective in sentiment classification. This research contributes to mapping public sentiment related to political debates in Indonesia through social media data analysis and provides insights into the effectiveness of Machine Learning algorithms in sentiment analysis.
ABSTRAK
Penelitian ini bertujuan untuk menganalisis sentimen opini masyarakat terhadap Debat Calon Presiden Indonesia 2024 menggunakan lima algoritma klasifikasi Machine Learning: Naïve Bayes, Decision Tree, Support Vector Machine, Random Forest, dan K-Nearest Neighbors. Data yang digunakan dalam penelitian ini diambil dari Twitter, yang merupakan salah satu platform media sosial dengan volume data yang besar dan beragam. Objek penelitian ini adalah opini publik yang diekspresikan di Twitter, dengan subjek penelitian berupa tweet yang diambil menggunakan Twitter API, menghasilkan 1300 data poin. Analisis data melibatkan proses ekstraksi teks dan preprocessing yang mencakup pembersihan data, tokenisasi, stemming, dan penghapusan stopwords. Hasil penelitian menunjukkan distribusi sentimen sebagai berikut: 51,55% positif (663 tweet), 14,83% negatif (183 tweet), dan 34,21% netral (440 tweet). Dari hasil pemodelan, Support Vector Machine dan Random Forest menunjukkan performa tertinggi dengan akurasi 81%, sedangkan Naïve Bayes memiliki performa paling rendah dengan akurasi 62%. Meskipun terdapat variasi kinerja di antara algoritma yang di gunakan, tidak ada satu metode pun yang sepenuhnya konsisten dalam klasifikasi sentimen. Penelitian ini memberikan kontribusi dalam memetakan sentimen publik terkait perdebatan politik di Indonesia melalui analisis data media sosial. serta memberikan wawasan tentang efektivitas algoritma Machine Learning dalam analisis sentimen.
Keywords
Full Text:
PDFReferences
Alrajak, M. S., Ernawati, I., & Nurlaili, I. (2020). Analisis sentimen serhadap pelayanan PT PLN di jakarta pada twitter dengan algoritma k- nearest neighbor (k-nn). Seminar Nasional Mahasiswa Ilmu Komputer Dan Aplikasinya (SENAMIKA), 1(2), 110–122.
Bagaskara, W., & Pusparini Nur Nawaningtyas, I. (2024). Klasifikasi Penjadwalan Kerja Perawatan Air Conditioner (Ac) Menggunakan Algoritma DECISION TREE (C4.5) PADA PT XYZ. Infotech: Journal of Technology Information, 10(1), 11–20. https://doi.org/https://doi.org/10.37365/jti.v10i1.240
Budiyantara, A., Irwansyah, I., Prengki, E., Pratama, P. A., & Wiliani, N. (2020). Komparasi Algoritma Decision Tree, Naive Bayes Dan K-Nearest Neighbor Untuk Memprediksi Mahasiswa Lulus Tepat Waktu. JITK (Jurnal Ilmu Pengetahuan Dan Teknologi Komputer), 5(2), 265–270. https://doi.org/10.33480/jitk.v5i2.1214
Haikal, M. F., & Indra, J. (2024). Analisis Sentimen Bakal Calon Presiden Indonesia 2024 Dengan Algoritma Naïve Bayes.
Hasan, F. N., & Dwijayanti, M. (2021). Analisis Sentimen Ulasan Pelanggan Terhadap Layanan Grab Indonesia Menggunakan Multinominal Naïve Bayes Classifier. Jurnal Linguistik Komputasional, 4(2), 52–58. https://doi.org/https://doi.org/10.26418/jlk.v4i2.61
Hendrastuty, N., Isnain, A. R., Rahmadhani, A. Y., Studi, P., Informasi, S., Indonesia, U. T., Informatika, P. S., Indonesia, U. T., & Lampung, K. B. (2021). Analisis Sentimen Masyarakat Terhadap Program Kartu Prakerja Pada Twitter Dengan Metode Support Vector Machine. 6(3), 150–155.
Isu, A., Agama, S. S. A., Evelina, L. W., & Ekonomi, D. (2015). Analisis Isu S ( Suku ) A ( Agama ) R ( Ras ) A ( Antar Golongan ) Di Media Social Indonesia.
Jurdi, S., Teteng, B., & Lukita, F. H. (2024). Analisis Terhadap Sistem Pemilu Indonesia : dari Proporsional Tertutup ke Proporsional Terbuka. 6, 145–161.
Luh, N., Sri, W., Ginantra, R., Yanti, C. P., Prasetya, G. D., Gede, I. B., Arya, I. K., & Wiguna, G. (2024). Analisis Sentimen Ulasan Villa Di Ubud Menggunakan Metode Naïve Bayes , Decision Tree , Dan K-Nn Jurnal Nasional Pendidikan Teknik Informatika : JANAPATI | 206. 11, 205–216.
Rini Widaswari Purba, Arya Adyaksa Waskita, M. (2024). Analisis Sentimen Opini Debat Calon Presiden Dengan Menggunakan Classifier Machine Learning (Studi Kasus: Pada Data Twitter 2024). https://doi.org/https://doi.org/10.37365/jti.v10i2.300
Rizka Ardiansyah. (2019). Analisis sentimen calon presiden dan wakil presiden periode 2019-2024 pasca debat pilpres di Twitter. ScientiCO: Computer Science and Informatics Journal, 2(1), 21–28.
Wasito, B. (2024). Analisis Sentimen Terhadap Para Kandidat Presiden 2024 Berdasarkan Netizen Pengguna Twitter Dengan Metode Data Mining Dan Text Mining.
DOI: https://doi.org/10.37365/jti.v10i2.300
Refbacks
- There are currently no refbacks.