Hate Speech Detection in 2024 Presidential Debate Discussions Using Deep Learning and NLP

Fajrul Rochist Febriansyah, Nurseno Bayu Aji, Kurnianingsih Kurnianingsih

Abstract


Perkembanan teknologi menyebabkan masyarakat lebih mudah dalam menyampaikan pendapatnya. Terkadang pendapat yang di sampaikan masyarakat mengandung ujaran kebencian yang kurang baik untuk dilihat, terutama jika topiknya adalah seputar politik. Tujuan penelitian ini adalah untuk mengetahui algoritme dan metode terbaik dalam mendeteksi ujaran kebencian dari data komentar pada platform X dan YouTube mengenai debat ke-5 capres cawapres 2024 menggunakan teknik Natural Language Processing (NLP). Penelitian menggunakan algoritme machine learning seperti Naive Bayes, Logistic Regression, SVM, dan Random Forest. Hasil terbaik yang didapat dari penelitian ini adalah menggunakan algoritme Random Forest dengan metode tanpa stemming, menghasilkan tingkat accuracy 97% pada platform X, dan 99% pada platform YouTube. Kesimpulan yang didapat dari penelitian ini adalah algoritme yang paling cocok untuk text processing adalah algoritme Random Forest dengan metode tanpa stemming pada tahap preprocessing

References


Afrianti, E., Fathoni, F., & Heroza, R. I. (2020). Klasifikasi teks dengan Naïve Bayes Classifier (NBC) untuk pengelompokan keterangan laporan dan durasi recovery time laporan gangguan listrik PT. PLN (Persero) WS2JB Area Palembang. JSI: Jurnal Sistem Informasi (E-Journal), 12(1), 1955-1960.

Ali, H., Salleh, M. N. M., Saedudin, R., Hussain, K., & Mushtaq, M. F. (2019). Imbalance class problems in data mining: A review. Indonesian Journal of Electrical Engineering and Computer Science, 14(3), 1560-1571.

Assaidi, S. A., & Amin, F. (2022). Analisis Sentimen Evaluasi Pembelajaran Tatap Muka 100 Persen pada Pengguna Twitter menggunakan Metode Logistic Regression. Jurnal Pendidikan Tambusai, 6(2), 13217–13227.

Biere, S. (2018). Hate Speech Detection Using Natural Language Processing Techniques. Vrije Universiteit Amsterdam, 30.

Imania, D., Andriani, A., & Ali, M. (2023). Klasifikasi Komentar Publik Dalam Pemilihan Umum Presiden 2024 Dengan Menggunakan Metode Naive Bayes: Studi Kasus Indentifikasi Haters Dan Non …. Inovate: Jurnal Ilmiah Inovasi …, 57– 64.

Ivan, Sari, Y. A., & Adikara, P. P. (2019). Klasifikasi Hate Speech Berbahasa Indonesia di Twitter Menggunakan Naive Bayes dan Seleksi Fitur Information Gain dengan Normalisasi Kata. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(5), 4914–4922.

Kurniawati, D., & M.Si, D. H. T. S. (2019). Deteksi Ujaran Kebencian pada Twitter Menjelang Pilpres 2019 dengan Machine Learning. Jurnal Ilmiah Matematika, 7(1), 1–6. Anemia, Bayesian regresi logistik, MCMC, Metropolis- Hasting.%0AAbstract

Nayla, A., Setianingsih, C., & Dirgantoro, B. (2023). Deteksi Hate Speech pada Twitter Menggunakan Algoritma BERT. e-Proceeding of Engineering, 10(1), 256-260. ISSN 2355-9365. Universitas Telkom, Bandung, Indonesia.

Putra, R. P. I., Akbar, M., & Amalia, R. (2020). Analisis sentimen masyarakat terhadap kinerja Persatuan Sepakbola Seluruh Indonesia menggunakan metode backpropagation. Journal of Information Technology Ampera, 1(2), 106–118.

Rifa'i, M., Buaton, R., & Prahmana, I. G. (2023). Sentiment analysis using text mining techniques on social media using the Support Vector Machine method: Case study Seagames 2023 football final. Journal of Artificial Intelligence and Engineering Applications, 3(1).

Septian, J. A., Fachrudin, T. M., & Nugroho, A. (2019). Analisis Sentimen Pengguna Twitter Terhadap Polemik Persepakbolaan Indonesia Menggunakan Pembobotan TF-IDF dan K-Nearest Neighbor. Journal of Intelligent System and Computation, 1(1), 43–49.

Supriyadi, R., Gata, W., Maulidah, N., & Fauzi, A. (2020). Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah. E-Bisnis : Jurnal Ilmiah Ekonomi Dan Bisnis, 13(2), 67–75.


Refbacks

  • There are currently no refbacks.


Indexing :

Creative Commons License
Journal of Informatics Engineering and Software Applications (JIEngS) licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.