Implementation of SMOTE and Information Gain Feature Selection in Learning Vector Quantization for Asthma Disease Classification

Diah Ayu Kinanti, Fitri Insani, Novi Yanti, Muhammad Affandes

Sari


Asma adalah penyakit pernapasan akibat peradangan saluran udara di paru-paru yang menyebabkan penyempitan dan kesulitan bernapas. Prevalensinya terus meningkat secara global, sehingga diperlukan metode deteksi dini yang akurat. Masalah yang ditemukan dalam proses pengklasifikasian penyakit asma adalah distribusi kelas yang tidak seimbang pada dataset. Penelitian ini menerapkan algoritma Learning Vector Quantization (LVQ) yang dioptimalkan dengan seleksi fitur Information Gain dan teknik penyeimbangan data SMOTE untuk klasifikasi penyakit asma. Dataset penelitian mencakup 2.392 data pasien dengan 28 fitur dan 1 kelas target yang diperoleh dari platform Kaggle. Pengujian dilakukan pada lima skenario dengan tiga fungsi jarak Euclidean , Chebyshev, Manhattan, learning rate 0,001–0,005, dan rasio pembagian data 90:10, 80:20, serta 70:30. Hasil terbaik diperoleh pada skenario SMOTE, Information Gain, dan LVQ menggunakan fungsi jarak Euclidean  dengan learning rate 0.004 dan rasio 90:10, menghasilkan akurasi 77.97%, precision  73.61%, recall  87.22% dan F1-score 79.84%. Penerapan SMOTE menjadi komponen penting karena tanpa SMOTE model gagal mengenali kelas asma, terbukti pada percobaan tanpa menggunakan SMOTE menghasilkan precision , recall , dan F1-score bernilai 0% meskipun akurasi mencapai 94–95%.

Teks Lengkap:

PDF

Referensi


E. G. Hutahaean, O. Sukma Pratiwi, and R. Afriyani, “Penerapan Metode Forward Chaining Dalam Sistem Pakar Diagnosa Penyakit Asma Menggunakan Bahasa Pemrograman PHP Dan Database Mysql,” Prosiding Seminar Nasional Bisnis Teknologi dan Kesehatan, no. Vol. 1 No. 1 (2024), Jul. 2024, Accessed: Nov. 12, 2025. [Online]. Available: https://www.ejournal.ummuba.ac.id/index.php/SENABISTEKES/article/view/2436

World Health Organization, “Asthma,” https://www.who.int/news-room/fact-sheets/detail/asthma. Accessed: Apr. 15, 2026. [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/asthma

Risha Justisia Suhendar, Irawan Danismaya, and Kartika Tarwati, “Gambaran Karakteristik Mahasiswa Dengan Asma Bronkial di Universitas Muhammadiyah Sukabumi Tahun 2024,” Jurnal Anestesi, vol. 2, no. 2, pp. 81–89, Apr. 2024, doi: 10.59680/anestesi.v2i2.1053.

W. Muchsin, Ensiklopedia Asma: Memahami, Mengelola, dan Hidup Berkualitas dengan Asma, 1st ed. Purwekerto: PT. Revormasi Jangkar Philosophia, 2025.

S. Aufa, A. Husna, and S. Syahrizal, “Penatalaksanaan Holistik Pasien Anak Dengan Asma Bronkial Melalui Pendekatan Kedokteran Keluarga,” J. Med. Sci., vol. 4, no. 2, pp. 127–137, Oct. 2023, doi: 10.55572/jms.v4i2.115.

I. Akbar, F. Supriadi, and D. Indra Junaedi, “Pemanfaatan Machine Learning di Bidang Kesehatan,” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 9, no. 1, pp. 1744–1749, Jan. 2025, doi: 10.36040/jati.v9i1.12663.

A. U. Dullah, P. Utami, and J. Unjung, “Asthma Classification Using an Adaptive Boosting Model with SVM-SMOTE Sampling,” Journal of Information System Exploration and Research, vol. 3, no. 1, pp. 1–10, Jan. 2025, doi: 10.52465/joiser.v3i1.486.

Zahab, M. Hussain, and L. S. Parwati, “Prediction of Asthma Disease Using Machine Learning Algorithm,” in Engineering Proceedings, MDPI AG, Sep. 2025, p. 115. doi: 10.3390/engproc2025107115.

E. A. Sianipar and M. Yasin S, “Optimization of Diabetes Disease Classification Using Learning Vector Quantization Algorithm(LVQ),” Journal of Computer Science and Informatics Engineering, vol. 4, no. 2, pp. 72–84, May 2025, doi: 10.55537/cosie.v4i2.1121.

A. Aziz, F. Insani, J. Jasril, and F. Syafria, “Implementasi Metode Learning Vector Quantization (LVQ) Untuk Klasifikasi Keluarga Beresiko Stunting,” Building of Informatics, Technology and Science (BITS), vol. 5, no. 1, Jun. 2023, doi: 10.47065/bits.v5i1.3478.

F. Alamri, S. Ningsih, I. Djakaria, D. Wungguli, and I. K. Hasan, “Perbandingan Metode LVQ dan Backpropagation untuk Klasifikasi Status Gizi Anak di Kecamatan Sangkup,” Jurnal Gaussian, vol. 12, no. 3, pp. 314–321, Sep. 2023, doi: 10.14710/j.gauss.12.3.314-321.

R. A. Azizah, F. Bachtiar, and S. Adinugroho, “Klasifikasi Kinerja Akademik Siswa Menggunakan Neighbor Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 9, no. 3, pp. 605–614, Jun. 2022, doi: 10.25126/jtiik.2022935751.

S. H. Zulaikhah, A. Aziz, and W. Harianto, “Optimasi Algoritma K-Nearest Neighbor (KNN) dengan Normalisasi dan Seleksi Fitur untuk Klasifikasi Penyakit Liver,” Sep. 2022. doi: 10.36040/jati.v6i2.4722.

N. Tsawaabul Khair, I. Afrianty, F. Syafria, E. Budianita, and S. Kurnia Gusti, “Penerapan Information Gain Untuk Seleksi Fitur Pada Klasifikasi Jenis Kelamin Tulang Tengkorak Menggunakan Backpropagation,” Media Online), vol. 5, no. 4, pp. 666–678, 2025, doi: 10.47065/bulletincsr.v5i4.637.

A. Fitri, I. Afrianty, E. Budianita, and S. Kurnia Gusti, “Implementation of Feature Selection Information Gain in Support Vector Machine Method for Stroke Disease Classification,” Bulletin of Informatics and Data Science, vol. 4, no. 1, pp. 22–33, 2025, doi: 10.61944/bids.v4i1.116.

M. Dewi, T. H. Saragih, and R. Herteno, “Penerapan SMOTE-NCL untuk Mengatasi Ketidakseimbangan Kelas pada Klasifikasi Penyakit Jantung Koroner,” Jurnal Informatika Polinema, vol. 10, no. 1, Dec. 2023, doi: 10.33795/jip.v10i1.1394.

M. Ibnu Choldun Rachmatullah and S. Armiati, “Menerapkan Smote pada Klasifikasi Data Penyakit Stroke,” Jurnal Ilmiah Manajemen Informatika, vol. 17, no. 1, 2025, Accessed: Dec. 17, 2025. [Online]. Available: https://ejurnal.ulbi.ac.id/index.php/improve/article/view/4307

A. Syukron, E. Saputro, and P. Widodo, “Penerapan Metode Smote Untuk Mengatasi Ketidakseimbangan Kelas Pada Prediksi Gagal Jantung,” 2023. doi: https://doi.org/10.25047/jtit.v10i1.313.

F. Meila Azzahra Sofyan, A. Putri Riyandoro, D. Fitriani Maulana, and J. Haerul Jaman, “Penerapan Data Mining dengan Algoritma C5.0 Untuk Prediksi Penyakit Stroke,” Jurnal Teknologi Sistem Informasi dan Sistem Komputer TGD, 2023, [Online]. Available: https://ojs.trigunadharma.ac.id/index.php/jsk/index

I. Wayan, B. Suryawan, N. Widya Utami, and K. Q. Fredlina, “Analisis Sentimen Review Wisatawan pada Objek Wisata Ubud Menggunakan Algoritma Support Vector Machine,” Feb. 2023. doi: https://doi.org/10.51401/jinteks.v5i1.2242.

M. P. Pulungan, A. Purnomo, and A. Kurniasih, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Kepribadian MBTI Menggunakan Naive Bayes Classifier,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 5, pp. 1033–1042, Oct. 2024, doi: 10.25126/jtiik.2024117989.

S. Narulita and N. Adi, “Feature Selection Information Gain pada Klasifikasi Pasien Penyakit Jantung (Heart Disease),” JURMIK (Jurnal Rekam Medis dan Manajemen Informasi Kesehatan), vol. 4, no. 1, 2024, doi: 10.53416/jurmik.v4i1.240.

M. Melisa, “Implementasi Learning Vector Quantization (LVQ) Dalam Mengidentifikasi Gula Aren Asli dengan Gula Aren Campuran,” Sci-Tech Journal, vol. 1, no. 1, pp. 39–51, Jun. 2022, doi: 10.56709/stj.v1i1.18.

F. M. Fathoni, C. A. Putra, and A. L. Nurlaili, “Klasifikasi Penyakit Daun Anggur Menggunakan Metode K-Nearest Neighbor Berdasarkan Gray Level Co-Occurrence Matrix,” Biner : Jurnal Ilmiah Informatika dan Komputer, vol. 3, no. 1, pp. 8–15, Jan. 2024, doi: 10.32699/biner.v3i1.6332.




DOI: http://dx.doi.org/10.30811/jaise.v6i2.9354

Refbacks

  • Saat ini tidak ada refbacks.


Indexing :

Creative Commons License
Journal of Artificial Intelligence and Software Engineering (JAISE) licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.