Application of Information Gain Feature Selection and SMOTE in XGBoost Algorithm for Asthma Disease Classification

Fioni Nikmatul Fajar, Fitri Insani, Suwanto Sanjaya, Iis Afrianty

Sari


Asma merupakan salah satu penyakit kronis pada sistem pernapasan yang prevalensinya terus meningkat dan memerlukan deteksi dini untuk mencegah komplikasi serius. Salah satu tantangan dalam klasifikasi asma menggunakan machine learning adalah ketidakseimbangan kelas yang menyebabkan model cenderung memprediksi kelas mayoritas sehingga kemampuan mendeteksi kasus asma menjadi rendah. Penelitian ini mengusulkan penerapan SMOTE dan seleksi fitur Information Gain dalam algoritma XGBoost untuk mengatasi permasalahan tersebut. Dataset yang digunakan terdiri dari 2.392 data dengan 28 atribut, di mana tahapan penelitian meliputi preprocessing, seleksi fitur menggunakan Information Gain yang mengurangi fitur menjadi 22 fitur, penyeimbangan data menggunakan SMOTE, pembagian data dengan rasio 90:10, 80:20, dan 70:30, serta klasifikasi menggunakan XGBoost. Pengujian dilakukan terhadap empat skenario pendekatan untuk membandingkan kontribusi setiap metode yang diterapkan. Evaluasi dilakukan menggunakan data uji seimbang dan data uji asli dengan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa skenario terbaik diperoleh pada kombinasi Information Gain + SMOTE + XGBoost dengan rasio 90:10 pada data uji seimbang, menghasilkan akurasi 75%, presisi 87,5%, recall 58,33%, dan F1-score 70%. Hasil tersebut menunjukkan bahwa kombinasi seleksi fitur dan penyeimbangan data mampu meningkatkan kemampuan model dalam mendeteksi penyakit asma.

Teks Lengkap:

PDF

Referensi


N. D. Rahmawati, I. L. Hilmi, and Salman, “Review of the Analysis of the Effectiveness and Risk of Aminophylline Toxicity in the Treatment of Asthma,” J. Pharm. Sci., vol. 6, no. 1, pp. 95–99, 2023, doi: https://doi.org/10.36490/journal-jps.com.v6i1.14.

Z. J. Lee, M. R. Yang, and B. J. Hwang, “A Sustainable Approach to Asthma Diagnosis: Classification with Data Augmentation, Feature Selection, and Boosting Algorithm,” Diagnostics, vol. 14, no. 7, 2024, doi: 10.3390/diagnostics14070723.

B. S. Pansare, A. D. Kulkarni, and P. P. Pawar, “Data-Driven Approach for Asthma Classification : Ensemble Learning with Random Forest and XGBoost †,” Comput. Sci. Math. Forum, vol. 12, no. 3, pp. 1–10, 2025, doi: https:// doi.org/10.3390/cmsf2025012003.

World Health Organization, “Asthma.” Accessed: Apr. 18, 2026. [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/asthma

Sarman and S. Bahri, “Analisis Perbandingan Algoritma Naïve Bayes dengan SVM ( Support Vektor Machine ) Dalam Mendiagnosis Penyakit Asma Asthma,” J. Janitra Inform. dan Sist. Inf., vol. 5, no. 2, pp. 189–198, 2025, doi: 10.59395/m9qa0357.

P. Ardhiyansyah et al., “Klasifikasi Penyakit Asma Menggunakan Algoritma Decision Tree Pada Rapidminer,” J. Ilmu Komput. Dan Inform., vol. 2, no. 3, pp. 103–107, 2026, doi: https://jurnal.globalscients.com/index.php/jiki.1014 E-ISSN.

A. U. Dullah, P. Utami, and Jumanto, “The Asthma Classification Using an Adaptive Boosting Model with SVM-SMOTE Sampling,” J. Inf. Syst. Explor. Res., vol. 3, no. 1, pp. 1–10, 2025, doi: 10.52465/joiser.v3i1.486.

J. Sodiq and S. D. Permai, “Binary Classification of Asthma for the CAPS Pediatric Dataset in Malawi Using Machine Learning,” J. EMACS (Engineering, Math. Comput. Sci., vol. 7, no. 3, pp. 337–342, 2025, doi: 10.21512/emacsjournal.v6.

A. F. B. Sajiwo, B. Rahmat, and A. Junaidi, “Klasifikasi Indeks Standar Pencemaran Udara (ISPU) Menggunakan Algoritma XGBoost Dengan Teknik Imbalanced Data (SMOTE),” JITET (Jurnal Inform. dan Tek. Elektro Ter., vol. 12, no. 3, pp. 2190–2200, 2024, doi: http://dx.doi.org/10.23960/jitet.v12i3.4699.

A. R. Illawati, A. I. Hadiana, and Melina, “Klasifikasi Penyakit Monkeypox dengan XGBoost dan SMOTE untuk Penanganan Data Tidak Seimbang,” J. Algoritm., vol. 22, no. 2, pp. 35–44, 2025, doi: 10.33364/algoritma/v.22-2.2349.

J. Yang and J. Guan, “A Heart Disease Prediction Model Based on Feature Optimization and Smote-Xgboost Algorithm,” Inf., vol. 13, no. 10, 2022, doi: 10.3390/info13100475.

Opitasari, F. Natsir, and E. S. Marsiani, “Klasifikasi Diagnosis untuk Penyakit Kanker Serviks Menggunakan Algoritma Extreme Gradient Boosting (XGBoost),” J. Ilm. FIFO, vol. 16, no. 1, p. 55, 2024, doi: 10.22441/fifo.2024.v16i1.006.

R. Zizilia et al., “Klasifikasi Penyakit Kanker Paru-Paru dengan Algoritma Extreme Gradient Boosting (XGBoost)dan Mutual Informationsebagai Metode Feature Selection,” Sist. J. Sist. Inf., vol. 14, no. 5, pp. 2540–9719, 2025, [Online]. Available: http://sistemasi.ftik.unisi.ac.id

N. R. Muntiari, K. H. Hanif, Muliyadi, and Mufida, “Penanganan Ketidakseimbangan Data Pada Klasifikasi Penyakit Campak Menggunakan Kombinasi SMOTE Dan XGBoost,” JIKSTRA, vol. 8, no. 01, pp. 42–51, 2026.

M. A. Nugraha, M. I. Mazdadi, A. Farmadi, Muliadi, and T. H. Saragih, “Penyeimbang Kelas SMOTE Dan Seleksi Fitur Ensemble Filter Pada Support Vector Machine Untuk Klasifikasi Penyakit Liver,” J. Teknol. Inf. dan Ilmu Komput., vol. 10, no. 6, pp. 1273–1284, 2023, doi: 10.25126/jtiik.2023107234.

W. M. Putri, E. Budianita, F. Syafria, I. Afrianty, and K. Kunci, “Klasifikasi Penyakit Ginjal Kronis Menggunakan Information Gain Dan LVQ,” J. Inf. Syst. Manag., vol. 7, no. 1, pp. 48–56, 2025, doi: https://doi.org/10.24076/joism.2025v7i1.2102.

G. F. Sijabat and W. A. E. Prabowo, “Studi Komparatif Model Machine Learning untuk Klasifikasi Penyakit Jantung dengan SMOTE pada Data Imbalanced,” JURIKOM (Jurnal Ris. Komputer), vol. 13, no. 1, pp. 398–409, 2026, doi: 10.30865/jurikom.v13i1.9485.

N. C. Ramadhan, H. H. H, T. Rohana, and A. M. Siregar, “Optimasi Algoritma Machine Learning Menggunakan Seleksi Fitur Xgboost Untuk Klasifikasi Kanker Payudara,” TIN Terap. Inform. Nusant., vol. 5, no. 2, pp. 162–171, 2024, doi: 10.47065/tin.v5i2.5408.

J. Pardede and R. Dwianto, “The Effect of Feature Selection on Machine Learning Classification,” Int. J. Informatics Vis., vol. 9, no. 4, pp. 1419–1429, 2025, doi: 10.62527/joiv.9.4.2926.

N. Ulinnuha and A. Fanani, “Klasifikasi Status Drop Out Mahasiswa Menggunakan Naïve Bayes dengan Seleksi Fitur Information Gain,” Techno.Com, vol. 22, no. 4, pp. 1014–1025, 2023, doi: 10.33633/tc.v22i4.9004.

Devian, P. Nurul Sabrina, and A. Komarudin, “Prediksi Penyakit Diabetes Dengan Metode K-Nearest Neighbor (KNN) Dan Seleksi Fitur Information Gain,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 6, pp. 11320–11326, 2024, doi: 10.36040/jati.v8i6.11364.

D. A. Nasution, H. H. Khotimah, and N. Chamidah, “Perbandingan Normalisasi Data untuk Klasifikasi Wine Menggunakan Algoritma K-NN,” Comput. Eng. Sci. Syst. J., vol. 4, no. 1, p. 78, 2019, doi: 10.24114/cess.v4i1.11458.

M. P. Pulungan, A. Purnomo, and A. Kurniasih, “PENERAPAN SMOTE UNTUK MENGATASI IMBALANCE CLASS DALAM KLASIFIKASI KEPRIBADIAN MBTI MENGGUNAKAN NAIVE BAYES CLASSIFIER,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 5, pp. 1033–1042, 2024, doi: 10.25126/jtiik.2024117989.

A. Yaqin and G. Ramadhani, “Penilaian Kredit Menggunakan Algoritma XGBoost dan Logistic Regression,” J. Inform. J. Pengemb. IT, vol. 8, no. 1, pp. 4–10, 2022, doi: 10.30591/jpit.v8i1.4337.

S. Murni, D. Widiyanto, and C. N. P. Dewi, “Klasifikasi Citra Penyakit Daun Kopi Arabika Menggunakan Support Vector Machine (SVM) Dengan Seleksi Fitur Information Gain,” Semin. Nas. Mhs. Ilmu Komput. dan Apl., vol. 3, pp. 700–709, 2022.

D. Kurnia, M. Itqan Mazdadi, D. Kartini, R. Adi Nugroho, and F. Abadi, “Seleksi Fitur dengan Particle Swarm Optimization pada Klasifikasi Penyakit Parkinson Menggunakan XGBoost,” J. Teknol. Inf. dan Ilmu Komput., vol. 10, no. 5, pp. 1083–1094, 2023, doi: 10.25126/jtiik.2023107252.

H. H. Sinaga and S. Agustian, “Pebandingan Metode Decision Tree dan XGBoost untuk Klasifikasi Sentimen Vaksin Covid-19 di Twitter,” J. Nas. Teknol. dan Sist. Inf., vol. 08, no. 03, pp. 107–114, 2022, doi: https://doi.org/10.25077/TEKNOSI.v8i3.2022.107-114.




DOI: http://dx.doi.org/10.30811/jaise.v6i2.9384

Refbacks

  • Saat ini tidak ada refbacks.


Indexing :

Creative Commons License
Journal of Artificial Intelligence and Software Engineering (JAISE) licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.