Penerapan metode Stacking dan Random Forest untuk Meningkatkan Kinerja Klasifikasi pada Proses Deteksi Web Phishing
Sari
Ketidakseimbangan kelas seringkali menjadi hal yang diabaikan terutama oleh para peneliti di bidang data mining dan machine learning. padahal dengan melakukan penanganan terhadap ketidakseimbangan kelas, memungkinkan adanya peningkatan kinerja klasifikasi apabila dibandingkan dengan penggunaan model klasifikasi tunggal. Hal tersebut dikarenakan cara kerja klasifikasi tunggal yang cenderung bekerja untuk mengenali pola mayoritas dan mengasumsikan distribusi data secara relative membuat kinerja klasifikasi menjadi kurang maksimal. Oleh karena itu, pada penelitian ini diusulkan sebuah pendekatan level algoritmik yang memanfaatkan algoritma random forest, serta metode stacking yang menggabungkan algoritma decision tree dengan naïve bayes sebagai model klasifikasi pada dua jenis web phising dataset yang masing-masing memiliki imbalanced rasio sebesar 1.25% untuk binary class dan 6.82% untuk multiclass. Ide dasar dilakukannya pendekatan level algoritmik ini karena keunggulannya yang mampu meningkatkan dan memaksimalkan kinerja klasifikasi tanpa merubah komposisi maupun pola dataset sehingga informasi yang ada pada dataset tetap terjaga. Hasilnya, penggunaan algoritma random forest memiliki nilai akurasi tertinggi yakni sebesar 96.4% pada dataset web phising binary class, sedangkan metode stacking yang menggabungkan algoritma decision tree dengan naïve bayes menghasilkan kinerja terbaik pada dataset web phising multiclass berdasarkan nilai akurasi sebesar 88.8%
Kata Kunci
ketidakseimbangan kelas, klasifikasi, machine learning, random forest, metode stacking, ensemble model
Teks Lengkap:
PDFDOI: http://dx.doi.org/10.30811/jim.v7i1.2959
Refbacks
- Saat ini tidak ada refbacks.
##submission.copyrightStatement##