METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN
DOI:
https://doi.org/10.36499/psnst.v1i1.1528Abstract
Class imbalance merupakan sebuah permasalahan yang lazim ditemukan pada dataset, dimana disribusi antara class mayoritas (Negative) dan minoritas (positive) tidak seimbang. Dengan kata lain, class mayoritas memiliki jumlah yang lebih banyak dibandingkan class minoritas. Dengan distribusi yang tidak seimbang, metode pada machine learning cenderung keliru mengklasifikasikan class minoritas. Paper ini mengadopsi pendekatan teknik sampling yaitu Algoritma SMOTE untuk menangani permasalahan class imbalance yang dikombinasikan dengan metode klasifikasi yang lainnya yaitu metode J48, SVM, dan Naive Bayes. Berdasarkan hasil pengujian yang telah dilakukan dengan tools weka menggunakan evaluasi kinerja confusion matrix, menunjukkan bahwa metode J48+SMOTE memiliki tingkat akurasi dan sensitivity paling tinggi yaitu sebesar 0,93% dan 0,93%. Sedangkan metode SVM memiliki nilai specificity yang paling tinggi sebesar 0.99% dan metode Naive Bayes memiliki waktu komputasi yang paling cepat dibandingkan ketiga metode lainnya sebesar 0.38 seconds. Dengan demikian, metode J48+SMOTE mampu menangani class imbalance pada dataset Bank Direct Marketing pada industri perbankan dibandingkan metode SVM dan Naive Bayes.
Kata kunci: Algoritma SMOTE; Class Imbalance; Metode Klasifikasi