KLASIFIKASI SENYAWA KELADI TIKUS MENGGUNAKAN ALGORITMA KNN, GAUSSIAN NAÃVE BAYES DENGAN MENERAPKAN IMBALANCE DATA BORDERLINE SMOTE

Iwan Binanto; Nesti Fronika Sianipar; Frista Dea; Margareta Navi Primadani; Theresia Winnie Kartikasari

doi:10.36499/psnst.v13i1.9005

Authors

Iwan Binanto Informatics, Sanata Dharma University
Nesti Fronika Sianipar Biotechnology Department, Faculty of Engineering, Bina Nusantara University, Jakarta
Frista Dea Informatics, Sanata Dharma University
Margareta Navi Primadani Informatics, Sanata Dharma University
Theresia Winnie Kartikasari Informatics, Sanata Dharma University

DOI:

https://doi.org/10.36499/psnst.v13i1.9005

Keywords:

LCMS, imbalance data, oversampling, Borderline-SMOTE

Abstract

Data seimbang atau imbalanced data merupakan keadaan di mana distribusi kelas data yang tidak seimbang yaitu jumlah data yang satu lebih sedikit atau lebih banyak dari kelas lainnya. MenanganiÂ data yang tidak seimbang telah menjadi tantangan besar selama dua dekade terakhir. Keseimbangan data merupakan faktor yang penting untuk diperhatikan, karena mempengaruhi hasil yang diperoleh. Penelitian ini bertujuan untuk melakukan perbandingan metode antara KNN, Gaussian NaÃ¯ve Bayes, dan Random Forest untuk menentukan metode yang paling baikÂ berdasarkan data tanaman keladi tikus. Data yang tidak seimbang akan diseimbangkan dengan menggunakan metode oversampling yaitu Borderline-SMOTE. Dari penelitian yang telah dilakukan, algoritma KNN, Gaussian NaÃ¯ve Bayes, dan Random Forest pada data yang sebenarnya (belum seimbang) menghasilkan nilai akurasi berturut-turut sebesar 0.984, 0.985, dan 1. Sedangkan pada data yang sudah diseimbangkan menghasilkan akurasi berturut-turut adalah sebesar 0.967, 0.499, dan 0.984. Algoritma random forest dapat mengklasifikasikan data yang seimbang dan belum seimbang dengan baik dibandingkan dengan algoritma yang lain. Hal ini karena algoritma random forest menghasilkan score akurasi, recall, F1-score, dan Precission yang tinggi dibanding dengan algoritma KNN dan Gaussian Naive Bayes pada data yang unbalance maupun balance.

KLASIFIKASI SENYAWA KELADI TIKUS MENGGUNAKAN ALGORITMA KNN, GAUSSIAN NAÃVE BAYES DENGAN MENERAPKAN IMBALANCE DATA BORDERLINE SMOTE

Authors

DOI:

Keywords:

Abstract

Downloads

Published

Issue

Section

Developed By

Language

Information

KLASIFIKASI SENYAWA KELADI TIKUS MENGGUNAKAN ALGORITMA KNN, GAUSSIAN NAÃVE BAYES DENGAN MENERAPKAN IMBALANCE DATA BORDERLINE SMOTE

Authors

DOI:

Keywords:

Abstract

Downloads

Published

Issue

Section

Developed By

Language

Information

KLASIFIKASI SENYAWA KELADI TIKUS MENGGUNAKAN ALGORITMA KNN, GAUSSIAN NAÃVE BAYES DENGAN MENERAPKAN IMBALANCE DATA BORDERLINE SMOTE