ANALISIS PENGARUH SELEKSI FITUR PADA KLASIFIKASI KONSENTRASI SPERMA BERDASARKAN FAKTOR FAKTOR LINGKUNGAN, KESEHATAN, DAN GAYA HIDUP

Authors

  • Nasrokhah Noviati Jurusan Teknik Elektro dan Teknologi Informasi FT UGM, Jalan Grafika No 2, Kampus UGM Yogyakarta 55281
  • Silmi Fauziati Jurusan Teknik Elektro dan Teknologi Informasi FT UGM, Jalan Grafika No 2, Kampus UGM Yogyakarta 55281
  • Indriana Hidayah Jurusan Teknik Elektro dan Teknologi Informasi FT UGM, Jalan Grafika No 2, Kampus UGM Yogyakarta 55281

DOI:

https://doi.org/10.36499/psnst.v1i1.1164

Abstract

Menurunnya fertilitas terjadi di banyak negara. Berbagai penyebab yang melatarbelakangi hal tersebut. Beberapa di antaranya adalah disebabkan gaya hidup yang buruk, latar belakang kesehatan yang tidak baik, dan juga lingkungan yang tidak sehat. Menggunakan metode data mining, dapat mengklasifikasikan konsentrasi sperma apakah normal atau tidak. Fitur yang banyak dalam dataset akan menimbulkan banyak permasalahan, sehingga perlu melakukan seleksi fitur. Keuntungan menggunakan seleksi fitur antara lain dapat mengingkatkan akurasi suatu klasifikasi, dan membantu mengurangi fitur-fitur yang tidak relevan. Algoritme seleksi fitur yang digunakan dalam penelitian ini Principal Component Alanalisys (PCA) yang diterapkan pada metode klasifikasi Multilayer Perceptron (MLP), Decision Tree, dan Support Vector Machines (SVM). Dataset yang digunakan diambil dari dataset fertility pada UCI Maching Learning Repository untuk mengklasifikasikan konsentrasi sperma. Kesimpulan pada penelitian ini adalah menggunakan seleksi fitur PCA mampu mengurangi fitur yang kurang relevan dari 9 fitur menjadi 5 fitur terbaik yaitu musim, penyakit, kecelakaan, demam, dan rokok. Serta 6 fitur terbaik yaitu musim, penyakit, kecelakaan, demam, rokok, dan operasi. Penggunaan  5 atau 6 fitur terpilih terbukti mampu meningkatkan akurasi dari hasil klasifikasi tanpa seleksi fitur.

Kata kunci: data mining,  fertilitas, seleksi fitur, PCA.