Algoritma Clustering untuk Seleksi Ciri pada Kategorisasi Terjemah Hadits

  • Arief Fatchul Huda UIN Sunan Gunung Djati
  • Qonita Ummi Safitri UIN Sunan Gunung Djati
  • Firda Ayu Setiawati UIN Sunan Gunung Djati
Keywords: Seleksi CIri; Kategorisasi ; k-Neirest Neighbor (k-NN); Clustering; k-Medoid; Neirest Centroid (NC).

Abstract

Permasalahan dalam kategorisasi teks adalah besarnya jumlah ciri. Jumlah ciri tergantung pada jumlah kata yang digunakan dalam seluruh dokumen yang diolah. Masalah lain adalah banyaknya elemen nol dalam ciri untuk tiap dokumen. Dalam penelitian ini penulis mengajukan metode untuk memilih (menyeleksi) ciri dengan menggunakan proses klastering. Algoritma klastering yang digunakan adalah Partition Around Medoid (PAM). Kategorisasi dilakukan dengan menggunakan algoritma k-NN dan Nearest Centroid. Penggunakan Seleksi Ciri dapat meningkatkan akurasi kategorisasi, untuk k-NN sebesar 3% dan untuk NC sebesar 6%. Selain itu juga pemilihan ciri dapat mengurangi waktu komputasi.

Published
2018-10-31