Algoritma Clustering untuk Seleksi Ciri pada Kategorisasi Terjemah Hadits
Keywords:
Seleksi CIri; Kategorisasi ; k-Neirest Neighbor (k-NN); Clustering; k-Medoid; Neirest Centroid (NC).
Abstract
Permasalahan dalam kategorisasi teks adalah besarnya jumlah ciri. Jumlah ciri tergantung pada jumlah kata yang digunakan dalam seluruh dokumen yang diolah. Masalah lain adalah banyaknya elemen nol dalam ciri untuk tiap dokumen. Dalam penelitian ini penulis mengajukan metode untuk memilih (menyeleksi) ciri dengan menggunakan proses klastering. Algoritma klastering yang digunakan adalah Partition Around Medoid (PAM). Kategorisasi dilakukan dengan menggunakan algoritma k-NN dan Nearest Centroid. Penggunakan Seleksi Ciri dapat meningkatkan akurasi kategorisasi, untuk k-NN sebesar 3% dan untuk NC sebesar 6%. Selain itu juga pemilihan ciri dapat mengurangi waktu komputasi.
Published
2018-10-31
Section
Articles