IMPLEMENTASI EKSTRAKSI FITUR PADA PENGOLAHAN DOKUMEN BERBAHASA INDONESIA

  • Putu Manik Prihatini Jurusan Teknik Elektro, Politeknik Negeri Bali

Abstract

Ekstraksi fitur merupakan proses untuk mencari nilai-nilai fitur yang terkandung dalam dokumen untuk proses text mining. Ekstraksi fitur menjadi bagian yang sangat penting dalam pengolahan dokumen pada mesin pencari karena sangat menentukan keberhasilan proses text mining. Salah satu metode ekstraksi fitur yang banyak digunakan dan populer adalah TF-IDF. Pada penelitian ini, metode TF-IDF telah diimplementasikan dengan membuat aplikasi menggunakan perangkat lunak Matlab. Dokumen untuk aplikasi diperoleh melalui media digital Detikcom dan disimpan dalam bentuk file teks. Proses pengolahan dokumen melibatkan case folding, tokenization, filtering, stemming dan ekstraksi fitur. Hasil ekstraksi fitur berupa matriks yang berisi urutan kata-kata unik dari seluruh dokumen dan nilai-nilai fitur TF-IDF dari setiap kata pada seluruh dokumen

Downloads

Download data is not yet available.
Published
Feb 22, 2017
How to Cite
PRIHATINI, Putu Manik. IMPLEMENTASI EKSTRAKSI FITUR PADA PENGOLAHAN DOKUMEN BERBAHASA INDONESIA. Matrix : Jurnal Manajemen Teknologi dan Informatika, [S.l.], v. 6, n. 3, p. 174, feb. 2017. ISSN 2580-5630. Available at: <https://ojs.pnb.ac.id/index.php/matrix/article/view/151>. Date accessed: 20 apr. 2024.