METODE LATENT DIRICHLET ALLOCATION UNTUK EKSTRAKSI TOPIK DOKUMEN

  • Putu Manik Prihatini Politeknik Negeri Bali
  • I Ketut Suryawan Politeknik Negeri Bali
  • I Nyoman Mandia Politeknik Negeri Bali

Abstract

Proses ekstraksi dalam temu kembali informasi menghasilkan fitur yang akan menjadi ciri unik dari suatu dokumen, sehingga dokumen tersebut dapat dinyatakan relevan atau tidak relevan terhadap kata kunci yang diketikkan oleh pengguna. Salah satu metode ekstraksi berbasis topik yang mampu menemukan hubungan struktural internal dalam dokumen adalah Latent Dirichlet Allocation, karena mampu bekerja pada level kata, dokumen dan korpus. Akan tetapi, penelitian-penelitian terkait ekstraksi topik dokumen dengan metode Latent Dirichlet Allocation lebih banyak dikembangkan untuk teks berbahasa asing, dan sampai saat ini, sangat jarang ditemukan untuk teks dokumen berbahasa Indonesia. Untuk itu, pada penelitian ini, diimplementasikan metode ekstraksi topik Latent Dirichlet Allocation untuk aplikasi teks dokumen berbahasa Indonesia. Tahapan penelitian terdiri dari akusisi data, tokenisasi, filtering, stemming, re-filtering, inisialisasi, sampling topik, perhitungan parameter final dan evaluasi. Hasil implementasi metode ekstraksi topik Latent Dirichlet Allocation untuk teks dokumen berbahasa Indonesia diuji dengan metriks pengukuran Precision, Recall dan F-Measure. Hasil penelitian ini nantinya diharapkan dapat menjadi referensi dalam melakukan penelitian-penelitian tentang metode ekstraksi topik untuk teks dokumen berbahasa Indonesia.

Downloads

Download data is not yet available.
Published
Nov 30, 2017
How to Cite
PRIHATINI, Putu Manik; SURYAWAN, I Ketut; MANDIA, I Nyoman. METODE LATENT DIRICHLET ALLOCATION UNTUK EKSTRAKSI TOPIK DOKUMEN. LOGIC Journal of Engineering Design and Technology, [S.l.], v. 17, n. 3, p. 153-157, nov. 2017. ISSN 2580-5630. Available at: <http://ojs.pnb.ac.id/index.php/LOGIC/article/view/604>. Date accessed: 18 aug. 2018.
Section
Articles