Pencocokan dokumen berbahasa Indonesia dengan metode Latent Semantic Indexing (LSI) Ide dasar dari LSI bahwa kemiripan antar dokumen dapat dilihat dari frekuensi kata-kata yang sama dalam dokumen tersebut. Untuk mengurangi besarnya ukuran frequency table (M x N), dimana M adalah jumlah dokumen dan N adalah jumlah kata, dalam LSI diterakan teknik singular value decomposition (SVD). Pengembangan penelitian ini akan menerapkan metode LSI untuk membandingan 2 dokumen berbahasa Indonesia yang menghasilkan seberapa dekat kemiripan antar dokumen tersebut.
Saturday, July 7, 2007
Subscribe to:
Post Comments (Atom)
1 comment:
Interesting http://geocities.com/seoidea/
Best regards!
Post a Comment