METODE PENGUKURAN SIMILARITAS (JACCARD)

LATIHAN

1.     Jika diketahui A={1, 2, 3, 4}, B={1, 2, 4}, dan C={1, 2, 4, 5}, berapakah Jaccard (A, B), Jaccard(B, C), dan Jaccard(A, C)?

Jawab:

2.     Berikutnya untuk kasus query dan document. Misalnya kita punya:

query: ideas of march

doc1: caesar died in march

doc2: the long march

Cari Koefisien Jaccard antara query dengan doc1 dan doc2.

Jawab:


3.     Diketahui 3 dokumen :

d1: “Jack London traveled to Oakland”

d2: “Jack London traveled to the city of Oakland”

d3: “Jack traveled from Oakland to London”

Nilai dari Koefisian Jaccard J(d1, d2) dan J(d1, d3) jika dilakukan dengan n-gram analisis dengan n=2 (bigram) adalah:

Jawab:







Komentar