Jaccard Benzerlik İndeksi (Jaccard Similarity Coefficient), iki küme arasındaki yapısal benzerliği ölçmek için kullanılan istatistiksel bir formüldür.
J(A,B) = |A ∩ B| / |A ∪ B|
Bu arama motorunda;
A kümesi birinci dersin,
B kümesi ise ikinci dersin katalogda yer alan eşsiz anahtar kelimelerini (bağlaçlar hariç) temsil eder.
Algoritma, iki dersin
ortak kelimelerinin sayısını, iki dersteki
toplam benzersiz kelime sayısına bölerek deterministik bir örtüşme oranı çıkarır. Bu yöntem anlamsal (semantik) bir analiz yapmaz, doğrudan müfredatın terminolojik kesişimini baz alır.