Volltext-Ranking
RANK = Summe ( g i * G i) = 0 .. 1
mit Summe ( g i ) = 1
- G 1 = Anz.vork.Terme / Ges.zahlTerme
- G 2 = 1 - Summe ( Summe ( minTermDistanzen ))/C
"je näher die Terme beieinander, desto besser"
- G 3 = f ( einzelTermVerteilung )
"je gleichverteilter jeder Einzelterm, desto besser"
- G 4 = Anz.versch.Worte / Ges.zahlWorte
Spam-Erkennung
+ rekursives HVV
nach Standford PageRank-Verfahren
Diplomarbeit Stefan Heineke, RRZN/RVS Uni Hannover
start
(C) RRZN, W.Sander-Beuermann