给定网页p和主题t
网站优化公司,RM可以如上计算,但是多数的情况的只给定网页p
,北京网站优化公司需要提取主题后计算。算法的目标是找到一组t,
北京网站优化使得RM(p,t)有较大的值。TOPIC系统中是抽取指向p的网页中的锚文本的单词作为主题(上面已经讨论过锚文本能很好描述目标网页,精度很高),
google优化避免了下载所有指向p的网页,而且RM(p,t)的计算很简单,算法的效率较高。
北京网站优化主题抽取时,还忽略了用于导航、重复的链接的文本,同时也过滤了停止字(stop word),如“a”,“the”,“for”,“in”等