◆◆0

链接分析算法之：HillTop算法
被墙跳转TG:@qianhenetwork QQ 851617266

来源：武汉seo 2019-04-26 20:54:34 SEO优化 537 0

Hilltop算法是由Krishna Baharat 在2000年左右研究的，于2001年申请专利，但是有很多人以为Hilltop算法是由谷歌研究的。只不过是Krishna Baharat 后来加入了Google成为了一名核心工程师，然后授权给Google使用的。

在与PageRank算法相比之下，Google意识到这个算法的进步会为他们的搜索排名带来非常重要的功能。Google的HillTop算法现在已经能更好的与旧的算法(PR算法)联合起来工作。根据观察HillTop算法比起它在2000年刚设计的时候已经有了很大的进步。显然这也是2003年11月16日“佛罗里达”更新中影响的一个最主要的算法。

1. Hilltop算法基本思想

Hilltop融合了HITS和PageRank两个算法的基本思想：

一方面，Hilltop是与用户查询请求相关的链接分析算法，吸收了HITS算法根据用户查询获得高质量相关网页子集的思想，即主题相关网页之间的链接对于权重计算的贡献比主题不相关的链接价值要更高.符合“子集传播模型”，是该模型的一个具体实例；

另一方面，在权值传播过程中，Hilltop也采纳了PageRank的基本指导思想，即通过页面入链的数量和质量来确定搜索结果的排序权重。

2. Hilltop算法的一些基本定义

非从属组织页面：

“非从属组织页面”（Non-affiliated Pages）是Hilltop算法的一个很重要的定义。要了解什么是非从属组织页面，先要搞明白什么是“从属组织网站”，所谓“从属组织网站”，即不同的网站属于同一机构或者其拥有者有密切关联。具体而言，满足如下任意一条判断规则的网站会被认为是从属网站：

条件1：主机IP地址的前三个子网段相同，比如：IP地址分别为159.226.138.127和159.226.138.234的两个网站会被认为是从属网站。

条件2：如果网站域名中的主域名相同，比如:和会被认为是从属组织网站。

“非从属组织页面”的含义是：如果两个页面不属于从属网站，则为非从属组织页面。图6-22是相关示意图，从图中可以看出，页面2和页面3同属于IBM的网页，所以是“从属组织页面”，而页面1和页面5、页面3和页面6都是“非从属组织页面”。由此也可看出，“非从属组织页面”代表的是页面的一种关系，单个一个页面是无所谓从属或者非从属组织页面的。