1.抓取(4种相应的链接提交方法)
抓取是基础,那么什么因素影响百度蜘蛛的频率和数量呢?百度给出了官方回复:
(1)网站更新频率:更新来得更快,更新来得更慢,这直接影响了拜杜斯皮德的访问频率
百度搜索引擎优化排名算法规则官方曝光!
(2)网站更新质量:更新频率增加,只吸引了拜杜斯皮尔(Baiduspier)的注意。Baiduspier有严格的质量要求。如果网站每天更新的大量内容被Baiduspier判断为低质量页面,那仍然毫无意义。
(3)连接性:网站应安全稳定,远离百度百科。经常把白杜斯迪拒之门外不是一件好事。
(4)、站点评价:百度搜索引擎会对每个站点进行评价,这种评价会根据站点情况而变化,这是百度搜索引擎对站点的基本评分(绝不是外界提到的百度权重),是百度内部非常机密的数据。网站评级从不独立使用,它将与其他因素和阈值合作,共同影响网站的捕获和排名。
2、关于过滤(过滤掉垃圾内容,底层库内容)
百度会自己过滤掉一些垃圾网页,哪些是垃圾网页?以下是官方答复:
(1)、网页的重复内容:互联网上现有的内容,百度将不再需要被收录。
(2)、空短网页的主要内容
[1]有些内容使用百度蜘蛛无法解析的技术,如JS、AJAX等。虽然用户在访问时可以看到丰富的内容,但他们仍然会被搜索引擎抛弃。
[2]加载速度太慢的网页也可能被视为空页和短页。请注意,广告加载时间是在网页的总加载时间内计算的。
[3]许多主题不引人注目的网页即使被检索到,也会被丢弃。
(3)一些作弊网站
3、关于数据库(内容为王,你的文章是否已经进入高质量的数据库)
百度将根据页面质量将返回的页面放入高质量、普通和低质量的库中。那么百度如何判断一个页面的质量呢?以下是官方答复:
(1)、对用户的价值:
[1]独特的内容,百度搜索引擎喜欢独特的内容
[2]主体是突出的,重要的是不要表现出网页的主要内容不突出,并且搜索引擎误判为空的和短的页面没有被捕获。
[3]内容丰富
[4]广告是合适的
(2)、环节重要性
[1]目录级别-浅优先级
[2]车站中的流行环节,内链
4、关于输出结果(重量、重量或重量)
最后,百度会根据用户搜索关键词,一是从索引数据库中提取相关网页,二是根据不同维度的得分对提取的网页进行排序。“不同维度”包括:
(1)相关性:网页内容与用户检索需求的匹配程度,如网页中包含的用户检查关键词的数量以及这些关键词出现的位置;外部网页用来指向页面的锚文本等。
(2)、权威:用户喜欢某些权威网站提供的内容。相应地,百度搜索引擎也相信高质量权威网站提供的内容。推荐阅读:客观了解2019搜索引擎优化的5个趋势!
(3)时效性:时效性结果是指新的网页,网页包含新的内容。目前,及时性结果在搜索引擎中越来越重要。
(4)重要性:网页内容与用户检查要求匹配的重要性或流行程度
(5)丰富性:丰富性似乎很简单,但它是一个覆盖面非常广的命题。可以理解,该网页内容丰富,能够完全满足用户的需求。既能满足用户的单一需求,又能满足用户的扩展需求。
(6)受欢迎程度:指网页是否受欢迎。