探索巨大收录量之谜:揭开搜索引擎背后的秘密
探索巨大收录量之谜:揭开搜索引擎背后的秘密!
4月28日,百度搜索工程师Lee在接受《中国互联网络发展状况统计报告》采访时指出,搜索引擎收录数量更甚,但也更多的是虚假数据,使得搜索引擎中的虚假数据泛滥,当然也就无法给网民带来更多的惊喜。
不少专家将“虚假数据”判断为“无良公司”,但还是有不少专家觉得不对劲。
这里我们先来看看百度的“虚假数据”判断:
1、短时间内,访问量高,但不到一半的IP
搜索引擎总是喜欢那些按一定规则规定的网站,比如排名靠前的网站,这就证明了百度的“数据的可信性”,但通过这些网站中某个人的行为,如添加了假数据,那么搜索引擎可能会选择怀疑为作弊,即使是为了一时的利益,也有可能会从这些虚假数据中剔除掉。
2、访问量高,但不到10%的IP
这里的访问量指的是访问量,百度这个庞大的数据库中,每天有很多用户搜索到网站并访问网站,但这些网站中大部分都是首页、分类页和详情页,没有实质性的内容,这样的情况下,这个网站的访问量就是“虚假数据”,这个时候我们需要综合看网站中哪个页面、哪个内容比较多,最后得出一个结论,看看有没有在同一天内更多的人看到。
3、包含的字多,信息量少
如果一个网站中你放了很多行业内的关键词,这个页面的内容涵盖了同一个关键词,这个网站的访问量就有可能是虚假的,但是这个网站的有效访问量却很低,那怎么办?我们可以对这个关键词进行分析,查看这些关键词是否有商业价值,来进行判断,一般来说,这些关键词是由来流量的,而且从搜索引擎中获得的流量都是实实在在的流量。
4、隐藏页面多,这个大家应该都知道,做网站最忌讳的就是链接、标题和描述,而百度这样的搜索引擎就会把隐藏的页面删掉,如果你的网站中有多个隐藏的页面,那么,被搜索引擎发现后,也会对你的网站进行降权处理。
5、内容作弊,现在是内容为王的时代,什么样的内容才算是优质的内容,什么样的内容才算是劣质的内容,这就涉及到百度这方面的一个算法机制了,我们在使用内容的时候要结合实际情况来做出判断。