问答

为什么有些网站的收录量超高流量却很低

2021-10-21 meiz21

问题答疑

       众所周知,搜索引擎索引库是分层级的,优质的网页会被分配到重要的索引库,而普通网页则待在普通库,至于再差一点的网页就会被分配到低级库去当补充材料。目前有60%的检索需求只要调用重要索引库就可满足,这也是为什么有些网站收录量超高,流量却一直不理想的原因。那么,有哪些网页可以进入优质索引库呢?其实总的原则就是一个:对用户的价值,包括却不仅于:

       1、有时效性且有价值的页面:这里时效性和价值是并列关系,缺一不可,有些站点为了产生时效性内容页面做了大量的采集工作,产生了一堆无价值页面,而这恰恰是百度所不愿看到的。

       2、内容优质的专题页面:专题页面内容不一定完全是原创的,也可以很好地把各方内容整合在一起,或者增加一些新鲜的内容,比如观点和评论,给用户更丰富全面的内容。

       3、高价值原创内容页面:百度把原创定义为花费一定成本、大量经验积累提取后形成的文章。

       4、重要个人页面:比如科比在新浪微博开户了,即使他不经常更新,但对于百度来讲,它仍然是一个极重要的页面。

       那么,有哪些网页无法建入索引库?

       虽然优质网页可以进入索引库,但其实互联网上大部分网站都没有被百度收录,并不是百度没有发现他们,而是在建库前的筛选环节就被过滤掉了,那么什么样的网页在最初环节会被过滤掉呢?

       1、重复内容的网页:互联网上已有的内容,百度显然不会再收录。

       2、主题内容空短的网页:

       A、有些内容使用了百度spider无法解析的技术,比如js、AJAX等,虽然用户访问能看到丰富的内容,但还是会被搜索引擎给抛弃。

       B、加载速度过慢的网页,很有可能被当做空短页面处理,注意广告加载时间算在网页的整体加载时间内。

       C、很多主题不突出的网页就算被抓取回来,也还是会在这个环节被抛弃。

       D、部分作弊网页。


QQ在线咨询