海科SEO顾问为您快速优化网站,网站SEO优化 营销型网站建设第一品牌!
189-3859-6332

轻松、简单、快速!值得信赖的SEO顾问服务。

专业 敬业 职业  

您现在的位置:首页 > 最新资讯 >

页面长度过长,也会导致不收录?

人气: 发表时间:2017-06-17 20:33

页面长度过长,也会导致不收录?这个说法是有两面性的,一个是过长是有多长,长的计算单位有是多少KB,如果按照搜索引擎的抓取页面大小去计的话,超过它所能抓取的范围,这个页面肯定是不被收录的,抓取单位有是多少KB我们就不知道了,这个毕竟是搜索引擎工程师去做的事,只能去问大侠们了。

【院长帮帮忙】页面长度过长,也会导致不收录?(2017年第4期)
最近院长收到一个非常典型的抓取优化例子,整理一下分享给各位,各位站长们谨记不要出现相同的情况:
 
站点反馈:
 
网站主体内容都是js生成,针对用户访问,没有做优化;但是网站特针对爬虫抓取做了优化,且将图片也直接做了base64转化;然而优化后发现内容却不被百度收录
 
页面质量很好,还特意针对爬虫做了优化,为什么内容反而不收录了呢?
 
工程师分析:
 
1、网站针对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,网站页面长度达164k;
 
2、 站点优化后将主体内容放于最后,图片却放于前面;
 
3、爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不收录。
 
工程师建议:
 
1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取
 
2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长
 
3、针对爬虫爬取做优化,请将主题内容放于前方,避免抓取截断造成的内容抓取不全

 

参考这篇百度经验的文章《百度收录网站三大标准》
 
一、确保主机空间稳定。
 
在这里一定要记住,主机空间服务器,是我们的的硬件所在,是我们的根本。主机空间稳定与否和网站存活的时间长短有很大的关系,如果你的空间经常打不开或访问速度很慢不要说是度娘就是广大用户也不会有耐心等待,提醒站长选择空间一定要找个好的空间商而且要确保服务器上没有不良记录或者被K,如果发现被K的了一定要联系对方及时删除。
 
二、网站结构忌混乱。
 
在网站策划建设之初,就一定要统筹好网站的结构,不要蜘蛛来对你进行分化,而是你导蜘蛛对你的网站进行细化,当你的网站结构过于混淆的时候,那么你就要注意了,你的新站,一般都不可能快速被百度蜘蛛认可,即使让你收录,你也不可能获得非常好的排名。网站结构要选择树形结构,导航尽量使用面包削导航,页面的层次不要太深做好位置导航对于用户很友好。
 
三、网站内容。
 
内容是一个网站的核心,是一个网站存在的本质,不管是做过站的朋友还是没做过的朋友,大家都喜欢新鲜的东西,蜘蛛也是一样,它也喜欢别人能满足它的新鲜感。只有这样,它才会每天过来看你是不是带给它惊喜。原创内容是非常重要的,因为原创内容会吸引百度蜘蛛来抓取页面,如果你核心都处理不好百度怎么会收录你的网站,不要一味的采集和转载内容。
本帖的地址:http://www.se-o.cn/news/1364.html
本文来自海科SEO(www.se-o.cn)整理编辑,转载本站文章请注明出处。