分析得出索引量下降的原因和解决途径

日期:2015-05-18 10:13:18

索引量是什么?站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。

导致索引量下降的常见原因——网站方原因
1、内容数据所在的网址url未规范统一
多域名都可以200状态正常访问网页内容;一域名下出现多种url形式可以访问相同内容,如大小写url、url规则变更等。
解决:选择主域名(或主url),其他域名下的所有url都301重定向到主域名(或主url),并站长工具提交域名改版(或目录url改版)
2、站点受青睐度下降
A、内容质量度下降
解决:提高内容质量度,杜绝简单拷贝,多做整合信息。
B、更新量及频率下降
解决:稳定的更新频率,视内容发展情况,扩充编辑团队,生产更多新内容,让网站索引避免下降,持续增加。(当更新量及频率下降明显,那么配额就会下降,首先表现抓取频次下降,导致索引量下降)
C、时效性信息消失
解决:时效性的信息,大部分一般在数据库不会长期保留,所以需要持续挖掘新的时效信息点,整合相关内容。
D、部分区域出现不良信息
解决:杜绝大量外链软文、恶劣弹窗广告、非法敏感类信息、专门针对搜索引擎作弊的内容
3、网页模板相关
【主体内容区域对蜘蛛的限制】
解决:取消登陆查看信息等限制,让蜘蛛便捷畅快的“采集”到己站数据
【启用了对蜘蛛不友好的技术】
解决:对需要蜘蛛识别的内容,不要启用对蜘蛛不友好的技术来调用
4、源码相关
【源码错误较严重,如编码错误、标签使用错误等;源码改动严重,蜘蛛“采集”数据后重新观察分析;某类url下的TD(网页title、description)变化,如变化比例大、变化页面量大,页面进行更改后会重走建索引库流程,如果页面质量达不到建索引库标准会从线上消失】
解决:校验源码,准确的源码是蜘蛛“采集”数据进行分析的基础;link内链结构、url地址形式、页面主题、页面各区域html标记等尽量维持改动前的情况;逐步、分期更换TD(网页title、description),结合页面主题、用户实际需求来制定合理的TD,不欺骗不误导用户。
5、已入库的url对蜘蛛状态有变化
【robots声明,禁止蜘蛛抓取】
解决:查看百度站长工具robots及抓取情况。
【url规则变化,原有url无法访问】
解决:特别是linux和win服务器之间的数据迁移,可能会出现大小写url支持变化,确保各类url规则不变化。url必须重构的时候,做好旧新url301重定向,站长工具提交改版需求。
【提示错误页面】
解决:由于误删,则可以数据恢复,并维持url对应网页内容的更新变化,提高抓取频次。如果确定要删除,那么提交死链,删除死链后,再robots禁止,这种情况的索引下降无需担忧。
【被入侵】
解决:防止url对蜘蛛进行非法跳转操作;防止url对应的网页内容对蜘蛛出现内容大变化,特别是一些违法乱纪的内容
6、DNS、服务器问题
【DNS问题】
dns不稳定;dns不安全
解决:选择可靠的dns服务;沟通强调对蜘蛛的稳定性;防止dns解析到非正常ip;防止解析的网站ip频繁变动。防止dns管理漏洞,导致被恶意解析;防止dns解析挂靠在小代理等技术能力、管理规范、道德法律约束都欠缺的平台上。

【服务器问题】
A、可访问性差
解决:尽量让目标地区所有运营商来路的用户都能在3秒内打开网站,***1秒内;监控网站运行状态,合理设置目标地区的所有运营商监控节点及监控项目、监控频率
B、屏蔽百度ua或ip
解决:多利用百度站长工具,查看百度抓取网页的情况
C、防刷压力值设定
解决:将蜘蛛解析到专用空间;如出现访问陡增的ip,查看是否为蜘蛛再确定是否禁止访问。
以上几个方面是易讯网络的浅谈,欢迎大家来分享。

上一篇文章:
下一篇文章: