百度的数据库确实问题很大,也总是清理大量垃圾或者说价值不大的信息。并不是说原创的就不删除,百度有个特点是,总是以网站来看网页的。权重高的站,什么都好说。
收录量不增的问题,建议还是看看蜘蛛爬取了哪些目录,主要的目录爬取是否频繁。得出结论后,再分析蜘蛛对每个页面的抓取量。我就那个自己做优化的网站举例。网站主要目录就几个,企业站也就是这样。m.kouchibing.com 一般收录问题也就是:网站每天都有收录,但是收录量不上升,有的甚至下降。还有的是就不收录,首页快照更新正常。得出的所有数据是用工具统计的,而不是靠百度 site: 得出的。因为大家都知道这个数据有多大的水分,百度统计、GA都可以。有数据才好说话。
网站首页站蜘蛛爬取量的很大一部分,而很多朋友在首页也加了不少链接到首页的链接。我的做法的,只保留第一个链接首页的链接。其他的都用nofollow标签限制,特别是“联系我们”这个导航栏。不管用robots文件还是nofollow标签,主要的思路还是引导蜘蛛爬行,因为百度蜘蛛还没有智能到像谷歌蜘蛛那样。如果蜘蛛的爬行还是有了,还是不收录的话,那就只能说你的文章没有达到百度收录的标准,或者有点被惩罚了。我有个习惯就是,每次发一篇文章,都会为这篇文章做几个外链。www.kouchibing.com |