网站诊断:网站为如何尽快收录快照更新
最近在一些站长论坛里面经常有看到人在问:为什么我发的内容百度不收录呢?为什么我网站的快照不更新呢?为什么我收录的内容又被百度删除了呢? 其实这些问题归根到底也就是一个问题,那就是网站内容质量的问题。当然,或者那些人的目的也并不是真的咨询问题的,为的可能也就是在询问问题的时候发布一 个外部链接而已。不过本人想了想,这其实也是很多seo从业人员初期会遇到的问题,所以也就整理了一些想法,写出这样一篇关于网站诊断的文字出来。至于是不是真的实用,那就是仁者见仁智者见智了。 为什么网站不被收录
在继续这个话题之前我们应该先了解一个概念,那就是搜索引擎收录的是什么?对于搜索引擎来说,收录的是页面,所以说,网站想要被更多的收录,那就需要 有更多的页面提供给搜索引擎,而页面对于我们来说就是网站的内容,一个针对网站主题发布的内容,然后经过程序生成的页面。那么网站的内容从什么地方而来 呢? 网站内容的来源 简单来说,网站的内容从发布来源分为两个部分,一是网站本身发布的,二是用户生成的。如果从内容的原创性上来看,同样也可以分为两个部分,一个是原创,二就是伪原创了。而我们这里重点要说的是第二种分类。原创的内容是网络上无法找到的,这部分内容对于搜索引擎来说是比较喜欢的,而伪原创就需要看具体怎么去做的了,这里可以参考《如何伪原创》一文。 搜索引擎收录的标准 这个具体可以参考一下百度官方发布的文档《百度搜索引擎优化指南2.0》,里面对于很多内容都有比较详细的说法,作为新手站长以及新手seo的话,这个参考文档是进入seo行业必须阅读的文档。 为什么发布的内容不收录 其实发布的内容不收录的问题很多网站都有,一般造成不收录的原因也不多。第一,检查网站的robot.txt协议,看这个协议中是不是有屏蔽了 搜索引擎蜘蛛的命令?第二,网站的内容。网站的内容是不是采集而来,是不是在互联网上有很多的重复,如果是的话,尽量原创吧。第三,太多的广告弹窗,这个 其实也会造成不被收录的,当然,如果网站权重高的话影响也不是太大的。第四,还是内容,那就是内容可能不是原创的,但是也不是采集的,而是伪原创或者是杂 乱的,这个虽然重复度不高,但是也有可能不被收录。 为什么快照不更新 可能的原因可能是服务器,所以一个网站必须要保持稳定。如果所在空间不稳定的话,建议更换一下稍好的。第二也就是首页内容了,首页其实也是一个页面,不过对比内容页来说权重稍高而已,所以也需要保持一定量的更新。第三,友情链接。看看是不是有被降权的友情链接连带了。 为什么收录的页面不见了 也有看到一些人问原本收录的页面最近总是不断的减少。那么这其实和不收录的问题差不多的。主要看文章质量,如果文章质量比较烂的话,收录后经过搜索引擎进行内容重复度对比,发现相似度太高,而且网站的权重也不如其他站的话,就有可能被去重了。这也就是收录减少的原因。 罗宾个 人建议使用百度统计,主要的功能和一般的统计代码都是比较类似的,不过其中有一个百度索引的功能可以让站长作为参考的作用,因为通过索引数据我们可以判断 出网站的页面是没有被收录还是被索引了没有放出来。然后结合网站访问日志,研究搜索引擎蜘蛛的爬行记录以及返回代码进行判断。 不管是在网站建设还是网站优化的 时候,我们都会遇到很多的问题,不过一般来说,问题都不会是第一次出现的,这个时候善用搜索引擎的话可以找到很多问题的答案。当然,对症下药才是最重要 的,所以我们在做优化的时候不应该是人云亦云,而应该是实战,实战再实战。然后对实战中的各种数据进行分析,那样才能制定出最完善的seo优化策略,让我 们的网站优化工作事半功倍。 |