雅酷SEO论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 541|回复: 0
打印 上一主题 下一主题

怎么看网站日志分析百度蜘蛛是否正常

[复制链接]

635

主题

0

好友

6913

积分

论坛元老

Rank: 8Rank: 8

  • TA的每日心情

    2015-7-3 17:11
  • 签到天数: 139 天

    连续签到: 1 天

    [LV.7]常住居民III

    跳转到指定楼层
    楼主
    发表于 2015-1-8 15:40:57 |只看该作者 |正序浏览
      网站上线后,勤劳的站长就应该多分析下自己网站日志,这样才能给分析我们网站的问题,比如日志没有蜘蛛来过的痕迹就需要加大站内质量文章的更新,和站外链接引蜘蛛,那么网站日志在那找呢?如何分析呢?


      很多虚拟主机控制面板都会有日志下载的功能,也有的在网站根目录下的"log文件夹"或"logfiles文件夹", 通过FTP下载到本地。用记事本打开。
      2014-06-19 15:52:03 W3SVC11.197.199.208 GET /zwz/18.html- 80 - 220.181.7.74 Baiduspider+(+baidu/search/spider.htm) 200 0 0 看到200 0 0大家就放心了。先介绍下200 0 0组成部分
      200 0 0
      sc-status(协议状态) sc-substatus(协议子状态) sc-win32-status(Win32状态码)
      sc-status(协议状态): 200 连接成功           sezyy.com
      sc-substatus(协议子状态) :0 成功
      sc-win32-status(Win32状态码):0 代表抓取成功并带回数据库 ; 64 指定的网络名不再可用
      1: 在这个访问记录里面1.197.199.208是你服务器的IP地址,220.181.7.74 是bd蜘蛛的IP/zwz/18.html 为蜘蛛访问你的页面 80是端口 GET是打开方式 W3SVC1是记录的文件夹,这里说明,bd蜘蛛已经访问了你的/zwz/18.html这个页面,那么最重要的是最后面的这个参数200 0 0.          fsb010.com
      2、200 0 0 成功访问该页面,0代表抓取成功并带回数据库。这个时候你就放心了,这个页面已经被bd收录,但是还没有释放出来,bd更新时就可能释放出来。
      3:200 0 64 网络上流传着这么三种解释
      第一有人说64为K站的前兆。
      第二说64的出现只是64位操作系统。
      第三:网络不可达,由于某种原因无法完全打开页面,或者网络不稳定这些原因,导致蜘蛛无法带回页面或者说不抓取该页面,
      反正当出现只抓抓取状态吗为200 0 64的解释也应该为:访问了该页面,但并没有任何抓取也没有带回数据库。这种原因多为空间不稳定、服务器不稳定。也可以解释蜘蛛访问了但快照不更新。           pifubaiban.net
      SEO学堂再来给大家介绍下其它返回码的意思:
      4:304 0 0这个返回码代表蜘蛛访问的页面没有更新,和他之前来的时候是一样的,所以看到这个不要担心,蜘蛛来过,只不过你没有更新,所以他也不愿意带走这个页面。
      5:404 0 0这个是代表404页面,但是有个很严重的问题,这个返回码告诉我们,蜘蛛来到了404页面并把他带走了要你有太多的404,那么蜘蛛就会不断是抓取,不断的带走,这样会造成无数的重复页面,最终导致K站或者降权。
      正确的返回码是404 0 64 这就代表蜘蛛没有抓取你这个页面。 (好像是内容有死链的意思)
      6:500错误500错误是服务器内部错误,是由程序的错误造成的,我不懂程序,但是500错误是会给你减分的,这点基本的逻辑都可以想的到,要发现500错误,马上查看是哪个页面的,然后去修正以下错误吧!            zgnpxw.com
      7:302要在日志中发现302的返回码也是需要注意的,302为临时重定向,要你是长期的将这个页面重定向到另一个页面,麻烦你使用301永久重定向,要是302的话bd蜘蛛下次来还会访问这个页面,这样又会造成复制大量页面的问题,结果肯定是K,所以,抽空检查以下。
      每个网络蜘蛛都有自己的名字,在抓取网页的时候,都会向网站标明自己的身份。网络蜘蛛在抓取网页的时候会发送一个请求,这个请求中就有一个字段为User-agent,用于标识此网络蜘蛛的身份。例如Google网络蜘蛛的标识为GoogleBot,Baidu网络蜘蛛的标识为BaiDuSpider,Yahoo网络蜘蛛的标识为Inktomi Slurp.

    分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    百度SEO教程|谷歌SEO学术|百度SEO谷歌|网站SEO优化|雅酷SEO论坛  

    GMT+8, 2024-9-25 17:18

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回顶部