作为SEO站长,每天的数据分析是我们的必须工作,那就少不了查看分析网站IIS日志。通过网站IIS日志分析第一个是了解蜘蛛爬取情况,第二可以查看哪些页面会出现404,第三了解服务器是否稳定,是否正常,第四查看用户访问行为。这些都是我们必须要做的工作,只有了解了这些,才能更好地优化网站。 同时,我们优化的网站每天都会遇到这样那样的问题,一个常识就是先分析一下网站的日志,通过网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个IP的百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回的HTTP状态码。通过excel表格就能得到很直观的数据界面,而且非常便于分析,实现轻松分析IIS日志。 日志的后缀名是log的我们用记事本打开,选择格式里的自动换行这样看起来方便,同时用搜索功能搜索BaiduSpider和Googlebot这两个蜘蛛。wp博客日志分析:首先下载,类似这样格式“Dec-2013.tar.gz”命名,解压后,看到两个文件,“seoxiaoyi.com.error.log.1”格式的是错误日志,不用管。我们下面要分析的是另外一个文件。通过excel表格分析日志具体步骤如下: 1.先用文本方式将日志文件打开,删除data前面的文字(包括空格),如图,红框中为必须删除的文字,这样是为了导入之后显示没有错位。保存,退出。 2.新建一个excel表格,如图选中“数据”→“导入外部数据”→“导入数据”。 3.找到日志所在的文件夹,在文件类型中选中“所有文件”,这时会显示出日志的log文件,双击进行导入。 4.在跳出的“导入向导”对话框中选中“分隔符号”,单击下一步。然后在“分隔符号”里面选中“空格”选项,然后下一步。直接点击完成,在新出来的对话框中点击确定。 5.这时,我们就可以看见日志数据很清晰的出现在表格中了,这时候我们要做的就是让数据更便于检索,选中第一行数据,点击“数据”→“筛选”→“自动筛选”。我们就可以看到第一行都出现了下拉箭头,在这个里面,我们就可以方便的选择想要看到的数据了,例如想看某个页面被访问的详情,就可以在“cs-uri-stem”下拉框中找到相应的页面,如果页面过多还可以在下拉框中选择“自定义”来进行各项操作,方便直观。如果想看百度蜘蛛的数据就可以在“cs(User-Agent)”选择百度机器人。 同时,这个筛选还支持复选,例如,你可以通过组合,选择某个蜘蛛的某个状态码,还可以看到蜘蛛前面的ip,不需要的参数,可以选中那一列删除或者缩小,让整个数据界面更直观一些。 注意:IIS日志是由服务器记录下来的操作记录,那么要查看IIS日志就必须要确定空间商是否给你载通了日志记录功能,如果没有开通,就需要我们自己到空间管理平台或者IDC(互联网数据中心)开通日志记录,一般是开通后隔天就可以下载了。如查空间商给我们开通了日志记录功能,那么我们可以到FTP上下载日志,一般都在logfiles/log这个文件夹中,和www根目录是同一级目录。
|