- 注册时间
- 2012-10-19
- 最后登录
- 2016-12-15
- 阅读权限
- 1
- 积分
- 3575
- 精华
- 0
- 帖子
- 1401
TA的每日心情 | 奋斗 2014-6-1 22:10 |
---|
签到天数: 8 天 连续签到: 1 天 [LV.3]偶尔看看II
|
起点以前见到它们,只知道两者都是通配符,用来模糊匹配url。尽管写法不同,但是最后的意义都差不多,没有细究。直到最近起点重新温故了一下robots协议的写法,才注意到*和$的区别:
"$" 匹配行结束符;
"*" 匹配零或多个任意字符
这里,起点通过举例,详细说明一下。
假设存在协议语法:disallow:/abc*,只要是根目录下的文件或者目录,开头包含abc的,比如/abc.php、/abcder.html、/abcd等,搜索引擎都会禁止。
假设存在协议语法:disallow:.htm$,所有以 .htm结束的路径都会被禁止,但是.html以及.htm后面跟一长串的动态字符的路径,都不会被禁止。因为$是行结束符,结束以.htm为标志。有时候,如果我们只想百度收录目录页一个页面,目录页下所有页面和路径全部禁止,就可以使用“$”。例如:
disallow:/seo
allow:/seo$
效果:只允许收录seo这个目录,但seo目录里面的所有页面和路径不收录。
子曰:温故而知新。一直以来起点不甚明白的通配符区别,想不到就在自己眼前,起点还曾google、百度过,可惜一直没有找到满意的答案。有时候,一本SEO教材可能会因为它的浅显而忽视它,但是最细微的细节也在其中。书读百遍,其意自现,就是这个道理!
|
|