首  页  |  酷站  |  精品网站  |  原创作品秀  |  网络学院   |  信息中心  |  艺术设计  |  求职招聘  |  建站资源  |  服装网站  |  论坛  |  设计部落  |  网站综合
个人网页  商业网站  业界动态  设计赛事  网站资源  下载专区  设计欣赏  CG-插画  JS特效  娱乐  国际品牌  知名品牌  服装院校  专题欣赏  SEO  BANNER
域名注册 虚拟主机 广州网站建设 广州网页设计 IDC赞助 设计资源下载 虚拟主机 域名注册 品牌网站建设 服装品牌网站建设 广告服务 网站推广 娱乐
当前位置:首 页 >> JS特效 >> 浏览器窗口 >> 如何防止robot骚扰你的网页

如何防止robot骚扰你的网页


中资源
转载请注明出处-中国设计秀-cnwebshow.com

今早在www.aspalliance.com上看到一篇文章(stopping automated web robots visiting asp/asp.net websites

,http://aspalliance.com/1018_stopping_automated_web_robots_visiting_aspaspnet_websites),

主要是讲了下如何采取一些措施,防止robot过度去抓你的网站。看了一下,有的东西还是值得探讨下的,现归纳如下:

1、辨认robot的一些参考标准

    large numbers of requests from a single ip address or a range of ip addresses within the same subnet (i.e. the first three numbers of the ip address are identical).

·         large numbers of requests for database driven content compared to the rest of the website.

·         many requests made from browsers that do not support asp sessions.

·         lots of and increasing numbers of website visitors, but no corresponding increase in transactions (e.g. sales!).

·         large numbers of spam or automated requests being generated from online forms.

2、到http://www.robotstxt.org/wc/norobots.html上,可以找到一个组织提出的防御robot的建议标准(可惜这个不是什么权威标准拉,没什么约束力),在这里有一些平常我们可以用到的例子和方法,主要是搞一个robot.txt文件,放在网站根目录下,比如

useragent: *

disallow: /

禁止所有robot

允许所有的robot访问:

useragent: *

disallow:

useragent: *

disallow: /cyberworld/map/      不允许robot探访/cyberworld/map目录下的文件

useragent: cybermapper    允许cybermapper这个robot

disallow:

useragent: *

disallow: /cyberworld/map/

disallow: /tmp/

disallow: /foo.html       不允许访问foo.html这个文件了

3、如果不方便设置robot.txt的话,还可以在meta里做手脚,比如用

<meta name="robots" content="noindex, nofollow">

可以单独对某页设置防御robot

4 减慢robot的疯狂访问。如果发现robot疯狂对你的站访问,而造成效率的降低的话,可以减低

robot的访问,

useragent: slurp

crawldelay: 10

是针对yahoo的,具体可以到http://help.yahoo.com/help/us/ysearch/slurp/slurp03.html

去看详细情况。

   但其实有的robot很智能的,有时不会那么蠢真的一拥而上地去访问。

5、如果发现不单是robot,是有恶意的攻击某页的话,文章中说可以找

http://www.peterblum.com/vam/visetools.aspx#sdm.

这个工具试试

   当然,之前好象cnblogs也受到robot的困扰,因此欢迎各位多发表意见,提下自己的一些

办法。

http://www.cnblogs.com/jackyrong/archive/2006/09/26/514917.html
转载请注明出处-中国设计秀-cnwebshow.com



投稿 】【对本文进行评论】 【字体: 】【发布于2007-09-04 10:21】

相关专题:暂无相关专题

上一篇:弹出网页窗口全攻略(html/hta)   下一篇:网页自动转向代码
 认证LOGO下载
     
Copyright © 2005-2007 中国设计秀_网页设计教程_优秀网页设计欣赏_平面设计欣赏 All Right Reserved.
做最专业的设计服务网站,秀出自我,秀出精彩!中国设计秀,秀---无处不在!!
QQ:54292427  8208442 MSN:kingvisual#hotmail.com 交流群:9107036 3848215 8850631
粤ICP备05067046号 RSS