ddc
联网
平面设计 画册 VI欣赏 包装 CG-插画 搜索 个人网页 Alexa排名 CSS 建站资源 下载专区 JS特效 品牌服装 服装院校 专题欣赏 SEO 图标欣赏 专题
网站建设 域名注册 网站建设 虚拟主机 广州网站设计 域名注册 广州网站建设 上海网站建设 虚拟主机 广州网页设计 虚拟主机 域名注册 acg王国 ACG玩家 品牌设计 上海网站建设
求创科技
网站建设
中国互联
素材出售
中国设计秀
中资源
当前位置:网站综合首页 >> 建站资源 >> SEO搜索引擎优化 >> 搜索引擎中robots.txt的好处与坏处

搜索引擎中robots.txt的好处与坏处

来源:中国设计秀    作者:163    点击:185     加入收藏    发表评论
0
顶一下

Robots.txt 带来的好处:

1. 几乎所有的搜索引擎 Spider 都遵循 robots.txt 给出的爬行规则,协议规定搜索引擎 Spider 进

入某个网站的入口即是该网站的 robots.txt,当然,前提是该网站存在此文件。对于没有配置robots.txt 的网站,Spider 将会被重定向至 404 错误页面,相关研究表明,如果网站采用了自定义的 404 错误页面,那么 Spider 将会把其视作 robots.txt虽然其并非一个纯粹的文本文件这将给 Spider 索引网站带来很大的困扰,影响搜索引擎对网站页面的收录。

2. robots.txt 可以制止不必要的搜索引擎占用服务器的宝贵带宽,如 email retrievers,这类搜索

引擎对大多数网站是没有意义的;再如 image strippers,对于大多数非图形类网站来说其也没有太大意义,但却耗用大量带宽。

3. robots.txt 可以制止搜索引擎对非公开页面的爬行与索引,如网站的后台程序、管理程序,事实上,对于某些在运行中产生临时页面的网站来说,如果未配置 robots.txt,搜索引擎甚至会索引那些临时文件。

4. 对于内容丰富、存在很多页面的网站来说,配置 robots.txt 的意义更为重大,因为很多时候

其会遭遇到搜索引擎 Spider 给予网站的巨大压力:洪水般的 Spider 访问,如果不加控制,甚至会影响网站的正常访问。

5. 同样地,如果网站内存在重复内容,使用 robots.txt 限制部分页面不被搜索引擎索引和收录,可以避免网站受到搜索引擎关于 duplicate content 的惩罚,保证网站的排名不受影响。

robots.txt 带来的风险及解决:

1. 凡事有利必有弊,robots.txt 同时也带来了一定的风险:其也给攻击者指明了网站的目录结构和私密数据所在的位置。虽然在 Web 服务器的安全措施配置得当的前提下这不是一个严重的问题,但毕竟降低了那些不怀好意者的攻击难度。

比如说,如果你有个网站如www.ppzxdy.cn中的私密数据通过dz目录下的index.html 访问,那么,在 robots.txt 的设置可能如下:

User-agent: *

Disallow: /dz/

这样,攻击者只需看一下 robots.txt 即可知你要隐藏的内容在哪里,在浏览器中输入

http://www.ppzxdy.cn/dz 便可访问我们不欲公开的内容。对这种情况,一般采取如下的办法:

设置访问权限,对/private/中的内容实施密码保护,这样,攻击者便无从进入。

另一种办法是将缺省的目录主文件 http://www.pipiflash.com/index.html 更名为其他,比如说 abc-protect.html,同时,制作一个新的index.html 文件,内容大致为%26quot;你没有权限访问此页%26quot;之类,这样,攻击者因不知实际的文件名而无法访问私密内容。

2. 如果设置不对,将导致搜索引擎将索引的数据全部删除。

User-agent: *

Disallow: /

上述代码将禁止所有的搜索引擎索引数据。

2008-07-24 13:47:24    出处:中国设计秀cnwebshow.com
Google
网站地图 | 关于我们 | 联系我们 | 网站建设 | 广告服务 | 版权声明 | 免责声明 | 网站公告 | 友情链接 | 留言 | 旧版入口