【雁北笑】
  • 首页
  • 免费办公软件
  • 免费营销软件
  • 免费办公软件使用方法
  • 经验分享
    • 河北秦皇岛SEO
    • 河北秦皇岛SEM竞价
    • 电商运营
    • 自媒体新媒体营销
    • 网站搭建源码
  • 联系站长
Kratos
一款专注于用户阅读体验的响应式博客主题
  1. 首页
  2. 个人分享
  3. 正文

robots.txt的基础知识

2014年12月29日 420点热度 0人点赞 0条评论

什么是robots文件?
robots文件简单的来说就是给你的网站做一个权限清单,一般是针对做SEO优化的。在这个文件里面写上哪些文件、哪些形式的链接允许搜索引擎抓取,哪些不允许。

为什么要放这个文件?放哪里?
在你的网站还没有调整好的时候,不想让搜索引擎收录,可以通过这个文件屏蔽搜索引擎。就像QQ你隐身了别人就看不到你。

这个文件的名字就是robots.txt,是固定的,不管哪个网站要放这个都是这个名字。一般我们会把robots.txt放到FTP根目录下。

如何屏蔽搜索引擎?
robots.txt就是一个记事本,所以只要在里面写上如下内容就可以屏蔽。

User-agent: *
Disallow:/

WP网站如何写robots.txt?
最简单的这样写就行了。

User-agent: *
Disallow: /wp-*
#Allow: /wp-content/uploads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?s=

robots.txt的写法规则

User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录
Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录
Disallow: /ABC/ 这里定义是禁止爬寻ABC整个目录
Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
Disallow: /*?* 禁止访问网站中所有的动态页面
Disallow: /jpg$ 禁止抓取网页所有的.jpg格式的图片
Disallow:/ab/adc.html 禁止爬去ab文件夹下面的adc.html文件。
User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录
Allow: /tmp 这里定义是允许爬寻tmp的整个目录
Allow: .htm$ 仅允许访问以".htm"为后缀的URL。
Allow: .gif$ 允许抓取网页和gif格式图片robots.txt文件用法举例

作者:河北秦皇岛SEO



标签: 暂无
最后更新:2014年12月29日

Kratos

保持饥渴的专注,追求最佳的品质

点赞
< 上一篇
下一篇 >

文章评论

取消回复

雁北笑微信公众号:HBWX2015
秦皇岛微信SEO
友情链接
  • seo培训
  • 北京网站优化
  • 廊坊网站优化
  • 微信营销
  • 河北SEO
百度统计
换链神器
卢松松博客大全

COPYRIGHT © 2020 【雁北笑】. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS