WordPress网站如何设置robots.txt

Robots协议（也称为爬虫协议、机器人协议等）的全称是“网络爬虫排除标准”（Robots Exclusion Protocol），网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。

robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt文件通常存放在网站根目录，想要搜索引擎搜索想要展示的页面，正确编写robots.txt文件很重要。

robots.txt文件的开头为User-agent:，用来指定搜索引擎蜘蛛。

User-agent:Baiduspider //针对百度搜索蜘蛛

User-agent:googlebot //针对谷歌搜索蜘蛛

User-agent: * /feed

Sitemap: http://domain/sitemap.xml

注意事项：

在线robots生成工具：http://tool.chinaz.com/robots/

robots.txt做好后，将此文件上传至服务器根目录。使用FileZilla工具连接服务器，将robots.txt文件上传至网站的根目录下。

浏览器地址栏直接输入http://domain/robots.txt，如果能正常访问并能看到自己刚配置的规则，表示robots.txt已生效。

课后答案张九龄《望月怀远》阅读答案及全诗翻译赏析