什么是robots协议？网站robots.txt文件的作用

　　当我们制作网站时，一个完整的网站应该有301个重定向、404个页面和robots.txt文件，这些都是制作网站所必需的。有经验的网站管理员知道301重定向是为了集中，404重定向是为了在网站有死链时引导蜘蛛和增加用户体验。

　　那么网站robots.txt文件的功能是什么，如何编写网站robots.txt

　　robots.txt协议(也称为爬虫协议、爬虫规则、机器人协议等。)

　　robots.txt文件是存储在网站根目录下的TXT文本文档。这是网站和蜘蛛之间的协议。

　　该网站告诉搜索引擎哪些页面可以被抓取，哪些页面不想通过机器人协议被抓取。推荐注意事项(深圳搜索引擎优化培训)

　　robots.txt的角色是什么？

　　如果你的网站根目录中有一个像robots.txt这样的文件，蜘蛛在抓取你的网站时会首先访问这个文件(robots文件通常存储在根目录中，蜘蛛首先访问这个文件，所以这个文件非常重要)。

　　机器人文件用于告诉搜索引擎蜘蛛网站的哪些文件夹可以被检索，哪些文件夹不能被检索，从而确保我们网站的隐私内容不会被包括在内。

　　机器人网站的内容如下:

　　*替换0或任意数量的字符

　　$ End符号，描绘以xxx结尾的文件

　　？动态页面的特别推荐阅读(什么是网站地图)

　　以下是机器人的书写格式:

　　每行的第一个字母大写。

　　必须用英语输入法来写

　　(注意)在继续写入之前，用户代理“不允许”、“允许”后面跟有英文冒号加空大小写。

　　每个主要搜索引擎蜘蛛的名字写如下:

　　1.百度蜘蛛

　　拜德斯皮德的名字是拜德斯皮德。百度蜘蛛日志中也有百度蜘蛛-手机、百度蜘蛛-图像、百度蜘蛛-视频和百度蜘蛛-新闻。百度蜘蛛和百度蜘蛛图片是百度蜘蛛的两种。

　　2.谷歌蜘蛛:谷歌机器人，谷歌机器人移动，它的名字是抓取wap内容

　　3.蜘蛛，这家伙很勤奋

　　4.索索斯派德:索索斯派德，比360更勤奋

　　5.雅虎蜘蛛:雅虎！诋毁中国

　　6.有一只蜘蛛:你的机器人

　　7.搜狗蜘蛛:搜狗新闻蜘蛛

　　搜狗蜘蛛还包括以下几种:搜狗蜘蛛、搜狗inst蜘蛛、搜狗搜狗蜘蛛2

　　博客、搜狗新闻蜘蛛、搜狗蜘蛛等。

　　8.MSN Spider: msnbot，MSN bot-媒体

　　9.冰蜘蛛:冰机器人