打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
蜘蛛
    搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。
    搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取速度,都使用多个蜘蛛并发分布爬行。
    蜘蛛访问任何一个网站时,都会先访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。
    和浏览器一样,搜索引擎蜘蛛也有标明自己身份的代理名称,站长可以在日志文件中看到搜索引擎的特定代理名称,从而辩识搜索引擎蜘蛛。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
robots协议是什么意思?robots.txt文件的作用是什么?
如何创建robots.txt文件?
搜索引擎原理-网络蜘蛛和ROBOTS
中文搜索引擎技术揭密:网络蜘蛛
SEO优化之网站收录:利用robots.txt 禁止不想被收
如何使用robots.txt及其详解
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服