找回密码
 我要注 册
搜索
热搜: 活动 交友 discuz
查看: 767|回复: 0

搜狗搜索蜘蛛爬虫抓取

[复制链接]

384

主题

0

回帖

111111万

积分

管理员

积分
1111110781
发表于 2024-6-4 23:02:53 | 显示全部楼层 |阅读模式
搜狗搜索蜘蛛爬虫抓取 admin2022年05月09日 20:11:26Spider443 sogou spider User-Agent字段是什么? PC端UA为 Sogou web spider Sogou inst spider Sogou spider 无线端UA为 Sogou wap spider 请注意,根据标准,ua区分大小写。 搜狗spider的IP有哪些? 搜狗暂不对外提供搜狗spider IP列表,但您可以通过DNS反查IP的方式判断某只spider是否来自搜狗搜索引擎。根据不同平台有不同的验证方法。 linux平台: 命令为host ip,如下图。搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。 在windows平台或者IBM OS/2平台: 命令为nslookup ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。 mac os平台: 命令为dig ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。 sogou spider 如何反应我网站上页面的更新? sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。 搜狗spider的抓取频次是怎样的? sogou spider 对于同一个 IP 地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。 如果您认为 sogou spider 对于您的网站抓取过快,请与我们联系,并最好能提供访问日志中sogou spider 访问的部分,而不要直接将搜狗spider的ua封禁。 sogou spider 喜欢收录什么样的页面 内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。 链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。 如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。 来源:搜狗资源平台 扫描二维码推送至手机访问。 版权声明:本文由SEO自学网发布,如需转载请注明出处。 本文链接:http://www.seozixuewang.com/post/3975.html 标签: sogou spider
您需要登录后才可以回帖 登录 | 我要注 册

本版积分规则

手机版|小黑屋|seo小学生

GMT+8, 2024-9-20 06:01 , Processed in 0.074415 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表