找回密码
 我要注 册
搜索
热搜: 活动 交友 discuz
查看: 765|回复: 0

爬行和抓取

[复制链接]

384

主题

0

回帖

111111万

积分

管理员

积分
1111110781
发表于 2024-6-4 22:57:36 | 显示全部楼层 |阅读模式
爬行和抓取 admin2022年04月08日 19:47:03搜索引擎工作原理380 爬行和抓取 是搜索引擎工作的第一步,完成数据收集任务。 1、蜘蛛: 搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。 2、跟踪链接: 为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就好像蜘蛛在蜘蛛网上爬行那样,这也是搜索引擎蜘蛛这个名称的由来。 3、吸引蜘蛛: 理论上蜘蛛能爬行和抓取所有页面,但实际上不能,也不会这么做。SEO人员想要让自己的更多页面被收录,就要想方设法吸引蜘蛛抓取。 4、地址库: 为了避免重复爬行和抓取网址,搜索引擎会建立一个地址库,记录已经被发现还没有抓取的页面,以及已经被抓取的页面。 5、文件储蓄: 搜索引擎蜘蛛抓取的数据存入原始页面数据库。其他的页面数据与用户浏览器得到的HTML是完全一样的。每个URL都是这样一个独特的文件编号。 来源:搜外网 扫描二维码推送至手机访问。 版权声明:本文由SEO自学网发布,如需转载请注明出处。 本文链接:http://www.seozixuewang.com/post/595.html 标签: 搜索引擎工作原理
您需要登录后才可以回帖 登录 | 我要注 册

本版积分规则

手机版|小黑屋|seo小学生

GMT+8, 2024-9-20 00:32 , Processed in 0.067538 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表