找回密码
 我要注 册
搜索
热搜: 活动 交友 discuz
查看: 805|回复: 0

搜索引擎检索系统概述

[复制链接]

384

主题

0

回帖

111111万

积分

管理员

积分
1111110781
发表于 2024-6-4 23:03:30 | 显示全部楼层 |阅读模式
搜索引擎检索系统概述 admin2022年05月14日 19:16:24搜索引擎工作原理1344 前面简要介绍过了搜索引擎的索引系统,实际上在建立倒排索引的最后还需要有一个入库写库的过程,而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部,并且对数据进行压缩,这涉及到的过于技术化在此就不多提了。今天简要给大家介绍一下索引之后的检索系统。 检索系统主要包含了五个部分,如下图所示: 索引&检索.jpg (1)Query串切词分词即将用户的查询词进行分词,对之后的查询做准备,以“10号线地铁故障”为例,可能的分词如下(同义词问题暂时略过): 10 0x123abc 号 0x13445d 线 0x234d 地铁 0x145cf 故障 0x354df (2)查出含每个term的文档集合,即找出待选集合,如下: 0x123abc 1 2 3 4 7 9….. 0x13445d 2 5 8 9 10 11…… …… …… (3)求交,上述求交,文档2和文档9可能是我们需要找的,整个求交过程实际上关系着整个系统的性能,这里面包含了使用缓存等等手段进行性能优化; (4)各种过滤,举例可能包含过滤掉死链、重复数据、色情、垃圾结果以及你懂的; (5)最终排序,将最能满足用户需求的结果排序在最前,可能包括的有用信息如:网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等,之后会详细给大家介绍。 如果大家对搜索引擎检索还有别的疑问,大家可以到[学堂同学汇][学习讨论]《搜索引擎检索系统概述》讨论帖中发表自己的看法,我们的工作人员会关注这里并与大家进行探讨。 来源:百度搜索资源平台 百度搜索学堂 扫描二维码推送至手机访问。 版权声明:本文由SEO自学网发布,如需转载请注明出处。 本文链接:http://www.seozixuewang.com/post/4508.html 标签: 搜索引擎工作原理
您需要登录后才可以回帖 登录 | 我要注 册

本版积分规则

手机版|小黑屋|seo小学生

GMT+8, 2024-9-20 05:56 , Processed in 0.059779 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表