导航
首页 教程 派聪明
  • 首页
  • 教程
  • 派聪明
  • 登录
登录技术派畅享更多权益

用户名密码登录

其他登录:
绑定星球,畅享VIP服务

微信扫码/长按识别登录

扫码关注登录
有效期五分钟 👉 手动刷新

登录即同意 用户协议 和 隐私政策

绑定知识星球,畅享 VIP 尊享服务!

戳我了解如何获取星球编号,新窗口打开

添加二哥微信 qing_gee 加速审核

记得备注 星球编号
账号迁移
请输入您之前账号的用户名和密码
通过知识星球授权进行账号绑定和迁移
去绑定
开篇词
1
派聪明RAG项目是什么
更新时间: 2025年07月30日
星球
2
派聪明如何写简历?
更新时间: 2025年07月30日
星球
工程篇
3
获取源码和教程权限
更新时间: 2025年07月30日
星球
4
派聪明的前置环境安装
更新时间: 2025年07月30日
星球
5
ES 8.10安装教程
更新时间: 2025年07月31日
星球
6
向量 API 申请
更新时间: 2025年08月02日
星球
7
Ollama+DeepSeek本地部署
更新时间: 2025年09月24日
星球
8
DeepSeek API申请
更新时间: 2025年09月24日
星球
9
本地运行派聪明
更新时间: 2025年07月31日
星球
10
Docker部署派聪明
更新时间: 2025年09月24日
星球
大厂篇
11
派聪明需求分析
更新时间: 2025年07月31日
星球
12
派聪明整体设计方案
更新时间: 2025年09月24日
星球
13
用户管理模块设计方案
更新时间: 2025年09月24日
星球
14
文件上传解析设计方案
更新时间: 2025年09月24日
星球
15
知识库检索设计方案
更新时间: 2025年09月24日
星球
16
聊天助手设计方案
更新时间: 2025年09月24日
星球
17
派聪明库表设计
更新时间: 2025年09月24日
星球
18
接口文档
更新时间: 2025年09月24日
星球
面试篇
19
RAG面试题预测
更新时间: 2025年09月24日
星球
20
架构设计面试题预测
更新时间: 2025年09月24日
星球
21
用户管理面试题预测
更新时间: 2025年09月24日
星球
22
文件上传解析面试题预测
更新时间: 2025年09月24日
星球
23
知识库检索面试题预测
更新时间: 2025年09月26日
星球
24
聊天助手面试题预测
更新时间: 2025年09月27日
星球
25
27家真实面经参考
更新时间: 2025年09月27日
星球
进阶篇
26
prompt 设计
更新时间: 2025年09月24日
星球
27
ES混合检索精讲
更新时间: 2025年09月27日
星球
关注公众号
原创
✅派聪明 RAG 知识库检索面试题预测,覆盖 ElasticSearch 的 KNN 和 BM25

1.当一个用户在搜索框里输入一句话然后点击搜索,系统大致会经历一个怎样的处理流程?

首先,用户通过前端页面输入搜索内容并提交,前端会将查询语句、用户信息等参数封装成 HTTP 请求发送到后端。后端接收到请求后,会解析出查询关键词和用户身份。

在进入搜索逻辑前,系统首先会调用外部的 Embedding 模型将用户的自然语言查询转化为向量表示。这一步是实现语义相似度搜索的基础。同时,系统还会提取出用户对应的组织标签,用于后续的权限过滤。

随后,系统会构造出一个 Elasticsearch 混合查询。融合了三类能力:首先是基于查询向量的 KNN 语义检索,用于找出语义上最接近的文本块;其次是基于关键词的 BM25 检索,用于匹配关键词相似的文档;最后是权限过滤机制,确保返回的文档必须是公开的、或属于该用户本人,或其组织标签在用户的有效标签列表中。

为了提高结果的相关性和精度,我们还会使用 Elasticsearch 的 rescore 机制,根据 BM25 与向量匹配的得分对初步召回的结果进行重排序,找到最终排名靠前的文档,并打分后返回给前端。

  • 什么是 KNN?https://www.elastic.co/cn/what-is/knn
  • 什么是 BM25:https://www.elastic.co/cn/blog/practical-bm25-part-2-the-bm25-algorithm-and-its-variables

备注:

kNN 又称 k 最近邻算法,会使用临近度来将一个数据点与训练时所使用并已记住的一个数据集进行对比,从而做出预测。其中字母 k 表示在分类或回归问题中所考虑的最近邻的数量,NN 代表 k 所选数字的最近邻。

面试时可以这样回答:kNN 是 Elasticsearch 的一个向量相似度搜索功能。它允许我们搜索‘内容语义’而不仅仅是‘关键词’——比如用问题匹配知识库答案,本质是让搜索引擎具备‘联想’的能力。

想象传统图书馆用关键词查书(BM25),而 kNN 像一位懂内容的图书管家:

  1. 内容转密码(Embedding):管家会把每
已加入二哥编程星球,即刻绑定星球编号解锁🔐
该文档仅「二哥编程星球」的VIP用户可见

二哥编程星球的内容包括:

1. 实战项目: 派聪明RAG、校招派Agent、PmHub、技术派、MYDB 等

2. 面试指南: 40 万+字面试求职攻略+面渣逆袭

3. 专属问答: 向二哥 1v1 发起提问,内容不限于 offer 选择、学习路线、职业规划等

4. 简历修改: 提供简历修改服务,附赠星球 5000+优质简历模板可供参考


二哥的星球

》步骤①:微信扫描上方二维码,点击「加入知识星球」按钮

》步骤②:访问星球置顶帖球友必看: https://t.zsxq.com/11rEo9Pdu,获取项目的源码权限和教程地址

已加入星球,绑定星球编号
删除提醒

确定删除《✅派聪明 RAG 知识库检索面试题预测,覆盖 ElasticSearch 的 KNN 和 BM25》吗

1人已点赞

回复

目录

分享文章
分享二维码