美团大模型应用开发面经，主要是RAG这块 - 技术派 - Java技术社区 | RAG+Agent实战项目教程+AI助手

开篇词

派聪明RAG项目是什么

更新时间: 2025年07月30日

派聪明如何写简历？

更新时间: 2025年07月30日

工程篇

获取源码和教程权限

更新时间: 2025年07月30日

派聪明的前置环境安装

更新时间: 2025年07月30日

ES 8.10安装教程

更新时间: 2025年07月31日

向量 API 申请

更新时间: 2025年08月02日

Ollama+DeepSeek本地部署

更新时间: 2025年09月24日

DeepSeek API申请

更新时间: 2025年09月24日

本地运行派聪明

更新时间: 2025年07月31日

Docker部署派聪明

更新时间: 2025年09月24日

大厂篇

派聪明需求分析

更新时间: 2025年07月31日

派聪明整体设计方案

更新时间: 2025年09月24日

用户管理模块设计方案

更新时间: 2025年09月24日

文件上传解析设计方案

更新时间: 2025年09月24日

知识库检索设计方案

更新时间: 2025年09月24日

聊天助手设计方案

更新时间: 2025年09月24日

派聪明库表设计

更新时间: 2025年09月24日

更新时间: 2025年09月24日

面试篇

RAG面试题预测

更新时间: 2025年09月24日

架构设计面试题预测

更新时间: 2025年09月24日

用户管理面试题预测

更新时间: 2025年09月24日

文件上传解析面试题预测

更新时间: 2025年09月24日

知识库检索面试题预测

更新时间: 2025年09月26日

聊天助手面试题预测

更新时间: 2025年09月27日

27家真实面经参考

更新时间: 2025年09月27日

进阶篇

更新时间: 2025年09月24日

ES混合检索精讲

更新时间: 2025年09月27日

Spring Security和RBAC

更新时间: 2025年09月27日

Go版本

Docker部署Go版派聪明

更新时间: 2025年10月25日

Go版本简历写法

更新时间: 2025年10月29日

补充篇

派聪明的学习路线

更新时间: 2025年10月29日

更新时间: 2026年02月03日

腾讯QQ RAG面试题

更新时间: 2026年04月10日

阿里飞猪一面

更新时间: 2026年04月14日

派聪明2026年4月20日面试题预测

更新时间: 2026年04月20日

美团RAG面试8连问

更新时间: 2026年04月21日

关注公众号

原创

美团大模型应用开发面经，主要是RAG这块

继续给大家分享美团大模型应用开发的面经，及详细答案，系好安全带，我们粗粗粗发～～

content

01、Embedding 向量检索的原理是什么？如何保证检索准确性？

“先说说你们项目里 Embedding 向量检索是怎么做的？”老王扶了扶快从鼻梁上掉下来的眼镜，开始拷打我派聪明 RAG 项目了。

我说：“我们用的是阿里的 text-embedding-v4 模型，把文本转成 2048 维的向量，存到 Elasticsearch 里。检索的时候，用户的问题也会先过一遍 Embedding 模型，变成同维度的向量，然后用 ES 的 KNN 做近邻搜索。”

向量检索的原理是什么？

Embedding 模型干的事情，就是把一段文字映射到一个高维空间的点上。语义相近的文本，在这个空间里距离就近。比如“Java 的垃圾回收机制”和“JVM GC 原理”，虽然字面完全不一样，但 Embedding 之后的向量距离会非常近。

检索的时候就是在这个高维空间里找“最近的邻居”——K-Nearest Neighbors，简称 KNN。ES 8.x 原生就支持这个能力，不需要装额外的插件。

“那光靠向量检索能保证准确吗？”老王追问。

我说：“光靠向量检索肯定不够，所以我们做了混合检索。”

在 HybridSearchService 里，我们设计了一个两阶段检索策略：

第一阶段：KNN 向量召回 + 关键词必中。 先用 KNN 做大范围召回，召回窗口是 topK 的 30 倍。同时加一个 must match 条件，要求文档必须包含用户查询的关键词。这一步是“宁可多召，不能漏掉”。

// ...

真诚点赞诚不我欺