✅派聪明RAG项目如何写到简历上？（附 20 道精选 AI 面试题）

重要提示，这部分内容有一些是我修改的球友简历，放上来是为了方便大家参考，请不要相互传播，引起误会，大家参考学习就好了，后期有遇到不错的内容我也会更新上来，互帮互助，才能更进一步。

Color1

如果有引发误会，我就只能保留前三个，其他都会删掉，望周知。
项目的写法有很多，往后面翻一翻。
教程和源码的获取方式：https://t.zsxq.com/XBc0a
派聪明的学习路线：https://paicoding.com/article/detail/2530200055836673

:::

项目名称：PaiSmart 2026年4月-2026年5月

项目介绍：基于 RAG 的企业级 AI 知识库，支持多租户文档智能检索与对话问答，提供从文档上传、切片向量化到语义检索、流式对话等。

技术栈：Spring Boot 3.4 / WebSocket / Elasticsearch 8 / Kafka / Redis / MinIO / MySQL / DeepSeek API / 阿里 Embedding

核心职责：

基于 WebSocket 实现全双工流式对话，后端通过 WebFlux 的 Stream 接入 DeepSeek 等 LLM 的 SSE 流，实现逐字输出；支持用户主动中断，后端同步取消 LLM 侧的流式连接，避免错误提示词下的 Token 消耗；整体首字响应延迟控制在 500ms 以内。
基于 LiteParse 命令行工具重构 PDF 解析流程，通过子进程调用实现本地 OCR，解决扫描件与图片型 PDF 在知识库中无法被检索的问题
设计可插拔 OCR 适配层，借助 LiteParse 的 ocr-server-url 机制将识别引擎在本地 Tesseract 与阿里云高精版 OCR 之间无缝切换
实现对话内容的持久化和断线续传，每个流式内容原子写入 Redis，并通过状态机维持状态；用户断线重连后自动恢复上一次输出进度，不丢失已生成文本，保障弱网环境下的用户体验。
利用 Elasticsearch + IK 分词器对知识库文档进行索引和向量检索，支持 Word、PDF 和 TXT 等多种文本类型；并集成阿里 Embedding 模型进行文本到向量的转换，支持 2048 维；再结合 ES 的 KNN 向量召回、关键词过滤和 BM25 重排序实现「关键词+语义」的双引擎搜索，同时内嵌多租户权限过滤，确保数据隔离。
基于 Spring WebSocket 实现全双工流式对话，后端通过 WebFlux 的 Reactive Stream 接入 DeepSeek 等 LLM 的 SSE 流，实现逐字输出；支持用户主动中断生成，后端同步取消 LLM 侧的流式连接，避免无效 Token 消耗；整体首字响应延迟控制在 500ms 以内。
前端使用 SparkMD5 计算文件指纹，然后开启 4 个 worker 并发上传分片；后端通过 Bitmap 追踪分片状态；合并阶段按 chunkIndex 升序组装后调用 MinIO 进行合并，保证分片不乱序。
利用 Kafka 进行异步文档处理，覆盖「文件解析 → 文本切片 → 向量化入库」全流程，并通过事务确保生产者侧消息不丢失不重复，消费端失败的消息经 4 次重试后自动路由至死信队列。
通过 Redis 维护 20 条消息的上下文窗口，供 LLM 调用时毫秒级加载；并将完整对话内容持久化到 MySQL。
实现可热插拔的多模型路由与 Token 配额管理，支持运行时切换 DeepSeek、通义千问等 LLM 和 Embedding 供应商，无需重启服务；并通过流式 usage 解析实现精确的 Token 消耗计量，结合每日请求数 + Token 余额双维度限流，控制调用成本。

写法1 派聪明 RAG 知识库 Java 后端开发 2025-06 ～ 2025-09

项目描述：派聪明是一个基于私有知识库的企业级智能对话平台，允许用户上传文档构建专属知识空间，并通过自然语言交互方式查询和获取知识。它结合了大语言模型和向量检索技术，能够让用户能够通过对话的形式与自己的知识库进行高效交互。

技术栈：SpringBoot、MySQL、Redis、Apache Tika、Ollama、Elasticsearch、MinIO、Kafka、Spring Security、WebSocket、Linux、Shell

核心职责：

编写 shell 脚本，一键启动 Kafka 的 KRaft模式，自动处理 cluster ID 的冲突问题，包括清理日志、生成集群 ID、格式化存储目录、启动 Kafka 服务器等。
利用 Elasticsearch 加 IK 分词器对知识库文档进行索引和向量检索，结合 KNN 向量召回与 BM25 关键词匹配，通过 RRF 融合排序实现语义加关键词的双引擎检索，经测试集评估检索命中率较纯关键词检索提升约25%。
引入 MCP 协议对本地文件操作、PDF 生成及数据库查询等能力进行 Server 端封装，实现了Agent 与工具生态的解耦。
参考 OpenManus 开源架构，设计了分层智能体体系（BaseAgent、ReActAgent、ToolCallAgent）。利用 SpringAI 的 FunctionCallback 机制实现本地方法的自主调用，以及 ReAct 推理，赋予 Agent“思考-规划-行动-观察”的自主决策能力，使其能够处理“检索/搜索-生成文本-生成总结PDF”等跨多步骤的复杂任务。
编写用户认证模块单元测试，结合 JUnit + Mockito 验证 Redis 引入前后的性能差异，为系统调优提供依据。
基于 Kafka 解耦文件上传、处理与向量化流程，实现分片上传与断点续传；使用 Redis 的 Bitmap 存储分片状态，并通过 MinIO 按照 MD5 进行分片合并。
能够在 Linux 服务器下通过 HTTPS 的方式启动 ElasticSearch，并设置 ES 的 JDK 加载版本为 17；可通过 CA 证书+ CURL 获取/更新 ElasticSearch 的键值对。
使用 Redis 的 BitMap 来存储文件分片上传状态，能最大程度节省内存，即使一个文件有 1000 个分片，也只需要 125 字节的存储空间。
支持 Docker 容器化部署，只需一个命令 docker-compose up -d 就可以在 1 分钟内一键启动整套系统。极大地简化了部署过程，并保证了开发、测试和生产环境的一致性。
利用 Elasticsearch + IK 分词器对知识库文档进行索引和向量检索，支持 Word、PDF 和 TXT 等多种文本类型；并集成阿里 Embedding 模型进行文本到向量的转换，支持 2048 维；再结合 ES 的 KNN 向量召回、关键词过滤和 BM25 重排序实现「关键词+语义」的双引擎搜索。
基于 WebSocket 实现前端和后端之间的长连接通信通道，并结合 DeepSeek 大模型的 Stream API 实现流式响应返回，只要后端有新的内容到达，前端就即时将文本逐步拼接显示，用户看到的就是一个“打字机”式的逐字生成过程。
使用 Redis 缓存文件元信息与上传分片，结合 MinIO 实现大文件分片上传与断点续传，优化后 1GB 文件上传耗时由 15s 降至 3s。 （本机是 macOS 顶配，128G 内存 Apple M3 Max 芯片）
构建 RAG 检索流程：通过用户提问 + 检索片段拼接生成增强型 Prompt，结合上下文与语义召回提升问答准确度，构建企业私有知识问答体系。
实现基于 Kafka 的文档处理异步流水线，解耦文件上传、解析和向量化过程，经测试，500M 文件上传仅需 200 毫秒。
利用 Spring Security+JWT 实现基于组织标签的 RBAC 的多级权限系统，通过用户角色、组织归属和文件属性的权限过滤，实现精细化的文档访问控制，确保敏感数据安全。
登录与鉴权模块采用 JWT 实现无状态认证，结合 ThreadLocal 管理用户上下文，配合拦截器实现 token 校验与自动续约，避免因 token 过期频繁导致的重新登录问题。
采用 JWT+Redis 的双令牌机制，通过 Access token 处理业务请求，Refresh token 实现用户无感的令牌刷新。
当用户搜索时，我们利用 Elasticsearch 的 KNN 算法计算查询向量和文档向量的余弦相似度，接着利用 ES 默认的 BM25 算法对关键词在文档中的出现频率、重要性进行打分，最后根据自定义公式综合计算出最后的置信分，方便用户判断检索结果的可靠性。
引入滑动窗口机制，在相邻 chunk 之间保持一定的重叠区域，以保证跨 chunk 的信息完整性。
采用基于 Redis 的对话历史管理机制，每个用户都有一个唯一的会话 ID，所有的对话内容都按照时间顺序存在 Redis 中，并设置了 7 天的过期时间，以便在多轮对话中保证上下文信息的完整性。
在调用豆包向量 API 失败时，我们会自动回退到纯文本搜索，实现服务降级；并在调用豆包向量 API 时，采用 Reactor 的重试机制，支持固定延迟重试 3 次，并设置了 30 秒的超时保护。
项目采用了 Mockito 注解驱动的测试模式，践行测试驱动开发（TDD）的理念，每个业务功能都有对应的测试用例，包括正常流程和异常流程。

项目名称：Agentic RAG 学术研究助手时间：2026.02 – 2026.04

技术栈：Spring Boot、LangChain4j、Elasticsearch、Redis、MinIO、Kafka、Java 21

项目描述：基于 ReAct 实现的 Agentic RAG 系统，将检索能力封装为工具接入 Agent Loop，支持多格式文档上传、混合检索与多轮对话，并通过多租户隔离保障数据安全。

核心职责：

• 将 RAG 模块封装为 Agent Tool，构建“向量 + BM25”双路检索能力，并通过 RRF 融合与 Rerank 模型重排结果；结合多种文档切块策略，减少无关内容干扰

• 设计三级上下文管理机制，基于滑动窗口控制上下文长度，对历史对话进行异步压缩，在保证对话连贯性的同时减少长上下文带来的信息丢失与 Token 消耗

• 使用 Kafka 解耦文档解析流程，将上传、解析、向量化拆分为异步任务，并通过 Outbox 模式保证数据一致性

• 设计多租户隔离方案，使用 TransmittableThreadLocal 在虚拟线程中传递用户身份信息，在数据写入与查询阶段附加用户标识，实现文档级权限控制

• 对不同格式文档解析流程进行拆分，使用策略模式与工厂模式组织解析逻辑，使系统可以方便扩展新的文档类型

Tiny-RAG

GitSeek

项目名：基于 RAG 的问答助手 2025.08-2025.11 后端开发

项目简介：面向企业内部文档检索与知识问答场景，搭建一套基于 RAG 的问答助手。系统支持大文件上传与异步解析向量化、混合检索召回与多轮对话。

技术栈：Spring Boot、MySQL、MyBatis、Redis、Kafka、Elasticsearch（向量检索）、MinIO、Ollama

核心职责：

基于 MinIO 搭建对象存储承载大文件上传，使用 Kafka 构建文档异步处理，把上传、解析、切块、向量化彻底解耦，同时将向量和关键词存入 Elasticsearch 供混合检索。
使用 Redis 持久化多轮对话历史，针对超长对话引入摘要记忆策略，触发大模型对早期上下文进行压缩总结，减少上下文长度带来的推理成本。
设计文档分块与索引方案，用文档层级树组织章/段/句结构，以句子作为最小向量单元，并实现动态粒度检索，减少语义链被硬切导致的召回断裂，使检索 F1 提升约 10%。
本地部署向量模型完成文本块向量化，落地关键词检索加向量检索的混合检索，采用 RRF 倒数排名融合策略计算 TopK。
构建 RAG 效果评测与模型对比机制，设计多层次文档匹配算法评估检索质量，针对 bge、qwen 等向量模型输出 Precision、Recall、F1、MRR 等指标，为优化提供量化依据。

智能 RAG 知识库管理系统（测试方向） 2025.06 - 至今

技术栈：Spring Boot、Spring Security、MySQL、Redis、Elasticsearch、Kafka、MinIO、Ollama

项目描述：构建智能化的知识库管理系统，支持文件存储、检索增强问答（RAG）、权限控制与智能文档处理。

主要工作：

参与整体后端架构设计，基于 Spring Boot + Spring Security 构建模块化分层架构，确保系统低耦合、高内聚。
设计 MySQL + Redis + MinIO + Elasticsearch 的多级存储体系，实现文件元数据、对象存储与向量数据的分离，结合用户标签权限模型，实现多租户知识库隔离。
集成 RAG 检索增强架构，利用 Embedding API 生成文档向量，结合 Elasticsearch 语义检索，较关键词搜索准确率提升 40%+；通过 Kafka 异步结构文档的解析、向量化和存储，从而提升系统的整体 QPS。
编写 JUnit + Mockito 单元测试，覆盖用户注册、认证、会话管理等功能与异常场景；对比验证 Redis 优化前后性能差异，为系统调优提供数据支撑。
项目采用了 Mockito 注解驱动的测试模式，践行测试驱动开发（TDD）的理念，每个业务功能都有对应的测试用例，包括正常流程和异常流程。
对文件分片上传、向量检索等关键环节进行压力测试和性能优化，检索响应时间从初始的 800ms 降低到 200ms，支持 TB 级文档存储和毫秒级检索。

运维方向

项目名称：RAG 智能报价系统 2025.03 - 至今运维工程师

技术栈：Spring Boot、Redis、MinIO、Elasticsearch、vLLM、Kubernetes、Prometheus、Grafana、Fluent Bit、NetworkPolicy、Helm

项目简介：为某传感器制造企业构建的智能报价系统，集成 RAG 架构与中文大模型，服务于内部销售人员与官网用户...

67人已点赞

65 条评论

聪明的小土豆 2026年06月15日 17:25

引用原文： executeInTransaction 方法

@派聪明 executeInTransaction 方法具体是怎么实现的？保证发送的可靠性的？

回复1 取消回复

派聪明 2026年06月15日 17:26

在 Spring Kafka 中，`executeInTransaction` 方法保证消息发送可靠性的核心机制是**事务**。具体实现和保证可靠性的原理如下： 1. **引入 Kafka事务支持**：底层依赖 Kafka Producer的事务特性。配置类需要开启 `spring.kafka.producer.transaction-id-prefix`，并且消费者的 `isolation.level` 设置为 `read_committed`，确保消费者只能读取到已成功提交的事务消息。 2. **本地数据库事务与 Kafka事务的协同（双写一致性）**：在项目（如派聪明）中，通常伴随着数据库操作。如果直接发送消息，极易出现“数据库回滚了但 Kafka消息已发出”的不一致情况。`executeInTransaction` 会开启一个 Kafka事务边界，配合 Spring 的 `@Transactional` 注解，将数据库操作和消息发送绑定。保证了**“要么数据库更新和消息发送同时成功，要么同时失败”**。 3. **底层执行流程**： ```javakafkaTemplate.executeInTransaction(kt -> { //1.执行数据库更新操作（如在DB中记录文件状态为“处理中”） //2. 发送消息到 Kafka kt.send(kafkaConfig.getFileProcessingTopic(), task); return true; }); ``` * **开启事务**：`KafkaTemplate`首先调用 `beginTransaction()`。 * **执行回调**：执行 Lambda 表达式内部的业务逻辑。只有当内部的数据库操作和 `kt.send()`均无异常时，才算成功。 * **提交与回滚**：如果正常返回，Spring 会自动调用 Kafka Producer 的 `commitTransaction()`，此时 Broker才会对消费者可见该消息；如果在执行过程中抛出**任何异常**（包括数据库操作失败），Spring 会自动调用 `abortTransaction()` 进行回滚，撤回尚未提交的消息。 4. **异常与重试机制**：当事务回滚后，结合系统设计的死信队列（Dead Letter Queue）策略，可以在后续针对失败的任务进行重试或兜底告警，从而保证文件处理任务的最终一致性和不丢失。

止 2026年06月08日 10:43

引用原文：使用 Redis 缓存文件元信息与上传分片，结合 MinIO 实现大文件分片上传与断点续传，优化后 1GB 文件上传耗时由 15s 降至 3s。

@派聪明这个上传耗时的时间计算的整体链路是什么，不包括解析吗

回复3 取消回复

派聪明 2026年06月08日 10:44

在基于 RAG 的知识库系统中，这条链路非常明确：**上传耗时是不包括后续的文档解析、切片和向量化的。** 整个业务流程采用了**异步解耦**的设计，具体的整体链路可以分为以下两个独立阶段： ### 第一阶段：大文件上传链路（即简历中的3s耗时）这个阶段的核心任务是**将文件完整、可靠地传输到服务器的对象存储中**，并记录元信息。它的链路如下： 1. **前端分片**：前端计算文件指纹（如 MD5），并将1GB的大文件切分为多个小块（分片），开启多线程并发上传。 2. **状态记录**：后端收到分片后，使用 **Redis BitMap** 高效记录各个分片的上传状态，MinIO负责存储这些分片内容。 3. **合并确认（终点）**：所有分片上传完毕后，触发合并接口，将零散分片在 MinIO 中组装成完整的1GB原始文件。 4. **快速响应**：合并成功后，后端立即给前端返回“上传成功”的响应。**这整个网络传输与合并的过程，就是简历中优化的3s耗时。** ### 第二阶段：文档异步处理链路（不包含在上传耗时内）上传接口返回后，系统通常会通过**消息队列（如 Kafka）**触发一个完全异步的后台任务来处理这个大文件。这部分耗时往往很久，如果在主线程做会导致接口超时。它的链路如下： 1. **事件触发**：文件合并成功后，向后端发送一个“文件就绪”的事件（或投入 MQ）。 2. **文档解析**：调用解析工具（如 Apache Tika、LiteParse）读取1GB 文件的内容，提取纯文本和 OCR 信息。 3. **文本切片**：按照一定策略（如滑动窗口）将长文本切分成多个语义块。 4. **向量化入库**：调用大模型（如阿里 Embedding）将文本块转化为向量数据，并存入 Elasticsearch等向量数据库中供后续检索。 **总结：** 简历中“15s降至3s”的指标，纯粹指代**“文件分片 -> 并发传输 -> 合并落盘”**的网传与 IO 过程。将耗时的“解析与向

展开剩余 2 条回复

受伤的指甲油 2026年06月07日 23:18

引用原文：RRF

是啥？@派聪明

派聪明 2026年06月07日 23:19

RRF 是 **Reciprocal Rank Fusion（倒数排名融合）** 的缩写。它是一种在 RAG（检索增强生成）知识库中常用的多路搜索结果融合算法。简单来说，它的核心思想是：**“一个文档越是在多个不同的检索排名列表里排在靠前的位置，它的最终综合得分就应该越高。”** 在传统的企业级搜索中，我们通常会同时使用**语义检索（KNN）**和**关键词检索（BM25）**。但它们返回的分数量纲不一致（例如 BM25 可能是几十上百，而向量相似度往往是0 到1之间的小数），不能简单地相加。RRF 就是为了解决这个问题而诞生的。 **它的计算原理非常简单：** 通过公式 `RRF_Score = Σ (1 / (k + rank_i))` 来计算。 - `rank_i` 是文档在某个检索结果中的排名（比如排第1 名就是1）。 - `k` 是一个常数（通常设为60），用于平滑排名靠后的文档对分数的影响。系统会计算出所有文档的综合得分，并按得分重新排序。 **RRF 的主要优势：** 1. **解决量纲不一致**：它完全屏蔽了原始得分大小的差异，只看重“排名先后”。 2. **提升召回准确率**：避免了简单“取交集”导致的相关文档漏掉的问题。它能很好地把语义相关的文档和包含特定关键词的文档结合起来。在实际开发中，现代搜索引擎（如 Elasticsearch8.x 版本之后）已经原生支持在一次查询中同时进行向量和关键词搜索，并直接指定使用 RRF算法进行自动融合排序，无需开发者手动编写代码计算。

ᶘ ᵒᴥᵒᶅ 2026年05月18日 17:00

引用原文：构建 RAG 效果评测与模型对比机制，设计多层次文档匹配算法评估检索质量，针对 bge、qwen 等向量模型输出 Precision、Recall、F1、MRR 等指标，为优化提供量化依据。

@牌聪明

沉喧 2026年04月24日 15:07

引用原文：集成 RAG 检索增强架构，利用 Embedding API 生成文档向量，结合 Elasticsearch 语义检索，较关键词搜索准确率提升 40%+；通过 Kafka 异步结构文档的解析、向量化和存储，从而提升系统的整体 QPS。

40%的准确率怎么实现的，具体流程是什么，使用了什么软件进行QPS测试

胖墩 2026年04月20日 20:11

引用原文：结合 MinIO 实现大文件分片上传与断点续传，将 1GB 文件上传耗时由 15s 优化至 3s

@派聪明这里的具体的数值是怎么计算得到的呢

怡然的鞋垫 2026年05月27日 14:36

吹N得到的

muximin 2026年04月07日 19:39

引用原文：文档数据库：存储未经再次切分的‘父文档’块，并为每个父文档生成一个唯一的ID。在‘子切片’存入向量库时，我会将它所属的‘父文档’ID 作为元数据（Metadata）一同存储。

@派聪明这里的“父文档”块是不是存储在文件分块信息表中的

过时的草莓 2026年04月01日 15:50

引用原文：融合通义千问 Embedding 模型实现 2048 维向量转换

什么意思@派聪明

派聪明 2026年04月01日 15:53

这句话的意思是：**通过集成阿里巴巴通义千问（Qwen）的Embedding模型，将文本数据转换为2048维度的数学向量表示**。具体解析如下： --- ### 1. **核心概念拆解** - **通义千问Embedding模型** 阿里巴巴开发的文本嵌入模型，能将文本（如句子、文档）转化为高维向量。这些向量在数学空间中捕捉语义关系，使相似文本的向量距离更近（例如"快乐"和"高兴"的向量相近）。 - **2048维向量转换** 模型输出的每个文本被表示为一个包含**2048个浮点数**的向量。这个维度是模型预定义的输出格式，决定了向量空间的复杂度和语义表示的精细程度。 --- ### 2. **技术实现逻辑** - **转换过程** 输入文本 → 通义千问Embedding模型 → 输出2048维向量。例如：用户查询"如何提升代码质量" → 模型生成一个长度为2048的向量数组。 - **应用场景** - **RAG系统**（如参考资料中多个项目）：将企业文档、知识库内容转换为2048维向量存储，用户提问时同样转换为向量，通过计算向量相似度（如余弦相似度）检索最相关的文档片段。 - **语义检索**：替代传统关键词搜索，实现更精准的语义匹配（如参考资料[5]提到医疗文献检索相关性提升34%）。 --- ### 3. **为什么选择2048维？** - **性能与精度的平衡**：参考资料[5][9]显示，通义千问Embedding模型在多语言任务（如MTEB评测）中超越OpenAI、谷歌同类模型，2048维是其优化后的标准配置，兼顾语义表达能力和计算效率。 - **任务适配性**：参考资料[8]提到，模型支持**自定义维度**，但2048维是针对企业级知识库、跨语言检索等场景的推荐配置，确保复杂语义的充分表示。 --- ### 4. **实际应用价值** - **提升检索准确率**：如参考资料[7]所述，高质量向量转换使RAG系统的检索准确率提升40%，尤其在专业领域（如医疗、代码分析）效果显著。 - **多语言支持**：参考资料[9]指出，该模型支持超100种语言，2048维向量能统一不同语言的语义空间，实现跨语言检索。 --- ### 总结这句话描述的是**利用通义千问Embedding模型将文本转化为2048维向量的技术过程**，核心目的是为语义检索、RAG系统等提供高精度的文本表示能力，从而提升AI应用的智能性和准确性。

洛兮 2026年04月01日 00:01

这里的优化具体指的是什么

✅派聪明RAG项目如何写到简历上？（附 20 道精选 AI 面试题）

项目名称：PaiSmart 2026年4月-2026年5月

写法1 派聪明 RAG 知识库 Java 后端开发 2025-06 ～ 2025-09

项目名称：Agentic RAG 学术研究助手时间：2026.02 – 2026.04

Tiny-RAG

GitSeek

项目名：基于 RAG 的问答助手 2025.08-2025.11 后端开发

智能 RAG 知识库管理系统（测试方向） 2025.06 - 至今

运维方向

热门评论

65 条评论

目录

划线评论

✅派聪明RAG项目如何写到简历上？（附 20 道精选 AI 面试题）

项目名称：PaiSmart 2026年4月-2026年5月

写法1 派聪明 RAG 知识库 Java 后端开发 2025-06 ～ 2025-09

项目名称：Agentic RAG 学术研究助手 时间：2026.02 – 2026.04

Tiny-RAG

GitSeek

项目名：基于 RAG 的问答助手 2025.08-2025.11 后端开发

智能 RAG 知识库管理系统（测试方向） 2025.06 - 至今

运维方向

热门评论

65 条评论

目录

划线评论

项目名称：Agentic RAG 学术研究助手时间：2026.02 – 2026.04