✅派聪明RAG项目如何写到简历上?(附 20 道精选 AI 面试题)
重要提示,这部分内容有一些是我修改的球友简历,放上来是为了方便大家参考,请不要相互传播,引起误会,大家参考学习就好了,后期有遇到不错的内容我也会更新上来,互帮互助,才能更进一步。
- 如果有引发误会,我就只能保留前三个,其他都会删掉,望周知。
- 项目的写法有很多,往后面翻一翻。
- 教程和源码的获取方式:https://t.zsxq.com/XBc0a
- 派聪明的学习路线:https://paicoding.com/article/detail/2530200055836673
:::
项目名称:PaiSmart 2026年4月-2026年5月
项目介绍:基于 RAG 的企业级 AI 知识库,支持多租户文档智能检索与对话问答,提供从文档上传、切片向量化到语义检索、流式对话等。
技术栈:Spring Boot 3.4 / WebSocket / Elasticsearch 8 / Kafka / Redis / MinIO / MySQL / DeepSeek API / 阿里 Embedding
核心职责:
基于 WebSocket 实现全双工流式对话,后端通过 WebFlux 的 Stream 接入 DeepSeek 等 LLM 的 SSE 流,实现逐字输出;支持用户主动中断,后端同步取消 LLM 侧的流式连接,避免错误提示词下的 Token 消耗;整体首字响应延迟控制在 500ms 以内。
实现对话内容的持久化和断线续传,每个流式内容原子写入 Redis,并通过状态机维持状态;用户断线重连后自动恢复上一次输出进度,不丢失已生成文本,保障弱网环境下的用户体验。
利用 Elasticsearch + IK 分词器对知识库文档进行索引和向量检索,支持 Word、PDF 和 TXT 等多种文本类型;并集成阿里 Embedding 模型进行文本到向量的转换,支持 2048 维;再结合 ES 的 KNN 向量召回、关键词过滤和 BM25 重排序实现「关键词+语义」的双引擎搜索,同时内嵌多租户权限过滤,确保数据隔离。
基于 Spring WebSocket 实现全双工流式对话,后端通过 WebFlux 的 Reactive Stream 接入 DeepSeek 等 LLM 的 SSE 流,实现逐字输出;支持用户主动中断生成,后端同步取消 LLM 侧的流式连接,避免无效 Token 消耗;整体首字响应延迟控制在 500ms 以内。
前端使用 SparkMD5 计算文件指纹,然后开启 4 个 worker 并发上传分片;后端通过 Bitmap 追踪分片状态;合并阶段按 chunkIndex 升序组装后调用 MinIO 进行合并,保证分片不乱序。
利用 Kafka 进行异步文档处理,覆盖「文件解析 → 文本切片 → 向量化入库」全流程,并通过事务确保生产者侧消息不丢失不重复,消费端失败的消息经 4 次重试后自动路由至死信队列。
通过 Redis 维护 20 条消息的上下文窗口,供 LLM 调用时毫秒级加载;并将完整对话内容持久化到 MySQL。
实现可热插拔的多模型路由与 Token 配额管理,支持运行时切换 DeepSeek、通义千问等 LLM 和 Embedding 供应商,无需重启服务;并通过流式 usage 解析实现精确的 Token 消耗计量,结合每日请求数 + Token 余额双维度限流,控制调用成本。
写法1 派聪明 RAG 知识库 Java 后端开发 2025-06 ~ 2025-09
项目描述:派聪明是一个基于私有知识库的企业级智能对话平台,允许用户上传文档构建专属知识空间,并通过自然语言交互方式查询和获取知识。它结合了大语言模型和向量检索技术,能够让用户能够通过对话的形式与自己的知识库进行高效交互。
技术栈:SpringBoot、MySQL、Redis、Apache Tika、Ollama、Elasticsearch、MinIO、Kafka、Spring Security、WebSocket、Linux、Shell
核心职责:
- 编写 shell 脚本,一键启动 Kafka 的 KRaft模式,自动处理 cluster ID 的冲突问题,包括清理日志、生成集群 ID、格式化存储目录、启动 Kafka 服务器等。
- 利用 Elasticsearch 加 IK 分词器对知识库文档进行索引和向量检索,结合 KNN 向量召回与 BM25 关键词匹配,通过 RRF 融合排序实现语义加关键词的双引擎检索,经测试集评估检索命中率较纯关键词检索提升约25%。
- 引入 MCP 协议对本地文件操作、PDF 生成及数据库查询等能力进行 Server 端封装,实现了Agent 与工具生态的解耦。
- 参考 OpenManus 开源架构,设计了分层智能体体系(BaseAgent、ReActAgent、ToolCallAgent)。利用 SpringAI 的 FunctionCallback 机制实现本地方法的自主调用,以及 ReAct 推理,赋予 Agent“思考-规划-行动-观察”的自主决策能力,使其能够处理“检索/搜索-生成文本-生成总结PDF”等跨多步骤的复杂任务。
- 编写用户认证模块单元测试,结合 JUnit + Mockito 验证 Redis 引入前后的性能差异,为系统调优提供依据。
- 基于 Kafka 解耦文件上传、处理与向量化流程,实现分片上传与断点续传;使用 Redis 的 Bitmap 存储分片状态,并通过 MinIO 按照 MD5 进行分片合并。
- 能够在 Linux 服务器下通过 HTTPS 的方式启动 ElasticSearch,并设置 ES 的 JDK 加载版本为 17;可通过 CA 证书+ CURL 获取/更新 ElasticSearch 的键值对。
- 使用 Redis 的 BitMap 来存储文件分片上传状态,能最大程度节省内存,即使一个文件有 1000 个分片,也只需要 125 字节的存储空间。
- 支持 Docker 容器化部署,只需一个命令
docker-compose up -d就可以在 1 分钟内一键启动整套系统。极大地简化了部署过程,并保证了开发、测试和生产环境的一致性。 - 利用 Elasticsearch + IK 分词器对知识库文档进行索引和向量检索,支持 Word、PDF 和 TXT 等多种文本类型;并集成阿里 Embedding 模型进行文本到向量的转换,支持 2048 维;再结合 ES 的 KNN 向量召回、关键词过滤和 BM25 重排序实现「关键词+语义」 的双引擎搜索。
- 基于 WebSocket 实现前端和后端之间的长连接通信通道,并结合 DeepSeek 大模型的 Stream API 实现流式响应返回,只要后端有新的内容到达,前端就即时将文本逐步拼接显示,用户看到的就是一个“打字机”式的逐字生成过程。
- 使用 Redis 缓存文件元信息与上传分片,结合 MinIO 实现大文件分片上传与断点续传,优化后 1GB 文件上传耗时由 15s 降至 3s。 (本机是 macOS 顶配,128G 内存 Apple M3 Max 芯片)
- 构建 RAG 检索流程:通过用户提问 + 检索片段拼接生成增强型 Prompt,结合上下文与语义召回提升问答准确度,构建企业私有知识问答体系。
- 实现基于 Kafka 的文档处理异步流水线,解耦文件上传、解析和向量化过程,经测试,500M 文件上传仅需 200 毫秒。
- 利用 Spring Security+JWT 实现基于组织标签的 RBAC 的多级权限系统,通过用户角色、组织归属和文件属性的权限过滤,实现精细化的文档访问控制,确保敏感数据安全。
- 登录与鉴权模块采用 JWT 实现无状态认证,结合 ThreadLocal 管理用户上下文,配合拦截器实现 token 校验与自动续约,避免因 token 过期频繁导致的重新登录问题。
- 采用 JWT+Redis 的双令牌机制,通过 Access token 处理业务请求,Refresh token 实现用户无感的令牌刷新。
- 当用户搜索时,我们利用 Elasticsearch 的 KNN 算法计算查询向量和文档向量的余弦相似度,接着利用 ES 默认的 BM25 算法对关键词在文档中的出现频率、重要性进行打分,最后根据自定义公式综合计算出最后的置信分,方便用户判断检索结果的可靠性。
- 引入滑动窗口机制,在相邻 chunk 之间保持一定的重叠区域,以保证跨 chunk 的信息完整性。
- 采用基于 Redis 的对话历史管理机制,每个用户都有一个唯一的会话 ID,所有的对话内容都按照时间顺序存在 Redis 中,并设置了 7 天的过期时间,以便在多轮对话中保证上下文信息的完整性。
- 在调用豆包向量 API 失败时,我们会自动回退到纯文本搜索,实现服务降级;并在调用豆包向量 API 时,采用 Reactor 的重试机制,支持固定延迟重试 3 次,并设置了 30 秒的超时保护。
- 项目采用了 Mockito 注解驱动的测试模式,践行测试驱动开发(TDD)的理念,每个业务功能都有对应的测试用例,包括正常流程和异常流程。
项目名称:Agentic RAG 学术研究助手 时间:2026.02 – 2026.04
技术栈:Spring Boot、LangChain4j、Elasticsearch、Redis、MinIO、Kafka、Java 21
项目描述:基于 ReAct 实现的 Agentic RAG 系统,将检索能力封装为工具接入 Agent Loop,支持多格式文档上传、混合检索与多轮对话,并通过多租户隔离保障数据安全。
核心职责:
• 将 RAG 模块封装为 Agent Tool,构建“向量 + BM25”双路检索能力,并通过 RRF 融合与 Rerank 模型重排结果;结合多种文档切块策略,减少无关内容干扰
• 设计三级上下文管理机制,基于滑动窗口控制上下文长度,对历史对话进行异步压缩,在保证对话连贯性的同时减少长上下文带来的信息丢失与 Token 消耗
• 使用 Kafka 解耦文档解析流程,将上传、解析、向量化拆分为异步任务,并通过 Outbox 模式保证数据一致性
• 设计多租户隔离方案,使用 TransmittableThreadLocal 在虚拟线程中传递用户身份信息,在数据写入与查询阶段附加用户标识,实现文档级权限控制
• 对不同格式文档解析流程进行拆分,使用策略模式与工厂模式组织解析逻辑,使系统可以方便扩展新的文档类型
Tiny-RAG



GitSeek

项目名:基于 RAG 的问答助手 2025.08-2025.11 后端开发
项目简介:面向企业内部文档检索与知识问答场景,搭建一套基于 RAG 的问答助手。系统支持大文件上传与异步解析向量化、混合检索召回与多轮对话。
技术栈:Spring Boot、MySQL、MyBatis、Redis、Kafka、Elasticsearch(向量检索)、MinIO、Ollama
核心职责:
- 基于 MinIO 搭建对象存储承载大文件上传,使用 Kafka 构建文档异步处理,把上传、解析、切块、向量化彻底解耦,同时将向量和关键词存入 Elasticsearch 供混合检索。
- 使用 Redis 持久化多轮对话历史,针对超长对话引入摘要记忆策略,触发大模型对早期上下文进行压缩总结,减少上下文长度带来的推理成本。
- 设计文档分块与索引方案,用文档层级树组织章/段/句结构,以句子作为最小向量单元,并实现动态粒度检索,减少语义链被硬切导致的召回断裂,使检索 F1 提升约 10%。
- 本地部署向量模型完成文本块向量化,落地关键词检索加向量检索的混合检索,采用 RRF 倒数排名融合策略计算 TopK。
- 构建 RAG 效果评测与模型对比机制,设计多层次文档匹配算法评估检索质量,针对 bge、qwen 等向量模型输出 Precision、Recall、F1、MRR 等指标,为优化提供量化依据。
智能 RAG 知识库管理系统(测试方向) 2025.06 - 至今
技术栈:Spring Boot、Spring Security、MySQL、Redis、Elasticsearch、Kafka、MinIO、Ollama
项目描述:构建智能化的知识库管理系统,支持文件存储、检索增强问答(RAG)、权限控制与智能文档处理。
主要工作:
- 参与整体后端架构设计,基于 Spring Boot + Spring Security 构建模块化分层架构,确保系统 低耦合、高内聚。
- 设计 MySQL + Redis + MinIO + Elasticsearch 的多级存储体系,实现文件元数据、对象存储与向量数据的分离,结合 用户标签权限模型,实现多租户知识库隔离。
- 集成 RAG 检索增强架构,利用 Embedding API 生成文档向量,结合 Elasticsearch 语义检索,较关键词搜索准确率提升 40%+;通过 Kafka 异步结构文档的解析、向量化和存储,从而提升系统的整体 QPS。
- 编写 JUnit + Mockito 单元测试,覆盖用户注册、认证、会话管理等功能与异常场景;对比验证 Redis 优化前后性能差异,为系统调优提供数据支撑。
- 项目采用了 Mockito 注解驱动的测试模式,践行测试驱动开发(TDD)的理念,每个业务功能都有对应的测试用例,包括正常流程和异常流程。
- 对文件分片上传、向量检索等关键环节进行压力测试和性能优化,检索响应时间从初始的 800ms 降低到 200ms,支持 TB 级文档存储和毫秒级检索。
运维方向
项目名称:RAG 智能报价系统 2025.03 - 至今 运维工程师
技术栈:Spring Boot、Redis、MinIO、Elasticsearch、vLLM、Kubernetes、Prometheus、Grafana、Fluent Bit、NetworkPolicy、Helm
项目简介:为某传感器制造企业构建的智能报价系统,集成 RAG 架构与中文大模型,服务于内部销售人员与官网用户,系统日均处理超 5000 次请求,基于 Kubernetes 私有平台部署,保障数据不出内网。
个人职责:
- 部署并维护 Spring Boot、Redis、MinIO、Elasticsearch 等核心服务,基于 Deployment + Service...
企业级Agent工作流编排项目PaiFlow
Vibe Coding版本的PaiAgent
派聪明RAG AI知识库Java版本+Go版本
微服务 PmHub、技术派、MYDB
求职派JobClaw(OpenClaw/Hermes架构
PaiCLI(类似Claude Code的Agent
派简历(代码已完成)
等实战项目。
1. 微信扫右侧的优惠券加入知识星球
2. 解锁星球的实战项目教程和源码: 项目源码+教程获取
热门评论
50 条评论
回复