开篇词

派聪明RAG项目是什么

更新时间: 2025年07月30日

派聪明的学习路线

更新时间: 2025年10月29日

派聪明如何写简历？

更新时间: 2025年07月30日

工程篇

获取源码和教程权限

更新时间: 2025年07月30日

派聪明的前置环境安装

更新时间: 2025年07月30日

ES 8.10安装教程

更新时间: 2025年07月31日

向量 API 申请

更新时间: 2025年08月02日

Ollama+DeepSeek本地部署

更新时间: 2025年09月24日

DeepSeek API申请

更新时间: 2025年09月24日

本地运行派聪明

更新时间: 2025年07月31日

Docker部署派聪明

更新时间: 2025年09月24日

大厂篇

派聪明需求分析

更新时间: 2025年07月31日

派聪明整体设计方案

更新时间: 2025年09月24日

用户管理模块设计方案

更新时间: 2025年09月24日

文件上传解析设计方案

更新时间: 2025年09月24日

知识库检索设计方案

更新时间: 2025年09月24日

聊天助手设计方案

更新时间: 2025年09月24日

派聪明库表设计

更新时间: 2025年09月24日

更新时间: 2025年09月24日

面试篇

RAG面试题预测

更新时间: 2025年09月24日

架构设计面试题预测

更新时间: 2025年09月24日

用户管理面试题预测

更新时间: 2025年09月24日

文件上传解析面试题预测

更新时间: 2025年09月24日

知识库检索面试题预测

更新时间: 2025年09月26日

聊天助手面试题预测

更新时间: 2025年09月27日

27家真实面经参考

更新时间: 2025年09月27日

腾讯QQ RAG面试题

更新时间: 2026年04月10日

阿里飞猪一面

更新时间: 2026年04月14日

美团RAG面试8连问

更新时间: 2026年04月21日

更新时间: 2026年04月23日

进阶篇

更新时间: 2025年09月24日

ES混合检索精讲

更新时间: 2025年09月27日

Spring Security和RBAC

更新时间: 2025年09月27日

加上ReAct+tool use

更新时间: 2026年05月06日

Go版本

Docker部署Go版派聪明

更新时间: 2025年10月25日

Go版本简历写法

更新时间: 2025年10月29日

补充篇

更新时间: 2026年02月03日

派聪明2026年4月20日面试题预测

更新时间: 2026年04月20日

Embedding 和 Rerank

更新时间: 2026年05月14日

关注公众号

原创

老板下了死命令：限你一天，把RAG升级成Agent，我反抗后无效，只能掏出Claude Code+DeepSeek猛猛干

给派聪明RAG加上 ReAct+tool use，代码已经提交到gitcode，球友们可以直接用了。

01、派聪明 RAG 是什么？

派聪明是一个 RAG 知识库，Spring Boot 3.4 + Elasticsearch 8.10 + DeepSeek API。核心流程就四步：用户提问 → 混合检索 → 拼装上下文 → 大模型生成回答。

整个问答入口在 ChatHandler.java，关键方法是 processMessage：

public void processMessage(String userId, String userMessage,
                           WebSocketSession session) {
    // 1. 拿到对话历史
    List> history = getConversationHistory(userId);

    // 2. 混合检索：向量相似度 + BM25 关键词
    List results = hybridSearchService
        .searchWithPermission(userMessage, userId, 5);

    // 3. 把检索结果拼成上下文
    String context = buildContext(results);

    // 4. 调 DeepSeek 生成回答，流式返回
    deepSeekClient.streamResponse(userId, userMessage, context,
        history, chunk -> sendToWebSocket(session, chunk));
}

检索用的是 HybridSearchService，策略是先用 KNN 向量搜索拉 30 倍候选集，再用 BM25 重打分，最后做权限过滤：

public List searchWithPermission(String query,
                                                String userId, int topK) {
    // KNN 向量搜索（30x 候选窗口）+ BM25 重打分
    SearchResponse response = elasticClient.search(s -> s
        .index("knowledge_chunks")
        .knn(k -> k.field("embedding").queryVector(embedQuery(query))
            .numCandidates(topK * 30).k(topK * 5))
        .query(q -> q.bool(b -> b
            .should(textMatch(query))
            .filter(permissionFilter(userId))
        ))...

二哥编程星球目前包含：
企业级Agent工作流编排项目PaiFlow
Vibe Coding版本的PaiAgent
派聪明RAG AI知识库Java版本+Go版本
微服务 PmHub、技术派、MYDB
求职派JobClaw（OpenClaw/Hermes架构
PaiCLI（类似Claude Code的Agent
派简历（代码已完成）
等实战项目。

1. 微信扫右侧的优惠券加入知识星球

2. 解锁星球的实战项目教程和源码：项目源码+教程获取

17人已点赞