杠精派
派聪明
0/512

热门评论

阿琳 2026年01月26日 15:28
引用原文:流式对话支持多轮吗?怎么实现的?
@派聪明
点赞
回复7 取消回复
派聪明 2026年01月26日 15:29
是的,流式对话支持多轮对话。实现方式如下: 1. 对话历史管理:使用Redis存储用户对话历史,最多保留最近20条对话。超过20条会自动裁剪,防止上下文爆炸。 2. 上下文拼接:每次提问时,会将用户历史对话和当前问题一起拼接到prompt中发送给大模型。 3. 流式返回:通过WebFlux的SSE(Server-Sent Events)技术实现流式返回,前端实时渲染内容。 4. 长度控制:对历史对话进行压缩处理,确保上下文长度在模型可接受范围内,同时保持关键语义信息。 这种设计既支持多轮连续对话,又控制了上下文长度,保证了系统性能和响应效率。
1
回复 取消回复
展开剩余 6 条回复

299 条评论

草莓熊 2026年06月16日 09:57
引用原文:了解过 agent 和 mcp 吗?
@派聪明
点赞
回复1 取消回复
派聪明 2026年06月16日 09:58
在AI知识库(RAG)项目中,虽然当前的核心流程是基于固定的检索增强生成,但了解 **Agent(智能体)** 和 **MCP(模型上下文协议)** 对于系统的后续架构升级至关重要。 **1. Agent(智能体)** Agent 是以大模型为“大脑”的自主实体。目前的RAG是单向流程(用户提问 ->检索 -> 回答),而 Agent 能根据用户意图,自主进行逻辑推理、任务拆解,并主动调用外部工具(如联网搜索、执行代码、操作数据库)。 *项目应用设想*:如果将知识库检索包装成一个“工具”交给 Agent,Agent 就能自主判断什么时候该查私有文档,什么时候该调用计算器,从而实现从“单一问答”向“复杂任务自动化处理”的跨越。 **2. MCP (Model Context Protocol)** MCP 是由 Anthropic提出的一项开放标准协议,它的作用类似于 AI 应用的“USB-C接口”。 大模型要连接各种外部系统和数据源,传统做法是为每一个 API 单独编写适配代码。MCP统一了模型与外部工具/数据源之间的连接规范。只要你的服务实现了 MCP协议(作为 MCP Server),任何支持 MCP 的客户端(如 Claude Desktop 或其他 AI IDE)都能即插即用地调用你的知识库,极大地降低了多系统、多组件之间的集成成本。
点赞
回复 取消回复
机灵的缘分 2026年05月26日 12:29
引用原文:考虑一下整体的业务流程怎么实现,用什么数据结构去存储用户与角色、权限之间的关系?用什么数据结构去跟前端交互呢?
@派聪明
点赞
回复 取消回复
 2026年05月09日 15:19
引用原文:可以通过 Spring 注入的方式给静态变量赋值吗
@派聪明
点赞
回复 取消回复
望江渡 2026年05月04日 08:50
引用原文:意图识别有没有兜底策略
@派聪明 现在的意识识别策略在哪一部分
点赞
回复 取消回复
山北雨夜漫步 2026年05月01日 18:37
引用原文:这个过程如果要配置一些预警,你觉得应该配置哪几个重点的指标;
@派聪明
点赞
回复 取消回复
山北雨夜漫步 2026年05月01日 14:22
引用原文:派聪明 IK 分词器为什么用这个,为什么不用 xxx(没听过)
@派聪明 为什么
点赞
回复 取消回复
虚拟的吐司 2026年04月23日 20:35
引用原文:就算使用 system 角色,返回的格式也不能保证 100%符合要求,怎么解决?
@杠精派
点赞
回复 取消回复
潇潇 2026年04月23日 11:04
引用原文:用户提交问题后的流程
@派聪明
点赞
回复 取消回复
才得相思 2026年04月16日 18:03
引用原文:你这个企业级智能问答系统,这个是企业级的应用还是研究生做的导师的项目呢,项目的初始学习来源在哪?
@派聪明 这个问题怎么回答
点赞
回复 取消回复
沉喧 2026年04月13日 19:30
引用原文:MD5
介绍MD5
点赞
回复 取消回复

目录