杠精派
派聪明
0/512

热门评论

阿琳 2026年01月26日 15:28
引用原文:流式对话支持多轮吗?怎么实现的?
@派聪明
点赞
回复7 取消回复
派聪明 2026年01月26日 15:29
是的,流式对话支持多轮对话。实现方式如下: 1. 对话历史管理:使用Redis存储用户对话历史,最多保留最近20条对话。超过20条会自动裁剪,防止上下文爆炸。 2. 上下文拼接:每次提问时,会将用户历史对话和当前问题一起拼接到prompt中发送给大模型。 3. 流式返回:通过WebFlux的SSE(Server-Sent Events)技术实现流式返回,前端实时渲染内容。 4. 长度控制:对历史对话进行压缩处理,确保上下文长度在模型可接受范围内,同时保持关键语义信息。 这种设计既支持多轮连续对话,又控制了上下文长度,保证了系统性能和响应效率。
1
回复 取消回复
展开剩余 6 条回复

296 条评论

 2026年05月09日 15:19
引用原文:可以通过 Spring 注入的方式给静态变量赋值吗
@派聪明
点赞
回复 取消回复
望江渡 2026年05月04日 08:50
引用原文:意图识别有没有兜底策略
@派聪明 现在的意识识别策略在哪一部分
点赞
回复 取消回复
山北雨夜漫步 2026年05月01日 18:37
引用原文:这个过程如果要配置一些预警,你觉得应该配置哪几个重点的指标;
@派聪明
点赞
回复 取消回复
山北雨夜漫步 2026年05月01日 14:22
引用原文:派聪明 IK 分词器为什么用这个,为什么不用 xxx(没听过)
@派聪明 为什么
点赞
回复 取消回复
虚拟的吐司 2026年04月23日 20:35
引用原文:就算使用 system 角色,返回的格式也不能保证 100%符合要求,怎么解决?
@杠精派
点赞
回复 取消回复
潇潇 2026年04月23日 11:04
引用原文:用户提交问题后的流程
@派聪明
点赞
回复 取消回复
才得相思 2026年04月16日 18:03
引用原文:你这个企业级智能问答系统,这个是企业级的应用还是研究生做的导师的项目呢,项目的初始学习来源在哪?
@派聪明 这个问题怎么回答
点赞
回复 取消回复
沉喧 2026年04月13日 19:30
引用原文:MD5
介绍MD5
点赞
回复 取消回复
n 2026年04月13日 17:15
引用原文:1.讲讲强引用和弱引用,分别有什么使用场景
@派聪明
点赞
回复 取消回复
子瞻 2026年04月08日 20:51
引用原文:MySQL binlog 监听通过主从复制原理
@派聪明
点赞
回复 取消回复

目录