杠精派
派聪明
0/512

热门评论

阿白 2026年01月27日 09:54
引用原文:首先,在检索这层,我们会给 Elasticsearch 设置一个相关性评分的门槛。比如我们会把低于 0.3 分的结果全部过滤掉。也就是说,如果一个文档跟用户的问题只有一点点关联关系,分数达不到要求,它就根本不会进入到下一步的上下文构建中。
@派聪明 我们不是相似性检索和关键词检索综合评分吗?这个最后的0.3过滤是根据什么分数过滤的?
点赞
回复3 取消回复
派聪明 2026年01月27日 09:54
根据参考资料,系统在Elasticsearch检索层采用**混合检索策略**(结合相似性检索和关键词检索),最终生成的相关性评分是一个**综合得分**。0.3分是系统设定的**最低相关性阈值**,具体依据如下: --- ### 1. **评分机制** - **混合检索评分**: 系统会同时进行**向量相似性检索**(如余弦相似度)和**关键词检索**(如BM25算法),并将两种结果按预设权重加权融合,生成一个0-1区间的综合相关性分数。 - **阈值过滤**: 低于0.3分的文档被视为与用户问题关联度不足,直接排除,避免低质量信息进入后续上下文构建。 --- ### 2. **0.3阈值的设定依据** - **经验性平衡**: 0.3是系统通过多轮测试确定的平衡点: - **查全率 vs. 查准率**: 过低阈值(如0.1)可能召回过多无关文档,导致LLM混淆;过高阈值(如0.5)可能遗漏有效信息,降低回答覆盖率。 - **业务场景需求**: 专业领域(如技术文档)要求更高相关性,而通用场景可适当放宽阈值。 - **动态调整可能性**: 阈值可根据不同知识库特性或用户反馈微调(如高敏感领域采用更高阈值)。 --- ### 3. **为什么过滤低分文档?** - **避免LLM“胡说八道”**: 参考资料明确要求,若上下文无足够信息,LLM需回答“无法回答”。低分文档可能包含错误或无关信息,干扰模型判断。 - **优化性能**: 减少冗余数据传递,降低大模型处理负担和响应延迟。 --- ### 总结: 0.3分是**混合检索后的综合相关性阈值**,用于筛选与问题强相关的文档。这一数值通过平衡查全率、查准率及业务需求确定,确保进入LLM的上下文信息既相关又可靠。
点赞
回复 取消回复
展开剩余 2 条回复

90 条评论

若存 2026年05月30日 18:56
引用原文:对于聊天这种历史数据
还是有持久化了吧
点赞
回复 取消回复
庸碌 2026年05月02日 22:34
引用原文:1.我们来聊聊这个聊天助手。它最吸引人的特点之一就是像真人聊天一样,答案一个字一个字地蹦出来。这种‘流式响应’或‘打字机效果’,在技术上是如何实现的?
@派聪明 如果是使用sse实现怎么回答呢?
点赞
回复 取消回复
zhiwenfan 2026年04月20日 12:50
引用原文:conversationId
ID 生成机制,断联之后重连,如何确定这个ID号
点赞
回复1 取消回复
故意的香氛 2026年05月08日 10:24
从 redis 中获取: String key = "user:" + userId + ":current_conversation"; String conversationId = redisTemplate.opsForValue().get(key);
点赞
回复 取消回复
丰富的胡萝卜 2026年04月09日 16:41
引用原文:WebSocket 是一种有状态、全双工的协议,一旦连接建立,前后端就可以随时互相发送消息。
@派聪明接受大模型的流式回复是单队列接收吗,怎么避免多线程会造成的前端输出乱序呢
点赞
回复 取消回复
违规名称 2026年04月07日 09:54
引用原文:第二,我们在 Prompt 的 System 指令里给出了明确的规则,“如果你发现上下文里没有足够信息来回答用户的问题,请直接说‘无法回答’或者‘没有找到相关资料’,而不是强行输出。”
评分低的时候为什么不直接返回固定拒答文案,为什么还要调用llm回答
1
回复 取消回复
Akaina 2026年04月06日 19:45
@派聪明 该项目 从用户输入 到 得到响应 需要多少时间
点赞
回复 取消回复
Akaina 2026年04月06日 19:42
该项目 从用户输入 到 得到响应 需要多少时间
点赞
回复 取消回复
借我 2026年04月03日 09:58
引用原文:然后在答案生成后还需要将新一轮的对话再次写入到历史记录中
每一次对话都会生成后直接写入还是在对话完全结束后再写入@派聪明
点赞
回复 取消回复
借我 2026年04月03日 09:03
引用原文:这一步是实现打字机效果的关键
智能对话时,到底是调用api还是本地Ollama部署呢@派聪明
点赞
回复 取消回复
过时的草莓 2026年04月01日 13:14
引用原文:前 N 个最相关
怎么确定这个N是多少
点赞
回复 取消回复

目录