杠精派
派聪明
0/512

热门评论

阿白 2026年04月25日 18:44
引用原文:宁可多召,不能漏掉”
这个是宁可少招,不能滥竽充数吧?
点赞
回复1 取消回复
XSX 2026年04月25日 22:03
"先用 KNN 做大范围召回,召回窗口是 topK 的 30 倍"这个就是多召
点赞
回复 取消回复

7 条评论

柒眠 2026年06月10日 17:12
引用原文: 2048 维的向量
@派聪明 为什么用2048维
点赞
回复1 取消回复
派聪明 2026年06月10日 17:13
采用2048维向量主要是为了在**语义表达能力(准确度)**与**计算/存储开销**之间取得最佳平衡。结合项目实践,原因主要有以下几点: **1.足够的语义表征精度** 向量维度的本质是用来表征文本特征的空间。在 RAG(检索增强生成)系统中,不仅要处理“字面匹配”,更要理解“语义相似”(例如“Java垃圾回收”与“JVM GC”)。2048维属于高维空间,能够捕捉极其丰富、细微的语义特征,从而确保在进行高维空间 KNN(最近邻)检索时,找出的内容在语义上高度精准,避免答非所问。 **2.模型与检索场景的最佳平衡** 虽然维度的增加能提升语义解析的精细度,但并非越高越好。过高的维度(如4096维)会带来严重的“维度灾难”,导致计算量剧增、存储成本翻倍,甚至引起向量表征过于稀疏而降低检索质量。2048维是目前主流高性能 Embedding模型(如项目使用的阿里 `text-embedding-v4`)在处理复杂长文本时,兼顾检索准确率和系统性能的“甜点(Sweet Spot)”。 **3.匹配项目的检索策略** 该 RAG 项目采用了非常深度的混合检索策略(如30倍窗口的召回率 + BM25 重排序 +语义分块)。2048维提供的精准基础向量距离度量,是保证第一阶段 KNN 大规模召回时不漏掉核心相关文档的前提。如果维度太低(如256或512),底层向量表征的信息量不足,后续再怎么重排序也无法挽回语义的丢失。
点赞
回复 取消回复
粗心的超短裙 2026年05月21日 23:33
引用原文:存了所有的历史消息
不需要做上下文管理吗,如果历史消息很多也要加到prompt里吗
点赞
回复 取消回复
亚泽 2026年05月13日 10:14
引用原文:前 120 个字符的摘要文本
@派聪明 元数据存这个是为何?
点赞
回复 取消回复
高高的雪糕 2026年05月01日 12:47
redis存储对话历史,怎么处理历史会话越来越多越来越大的问题呢
点赞
回复 取消回复
阿白 2026年04月25日 18:44
引用原文:宁可多召,不能漏掉”
这个是宁可少招,不能滥竽充数吧?
点赞
回复1 取消回复
XSX 2026年04月25日 22:03
"先用 KNN 做大范围召回,召回窗口是 topK 的 30 倍"这个就是多召
点赞
回复 取消回复

目录