派聪明 RAG 真实面经参考,已累计 27 家,700 道题目(不断更新中)
1.快手快 star
- 描述一下上传文件,提问到显示答案整个数据流以及涉及到的模块/技术栈,
- 怎么 chunk 的,为什么这么做?
- 用的什么模型,有对比过吗
- 检索结果不符合预期怎么办
- ES 里怎么存的
- 分片上传是怎么做的?断点续传?你这个场景有意义吗
2.小红书一面
AI & RAG 相关
- RAG 怎么解决 LLM 上下文窗口有限的问题?
- RAG 里的“重要性重排序”是怎么判断哪个内容更“重要”的?
- 流式对话支持多轮吗?怎么实现的?
- 提示词做了哪些优化?如果多轮对话关联性不强,怎么抓住新问题的重点?
- OpenAI 协议里,上下文的角色有哪几种?
- system, user, assistant 这几个角色在使用上有什么区别?
Java 基础 & 并发
- 讲讲 Java 不同更新版本的区别,特别是关键版本。
- 为什么 Spring Boot 3.x 要用 Java 17+的版本?项目里用了哪些新特性?
- Lambda 表达式和 Stream API,跟传统的 for 循环比,优缺点是什么?
- parallelStream()为什么性能好?底层是什么实现的?
- 如果不用 parallelStream,用传统 for 循环自己写并发提交任务,代码大概分几块?
- 都说 Java 线程“重”,Go 协程“轻”,这个“重”具体体现在哪?
- 为什么 Java 线程实际只用很少的栈,但 JVM 却要给它分配那么大的栈空间?
- 协程到底是个什么东西?
- Java 里写 for 循环有几种方式(比如用索引 i,用迭代器),它们有什么区别?
算法手撕
- 实现一个函数,找出字符串里所有长度大于 1 的子回文串。
3.某对标亚信公司一面
- 面了一家听说对标亚信的公司,面试官口头和我说过了,下一轮 boss 面让我瞎聊就行
- java 基础和集合查缺补漏面经:
- embedding 用什么模型?
- 混合检索?怎么评估准确性?
- 大模型的选择
- 上下文管理?
- redis 的击穿, 雪崩,穿透
- AOP
- MySQL binlog 监听通过主从复制原理
- ThreadLocal
- 消息队列,消息如何不丢失?
要我现场跑跑派聪明,没跑起来。。。很悲催,我没改前端也不怎么熟悉流程。
4.未知公司
面经:
- 1、介绍项目从数据上传到最后存入数据库的流程、RAG 流程
- 2、切块的步骤、如何评价优化前后的 RAG 的好坏
- 3、针对用户不同的提问:提问语句长短不同,分别怎么检索?
- 4、向量化的数据有做处理吗?
5.腾讯二面
- 1.派聪明技术选型,如为什么用 minio 做文件存储、选择 es 等
- 2.rag 的准确率如何优化
- 3.语块如何分片
- 4.es 相关
- 5.大文件也可以断点续传为什么要分片?
- 6.从用户体验上来说,一个文档也没有很大,分片上传的提升并不大,这里如何考虑的?
6.合合信息一二面
一面面经
拷打项目
- 讲一下自己的 rag 这一套流程的理解
- 在里面采取了哪些技术
- 对接大模型用的什么
- 文件拆分是怎么分割的
- 用户提交问题后的流程
- 中间过程纯手工编的吗?(我答的没用 langchain4j 或者 Spring ai)
- 如果有充足时间优化 会优化哪些点
- 怎么解决检索过程中的权重误差?
- 如何优化检索来提高回答准确性?
- 了解过 agent 和 mcp 吗?
- 可以把整个流程让大模型自动弄吗?
回复