大家好,我是二哥呀。
相信大家都注意到了,罗福莉加入小米后的第一个成绩单公布了:MiMo-V2-Flash 官宣开源,并且好评如潮。
官方给的数据是:代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生成速度提升 2 倍。
啧啧啧。
对于想从事 AI infra 的同学来说,你需要知道 MiMo-V2-Flash 模型采用了混合 SWA 架构,能显著降低 KV 缓存使用(约 6 倍),推理速度高达 150 tokens 每秒。
并且你还可以从官方开源的资料深入学习模型的训练技巧,比如 MoE 的稀疏激活。
你还可以从 HuggingFace 上下载模型,微调它用于特定任务(比如自定义 AI 代理、低延迟的聊天机器人),然后学习如何优化模型的部署脚本,这些积累在求职中都是加分项。
当然了,可能很多同学认为 AI 应用开发和 AI infra 离自己很远很远,但其实很近很近。
26 届的球友,有很多都拿到了这两个方向的 offer,比如说下面这位球友,就拿到了拼多多的 AI infra,薪资给的非常可观。
这里给大家解释一下 AI infra 可能干的事情。包括大模型的设计和开发,比如说推理链路怎么设计,KV cache 怎么省。
小米的 MiMo-V2-Flash,为什么反复强调混合 SWA、KV 缓存下降 6 倍,本质就是 infra 成绩单。
还有大模型的服务平台开发,比如说限流怎么做,多租户怎么隔离,API 层如何兼容 OpenAI 协议等等。
以及模型训练,比如数据清洗、采样等。
AI infra 可以说是 AI 时代最火热的岗位之一, 前途无量。那怎样才能拿到 AI infra 的 offer 呢?
我这么说吧,对于校招生来说,你并不需要任何 AI infra 的开发经验,完全可以按照后端开发的路线去准备。
拿到拼多多 AI infra offer 的球友就是,他是 2025 年 2 月份加入星球的,4 月份靠技术派+点评拿到了字节的暑期实习 offer。
他当时在星球里详细分享了自己的上岸经验,我把原贴地址放出来,需要的同学可以去借鉴 下,参考价值非常大。
复制到浏览器打开:https://t.zsxq.com/4IVPd
他的经验心得包括:
除开 Java 后端四大件的常见八股,AI方面有的面试官问的也比较多,常见的有比较几种大模型、DeepSeek效果为什么好、Transformer结构、RAG、agent、prompt这些。
秋招的项目我也替大家问了一嘴,派聪明 RAG + 魔改的技术派+点评。
这就是校招生的优势,你可以拿 Java 后端的项目去投 AI infra 的岗位,去投 AI 应用开发的岗位,甚至 go、前端、客户端、测试测开。
完全不受限制。
那对于想从事 AI 应用开发的同学来说,可以快速把 MiMo-V2-Flash 接入到自己的系统中,对比一下它和其他模型的输入/输出/速度有什么区别。
比如说我就第一时间把它接入到了我们最新的 PaiFlow Agent 项目当中,同样的提示词,同样的输入,从输出结果上来看,蛮符合我的预期(响应速度挺快)。
API 的调用方式完全兼容 OpenAI 和 Anthropic,代码层面不需要做任何修改,只需要把 API key 配置到大模型节点的配置参数中就可以了。
那从 AI 应用开发的角度,除了对接小米的 MiMo-V2-Flash API,我们还能学到什么呢,面试中如何表现自己的 AI 能力呢?
面试术语:
- 在 PaiFlow 的应用设计中,我会严格控制上下文长度、拆分长任务、尽量避免把无关历史塞进 prompt,同时根据任务类型调整 temperature 和 max_tokens,以平衡成本和效果。
- 在 PaiFlow 开发中,我更关注模型能力的边界。比如像 MiMo-V2-Flash 这种偏推理和 Agent 的模型,我会主要用在任务拆解、工具调度和复杂流程控制中,而不是简单对话。同时在工程上,我会通过 prompt 约束、tool schema、上下文裁剪和失败兜底,来保证系统的稳定性和成本可控。
你看,是不是很专业?
对于我们绝大多数求职者来说,重要的不是去 开发和训练出一个像 MiMo-V2-Flash 这样强的模型,而是能够把模型接入到自己的实战项目当中,并且发挥出每一家模型的优势。
知道模型为什么要限制上下文长度?为什么要拆解任务、控制成本?
换句话说,求职前我们从事的是 AI 应用层的开发,包括 RAG 和 Agent 流程编排,但入职后,我们可能会从事更底层的 AI infra 岗位。
校招更看重的是你的潜力。
所以,兄弟姐妹们,放心大胆地去冲,你完全有能力,也有机会拿到一个远超你预期的 offer。
就像你现在学的是技术派、派聪明,未来却可能加入到小米的 MiMo 团队,从事小米大模型的研发~
冲冲冲。
ending
一个人可以走得很快,但一群人才能走得更远。二哥的编程星球已经有 10900 多名球友加入了,如果你也需要一个优质的学习环境,戳链接 🔗 加入我们吧。这是一个 简历精修 + 编程项目实战(RAG 派聪明 Java 版/Go 版本、技术派、微服务 PmHub)+ Java 面试指南的私密圈子,你可以阅读星球专栏、向二哥提问、帮你制定学习计划、和球友一起打卡成长。
最后,把二哥的座右铭送给大家:没有什么使我停留——除了目的,纵然岸旁有玫瑰、有绿荫、有宁静的港湾,我是不系之舟。共勉 💪。
回复