大家好,我是二哥呀。
众所周知,阿里巴巴有多个 bu,随着饿了么改名淘宝闪购,淘天的阵营又壮大了,剩下能比肩或者超越淘天的,我认为只有阿里云了。
云未来的想象空间足够大,这个空间来源于 AI。
看到一个数据,由 Omdia 发布的 2025 年 上半年“AI云”市场规模:国内 AI 云市场规模达 221.9 亿元。其中阿里云占比 35.8%,高于 2 到 4 名的份额总和!
所以必须要恭喜今年选择阿里云的同学,不仅能拿到一个非常可观的起薪,也能在未来三到五年内快速晋升;如果能在 AI 方向上积攒一定的功力,跳槽的优势也会非常大。
接下来,给大家分享一下《Java 面试指南》 专栏里收录的最新阿里云校招薪资,方便大家做个参考。
- 硕士985,开发岗,给了 32k,这绝对算是 SSP 级别,base 北京;
- 硕士 985,研发岗,给了 28k,还有 2 万签字费,估计是 SP,base 杭州;
- 学历没说,开发岗,给了 27k,瓴羊部门,还有一笔签字费;
- 算法岗,给了 32k,感觉和开发一个水平。
从阿里云今年在研发岗位上的出价就能看得出来,阿里非常重视 AI 云的发展。
星球里有球友拿到了一个 SRE 的岗位,开到了大 SP 的水平,属于比较核心的业务。
所以我在这里也是吆喝一声,学 Java 不要只投 Java 后端开发岗,AI 应用开发,运维岗、前端、客户端、测试、测开,甚至 Go 岗,你都可以投,校招在语言和岗位上几乎不做限制。
阿里云在 AI 领域最知名的产品莫非通义千问,目前已经是全球公认的第一开源大模型。
当然了,通义千问本质上是 MaaS(Model as a Service)服务,而 MaaS 只是 AI 云的一部分。
云厂商把大模型能力封装成标准化接口,企业不需要自己训练模型、不需要自己养 GPU,只要按量调用 API,就能直接获得 AI 能力。
完整的 AI 云通常包括三层:
- 最底层是 AI infra,也就是算力、网络、存储、加速卡、集群调动,决定了模型能不能跑得动、跑得快、跑得性价比高。
- 中间是 AI 开发平台,负责数据处理、模型训练、微调、推理部署、监控治理,比如说阿里百炼。
- 最上层才是 Maas,把模型能力以服务的形式交付给开发者和企业。
那可能有同学会问:
- 到底从事 AI 应用开发需要掌握哪些技术栈?
- 专业技能中针对 AI 部分应该写点什么?
- 针对 AI 应用/RAG/Agent 方向,面试中的八股主要集中在哪些方面?
我来帮大家详细地梳理一下。
01、AI 应用开发需要什么技术栈?
强调一点。
AI 应用开发并非只能 Python 来干,Python 能做到的,Java 同样能做到(注意前置条件是 AI 应用开发😄)。
AI 应用开发,是在传统的 Java 后端上增加 AI 模块,不是把 Java 技术栈扔掉,重构成 Python 技术栈。
Java 有 SpringAI,有 LangGraph4J,能够满足绝大多数场景下的 AI 应用开发。
下图是派聪明 RAG 项目中用到的技术栈,JDK17、ElasticSearch、MySQL、Redis、MinIO、Kafka、WebSocket 等等,都不需要 SpringAI 框架就能完成 RAG 业务的落地。
这个项目在今年秋招发挥的作用巨大,很多很多球友发喜报的时候都特意盛赞一下这个项目。
所以真不需要说刻意去学 Python 才能满足 AI 应用开发的需求。
当然了,对于需要 Python 技术栈的同学,下一个项目派派工作流,也有😄。
02、专业技能如何写 AI 部分?
AI 工具的是用,AI 技术栈的了解,AI 的底层架构,都可以写,我举几个简单的例子:
- 了解 RAG 流程,能完成文档解析、分段切块、向量化、混合检索和上下文拼接,并处理相似度阈值与召回数量等参数调优。
- 了解 Embedding 向量化与向量检索,使用 ElasticSearch dense_vector 或其他向量库进行相似度检索,并结合 BM25 实现混合搜索提升召回质量。
- 了解大模型调用链路和基本工程治理,能处理超时重试、限流熔断、日志追踪、成本控制和模型降级等问题。
我在精选简历里收录了很多例子,需要的同学可以查看。
复制到浏览器打开:https://t.zsxq.com/19d0wrDnp
03、AI 的八股从哪里搞?
这部分最重要的还是积累,平常要多去梳理总结一些 AI 相关的题目,然后总结形成属于自己的表述方式。
如果你做的是 RAG,那下面这些题目基本上都会问到:
- RAG 是什么,为什么需要 RAG,解决了大模型哪些问题?
- 文档解析怎么做,PDF/Word/网页怎么抽取文本,Tika 在链路里的作用?
- 切块 chunk 怎么切,按长度切还是按语义切,chunk size 和 overlap 怎么选?
- Embedding 是什么,向量相似度怎么衡量,余弦相似度了解吗?
- 只做向量检索为什么不够,为什么要混合检索 BM25 + 向量?
- TopK 怎么选,阈值怎么定,怎么减少无用的片段?
- 召回不准怎么办,重排序 rerank 怎么做?
- 幻觉怎么降低,引用来源怎么保证,回答必须基于上下文怎么做?
- 评估怎么做,离线评估指标怎么定,线上怎么做 A/B 和反馈闭环?
可以参考派聪明 RAG 项目,里面有整理超过 2 万字的 AI 八股。
如果你做的是 Agent 模块,工具调用和工作流会被问到:
- Agent 和 RAG 的区别,什么场景用 Agent,什么场景用 RAG?
- Function Calling 是什么,怎么把业务接口包装成工具?
- 工具调用失败怎么办,超时、重试、幂等、降级怎么设计?
- 多工具协同怎么做,如何避免模型乱调工具、陷入循环?
- 记忆 memory 怎么做,短期记忆 vs 长期记忆,怎么落库?
- 多轮对话如何保持上下文,token 爆了怎么办,怎么做摘要压缩?
- MCP 是什么,它解决什么问题,为什么比自己写一堆插件更稳?
这部分面试题的答案会在校招派 Agent+MCP 项目中揭晓,结合实际的项目给出答案,大家可以敬请期待。
AI 云不是一个短期风口,更是一场长期投入、重资产的硬仗。
2025 年 2 月,阿里就宣布:未来三年会投入 3800 亿元建设云和 AI 硬件基础设施。
所以对 AI 应用开发感兴趣的同学,可以尝试在 AI 这波云浪潮中,提前占一个位置。除了阿里云,其他云厂商也都可以选。
我也在考虑,下下下个项目可以做个阿里百炼这种平台,应该不错。
进入 12 月下半场了,冲吧,兄弟姐妹们。
ending
一个人可以走得很快,但一群人才能走得更远。二哥的编程星球已经有 10800 多名球友加入了,如果你也需要一个优质的学习环境,戳链接 🔗 加入我们吧。这是一个 简历精修 + 编程项目实战(RAG 派聪明 Java 版/Go 版本、技术派、微服务 PmHub)+ Java 面试指南的私密圈子,你可以阅读星球专栏、向二哥提问、帮你制定学习计划、和球友一起打卡成长。
最后,把二哥的座右铭送给大家:没有什么使我停留——除了目的,纵然岸旁有玫瑰、有绿荫、有宁静的港湾,我是不系之舟。共勉 💪。
回复