本期 HOT JOB 云计算专场热门职位如下,如果您对以下职位有兴趣,请添加文章结尾联系方式进行咨询,谢谢。
工作地点:北京
薪酬预算:120-220万
公司背景:知名大厂
职位核心要求:
1. 在离线混部的核心技术,例如资源隔离,资源调度,资源预测,资源动调,离线资源驱逐等
2. 熟悉Borg,Koordinator,Matrix,Caelus等业界主流混部系统
工作地点:上海
薪酬范围:100-160万
客户背景:国企
职位核心要求:
1. 云原生技术体系(k8s,docker,服务网格,调度编排等)
2. GPU/AI大模型的部署推理有一定了解
3. 云平台核心系统架构设计经验
4. 30人左右团队管理经验
工作地点:上海
薪酬预算:80-160万
公司背景:国企
职位核心要求:
1. 负责智算云调度平台产品的研发
2. 做过架构,懂云平台,有30人以上的团队管理经验
工作地点:北京
薪酬预算:80-200万
公司背景:量化大厂
职位核心要求:
1. 基于业务需求制定 Kubernetes 集群优化方案
2. 深入理解 Kubernetes 及其核心组件(CNI、CSI、LB等)
3. 熟悉 Kubernetes/Docker 开发及其内部原理
工作地点:上海/北京/杭州/深圳
薪酬预算:80-200万
公司背景:头部大厂/大模型厂/智驾厂
职位核心要求:
1. 云原生:编排调度/资源优化/多云Fed/资源混布
2. Kubernetes/Volcano/Yarn
3. 容器化:docker/containerd
工作地点:上海/北京
薪酬预算:80-200万
公司背景:某AI国企/某大模型厂
职位核心要求:
1. 设计构建用于训练及推理的大规模GPU算力池和异构计算资源池的全局架构
2. AI基础设施开发和架构搭建,确保集群性能及稳定性
3. 构建自动化、可视化的硬件生命周期(服务器、GPU)管理平台
4. 0-1超大规模(万卡)GPU集群经验者优先
工作地点:北京/上海
薪酬预算:80-200万
公司背景:某头部量化/某大厂
职位核心要求:
1. 高性能背景,懂cuda的人选
2. 计算引擎、性能优化、推理优化、python编译优化、存储加速相关
3. 编程语言python/c++
薪酬预算:80-200万
职位核心要求:
1. 某大厂--云存储平台研发组长(P8/P9)--深圳/北京/上海/成都
2. 某大模型厂--KV存储研发(p6/p7)--北京/上海--大规模训练数据存储的稳定性和性能优化
3. 某中厂--资深KV存储研发(p7)--北京--KV产品的架构和运维体系设计、研发
4. 某智驾--AI存储研发(P7)--北京/上海--文件/对象/tikv/元数据
5. 存储系统研发专家(P7/P8)--北京、杭州--训推一体存储设计开发
工作地点:上海
薪酬预算:60-100万
公司背景:国企
职位核心要求:
1. 负责机房的选择、规划及管理,确保其稳定运行,制定和优化机房相关运维流程和规范,提高运维效率和质量保障
2. 负责智算集群服务器的全生命周期管理,对服务器性能进行监控和分析,提出优化建议并实施,确保服务器和机房资源利用率最大化
3. 负责与各厂商的支持团队建立密切、高效合作关系,推动供应商改进和完善交付、售后服务
4. 负责相关团队的招聘、培训、考核和管理,提高团队的专业能力和工作效率
工作地点:上海
薪酬预算:60-120万
公司背景:国企/互联网大厂/量化公司
职位核心要求:
1. 故障数据整理与管理
2. 建立标准化故障数据台账
3. 服务器运维里面会做故障诊断、汇总、数据分析
工作地点:上海
薪酬预算:60-120万
公司背景:国企/互联网大厂/量化公司
职位核心要求:
1. 本科及以上学历,计算机、软件工程相关专业,5年及以上工作经验
2. 熟悉CI/CD相关基础设施和工具链的搭建与运维,对DevOps有深入理解
3. 具有优秀的编码能力,精通python/go中至少一种语言,熟悉k8s、docker者优先
4. 具备高度的责任心, 良好的沟通协作能力,能够针对业务场景识别并解决主要问题
工作地点:上海
薪酬预算:40-80万
公司背景:国企/互联网大厂/量化公司
职位核心要求:
1. 主导设计、构建和优化用于训练及推理的大规模GPU算力池和异构计算资源池的全局架构
2. 构建自动化、可视化的硬件生命周期(服务器、GPU)管理平台
3. 建立完善的监控、告警和日志系统(如Prometheus, Grafana, ELK)
若您对以上职位感兴趣
请添加以下微信联系我们

我们将第一时间为您提供
精准高效匹配服务

