城市:广东省内各市
薪资:50-100W
职责:
1、深度参与云主机、弹性伸缩、专有宿主机、GPU实例、裸金属服务器等核心计算产品的全流程质量保障工作。
2、设计和执行计算实例的规格性能、稳定性、压力和极限测试,分析CPU、内存、磁盘I/O、网络PPS等关键指标。
3、开发和维护针对计算产品API和UI的自动化测试框架与脚本等。
学历&工作年限:大学本科及以上学历,并取得相应学位,计算机及相关专业优先
要求:
1、5年及以上工作经验,其中至少3年及以上云计算或大型分布式系统测试开发经验,至少有2年以上专注于IaaS计算产品(如虚拟机、裸金属)的测试经验;
2、精通测试理论、方法和流程,具备复杂系统的测试设计和用例编写能力。有性能测试、稳定性测试、自动化测试的专项经验者优先;
3、深入理解虚拟化技术:精通至少一种主流虚拟化技术(如KVM)的原理、架构及常用工具(如libvirt, qemu-kvm)等。
城市:北京/上海
薪资:50-100W
职责:
1. 负责Agent Infra平台的整体技术架构设计与选型。
2. 攻克Agent运行时的秒级/毫秒级启动、高并发、低延迟、高可用性等技术挑战。
3.负责设计并实现统一的Agent工具调用API,支持浏览器自动化、终端命令、云手机操作等。
学历&工作年限:大学本科及以上学历,并取得相应学位,计算机、软件工程、云计算等相关专业优先
要求:
1、8年及以上工作经验,其中至少5年以上云计算底层或PaaS平台架构经验;
2、精通Linux系统原理,熟悉KVM/QEMU、Firecracker、Docker等虚拟化与容器技术、熟悉Agent开发相关技术等;
3、熟悉分布式计算、资源调度、弹性伸缩系统,有Kubernetes、微服务架构实战经验等。
城市:北京
1.研究和跟进智算服务器行业的最新技术,评估并设计POC系统;
3.和业务团队、操作系统团队紧密配合,分析训练,推理,应用模型,并帮助业务团队实现硬件方案创新等。
学历&工作年限: 大学本科及以上学历,并取得相应学位,计算机、电子或其他相关专业优先
1、8年以上研发经验,5年及以上的GPU服务器硬件相关工作经验;
2、熟悉计算机体系和异构硬件架构,对GPU体系结构有深入理解;
3、有过对AI大数据,训练,推理,渲染,云桌面,云游戏等业务的需求分析以及硬件转化项目经验等。
城市:北京/上海
薪资: 50-100W
1、负责开源操作系统的问题定位和分析,操作系统内核进行性能分析与调优;
2、设计并实施内核级性能测试与基准评测方案,持续监控与回归验证优化效果,深入研究并优化虚拟化平台中的性能关键路径;
3、优化内存管理子系统,提升内存利用率与访问效率调研并调优中断子系统等。
学历&工作年限:
大学本科及以上学历,并取得相应学位,计算机及相关专业优先
1、八年及以上工作经验,其中至少5年 Linux/windows等内核或系统级软件性能优化经验;精通 C 语言,熟悉汇编 (x86/ARM);具备良好的脚本能力(Python、Shell);
2、精通操作系统原理,至少掌握Linux内核源码分析与调试;
3、熟悉 CPU 架构(x86_64/ARM)、Cache 层级、TLB、内存子系统、总线协议等;熟练使用并优化 KVM、QEMU;了解Intel VT-x/AMD-V、EPT/NPT工作原理等。
城市:上海/北京
薪资:50-100W
职责:
1、参与/负责大规模分布式时序存储和研发,建设高可用、高性能、易伸缩的分布式时序存储。
3、参与监控体系产品迭代,构建高效智能的APM、报警中心、事件中心、拨测平台和指标分析平台等。
学历&工作年限:本科及以上学历,计算机或相关专业优先,并获得相应学位
要求:
1、8年及以上工作经验,3年及以上监控相关工作经验,5年以上者更佳。熟练掌握Golang研发语言,具备高并发场景下设计、编码、优化及问题排查能力。
2、掌握扎实的计算机基础知识,深入理解数据结构、算法和操作系统知识。
3、熟悉监控系统相关组件,对InfluxDB、Prometheus、VictoriaMetrics、Thanos等一个或多个有较深了解和相关开发经验等。
城市:上海/北京
薪资:50-100W
职责:
1、研究HPC行业软件以及性能优化
3、与高性能网络(如InfiniBand)、并行文件系统等云产品对接,并持续进行优化等。
学历&工作年限:大学本科及以上学历
要求:
1、5年及以上研发工作经验,对云计算openstack/Kubernetes/ Mesos / Yarn 等有一定了解;
2、具备丰富的基础设施自动化经验,熟练使用 Ansible、Terraform 等工具;
3、深刻理解并行计算,拥有使用MPI和OpenMP进行开发的实际项目经验等。
城市:北京/杭州
薪资: 50-120W
职责:
1、建设AI智算平台在专属云场景监管控系统核心能力。
2、建设满足专属云业务场景和数据合规要求的智算集群库存管理体系。
3、结合专属云特殊基础设施情况,建设智算集群和管控系统自身高可用体系等。。
学历&工作年限:统招本科以上学历
要求:
1、拥有5年以上大规模分布式系统设计及研发经验,独立负责过包含多模块的业务子系统。
2、编程基本功扎实,熟悉数据结构和算法,熟练掌握Golang / Java / Python / C++ 中至少一种开发语言。
3、系统工程能力扎实过硬,线上稳定性意识强,有过线上系统监控体系、变更体系/流程设计和研发经验者优先等。
职责:
1、负责公司智算产品的质量保障工作,负责集测平台设计开发,产品需求评审。
2、负责制定完善测试流程与规范,实现端到端验收测试,为线上产品功能与稳定性保驾护航。
3、负责自动化测试工具建设,自动化测试用例设计、执行,持续集成等。
学历&工作年限:统招本科以上学历
要求:
1、5年以上测开工作经验,在自动化测试平台建设、性能测试上有丰富工作经验。
2、精通Java/python等至少一种编程语言,熟悉 linux系统,熟练使用主流自动化测试工具经验。
3、精通测试流程和测试用例设计方法,能够独立负责某个领域的测试工作并拿到具体的成果等。
城市:杭州
薪资:50-120W
职责:
1、负责各计算集群交付运维工作,并且参与基础运维平台架构设计和建设;
2、运维服务体系建设与优化,达成产品稳定性与SLA目标;
3、制定交付标准,沉淀运维规范,通过工具平台提效日常工作等。
学历&工作年限:统招本科以上学历
要求:
1、5年以上IT、互联网、云计算行业运维工作经验,有AI运维开发相关经验者优先;
2、熟悉Linux操作系统和TCP/IP等主流协议,有扎实的操作系统和网络问题处理经验;
3、熟悉容器和kubemetes,slurm,ls等编排技术等。
城市:杭州/上海
薪资:50-120W
职责:
1、依据公共云统一架构、OpenAPI 规范、软件技术栈以及交付运维体系,负责专属云产品的研发与交付。
2、跟踪并把握 GPU 架构设计的发展趋势,探索前沿的 GPU 架构设计技术。
3、研发并持续改进系统的稳定性和安全性,确保平台的安全可靠运行,并不断提升对外服务质量标准。
学历&工作年限:计算机科学、电子工程、通信工程、电气工程等相关专业背景,统招本科以上学历。
要求:
1、精通 PythonShell、C/C++ 等开发语言,拥有至少 5 年的相关工作经验
3、具备容器化服务的经验,了解容器化资源管控或作业调度机制等。
城市:杭州
薪资:50-120W
职责:
1、负责计算集群中GPU资源的全面监控、质量巡检及故障预测。
2、保障计算集群产品与集团在线POD的集群资源管理与切分业务。
3、开发和维护KuberGPU技术,实现GPU资源的高效切分与容器化部署等。
学历&工作年限:统招本科以上学历
要求:
1、需要满足5年以上异构、GPU领域的研发工作经验;
2、具备GPU特定领域的热迁移热升级等技术的研发能力;
3、有GPU容器实现,GPU切分,GPU细粒度资源调度等技术能力储备及相关经验等。
城市:杭州/北京
薪资:50-120W
1、负责计算集群的AI系统性能分析与优化,支持客户多个AI作业场景在不同平台芯片和多种集群规模下的适配和性能调优;
2、针对主流深度学习框架、分布式训练和模型部署场景等,进行性能调优,优化算子性能、通信性能、内存利用率等关键指标;
3、 对AI系统进行性能建模与仿真,建立Roofline模型等性能分析工具等。
学历&工作年限:统招本科以上学历
1、熟悉深度学习框架(pytorch),分布式训练和推理技术框架;
2、熟悉AI系统的性能分析工具(如Nsight、PyTorch Profiler等);
3、具备性能建模与仿真经验,熟悉Roofline模型等性能分析方法等。
城市:杭州/北京
职责:
1、作为产品解决方案架构师,深入理解计算集群及异构产品所负责的高性能AI智算集群的技术原理、架构和使用场景。
2、具备良好的架构思维能力,敏锐捕捉市场趋势,分析竞对产品及市场策略,为产品的设计、实现、改进不断提出建设性的想法和建议。
3、与前线架构师/BTE销售紧密合作,帮助客户解决技术问题,寻找新的业务突破点。
学历&工作年限:计算机科学、电子工程或相关领域硕士及以上学历
1、具有8年以上云计算平台、分布式系统、大规模数据处理或人工智能系统架构设计与实施经验。
2、对AI/ML技术栈非常了解,熟悉模型训练和推理的原理和过程,拥有训练及推理性能优化的实际经验。
3、精通分布式计算架构,深入了解GPU/TPU/DPU计算和高性能网络原理(RoCE和IB),具有实际优化集群计算及网络资源的经验等。
城市:杭州/北京
薪资:50-120W
职责:
1、负责AI训练&推理,存储&数据库等场景下高性能网络的性能分析和问题定位,以及相应工具和系统的研发;
2、 负责高性能网络系统中驱动&通信库、拥塞控制算法、虚拟化技术等组件的研发,以及相关组件在AI场景下的性能调优;
3、AI 训练集群网络架构设计与运维部署、运维和维护基于 RoCE/InfiniBand 的 RDMA 网络架构,支撑大规模 AI 训练集群(如万卡级 GPU 集群);优化分布式 AI 工作负载(如 NCCL、MPI)的网络性能,降低通信延迟,提升吞吐效率等。
学历&工作年限:统招本科以上学历
要求:
1、5年以上IT、互联网、云计算开发相关工作经验及Coding经验;2年及以上相关产品/技术的开发经验;
2、充分理解自己团队在生产关系大图中的定位,具备较高复杂度项目的管理能力,与业务和协作团队关系;
3、熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享。
城市:杭州
薪资:50-120W
职责:
1、 负责高性能网络协议栈核心功能的研发,基于需求完成技术方案设计、UT/IT测试方案设计,带领技术小组完成研发、测试和交付;
2、基于技术方案的拆解,完成任务/子任务的设计、编码开发和系统功能实现;
3、负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等。
学历&工作年限:统招本科以上学历,计算机、网络相关专业优先,熟悉云计算网络相关知识
要求:
1、5年以上相关经验,有网络相关产品 (交换机 / 路由器 / 虚拟网络 / 负载均衡 / DNS等) 的研发或相关技术工作背景;
2、 对云网络产品和解决方案有理解,具备产品和解决方案设计、部署以及创新能力;
3、懂云计算云网络行业,对行业和客户业务有丰富 know how, 有行业策略规划能力等。
城市:杭州/北京
薪资: 50-120W
1、调研 AI 大模型训练及推理的前沿技术发展,分析前沿技术和网络的关联以及优化方向;
2、负责 AI 计算系统的通信库研发、测试、以及交付与支持;
3、制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠等。
学历&工作年限:硕士及以上学历
1、8 年以上 Coding 经验;
2、熟悉竟对和对标产品的核心技术指标、优劣势对比;
3、精通工作中使用的技术栈,在设计、架构、并发、分布式数据等一个或多个技术领域达到专家水平,能够识别并准确解决问题等。
城市:杭州
薪资:50-120W
职责:
1、理解内外部客户、产品运营等各方需求,资源的需求承接可行性分析,资源策略,规格定制,准入验证,以及生产,部署,上线的护航保障 ,在保障齐套交付的基础上,同时负责协调项目系统流程处理,交付结果系统同步。
2、负责云资源/物理资源交付涉及的业务流程的优化迭代,适配新需求、新场景的落地,不断的提升交付竞争力等。
学历&工作年限:统招本科以上学历
要求:
1、8年以上云计算/ICT/运营商行业的云网络资源/物理资源管理工作经验;
2、运用数据处理与分析的方式进行资源的计算、排布、运营等工作,提出数据模型、推动平台建设,牵头运营专项落地;
3、资源管理和运营的整体方案设计,通过运营提升资源利用率,控制资源损耗率,同时提升单资源的运营效益等。
城市:杭州/上海
薪资:50-120W
职责:
1、负责云网络产品的市场经营策略在区域 / 行业线的落地,并直接为经营结果负责;
2、分析云网络技术发展趋势,制定行业战略规划和策略,敏锐挖掘行业数据 / 客户商机,促进有效商机转化,推动规模增长;
3、 不断完善和创新云网络解决方案并规模化复制,支撑云网络产品售前、售中、售后服务等。
学历&工作年限:统招本科以上学历, 计算机、网络相关专业优先,熟悉云计算网络相关知识要求:
1、5 年以上相关经验,有网络相关产品 (交换机 / 路由器 / 虚拟网络 / 负载均衡 / DNS 等) 的研发或相关技术工作背景;
2、对云网络产品和解决方案有理解,在洞察客户业务需求的基础上,具备产品和解决方案设计、部署以及创新能力;
3、懂云计算云网络行业,对行业和客户业务有丰富 know how, 有行业策略规划能力等。
城市:杭州
薪资: 50-120W
职责:
1、负责AI智算场景VPC网络接入,低时延、高吞吐的高速网络技术研发,以及在计算/存储/AI/机器学习/推荐等公司关键业务上的应用;
2、应用VPC高性能网络技术到虚拟机和容器网络,加速网络虚拟化场景;
3、通过DPU、可编程硬件等,推动高性能VPC技术在阿里云智算场景的大规模部署等。
学历&工作年限:统招本科以上学历
要求:
1、5年及以上网络相关经验;
2、精通计算机网络和网络编程,精通至少一门主流编程语言,比如C/C++, Python, Go等;
3、精通TCP/IP协议栈、DPDK、OVS等网络高性能传输技术等。
职责:
1、负责阿里云面向AI智算场景的云网络控制系统的设计研发工作。
2、负责云网络控制器平台性能优化,为AI GPU计算、通用CPU计算提供极致的网络弹性需求。
3、利用AI DevOps技术提升云网络控制器研发效率、运维效率和系统的整体稳定性,并形成标准化的运维产品方案落地等。
学历&工作年限:统招本科以上学历
要求:
1、精通Java编程语言,3年以上相关开发经验,熟悉常用设计模式。
2、熟悉Spring、iBatis、Struts等开源框架以及MySQL、Redis、消息队列等中间件的基本原理并有一定应用实践。
3、熟悉分布式系统以及高并发服务核心技术,熟练使用JVM性能调优工具,并具备高并发服务架构设计能力等。
城市:杭州
薪资:50-120W
职责:
1、 参与共i战略级产品SLS研发,参与面向AI应用场景的数据采集、处理、查询分析等功能开发与设计;
2、数据索引和查询分析引擎优化,通过数据编码、压缩、向量索引、倒排索引、SQL执行优化、CodeGen等各类技术,实现百~千亿数据实时查询秒级延时,提供极致查询体验;
3、分布式系统精细化调度,提升在线系统执行效率和资源利用率等。
学历&工作年限:统招本科以上学历
要求:
1、熟悉AI领域,对于AI应用数据特征,数据存储和查询需求有深入理解;
2、在高性能数据结构、数据编码压缩、向量构建和检索、索引查询算法上深入研究,熟悉分布式SQL优先;
3、高性能网络服务器编程经验,熟悉异步IO、内存管理、多线程同步等技术,有Linux内核研究经验更佳。
城市:杭州/北京
薪资:50-120W
职责:
1、负责云原生产品的定义,设计及商业化落地。
2、制定产品策略以及市场策略,以业务成功为导向,协同研发,售前架构师,运营,文档等多角色共同达成业务目标;
3、深刻理解客户业务和场景需求,追踪行业发展趋势及技术发展动态,规划产品演进路径,及迭代等。
学历&工作年限:统招本科以上学历。
要求:
1、5年以上云原生相关产品技术开发及产品经验。对容器,serverless,消息队列,可观测,微服务,devops领域中的一个以上有深入了解;
2、具有很好的沟通技巧,对外可以很好的与客户沟通澄清需求,对内能够与研发,售前,销售等多角色沟通协同;
3、精通解决方案架构设计并可以形成文档,具备撰写技术文档的能力如技术方案,场景描述,客户案例等。
城市:杭州
薪资:50-120W
职责:
1、主导 AI 网关的系统设计与实现,独立完成 AI 模块的完整设计、开发工作,并保证功能交付的质量与稳定性。
2、主导 AI 网关的用户洞察,产品链接,需求实现,主动组织推动上下游团队的协作,按时保质地交付用户功能需求。
3、主导 AI 网关的高可用能力构建,主动通过单元测试、功能测试、性能测试、容灾演练等持续提升自身负责模块的稳定性能力等。
学历&工作年限:统招本科以上学历
要求:
1、具备强烈的技术好奇心,专注网关 (Nginx/Higress/APISix/Kong) 等领域相关经验。有研发生产级高可用分布式系统者优先考虑。
2、熟练掌握 Golang 编程语言及其技术栈。具备良好的软件工程研发素质、极限编程以及敏捷开发经验者优先。
3、熟悉 AIAgent、MCP、A2A、Memory 相关领域知识,有实际 AIAgent、MCP 开发经验的优先考虑。
城市:杭州
薪资:50-120W
1、基于对目前主流AI芯片的深刻理解,分析硬件系统结构,提供软硬件优化实践和调优指南;
2、了解市场上主流AI,大数据,HPC应用对异构计算系统设计的挑战,应用AI加速芯片,设计打造高效异构计算产品;
3、聚焦异构资源在线性能分析,负责系统级性能分析和业务瓶颈定位,助力异构集群的极致稳定等。
学历&工作年限:统招本科以上学历
1、拥有扎实的编码功底,精通C/C++/Go/Rust等语言,拥有规范的工程化能力;
2、深入理解Linux系统,有大规模生产系统软件的开发与运维经验;
3、有大规模GPU集群监控,性能调优/profiling,调度经验等。
城市:杭州/北京/上海
职责:
1、作为业务子系统的负责人,进行方案设计和代码开发;
2、配合上下游进行,进行架构、设计、验证 等各领域的工作,确保高质量交付;
学历&工作年限:统招本科以上学历
1、7年以上ASIC设计经验,有清晰的思路和分析能力,有过先进工艺的TO和调试经验:
2、熟悉ASIC设计的全流程,熟悉ASIC底层结构;
3、熟悉Spyglass,Synthesize,STA,DFT,Formal工具等。
城市:北京
薪资:50-120W
职责:
1、SOC设计:负责S0C微架构文档和代码实现,时序优化,确保前端交付的各项质量检查,指导SOC设计及验证工程师完成实现及验证工作等。
2、SOC后端实现:负责推动,指导Design Service 完成芯片从Netlist到GDS输出的全部工作,解决先进工艺(3,5,7nm)下的设计挑战等。
学历&工作年限:统招本科以上学历
要求:
1、5年以上IT、互联网、云计算开发相关工作经验及Coding经验;2年及以上相关产品/技术的开发经验;
2、充分理解自己团队在生产关系大图中的定位,具备较高复杂度项目的管理能力,与业务和协作团队关系;
3、熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享。
城市:北京
薪资:50-120W
职责:
1、 深入理解块存储、分布式存储的原理、技术架构,设计 & 开发软硬件协同的加速方案;
2、负责服务器产品测试策略、测试方案,测试用例,测试工具的定义、开发以及优化,支撑项目产品高效交付;
3、与各团队密切配合,推进服务器整机产品在块存储 / 数据库等场景的落地等。
学历&工作年限:统招本科以上学历
要求:
1、5 年以上存储领域的工作背景,熟悉存储软件和分布式系系统的开发,具备存储软件 / 硬件开发和产品化经验;
2、熟练使用 C/C++/Python 等编程语言中的一种及以上,具有相关的开发经验
3、熟悉 Linux 系统和工具,具有系统软件调优经验优先等。
城市:杭州
薪资:50-120W
职责:
1. 负责研发 AI 类算法的计算性能优化能力,解决大模型等情境的算力和访存瓶颈,提升 AI 模型在 GPU、AI 加速器等硬件上部署性能和效率,推动大模型普惠应用和高性价比的竞争力;
2、负责研发业界 SOTA 的计算性能优化算法创新和工程落地;
3、负责高性能 AI 基础设施的构建,通过结合模型算法和硬件来充分挖掘软硬协同的组合优化潜力,实现单一领域无法达到的优化边界和收益等。
学历&工作年限:统招本科以上学历
要求:
1、熟悉深度学习算法,对 AI 深度学习相关知识和技术栈有清晰的的理解和认系统性的认知;
2、熟悉 AI 部署和推理流程,工程能力强,具备独立工程研发、性能分析和落地能力;
3、熟悉常见的性能分析及优化加速方法,有 GPU 优化和算子优化相关经验和能力等。
每天更新科技类岗位(半导体/新能源/存算一体/智能制造/5G通信技术/汽车电子/具身智能等),点击下方关注不迷路~