职位编号:162349
职位地点:杭州
行业:量化私募
年资要求:3年以上
-
负责设计开发AI分布式超算集群,全方位优化集群性能,包括但不限于分布式数据读写策略、负载与调度策略、GPU计算、CPU计算等优化; -
研究与改造深度学习模型底层实现,优化模型算子,提升模型训练与推理性能; -
软硬件协同优化,结合实际业务与优化目标设计硬件系统; -
技能栈关键词:高性能计算, CUDA,操作系统,硬件(cpu,gpu,nvme,memory,RDMA网络)。
-
对高性能计算/操作系统/RDMA网络/CUDA中若干方向有深入研究; -
熟练使用C++/Python/Pytorch,较强开发能力; -
对系统性能有极致追求,关心前沿技术的实际落地,具有强烈的责任心; -
ASC/ISC/SC等超算竞赛获奖选手或有相关工作经验优先。

