大数跨境
0
0

Traversal 如何借助 DigitalOcean,把 AI SRE 带入“提前发现故障”的时代

Traversal 如何借助 DigitalOcean,把 AI SRE 带入“提前发现故障”的时代 卓普云 AI Droplet
2025-12-12
1

Traversal 是一家 AI 初创公司,正在攻克可观测性领域最棘手的难题之一:从嘈杂数据中“杀”出重围,精准定位故障根因并给出修复方案,从而缩短宕机时间、减轻工程师压力。这类新兴工具被称为“AI 站点可靠性工程(AI SRE)”,而 Traversal 正凭借先进的 AI 与因果机器学习(CML)把“生产系统根因分析”这一监控圣杯变成现实。

基础设施工程师 Carlo Ruiz 表示,Traversal 的研究基因是其愿景的核心。“很多 AI 工具只做告警分诊、事后救火,而我们想再往下钻一层。”他说,“跨复杂生产系统的故障根因分析早被公认为难题,我们正在打造真正能解决它的系统。”

“实验 + 严谨 + 速度”并重

2024 年初成立以来,Traversal 已迅速扩张至 50 多名工程师,涵盖 AI 研究员、数据科学家与基础设施专家。创始团队的学术背景塑造了“实验 + 严谨 + 速度”并重的文化。“任何前沿 AI 团队都在同时迭代技术和用户体验,”Carlo 说,“当我们看到 Traversal 真正解决客户痛点时,动力满满。”

技术团队成员 Prashanthi Ramachandran 认为,多元背景是最大优势。“我们有来自交易公司、初创公司、学界和大厂的人,这种多样性让产品设计更立体——不仅懂 AI,也懂系统、懂人。”

Traversal 的 AI SRE 引擎由一群协同工作的智能体驱动,可分 Reactive(响应)与 Proactive(主动)两种模式:既可在类聊天界面里直接回答工程师提问,也可在后台持续扫描数据,提前捕捉异常。Carlo 总结:“系统不傻等告警,而是主动找出可能出问题的苗头。”

选择 DigitalOcean:开发者友好的 AI 基础设施

作为 B2B 公司,Traversal 的大客户每天产生海量可观测数据,平台必须贴近数据——所谓“数据引力”原则。当客户托管在 DigitalOcean 时,Traversal 干脆也部署过去。“我们要离客户最近,”Carlo 说,“一旦跑起来,发现我们自己也很喜欢这个平台。”

原本出于务实的选址,很快变成偏爱:界面简洁、开发者体验极佳。“研究人员不是云专家,点几下就能跑起来,不用先闯 20 道安全关卡,”Carlo 点赞。Prashanthi 从其他云跳槽而来,第一印象同样是“清爽”。“很多云配置选项无穷无尽,简单任务拖成马拉松;DigitalOcean 干净利索,正是初创公司需要的速度。”

用 DigitalOcean 驱动 AI 研究与生产

如今 Traversal 的核心基础设施深度依托 DigitalOcean 全家桶:DigitalOcean Kubernetes(DOKS)、GPU Droplets、以及 Gradient™ AI 平台的 Serverless Inference。

核心应用(AI 智能体、Web 服务、支撑服务)全部跑在 DOKS 上。“Kubernetes 是现代应用的事实标准,用 DOKS 几分钟就能拉起稳定安全的集群,”Carlo 说。

AI 侧,团队用 Gradient™ AI GPU Droplets 完成模型训练、微调与评估。每个企业的可观测数据独一无二,Traversal 需为客户定制模型。“GPU Droplets 弹性高,想跑啥都行,”Carlo 介绍,使用的主力卡为 NVIDIA HGX H100/H200。

生产级推理则交给 Serverless Inference。“想调多少调用就调多少,完全不用管基础设施,自动伸缩太香,”Carlo 说。Prashanthi 补充:“Gradient AI + DigitalOcean 一站式搞定,创业阶段再也不用东拼西凑。”

企业级可靠性

对客户而言,可靠性就是生命线。“客户出故障时,我们绝不能也挂,”Prashanthi 强调。Traversal 每月经 Gradient AI 平台调用数百万次 API,可用率近 99.96%,部分产品接近 100%。Carlo 把功劳归于 DigitalOcean“强大与简洁的平衡”:“别的云给你无数旋钮,最后只会眼花;DigitalOcean 点几下就稳稳跑起来。”

迈向智能可观测的未来

随着业务扩张,Traversal 计划更深地挖掘 GPU Droplets,并自研中间件,让研究员对训练管线拥有完全掌控。“我们会在 GPU Droplets 之上做更多抽象,同时继续用 Serverless Inference 承载不断增长的推理负载。”

对 Traversal 而言,DigitalOcean 不只是云供应商,更是实现使命的加速器。正如 Prashanthi 所言:“DigitalOcean 让我们更快、更稳,把精力真正集中在核心——帮工程师以前所未有的速度解决问题。”




About us

 关于 DigitalOcean
作为全球领先的云基础设施提供商之一,DigitalOcean 专注于为开发者和企业提供简单、高性能的云服务,包括 Droplet 云主机、 GPU Droplet 云服务、托管数据库(PostgreSQL、MySQL 、MongoDB 、Kafka 和 Redis)、对象存储、块存储和Kubernetes、负载均衡等。
自2012年成立以来,凭借简单透明的定价和开发者友好的产品,DigitalOcean 在全球已经有 60 万企业用户在使用。如今,对于中国的出海企业,DigitalOcean 还特别通过中国区独家战略合作伙伴卓普云提供技术支持、售前服务。所有用户都可以通过卓普云与 DigitalOcean 进行直签,并享受相同的服务以及中文的技术支持。
往期回顾

Read More

【声明】内容源于网络
0
0
卓普云 AI Droplet
DigitalOcean中国在等你
内容 209
粉丝 0
卓普云 AI Droplet DigitalOcean中国在等你
总阅读2
粉丝0
内容209