大数跨境
DigitalOcean 开发者沙龙:AI 模型的性能与成本优化专场
DigitalOcean 开发者沙龙:AI 模型的性能与成本优化专场
不支持退款
该活动不支持退款
时间: 2025-06-07 14:00 ~ 17:00
地点:
北京市 导航
主办:

卓普云科技

票种:
数量:

分享:
活动介绍

DigitalOCean 首度开启中国区技术沙龙,欢迎DigitalOcean的老用户来与我们交流。

活动亮点

亮点1:大模型训练的存储成本优化

大模型训练中,涉及到大量数据的成本,这部分的成本不容忽视。JuiceFS将分享通过对象存储的分部署文件系统,打造一个高效且经济的存储解决方案。

亮点2:推理场景下的成本和性能优化

通过RAG优化,降低GPU的调用量,是最直接的降低推理成本的方式。商汤和NebulaGraph将分享RAG优化解决方案,提高推理性能,降低推理成本

亮点3:GPU的选型和架构设计

AI训练和推理,GPU资源是必不可少的。GPU如何选,架构上如何设计,以便于降低成本、提高容错且考虑到未来迁移。

通过参与此次活动,你将获取选卡、架构设计、性能优化、成本优化多方面的解决方案。

活动流程

14:00-14:40

JuiceFS在大规模 AI 场景中遇到的存储挑战与实践经验

苏锐,Juicedata 合伙人

AI 业务涉及大量非结构化数据,包括文本、图像和视频等格式,同时企业还必须应对数据量的急剧增长。在这样的背景下,分布式文件系统成为 AI 时代数据存储的一项关键技术。相比传统的全闪和内核并行文件系统,JuiceFS 作为一款基于对象存储的分布式文件系统,提供了一个既经济又高效的云上存储解决方案,并已经被应用在多个AI场景,如大模型、自动驾驶等。

在本次活动将分享我们在大规模 AI 场景中遇到的存储挑战与实践经验。

大纲

性能:AI 训练中,如何为 GPU 提供充足的吞吐?

成本:面对指数级增长的数据量,如何平衡存储成本与性能?

多云:如何应对多云架构中,数据同步、一致性等复杂的运维挑战?

前沿场景案例分享 

自动驾驶

大模型研发

14:40-15:20 

议题:企业级RAG性能优化实践

王志宏,商汤科技大装置事业群研发总监

内容简介:

到目前为止,RAG依然是当下最落地的大模型技术(没有之一),但很多企业面临RAG效果差或者性能不佳的问题。在本次活动中,我们将分享:

1. 通用RAG的流程解析

2. 冷启动加速

3. 召回模块加速

4. 生成模块加速

15:20-16:00 

构建图和视频生成式大模型最快的推理框架

成泽毅,WaveSpeedAI 创始人

16:00-16:40 

NebulaGraph: 如何使用 GraphRAG 构建企业级知识库

邵晓凌 NebulaGraph GenAI 解决方案架构师

1. 大模型企业化应用的核心挑战

剖析行业痛点:数据隐私性、领域知识适配性、计算资源成本、推理实时性等关键瓶颈,企业级需求与传统通用大模型的能力鸿沟。

2. 通用RAG技术体系解析

技术定义:检索增强生成(Retrieval-Augmented Generation)的架构范式与核心价值

实现路径:文档切片、向量检索、生成优化的全链路技术方案

3. Graph RAG的技术突破性优势

知识结构化:基于图数据库的实体关系建模实现深层语义关联

动态推理能力:通过图遍历实现多跳逻辑推理与上下文扩展

对比实验:与传统向量检索方案在复杂查询场景下的性能差异

4. NebulaGraph AI平台的GraphRAG 融合创新实践

技术集成架构:混合检索策略(向量+图+关键词)的协同优化

企业级解决方案:

✓ 私有化知识图谱构建

✓ 细粒度访问控制机制

✓ 领域自适应微调管道

16:40-17:20 

从选型到架构,如何构建 AI 训练和推理提供AI算力资源

Derek Ding,DigitalOcean Cloud Solutions Expert,卓普云科技解决方案架构师

越来越多的企业开始开展自己的AI业务,但是很多企业面临这样的问题:如何进行选型,架构上如何设计,如何降低成本?在本次活动,我们将分享:

架构对比:算力、显存、互联带宽

性价比分析:训练/推理成本、能耗比

适用场景:LLM训练、推理部署、多卡扩展

演讲嘉宾:丁可, DigitalOcean Cloud Solutions Expert,卓普云科技解决方案架构师

活动嘉宾

丁 可

DigitalOcean Cloud Solutions Expert

卓普云科技解决方案架构师

云计算与数据分析领域从业18年,先后供职于Digital Ocean中国、Neo4j图数据、亚马逊AWS和甲骨文数据库等公司担任架构师与技术咨询和实施顾问。关注新兴人工智能技术与当前IT服务的结合和重构,人工智能的工程化与落地等领域。人工智能与数据和计算的结合。对开源社区与AIGC有着浓厚的兴趣与参与。AWS认证DevOps专家/解决方案专家/数据专家,Neo4j图数据科学专家。

苏锐

Juicedata 合伙人

Juicedata 合伙人,作为 1 号成员参与创建 JuiceFS,一直深度参与在开源社区中支持开发者使用 JuiceFS。

成泽毅

WaveSpeedAI 创始人

创始人成泽毅是stable-fast、ParaAttention、Comfy-WaveSpeed等多个行业明星开源项目作者,多次实现行业SOTA性能突破。创立WaveSpeedAI前,成泽毅曾在硅谷知名AI基础设施公司担任推理引擎负责人,推动公司图像生成业务推理性能提升10倍,成为支撑公司商业爆发的关键技术力量。

在成泽毅的带领下,WaveSpeedAI对标硅谷一线AI Infra公司,已在多模态生成领域取得技术领先优势。

邵晓凌

GenAI 解决方案架构师|NebulaGraph 

NebulaGraph 图技术解决方案专家,曾就职于谷歌、福特等世界500强的技术管理岗。复旦计算机硕士,10+ 技术专利持有者。现在 NebulaGraph 主导设计 Graph+LLM 融合架构,推动 GraphRAG在企业级知识库应用落地中实践检索。

 王志宏

商汤科技大装置事业群研发总监

曾担任商汤自研的深度学习框架 SenseParrots 的研发负责人;目前负责探索大模型应用的商业落地,并主导多 Agent 大模型应用开发工具链 LazyLLM社区版及企业版的研发工作。

声明:本页面所有信息均由商家提供,大数跨境仅提供技术支持

分享:
收藏
举报
活动报名
    暂无内容
    暂无数据