Data for AI Meetup @上海（2025-12-20）

时间： 2025-12-20 周六 13:30 ~ 17:30

地点：

上海市

导航

主办：

Data for AI

票种：

数量：

活动介绍

易拉宝.png

🎯 为什么你应该来？

五大技术议题，覆盖AI数据全链路！

本次 Meetup 汇聚了来自莉莉丝游戏、Datastrato、IBM、腾讯、上海 AI Lab 的一线工程师，分享他们在数据基础设施领域的最新实践：

1️⃣ Trino 在莉莉丝游戏的演进之路

韩前斌 | 莉莉丝高级大数据开发工程师

深度剖析 Trino 在游戏行业的定制化开发实践：

基于 Alluxio 的容错优化
Iceberg Upsert 语义支持
StarRocks 和 Gravitino 连接器集成
构建高效 OLAP 平台的实战经验

2️⃣ 迈向多模态湖仓：Apache Gravitino 1.1 & Lance + Daft

余启、齐赫 | Datastrato 工程师（Apache Gravitino Committer）

AI 时代的数据管理新范式：

Gravitino 1.1 如何打破多模态数据孤岛
统一权限模型与 IRC 安全机制
Lance + Daft 实战 Demo
构建 AI 原生多模态湖仓的完整方案

3️⃣ Apache Gluten：让 SparkSQL 性能翻倍的插件

Ma Rong | IBM 大数据开发工程师（Apache Gluten PPMC）

探索 Apache 基金会新兴项目如何加速大数据计算：

向量化执行与列式数据格式优化
高效内存管理技术
Gluten + Velox backend 实战
大规模数据处理的性能提升秘籍

4️⃣ Gravitino IRC 在腾讯 TBDS 中的应用与实践

徐潇 | 腾讯大数据系统开发工程师（Apache Gravitino PMC）

腾讯大数据平台的元数据架构演进：

基于 Gravitino IRC 的统一元数据治理实践
突破 Hive Metastore 的局限性
实现跨引擎、跨存储的元数据统一管理
Iceberg REST Catalog 在生产环境的落地经验
企业级大数据平台的架构演进思考

5️⃣ 智能解析，质造未来：MinerU 助力 AI-Ready 数据自由

李薇 | 上海 AI Lab 高级工程师

破解高质量训练数据的核心挑战：

从"规模扩张"到"质量优先"的范式转变
MinerU 多模态智能文档解析引擎
OmniDocBench 文档评测标准
为 AI-Agent 和 RAG 知识库构建高效数据管道

🤝 感谢强大的社区联盟和赞助支持方

本次活动由 Data for AI 社区 和 ALC Shanghai 联合主办，得到了众多开源社区的支持：

合作社区：LF AI & Data APAC、ALC Beijing、Hadoop China、Gluten 中文社区、Gravitino 中文社区、Daft 中文社区、LanceDB 中文社区、开源社、DataFun、dbaplus

赞助方：Datastrato.ai

场地支持：云赛空间

这不仅是一次技术分享，更是一次开源社区的大联欢。你将有机会：

与 Apache 项目 PMC/Committer 面对面交流
结识来自一线互联网公司的技术专家
加入活跃的开源技术社区
拓展你的技术人脉网络

👥 加入我们！

✅ 大数据平台架构师 / 开发工程师

✅ AI 基础设施建设者

✅ 数据科学家 / 机器学习工程师

✅ 开源技术爱好者

✅ 对 AI 时代数据技术感兴趣的从业者

无论你是正在构建企业级数据平台，还是探索 AI 应用落地，这场 Meetup 都将为你带来实战经验和技术启发。

💬 联系我们

Data for AI 社区联系人：Richard 林旅强，微信号 OPQRichard 欢迎添加微信咨询：

加入社区组织
参与活动报名
提交议题分享
社区合作洽谈
赞助支持咨询

🌟 关于我们

Data for AI（简称 Data4AI）是一个聚焦数据与人工智能基础设施生态的技术交流社区。

社区的分享嘉宾来自全球数据与人工智能领域众多头部厂商与新锐创业团队，包括 Alibaba、Anyscale、AWS、Bilibili、ByteDance、Databricks、Datastrato、eBay、IBM、Intel、LanceDB、Lilith、Meta、Microsoft、NVIDIA、OpenAI、Pinterest、Roku、Tencent、Uber、Xiaomi、Zilliz 等企业。如此多方参与，让社区能持续输出高质量、贴近行业一线的技术内容。

我们的组织者来自 Linux 和 Apache 等知名开源基金会和社区。这让 Data for AI 在保持开放友好氛围的同时，也具备中立、可信、专业的技术讨论基础。

Data for AI 的目标，是为数据工程、AI & Data Infra 等领域的开发者打造一个轻松而专业的交流平台。通过线上线下的活动，大家可以一起探索前沿趋势、分享实践经验、拆解真实业务案例，打破行业信息壁垒，连接优质同行伙伴，共同构建一个持续成长、价值共生的技术社群网络。

声明：本页面所有信息均由商家提供，大数跨境仅提供技术支持