关键要点 ▼
自主AI将自动化重复性EDA任务,使工程师能专注于更高价值的设计工作。
数据中心基础设施必须快速演进:提升机架功率、采用芯片直连和浸没式冷却技术,实现微秒级延迟。
混合多云存储和端到端数据管道对性能、治理及自主数据访问至关重要。
实现可信赖的采用需要分阶段部署、人工监督、置信度评分以及监控生产力和质量的指标。
NetApp最近举办了一场关于“智能体AI作为EDA未来及其对基础设施影响”的网络研讨会。嘉宾阵容强大,包括Cadence云业务副总裁Mahesh Turaga(他介绍了Cadence在基础设施和智能体AI方面的实践),以及Dan Nenni(半导体百科先生)担任主持人,还有AMD院士Khaled Heloue(CAD/方法论/AI领域)、Cadence战略与新业务高级总监Rob Knoth,以及NetApp行业负责人Janhavi Giri(前英特尔员工)。这场研讨会非常精彩,不仅展望了智能体AI的未来,还提供了关于如何开始并推进AI及智能体技术应用的实用建议。由于研讨会时长较长,我不会过多讨论愿景部分,而是分享一些近期观察到的要点。
基础设施的影响
除非你与世隔绝,否则不可能不知道超大规模运营商和潜在竞争者正在投入巨额资金——高达数千亿美元——建设巨型数据中心。但你可能不了解(不过这并不令人意外)的是,其中60%的投资流向了技术开发领域——也就是我们所在的行业。这对系统和半导体生态系统而言是多么巨大的机遇!
Mahesh指出了这些数据中心面临的部分基础设施挑战。原本功率为10-15kW的机柜现已攀升至100-120kW,到2027年单个机柜功率可能达到1-2MW。直接芯片液冷技术已成为必然选择,而在更高功率下我们将不得不转向浸没式冷却。此外,机柜内部及之间的AI核心数据流现在要求微秒级延迟,而此前毫秒级延迟尚可接受。
基础设施的快速变革带来深远影响,尤其是对设计和运维的支持(例如规划新旧硬件更替)。GPU设计周期为12-18个月,硬件折旧期为5-6年,因此必须谨慎规划更新换代。Cadence通过其Reality Digital Twin与英伟达密切合作,帮助企业针对这些目标及其他(散热、冷却等)需求设计和维护数据中心。
NetApp在存储和云运营管理方面也发挥着重要作用。大型企业的设计数据往往分散在全球各地:美国、欧洲、印度、亚洲。他们还需要充分利用计算/AI选项的灵活性:本地部署、云端及混合配置。特别是在智能体系统中,从分布式数据模式中学习可能会带来高度复杂性和难以接受的性能开销。
有效管理复杂性和性能部分取决于智能体架构,同时也需要存储和云基础设施提供充分的智能体感知支持。NetApp通过端到端数据管道实现这一目标:跨混合多云环境定位所需数据、根据数据源变化实时更新、在整个数据生命周期实施治理与安全保护,并为AI应用提供必要的数据转换支持。全面支持MCP(智能体通信标准)标准,并与Kubernetes等容器编排平台深度集成。
讨论要点总结
Dan以一个精彩问题开场:哪些最耗时且重复性高的工作可由自主AI实现自动化?这个问题直击媒体夸大AI威胁的荒谬性,同时揭示了其对工程师的真实价值(工程师不会被AI取代,反而能更专注于高价值工作)。
当今工程师的日常被低效事务性工作占据:学习陌生流程(尤其对初级工程师)、用Tcl/Skill/Python等扩展语言编写脚本、处理程序崩溃或PPA目标未达成时的应对、为设计评审整理进度报告。这些必要但琐碎的任务消耗了大量本可用于创造性推进设计的时间。以任务为中心的智能体结合RAG检索能减少摩擦,帮助新人快速上手。自主化方法更能通过自动化彻底解放人力。
尽管部分应用已走在前列,我们仍处发展初期。用自然语言驱动EDA工具将是重大突破(未来工程师回顾我们现在使用的原始脚本方式定会震惊)。重复性分析的自主化也是明显应用场景:对多组参数进行批量分析并提炼结果,返回最值得深入研究的三个选项。这类方法易于信任,因为自主系统就像能在指导下学习的优秀实习生——你仍可监督其工作,但无需亲历亲为。
在验证、布局规划、实施优化和多物理场分析领域已有实践。虽然目前主要是特定分析的效率优化,但可畅想更远。哈立德提出可尝试简单模块的全程自动化设计。
关于风险管理?共识是新目标必须分阶段谨慎引入人工监督。建立信任的方法需重点投入:如置信度评分、"展示推导过程"报告,以及衡量应用提升效率/QoR的指标。我们不想把常规流程中的琐事变成与自主系统博弈的新琐事。
另一个好问题探讨如何最佳训练自主系统。这涉及半导体/系统设计中自主系统的架构设计、权责划分(需兼顾商业机密保护与专业训练能力),以及是否会催生自主系统生态。目前讨论倾向于局部增强现有方案的智能体,辅以RAG机制解决"如何操作"问题。虽是不错的起点,但将部分RAG数据嵌入智能体或许能更优。
您可以观看网络研讨会
https://www.netapp.com/video/-dz4rlublus/is-agentic-ai-the-future-for-eda-and-what-does-it-mean-for-eda-infrastructure/

