搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
产业带
导航
知识体系
工具箱
产业园
更多
百科
找货源
跨境招聘
DeepSeek
首页
>
英特尔、谷歌和AMD同天发布新款AI芯片,谁能切走英伟达的蛋糕?
>
英特尔、谷歌和AMD同天发布新款AI芯片,谁能切走英伟达的蛋糕?
问芯
2024-04-10
0
导读:在生成式AI市场快速增长和巨大需求背景下,AI芯片领域的竞争正越来越激烈。
生成式 AI 市场还在迅猛增长。
这种增长的背后离不开对高性能计算硬件,特别是英伟达 GPU 芯片的巨大需求
。
英伟达在 AI 浪潮的助推下,市值在短
时间
内超过 2 万亿美元,仅次于苹果和微软。
据数据统计公司 Statista 预测,预计 2024 年,生成式 AI 的市场规模将达到 666.2 亿美元,到 2030 年市场规模有望达到 2070 亿美元。
由于芯片对 AI 的重要性和英伟达的统治地位,
传统半导体厂商和大型科技公司都在持续加码 AI 芯片领域
,以期能从英伟达手中抢下一定市场份额,或者摆脱对其依赖。
当地时间 4 月 9 日,英特尔、AMD、谷歌在同一天都发布了相关 AI 芯片产品。
英特尔在其年度
Intel Vision
2024 会议上,推出了新的人工智能芯片 Gaudi 3。Gaudi 系列芯片来自于英特尔 2019 年以 20 亿美元收购的 AI 芯片初创公司 Habana Labs。
英特尔在会上介绍,Gaudi 3 采用 5nm 工艺(上代为 7nm),相比前代,Gaudi 3 加强了网络带宽,
在处理 BF16 格式(被 AI 应用广泛使用)数据时性能提高了 4 倍
;相同 AI 集群中部署的 Gaudi 3 芯片可以更快速地相互交换数据,一台
服务
器可以安装 8 个 Gaudi 3 芯片。
(来源:英特尔官网)
会上当然少不了要和英伟达芯片做对比。英特尔内部评估显示,
与英伟达 H100 显卡相比,Gaudi 3 训练某些版本的 Llama 2 大语言模型
速度
要快 50%;推理速度比 H200 快 30%
。H200 是 H100 的增强版本,专门针对大语言模型任务进行了优化。
英特尔也意识到了生态的重要性,它表示,正在与十几家合作伙伴共同创建企业级的 AI 开放平台,旨在为公司提供优化运行 AI 模型的系统,这些系统整合了多家供应商的软硬件。
Gaudi 3 芯片预计在今年第三季度全面上市,第二季度会提供给原始设备制造商(OEM),具体价格未透露。
在同一天,AMD 也更新了其 Versal 系列芯片。此次更新可能不是 AMD 产品的重点,并没有开专门的发布会,但也值得一提。新推出的 Versal AI Edge Series Gen 2 和 Versal Prime Series Gen 2
采用单芯片智能方案,集成了用于预处理、AI 推理和后处理的多种处理器,可为 AI 驱动的嵌入式系统提供端到端加速
。
(来源:AMD 官网)
嵌入式系统是一种专门为某些特定任务而设计的计算系统,通常嵌入在更大的设备中以提供智能控制。如今随着嵌入式 AI、视频和控制应用的不断增长,对异构处理的需求越来越大。Versal 2 的集成方法不仅可以降低系统的复杂性和成本,还能提高能效和性能,使得嵌入式 AI 系统更加小巧、高效,同时缩短上市时间。
与初代相比,Versal 系列第 2 代产品组合能源效率提高3倍,新集成的 Arm CPU 的标量计算能力提高 10 倍。
Versal 第 2 代旨在满足自动驾驶、航空航天和国防、工业、医疗等行业的需求。该产品预计 2025 年底进行量产,在此之前会提供评估样品。
谷歌也于今日的
Google
Cloud Next 2024 会议上发布了名为 Axion 的全新处理器,
这是谷歌为数据中心设计的首款基于 Arm 架构的定制 CPU
。
(来源:谷歌官网)
虽然 GPU 是训练 AI 模型的主力,
但 CPU 在整个 AI 系统中也有其不可替代的作用
。CPU 更擅长处理序列任务和复杂的控制流程。在一些场景下,如数据预处理、AI 模型的部署和推理,以及处理不能高效利用 GPU 并行能力的任务时,CPU 是更合适的选择。
相较于市面上最快的基于 Arm 的同类产品,
Axion 的性能提升高达 30%。而比基于 x86 的产品,性能提升 50%,能效提高 60%
。由于建立在标准的 Arm v9 架构和指令集上,大多数应用无需重写代码即可在 Axion 上运行。
Axion 今年晚些时候会提供给 Google Cloud 客户,基于 Axion 处理器的虚拟机将在未来几个月内提供预览。
值得一提的是,谷歌现有芯片中除了最新的 Axion,在此之前已经发布了五代张量处理器 (TPU)。TPU 是谷歌为机器学习开发的专用集成电路,自 2015 年开始在内部使用,2018 年向第三方开放。长期以来,TPU 一直服务于谷歌YouTube、Gmail 和 Android 等诸多产品,并被用于训练谷歌 Gemini 大模型。最新版本是发布于 2023 年 12 月的 TPU v5p,性能接近英伟达 H100 芯片。
可以看到,AI 芯片领域的竞争正在加剧。
面对英伟达在 AI 芯片市场的领先地位,英特尔、AMD 等传统半导体公司除了在技术上进行竞争,也在寻求合作伙伴,构建生态系统,努力提供更加完整的解决方案。
而谷歌以及
亚马逊
、微软和 Meta 等科技巨头,也出于各种考量纷纷定制自己的 AI 芯片。首先,这有助于它们控制成本。根据 CB Insights 发布的 2024 年生成式 AI 预测
报告
,一颗 H100 的制造成本大约为 3320 美元,但平均售价已经达到 3 万美元,最高售价甚至一度达到将近 10 万美元。自研芯片的成功,也能避免芯片短缺风险、降低依赖,并最终可以向使用其云服务的企业出售芯片。
此外,相
比通
用 GPU,定制化的 AI 芯片不仅能够提供更加专业和高效的服务,还能够根据特定需求进行快速迭代和优化。
理论上,如果能够确保产量和降低成本,谷歌等公司应该能够提供比英伟达更好的产品
。
如今,英伟达得益于其在性能、软件生态系统兼容性和市场影响力方面的综合优势,依然在 AI 芯片领域保持着明显的领先地位。其他厂商在不断追赶的同时,英伟达也并不会停滞不前。在刚刚过去的 3 月,该公司也发布了 Blackwell 全新架构的下一代 GPU。在新芯片的加持下,训练相同参数模型需要的 GPU 数量和消耗的电力都可以缩减约 4 倍。
AI 芯片的发展对半导体产业产生了长远影响,接下来的问题是,谁能从英伟达的嘴里切走一大块蛋糕?
参考:
https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html
https://ir.amd.com/news-events/press-releases/detail/1189/amd-extends-leadership-adaptive-soc-portfolio-with-new
https://cloud.google.com/blog/products/compute/introducing-googles-new-arm-based-cpu
https://mp.weixin.qq.com/s/q5OT7YeQ8Q3HVdhprRJ6Ug
【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容
628
粉丝
0
关注
在线咨询
问芯
AI、机器人和未来。
总阅读
45
粉丝
0
内容
628