大数跨境

高通:生成式AI商机不只在数据中心,混合式AI才是真正王道

高通:生成式AI商机不只在数据中心,混合式AI才是真正王道 问芯
2023-06-27
2
导读:生成式AI火爆,带给微软、英伟达、Google、脸书、AMD等全球科技巨头一场热情四射的狂欢盛宴。 “AI教
生成式AI火爆,带给微软、英伟达、Google、脸书、AMD等全球科技巨头一场热情四射的狂欢盛宴。 “AI教主黄仁勋声势全球攀顶,AMD端出挑战英伟达的新品MI300系列GPU则是出师不利,且被华尔街一路看衰; 联发科则因为黄仁勋在COMPUTEX去站个台,也勉强与AI沾了个边。

但,似乎少了什么,大家都忘了高通吗?

不见旧人哭,只见新人笑。身为手机霸主的高通,并没有在这场激烈的AI肉搏赛中退场或是隐身,而是选择了一个适当的时机,另辟蹊径,向大家推广:混合式AI”才是让生成式AI真正普及的解决方案。

生成式AI 的应用非常广泛, 包括搜索、 内容生成、 生产力、 代码编写等等,颠覆了众多技术领域。生成式AI能够在数秒之内通过大型基础模型创作内容,但很多人将生成式AI 和云端联系在一起,高通以技术打开了边缘端侧的生成式AI商机之门。

台积电董事长刘德音在股东会上就划重点:外界在看生成式AI商机聚焦在数据中心,好像都是英伟达的生意,但实则不然,高通提出的混合式AI架构未来也会应用在手机、PC上,未来庞大的AI商机不会只有在云端。

高通宣言:混合式AI才是 AI 的未来。什么是混合式AI

当今,传统计算从大型主机演变成云端和边缘端结合的模式,AI 处理也必须分布在云端和终端进行,才能实现 AI 的规模化扩展并发挥其最大潜能。

混合式AI架构的运行方式是:在云端和边缘终端(如智能手机、汽车、个人电脑、XR 头显和物联网终端)之间分配并协同处理 AI 工作负载,混合式AI架构或仅在终端侧运行 AI ,这样的做法最大优势是节省成本。

高通指出,在以终端为中心的混合式AI架构中, 云端仅用于处理终端侧无法充分运行的AI 任务 。随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合式AI的潜力将会进一步增长。

举例来说,据估计使用基于生成式AI 的搜索, 每一次查询 ( query ) 其成本是传统搜索方法的10倍, 而这只是众多生成式AI 的应用之一。混合 AI 可支持生成式AI 利用边缘侧终端的计算能力来降低成本。 

混合式AI 架构可以根据模型和查询需求的复杂度等因素,选择不同方式在云端和终端侧之间分配处理负载。例如, 如果模型大小、提示 ( prompt ) 和生成长度小于某个限定值,并且能够提供可接受的精确度,推理即可完全在终端侧进行。

如果是更复杂的任务,模型则可以跨云端和终端运行。混合式AI 还能支持模型在终端侧和云端同时运行,也就是在终端侧运行轻量版模型时,在云端并行处理完整模型的多个标记( token ), 并在需要时更正终端侧的处理结果。

高通指出,参数超过10亿的 AI 模型已经能够在手机上运行,且性能和精度达到与云端相似的水平。不久的将来,将看到100 亿或更高参数的模型将能够在终端上运行。

高通表示,作为终端侧AI领导者, 面向包括手机、汽车、XR头显与眼镜、PC和物联网等在内的数10亿边缘终端, 将提供硬件和软件解决方案推动混合AI 规模化扩展独具优势。

高通进一步指出,智能手机解决方案的能效与竞品对比,大约有两倍的优势,凭借一系列基础研究, 以及跨AI 应用、 模型、 硬件与软件的全栈终端侧AI 优化,持续引领终端侧 AI 解决方案发展。

高通产品管理高级副总裁兼 AI 负责人 Ziad Asghar解释,云端处理存在成本的乘数效应,用户进行查询的次数越多,模型规模就越大,使得云端成本上升。不仅如此,应用数量和用户数量的增加,也会导致成本提高。因此,在云端完成所有生成式 AI 所需的工作负载是难以实现的,而使用混合AI 的方式,可以将部分处理交给终端侧完成,从而真正发挥生成式 AI 的优势。 

生成式 AI 引领下,市场上也出现了众多非常庞大的模型。高通认为要真正释放生成式 AI 的全部潜能,AI 需要在边缘侧运行,该技术可以实现在所有高通的产品线上。

手机:以骁龙为例, 生成式 AI 能够基于视频会议的语音转录内容, 制定任务清单, 并自动生成完整的演示文稿,让生产力倍增。骁龙计算平台的独特优势在于,拥有专用的硬件单元,能原生支持生成式 AI 在本地使用,这与目前市场上其他的产品完全不同。 

XR:生成式 AI 能够根据终端侧所提供的用户信息进行定制和优化,为用户带来独特的虚拟世界体验。如果只在云端运行,则不具备终端侧的情境信息, 因此利用终端能够带来更好的用户体验。 

汽车:在座舱中使用对话式 AI ,能够帮助用户规划路线,在去餐厅的路上推荐用餐选项,或者在上班途中列出今日的工作事项。生成式AI 还可以根据出发点和目的地信息,制定不同的路线规划,找到最佳路线。

物联网:如果来到一个新的城市,生成式 AI 能够帮助提供旅行目的地推荐。同时也适用于其他的垂直领域,如医疗、零售、酒店管理等。

高通也实现了全球首个 Android 手机上的 Stable Diffusion 终端侧演示。Stable Diffusion 是参数超过10 亿的超大神经网络基础模型,能够基于输入的文本提示生成图片。高通在终端侧实现在飞行模式下,通过全栈AI 优化,在15 秒内完成 20 步推理,生成包含细节的图像。

高通指出,如果在云端运行一个超过10 亿参数的生成式 AI 模型, 可能需要数百瓦的功耗,但在终端侧运行需要的功耗仅有几毫瓦。 高通的AI 技术能够支持终端在既定功耗下完成更多处理工作,这是竞争对手在生成式AI 领域所做不到的。

混合AI的优势在于, 即使不同终端处理能力不尽相同,但仍然能够提供相近的体验,同时带来包括 成本、能耗、隐私与安全、个性化等优势,还能通过5G连接技术确保信息在端到端之间进行高效传输。

高通 AI 软件栈最关键的核心优势在于,模型一旦开发出来,就可以在不同地方使用,再与混合 AI 部署相结合,形成杀手级的组合,将帮助生成式 AI 在不同终端上进行规模化扩展。不久将来,可看到100亿或更大参数的生成式AI 模型将能够在终端上运行。

【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容 628
粉丝 0
问芯 AI、机器人和未来。
总阅读45
粉丝0
内容628