但,似乎少了什么,大家都忘了高通吗?
不见旧人哭,只见新人笑。身为手机霸主的高通,并没有在这场激烈的AI肉搏赛中退场或是隐身,而是选择了一个适当的时机,另辟蹊径,向大家推广:“混合式AI”才是让生成式AI真正普及的解决方案。
生成式AI 的应用非常广泛, 包括搜索、 内容生成、 生产力、 代码编写等等,颠覆了众多技术领域。生成式AI能够在数秒之内通过大型基础模型创作内容,但很多人将生成式AI 和云端联系在一起,高通以技术打开了边缘端侧的生成式AI商机之门。
台积电董事长刘德音在股东会上就“划重点”:外界在看生成式AI商机聚焦在数据中心,好像都是英伟达的生意,但实则不然,高通提出的混合式AI架构未来也会应用在手机、PC上,未来庞大的AI商机不会只有在云端。
当今,传统计算从大型主机演变成云端和边缘端结合的模式,AI 处理也必须分布在云端和终端进行,才能实现 AI 的规模化扩展并发挥其最大潜能。
混合式AI架构的运行方式是:在云端和边缘终端(如智能手机、汽车、个人电脑、XR 头显和物联网终端)之间分配并协同处理 AI 工作负载,混合式AI架构或仅在终端侧运行 AI ,这样的做法最大优势是节省成本。
高通指出,在以终端为中心的混合式AI架构中, 云端仅用于处理终端侧无法充分运行的AI 任务 。随着强大的生成式AI模型不断缩小,以及终端侧处理能力的持续提升,混合式AI的潜力将会进一步增长。
举例来说,据估计使用基于生成式AI 的搜索, 每一次查询 ( query ) 其成本是传统搜索方法的10倍, 而这只是众多生成式AI 的应用之一。混合 AI 可支持生成式AI 利用边缘侧终端的计算能力来降低成本。

如果是更复杂的任务,模型则可以跨云端和终端运行。混合式AI 还能支持模型在终端侧和云端同时运行,也就是在终端侧运行轻量版模型时,在云端并行处理完整模型的多个标记( token ), 并在需要时更正终端侧的处理结果。
高通指出,参数超过10亿的 AI 模型已经能够在手机上运行,且性能和精度达到与云端相似的水平。不久的将来,将看到100 亿或更高参数的模型将能够在终端上运行。
高通表示,作为终端侧AI领导者, 面向包括手机、汽车、XR头显与眼镜、PC和物联网等在内的数10亿边缘终端, 将提供硬件和软件解决方案推动混合AI 规模化扩展独具优势。
高通进一步指出,智能手机解决方案的能效与竞品对比,大约有两倍的优势,凭借一系列基础研究, 以及跨AI 应用、 模型、 硬件与软件的全栈终端侧AI 优化,持续引领终端侧 AI 解决方案发展。
高通产品管理高级副总裁兼 AI 负责人 Ziad Asghar解释,云端处理存在成本的乘数效应,用户进行查询的次数越多,模型规模就越大,使得云端成本上升。不仅如此,应用数量和用户数量的增加,也会导致成本提高。因此,在云端完成所有生成式 AI 所需的工作负载是难以实现的,而使用混合AI 的方式,可以将部分处理交给终端侧完成,从而真正发挥生成式 AI 的优势。
生成式 AI 引领下,市场上也出现了众多非常庞大的模型。高通认为要真正释放生成式 AI 的全部潜能,AI 需要在边缘侧运行,该技术可以实现在所有高通的产品线上。
XR:生成式 AI 能够根据终端侧所提供的用户信息进行定制和优化,为用户带来独特的虚拟世界体验。如果只在云端运行,则不具备终端侧的情境信息, 因此利用终端能够带来更好的用户体验。
汽车:在座舱中使用对话式 AI ,能够帮助用户规划路线,在去餐厅的路上推荐用餐选项,或者在上班途中列出今日的工作事项。生成式AI 还可以根据出发点和目的地信息,制定不同的路线规划,找到最佳路线。
物联网:如果来到一个新的城市,生成式 AI 能够帮助提供旅行目的地推荐。同时也适用于其他的垂直领域,如医疗、零售、酒店管理等。

高通指出,如果在云端运行一个超过10 亿参数的生成式 AI 模型, 可能需要数百瓦的功耗,但在终端侧运行需要的功耗仅有几毫瓦。 高通的AI 技术能够支持终端在既定功耗下完成更多处理工作,这是竞争对手在生成式AI 领域所做不到的。
混合AI的优势在于, 即使不同终端处理能力不尽相同,但仍然能够提供相近的体验,同时带来包括 成本、能耗、隐私与安全、个性化等优势,还能通过5G连接技术确保信息在端到端之间进行高效传输。
高通 AI 软件栈最关键的核心优势在于,模型一旦开发出来,就可以在不同地方使用,再与混合 AI 部署相结合,形成杀手级的组合,将帮助生成式 AI 在不同终端上进行规模化扩展。不久将来,可看到100亿或更大参数的生成式AI 模型将能够在终端上运行。

