点击蓝字,关注我们
十年来,人工智能一直是科技圈的大热门。我们见证了高准确率的人脸识别系统、打败人类围棋高手的围棋AI、预测蛋白质结构的AI…… 这些技术进步令人惊叹,也在各自领域内被寄予了「颠覆格局」的期望,但在通用能力上还有所欠缺。
然而,最近两年,预训练大模型技术使得AI的通用能力迈出了一大步。几十亿、上百亿的参数模型不仅能处理海量信息,还能理解人类的自然语言输入、进行复杂逻辑推理并具备了优秀的内容生成能力。AI正在从特定任务的解决方案转向拥有更广泛应用性的解决方案,或者说,有望大规模地创造价值。
比如,Stability AI 推出了一项新的生成工具「Stable Doodle」。有了这个工具的帮助,你只需几笔草图,就能在几秒钟内生成媲美专业画师作品的原创插画:
这种AI的力量正在逐渐演变成超级生产力。据全球管理咨询公司麦肯锡最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》指出,生成式AI每年可能为全球经济增加2.6万亿到4.4万亿美元的价值。
亚马逊云科技纽约峰会上也同样热议「生成式AI」。Swami Sivasubramanian,亚马逊云科技数据库、数据分析和机器学习全球副总裁,在峰会上发表了主旨演讲。他表示:「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。」他还强调:「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」
亚马逊云科技的路线是明确的,为了让生成式AI广泛落地,他们将AI能力集成到简单易用的产品中,希望用最简洁的方式让技术进步造福各行各业。
生成式AI的大模型竞赛正在火热进行。OpenAI和谷歌你追我赶,迅速崛起的「开源」力量也不甘示弱。说实话,未来的大模型竞争格局恐怕是:「没有一个模型可以统治一切。」毕竟,谁也没有铁打的背景。
比如,ChatGPT发布两个月后,Anthropic公司迅速推出了「最强竞品」Claude,又在7月初完成了Claude 2的升级。号称「AI界最强大的开源大模型」的LLaMa,最近也升级为LLaMa 2,不断提升开源大模型的能力上限。业内人士评论道:「任何一家闭源的大模型提供商都没有护城河。」不管是LLaMa还是Claude,开源大模型都展现出更快的迭代速度、更强的可定制性和更好的私密性。
亚马逊云科技也不甘落后,早在今年4月,他们就发布了全托管基础模型服务「Amazon Bedrock」,成为大模型之战的新力量。要知道,自研大模型需要数十亿美元和多年的训练,而更优的解决方案是对已有的强大开源基础模型进行定制化微调,以满足多样化业务需求。Amazon Bedrock的重要价值就在于此,它让所有人都能够基于已有的大模型、专用的AI算力和工具来构建生成式AI应用。
在最新扩展后的Amazon Bedrock中,汇聚了一批顶级大模型供应商的最新成果:目前,Amazon Bedrock提供了Anthropic最新语言模型Claude 2、AI21的JURASSIC-2、亚马逊自研的Amazon Titan系列模型的访问。Stability AI也在Amazon Bedrock中首发了最新版的文生图模型套件Stable Diffusion XL 1.0。此外,Cohere成为了最新加入Amazon Bedrock的基础模型供应商,并带来了文本生成模型Command和文本理解模型EMBED。
与其他一站式大模型服务平台相比,Amazon Bedrock的优势在于用户可以将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在Amazon S3对象存储服务中的数据,并能够从亚马逊云科技访问各种工具。这就像是一场完美的舞蹈,让所有组件都协调一致,快速运转。
为了进一步简化这一过程,亚马逊云科技正式推出了Amazon Bedrock Agents。这个Agent可以扩展基础模型,理解用户的请求,将复杂任务分解成多个步骤,并与用户对话,收集更多信息,并采取行动来满足用户的需求。开发者只需点击几下,就能创建完全托管的Agents:这些对话式智能体根据专业数据提供个性化的答案并执行操作,帮助企业加速交付生成式AI应用程序,解决生成式AI落地的最后一公里问题。比如,你可以使用Amazon Bedrock Agents创建一个客户服务聊天机器人,用于处理订单,根据内部信息(包括客户资料和退货政策)定制化服务每个订单。
Amazon Bedrock Agents就像你的得力助手。不久的将来,我们或许会享受到它所提供的用户端服务:不仅显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮你预订、跟进。生成式AI的时代带来了搜索技术的变革。在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」概念逐渐为人们所熟知。这是在生成式AI时代搜索技术发生的一场革命。
可以说,向量数据库将成为未来大模型研发和落地必不可少的基础设施之一。对于这个方向,亚马逊云科技早有布局,他们不久前已经推出了多项支持向量的数据存储服务,包括Amazon Aurora PostgreSQL兼容版关系型数据库、兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库等。在这次峰会上,亚马逊云科技又发布了适用于Amazon OpenSearch Serverless的向量引擎。这个引擎支持简单的API调用,可用于存储和查询数十亿个Embeddings。由Amazon OpenSearch项目中的k最近邻(kNN)搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。亚马逊云科技还宣布,平台上所有的数据库将来都将具有向量功能,以帮助客户简化运营并方便集成数据。
为了加速生成式AI的训练和应用,亚马逊云科技推出了一系列服务和工具。最新动态是,两项关键服务已经正式可用:其中一项服务涉及计算基础设施,基于英伟达H100 Tensor Core GPU的Amazon EC2 P5实例已经可以使用。相比之前的GPU实例,Amazon EC2 P5实例训练速度提高了6倍,以前需要几天的训练时间现在缩短到几小时,帮助客户降低高达40%的训练成本。
另一项服务是关于开发工具。去年,亚马逊云科技推出了AI编程助手Amazon CodeWhisperer的预览版,得到了开发者的高度关注。数据显示,与未使用该编程助手的开发者相比,使用者的任务完成速度平均快57%。现在,Amazon CodeWhisperer已经正式可用,并且实现了与Amazon Glue的集成。
从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhisperer将直接在Amazon Glue Notebooks中推荐一个或多个可完成任务的代码片段,用户可以选择接受推荐建议、查看更多建议或继续自己编写代码。也就是说,即使完全不会写代码,你也可以尝试用「说话」的方式构建出完整的应用程序。
对于通用人工智能(AGI)是否能实现的问题,现在似乎再没有人会质疑。在这场浪潮中,亚马逊云科技选择了做好「关键基础设施提供商」的工作。他们的优势在于过去20年在人工智能技术上的深厚积累,对于超过10万家客户的深刻理解,以及多年的高可用、强大的基础设施。这些都将有力地推动亚马逊云科技加快生成式AI落地的征程,帮助每一位开发者和创业团队。我们可以看到,在这些面向生成式AI的基础设施和开发工具不断应用之后,大模型落地的门槛正在被打破,开始走向各行各业的深处。生成式AI的生产力革命,显然正在加速中。
一场生成式AI引发的生产力革命正在加速发生,行业壁垒在某种程度上被打破和重构。对于通用人工智能(AGI)是否能实现的问题,现在似乎再没有人会质疑。在这场浪潮中,亚马逊云科技选择了做好「关键基础设施提供商」的工作。他们的优势在于过去20年在人工智能技术上的深厚积累,对于超过10万家客户的深刻理解,以及多年的高可用、强大的基础设施。这些都将有力地推动亚马逊云科技加快生成式AI落地的征程,帮助每一位开发者和创业团队。我们可以看到,在这些面向生成式AI的基础设施和开发工具不断应用之后,大模型落地的门槛正在被打破,开始走向各行各业的深处。
生成式AI的生产力革命,显然正在加速中。
·END·


