来源|AI先锋官
近日,2023云栖大会在杭州云栖小镇开幕。从主题展馆设置到500多场分论坛的话题设置,以及现场各种沉浸式的科技体验,大会处处都在展示“云+AI”技术创新的最新进展,也在处处体现阿里巴巴“用户为先、AI驱动”的战略重心。
今年云栖大会主题回归“计算,为了无法计算的价值”,这也是2015年云栖大会的主题。当时云计算支撑的移动互联网创新如雨后春笋,阿里巴巴希望在AI时代继续支撑所有开发者的创新和梦想。
阿里巴巴集团董事会主席蔡崇信在开幕式致辞时更是明确表示,随着人工智能(AI)大模型技术的迅速发展,智能化时代正在开启,AI将成为各行各业的新型生产力,这也对算力提出更高要求,“我们要打造AI时代最开放的云。”
阿里千亿参数大模型通义千问2.0的发布也备受市场关注。据悉,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5和Llama2,正在加速追赶GPT-4。
-1-
“阿里云要成为AI时代一朵最开放的云”
“目前中国80%的科技企业和一半的大模型公司都跑在阿里云上面。”10月31日上午,蔡崇信在2023云栖大会开幕式上致辞时介绍。

蔡崇信还表示,在智能化时代AI将成为各行各业的新型生产力,这也对算力提出更高要求,“从底层算力到AI平台再到模型服务,阿里巴巴加大研发投入,推动阿里云进行全面的技术升级和创新。”
云计算是数字经济乃至全社会重要的基础设施。据蔡崇信介绍,目前全国80%的科技企业和超过一半的AI大模型公司跑在阿里云上。10月刚刚闭幕的杭州亚运会核心系统100%跑在云上,成为首届“云上亚运”,创造了亚运历史。
他用几个“第一”概括了阿里云的历程与理念:“从2009年阿里云计算写下第一行代码开始,阿里巴巴就希望让计算成为像水和电一样的公共服务,成就更多开发者和企业。阿里巴巴是全球第一家把自身所有业务都搬上云的大型互联网公司。从PC时代到移动互联网时代,再到AI时代,阿里巴巴对‘客户第一’的坚守始终不变。”
在致辞中,蔡崇信强调最多的词是“开放”。他说:“我们坚信,不开放就没有生态,没有生态就没有未来。同时,我们要始终攀登技术高峰,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。”
据最新数据显示,去年云栖大会上阿里云发布的AI开源社区“魔搭”,经过短短一年时间,已汇聚280万开发者、2300多个优质模型,模型下载量超过1亿,成为了中国规模最大、最活跃的AI开发者社区,为数字经济“以开放促发展”理念提供了一个鲜活案例。
蔡崇信寄望通过这朵“AI时代最开放的云”,让开发AI、使用AI变得更加容易和便宜,帮助各行各业、特别是中小企业,把AI转化为巨大的生产力。
-2-
“云计算和GPT的关系,就是电和电机的关系”
AI时代已然开启,并且正以惊人的速度改变着我们的生活和工作方式。那么AI与云计算结合会碰撞出怎样的火花?
在2023云栖大会上,中国工程院院士、阿里云创始人王坚以《云计算的第三次浪潮》为主题发表演讲。他认为AI和云计算的结合将带来云计算的第三次浪潮,“它不会在一年、两年完成,它可能会给我们十年、几十年的时间里让足够多的创新,在云计算时代能够发明出来。”

王坚回顾了云计算的发展,第一次云计算浪潮改变了今天全球互联网,奈飞、米哈游为代表的企业从第一天起100%完完整整就在云上;第二次云计算浪潮中,“传统企业”开始使用云计算;在云计算的第三次浪潮中,2023年AI和云计算有了一次集中的体现和爆发。
他表示,“‘传统企业’,我打个引号,没有任何贬义的意思,就是我们过去看到的企业开始用云计算,我自己觉得是第二次浪潮的开始,因为这些企业在那个时代看起来是IT技术的先行者。”
这其中最标志性的事件是2022年北京冬奥会上,云计算第一次承载了赛事的核心系统。王坚表示,云计算跟奥运会的关系不是简单的用技术还是不用技术的关系,它的意义就像当年在芝加哥的世界博览会上第一次用交流电。
在第三次浪潮中,GPT模型的出现使得计算机对科技创新的革命产生了非常重要的影响。
“如果再从那场一百多年以前的电的革命来看的话,云计算和GPT的关系就是电和电动机的关系。未来事实上云计算的算力都是会被这些在智能时代的电动机,就是被模型消耗掉。”他认为。
他还坚定地认为,“最后所有这些计算,都会以云的方式来提供。我想这也是作为一个行业的生命性,就像今天的电可能跟爱迪生说的电不是同一个电了,但是电作为一个公共服务的存在、作为一个基础设施的存在,它有非常久远的生命力。”即使像英伟达这样的这么跑在前面的企业,最后也回避不了这件事情。
AI和云计算的一次结合是云计算的第三次浪潮。王坚表示,相信它不会在一年、两年完成的,它可能会给我们十年、几十年的时间,才会让真正把刚才我们看到的20项发明里面的那另外19项,在云计算时代能够发明出来。
-3-
千亿级参数通义千问2.0发布
综合性已超GPT-3.5,正加速追赶GPT-4
阿里巴巴业务上“AI驱动”的战略重心在此次云栖大会上处处得到体现,其中通义千问2.0千亿参数大模型的发布尤为令人瞩目。
在2023年云栖大会技术主论坛上,阿里云首席技术官周靖人宣布通义千问 2.0 正式升级发布,参数量全面提升至千亿级别。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
图:通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4
在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。
图:通义千问2.0发布
通义千问更成熟了,也更好用了。
通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。
8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
图:通义大模型家族全面升级,8大行业模型组团上线
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。

图:通义千问72B即将开源
回顾“通义”大模型的发展历程,阿里云于2022年9月发布自研大模“通义”大模型;今年4月正式对外发布“通义千问”;7月宣布AI绘画创作大模型“通义万相”开启定向邀测;8月宣布“通义千问”正式开源;9月宣布“通义千问”大模型已首批通过备案,并正式向公众开放。
周靖人还表示,阿里云已经成为包括百川大模型、智谱AI ChatGLM、昆仑万维天工大模型、零一万物大模型、vivo大模型在内的众多大模型企业的AI基础设施。
-END-





