人工智能行业专题报告：大模型应用百花齐放，AI发展进入新时代(下篇)- 大数跨境

首页

人工智能行业专题报告：大模型应用百花齐放，AI发展进入新时代(下篇)

知晓报告

2023-03-30

导读：#01微软和英伟达相继召开发布会，AI应用广泛落地1、微软推出Microsoft 365 Copilot，办

#01

微软和英伟达相继召开发布会，AI应用广泛落地

1、微软推出Microsoft 365 Copilot，办公场景根本性变革

微软宣布 Microsoft 365 服务全面接入 AI 驱动工具 Copilot。3 月 16 日晚，微软在“The Future Work with AI”发布会上宣布将人工智能大语言模型技术（LLM）引入 Office 应用程序，推出了 AI 助手——Microsoft 365 Copilot，帮助用户提高办公生产力。该 AI 助手由 OpenAI 的 GPT-4 技术驱动，出现在 Microsoft 365 应用的侧边栏，可以作为一个聊天机器人随时召唤，带来更智能、更高效的办公体验。微软 CEO 表示，Copilot 的核心特点是通过自然语言理解用户的需求提供更加个性化的服务，基于自然语言技术将大模型、用户数据和应用结合起来。

Copilot 打通微软办公产品线，数据在各个产品中自由流通。Microsoft 365 Copilot 将大语言模型的能力与储存在 Microsoft Graph 中的数据如邮件、文档、会议、日程、聊天等以及 Word、Excel、 PowerPoint、Teams、Outlook 等办公产品全部联系到一起，通过四个步骤将用户的文本命令输入转化为应用层的执行。Copilot 以迭代的方式来处理和编排这一系列流程服务，形成了集合大模型、用户数据和应用的 Copilot System，实现了多种令人惊叹的功能。

1) 第一步：用户在办公产品端通过文本输入 prompt，Copilot 接收用户的 prompt，并通过 Grounding 技术对 prompt 进行预处理，其核心是调用 Microsoft Graph 来检索与此 prompt 相关的业务内容背景信息，并基于这些信息对 Prompt 进行修改； 2) 第二步：Copilot 将修改后的 prompt 发送给大语言模型 LLM； 3) 第三步：Copilot 获取到 LLM 对 prompt 产生的回应，并再次通过 Grounding 技术对回应进行后处理，包括额外的图形调用、对 AI 生成结果的安全性、合规性检查等，并生成对应用的调用命令； 4) 第四步：Copilot 向用户发送最终回复和对应用程序的调用命令。

Copilot 与 Microsoft 365 应用紧密集成。微软将 AI 助手 Copilot 与 Word、Excel、PowerPoint、 Outlook、Teams 等产品紧密结合，成为高效的生产力工具。用户可以用 Copilot 实现在 Word 中生成文稿，为 PPT 增加图片和动画效果，在 Excel 里分析用户输入的数据并将结果生成可视化图表，帮助 Outlook 进行邮件管理和智能生成回复，在 Teams 里进行会议实时总结和会议纪要生成等功能，甚至可以在不同的产品应用间进行格式转换，例如要求其根据给定的 Word 文档创建 PPT，极大地提高了用户在办公场景的效率。

Business Chat 功能将数据转化为知识，大幅提升办公效率。Copilot 提供了 Business Chat 功能，横跨了所有的数据和应用，用 Microsoft Graph 将来自文档、PPT、电子邮件、日历、便笺和联系人等的数据汇集在一起。比如可以直接通过与客户的聊天、邮件、日历等信息进行总结，按照 A 文件的格式编写包含 B 计划的时间表并给相关联系人发送邮件等。同时，团队中的每个人都可以在同一个Chat页面上共同进行业务的推进，比如在员工 A 创建了文档后，员工B可以直接命令Copilot对文档进行修改，实现了协同办公效率的大幅提升。

Copilot 作为流程编排引擎驱动流程自动化与业务应用开发的 AI 变革。微软将 Copilot 也接入到了旗下的低代码开发平台 Power Platform 中，用户可以在 Power Apps、Power Virtual Agents 和 Power Automate 中用自然语言描述他们想要的应用、功能和流程，Copilot 可以在几秒钟内完成应用和流程的创建，并提供改进的建议。在 2022 年 10 月上线的预览版 Power Automate 中，采用了 AI 驱动的流程自动化创建能够节省约 50%的时间，大幅提高了业务工作效率。

2、英伟达GTC 2023召开，展现AI多领域应用

英伟达 GTC 2023 正式召开，展现 AI、加速计算及其他领域的突破性进展。北京时间 3 月 21 日晚，英伟达 CEO 黄仁勋为 GTC 2023 进行了主题演讲，对英伟达在 AI 应用、加速计算等软硬件领域取得的新进展进行了介绍。经过几十年的经营，英伟达不仅成为了全球领先的 AI 算力提供商，也构建了一套围绕着实际产业运转的 AI 应用生态，在自然科学、化学制药、视觉解析、数据处理、机器学习和大模型领域成为不可或缺的一环。

AI 产业迎来“iPhone”时刻，英伟达联手云厂商推出 DGX 云服务。黄仁勋在演讲中多次表示， AI 产业正处于“iPhone”时刻，生成式 AI 技术的快速进步引发了全球企业对 AI 战略制定的紧迫感。为了方便企业客户更快地访问英伟达 AI 算力与应用库，黄仁勋在演讲中宣布英伟达将与微软 Azure、谷歌云、Oracle OCI 合作，推出英伟达 DGX 云服务。这一合作将英伟达的生态系统引入了云服务厂商，极大地扩展了英伟达的触及范围。这意味着当下性能最佳的 DGX AI 超级计算机将成为能够提供多租户的云服务设施，一众试图训练自营大语言模型、图片模型的企业，将能直接通过云服务快速实现自己的愿景。目前已有 50 余家企业客户已经开始使用 DGX 云服务，涵盖了医疗、媒体、金融等多个行业领域。

生成式 AI 将重塑几乎所有行业，行业模型有望成为未来大趋势。生成式 AI 是一种新型的计算平台，与 PC、互联网、移动设备和云诞生的时代类似，先行者们已经在利用生成式 AI 打造新的应用，利用其智能自动化和协同创作能力来改变传统的行业运行模式。对于某些具有较高专业性的领域比如医疗、药物等行业，可能需要用专属的行业数据来构建定制化的行业模型，以满足该行业的特定要求。我们在之前的报告《文心一言发布在即，大模型有望引领产业智能化变革》也有展望过，通过模型蒸馏技术将大模型“瘦身”成为垂直行业模型，能够大大降低模型搭建的成本， MaaS 在未来将有望成为大模型落地的新形态。

英伟达推出 AI Foundations 云服务，提供从建立模型到上线运营的全套服务。对想要建立独有的垂直领域行业模型的客户，英伟达推出了 AI Foundations 一站式云服务，从模型的构建到生成应用上线，英伟达就类似于芯片行业的台积电，成为了生成式 AI 领域的代工厂，协助客户快速构建、优化和运营大模型，把制造大模型的能力传递到每一个用户。英伟达 AI Foundations 由三个部分组成：

1) NEMO：NEMO 是用于自然语言文本的生成式模型，提供 80 亿、430 亿、5300 亿参数的 GPT 模型，客户也可以引入自己想要的模型。Nemo 会定期更新额外的训练数据，可以帮助企业为客服、企业搜索、文档处理、市场分析等场景定制生产生成式 AI 模型。

2) PICASSO：PICASSO 是一项视觉语言模型的制作服务，可以用于训练能够生成图像、视频和 3D 素材的模型。客户可以基于英伟达提供的 Edify 大模型或是自建定制模型来进行训练和优化，得到自己想要的生成式 AI 模型。Shtterstock 目前正在与英伟达合作开发一款以其专业的图像、3D 和视频素材库进行训练的 Edify-3D 生成式模型，用于简化创意制作、数字孪生和虚拟协作中 3D 素材的创建过程。Adobe 也与英伟达合作，发布了 Adobe Firefly 这一生成式 AI 工具，将生成式 AI 融入了营销人员和创意工作者的日常工作流中。

3) BIONEMO：BIONEMO 是针对于生物制药领域的 AI 模型服务。生物制药行业目前正在转向利用生成式 AI 来发现疾病靶因、设计新型分子或蛋白质类药物、以及预测药物对机体的作用等。BIONEMO 可以为用户提供创建、微调、提供自定义模型的平台，包括 AlphaFold、 ESMFold、OpenFold 等蛋白质预测模型。生成式 AI 模型可以在给出氨基酸序列的条件下快速准确地预测目标蛋白质结构，预测蛋白质和分子的相互作用等，极大地提升了最佳候选药物研发的效率。

工业软件领域与 AI 大模型能力的结合值得期待。本次英伟达 CEO 的主题演讲中，AI 与专业的创意设计、工业设计、模拟仿真类软件结合方式为 AI 大模型的落地带来了新的场景，在驾驶仿真、粒子特效运算、动画制作、材质表面生成、物理效果等领域都有良好的应用。我们认为，随着 AI 能力的持续进步和业界对 AI 应用方式的不断探索，像 CAD、EDA、BIM 等工业软件也有较大成长的机会，其模型设计、图纸生成等功能都与大模型能力十分契合。未来随着国外头部厂商进行大模型方向的创新应用，国内的相关工业软件企业也会有较大发展空间。

#02

生成与通用领域双线发展，人工智能迈入“双G时代”

大语言模型的诞生带来了新的知识表示和调用方式的变迁。自计算机诞生以来，知识表示和调用方式历经了两次大的变迁。在互联网诞生之前，最为常见的知识表示方式是关系型数据库，通过 SQL 语句进行调用，精确度高但调用的方式较为复杂，代表的公司比如 Oracle 等数据库的巨头公司。随着互联网的诞生与搜索引擎的诞生，知识的调用方式变化为了关键词搜索，方便程度提高了，但是对于知识调用的精确度却有所降低。而大模型的诞生进一步提高了知识调用方式的自然度，仅需通过自然语言交互即可访问想要的知识。

当下人工智能在生成和通用两条主线上不断发展，迈入“双 G 时代”。目前人工智能最火热的两个赛道分别是生成（Generation）和通用（General），这两条赛道相互交织并行，AI 领域也进入了“双 G 时代”。在生成领域，以 DALLE-2、Stable Diffusion 等引领的生成式 AI 技术与 AIGC 概念如火如荼；在通用领域，AI 研究者们现在都在朝着通用人工智能（Artificial General Intelligence, AGI）的方向不断努力，大模型不断增强的多模态感知能力就是迈向 AGI 的重要途径。这两条赛道是密不可分的，像百度的“文心一言”大模型就既具有多模态的生成能力，又能够回答大部分的通用问题，具有一定的通用人工智能能力。

OpenAI 及其 GPT 系列模型是当前人工智能赛道上的领跑者，超大规模模型带来的知识涌现能力是 ChatGPT 出圈的关键。OpenAI 和 GPT-4 毫无疑问是当下人工智能领域最为耀眼的明珠，回顾 GPT 系列模型的发展历程，2018 年 OpenAI 发布 GPT-1 模型，仅有 1.17 亿参数，性能也落后于谷歌随后发布的 BERT 模型，BERT 也成为当时 NLP 领域最常用的模型。OpenAI 持续在 GPT 模型上发力，陆续推出规模更大的迭代版本 GPT-2 和 GPT-3，在 OpenAI 的研究中，发现了当模型参数到达一定规模时，模型会开始涌现出 In-context learning（上下文学习）、Chain ofThoughts（思维链）、Zero-shot（能够处理未见任务）等能力，而这样的能力成为了 ChatGPT 能够“更像人”的关键。

“文心一言”已达“能用”标准，我国在人工智能赛道上将持续追赶。从近期的“文心一言”相关测试来看，距离 GPT-4 还有很大差距，但是其能力展现已有 GPT-3 的水平，达到了“能用” 标准，在 B 端、垂直行业端等都有应用的空间。我们认为，我国的人工智能技术起步晚，经验积累不足，但是发展速度较快。随着我国相关科技公司大力投入生成式 AI、大语言模型的研究，我国在 AI 的“双 G 时代”中将持续扮演追赶者的角色，争取和国际领先水平缩小差距。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

文章篇幅有限，仅为部分预览

*免责声明：以上报告均为本公众号通过公开、合法渠道获得，报告版权归原撰写/发布机构所有，如涉侵权，请联系删除；本号报告为推荐阅读，仅供参考学习，不构成投资建议。

【声明】内容源于网络

知晓报告

知晓报告报告涉及200+细分行业资料，每周定期更新，全面覆盖各行商业投资领域行业研究报告、行业报告，依托海量宏观策略、行业发展规划、上市公司、蓝白皮书等研究报告，欢迎金融人士、投资商、咨询顾问、商业分析师等关注后回复‘1’ 进研报分享群

内容 3428

粉丝 0

知晓报告知晓报告报告涉及200+细分行业资料，每周定期更新，全面覆盖各行商业投资领域行业研究报告、行业报告，依托海量宏观策略、行业发展规划、上市公司、蓝白皮书等研究报告，欢迎金融人士、投资商、咨询顾问、商业分析师等关注后回复‘1’ 进研报分享群

总阅读722

粉丝0

内容3.4k