大数跨境

ChatGPT加速产业升级

ChatGPT加速产业升级 数组智控产业发展科技院
2023-07-14
4
导读:文章来源《一本书读懂ChatGPT》ChatGPT将会催生哪些新产业,如何影响产业领域升级变革?一 Chat

文章来源《一本书读懂ChatGPT

ChatGPT将会催生哪些新产业,如何影响产业领域升级变革?

一 ChatGPT催生全新产业结构

ChatGPT的“出圈”现象将市场目光聚焦于人工智能交互能力的再一次突破,这预示着自然语言处理技术更真实准确地应用于人类思维的组织与表达,加速其与各行业技术融合的进程,使人工智能的边际成本越来越低,为各行各业服务,给更多产业创造更多素材和场景。

(一)ChatGPT在医疗服务领域的应用

事实上,在我国传统医疗模式进入数字化转型的关键周期内,基于算法+数据+云端算力的人工智能应用创新逐渐成为新的增长引擎。

医学被认为是人工智能应用中最有可能率先实现商业化的细分领域。

在“政产学研用”多方努力下,全球智能时代加速到来,而医疗行业也正加速进入数字化的爆发期,ChatGPT以准确率极高的自动写作、决策支持、智能诊断、智能搜索、智能推荐、分析预测等能力,拓展了交互式人工智能释放行业生产力的更多可能,涉及医疗领域的应用,互联网医院或是匹配度最高的场景,以ChatGPT为代表的人工智能产品或技术将给医疗行业带来深刻变革。

第一,改变掌握医学知识技能的方式。

ChatGPT或将以人们难以想象的方式,不断完善医生的知识和更新其掌握的技能,提供更佳的医疗实践和主动健康干预措施。

如今,数据信息量以指数级别增长,生成式人工智能的能力增长率在未来10年或将超过1000倍。

更新换代的ChatGPT将具有远超过预期的分析和解决问题能力,那时候的人工智能技术或许能和临床医生诊断技能相匹配。

图10-1 2022年12月14日,江苏省南通市第六人民医院互联网医院医生为患者诊断病情

图片来源:中新图片/许丛军

第二,模仿医生作出临床决策。

ChatGPT解决问题不同于其他现有人工智能工具,其逻辑推理更像医生解决问题的思维方式:

分析患者的症状和病史,从大型数据信息库提取有用的信息和经验,选择对患者最有价值的证据、决策支持和治疗方案,通过比较和鉴别诊断,为医生提供参考,最终确定正确选择。

ChatGPT掌握的数据信息量几乎是所有相同专业人员掌握数据信息的“总和”,拥有多达数十亿参数,可以准确“定位”最佳方法和决策选择,权衡选项并预测各种可能性是否是最佳匹配方案,这种技术可以提高诊断的准确性,并帮助医生更快地作出决策。

第三,满足全天候医疗保健需求。

这是ChatGPT重点扩展应用的领域之一。

如今,患两种及两种以上慢性疾病以及每天需要医疗监护和健康管理的慢性病群体不断扩大,目前的医疗保健模式和家庭医生服务模式不仅无法满足患者需求,而且在某些情况下还可能会延误诊治。

而这正是ChatGPT的“主战场”。

ChatGPT可全天候满足患者医疗和健康管理需求,可以用于回答患者的医疗问题,实时提供疾病管理和保健须知,例如,解释疾病、解释诊断或治疗方案、提供健康建议等,通过与患者互动,为他们提供快速、个性化的医疗信息。

它可以作为可穿戴设备的智能软件系统,提供全天候居家重症患者监测,进行个性化主动健康干预,将数据与医生预设阈值比较,提醒医生和患者是否存在风险,提醒潜在高风险正常人群进行筛查和维持健康生活习惯。

第四,避免医疗差错。

尽管医院有明确制度预防不必要死亡或并发症,但医护人员在繁重的日常工作中难免会出差错。

具有视频功能的ChatGPT可实时观察医护人员操作,对比诊疗指南等要求,及时提醒或警示医护人员。

这好比自动驾驶安全监测系统帮助驾驶员安全行车,该人工智能技术应用在很大程度上可降低用药错误、院内感染等情况的发生率。

第五,辅助医生发挥最佳表现。

医学生通常需要10年左右的教育和培训才能成为一名合格的医生,而ChatGPT有望在数月甚至更短时间内完成这一培训过程,它可以从数百家医院的临床经验信息中习得最佳临床技能和经验。

ChatGPT可连接居家患者监护仪,访问临床检验数据,并听取医患互动信息,随时预测最佳步骤。

同时,通过比较诊疗记录和医嘱,ChatGPT可完成学习和自我完善。

当它能熟练预测医学专家的判断后,未来可帮助偏远地区的医生掌握专业知识、拥有娴熟技能。

(二)ChatGPT加速政府数字化转型

数字政府是政府部门运用各类数字技术来改进政府管理和公共服务,推动政府的经济调节、市场监管、公共服务、社会管理、生态环境保护、政务运行、政务公开等方面的所有职能环节实现数字化转型。

2022年6月23日,国务院发布《关于加强数字政府建设的指导意见》,提出构建数字化、智能化的政府运行新形态,将数字技术广泛应用于政府管理服务,推进政府治理流程优化、模式创新和履职能力提升。

人工智能技术在政府部门和公共管理中的应用已经受到广泛关注,但是ChatGPT的崛起则为人们重新思考数字政府建设方向提供了可能。

和此前的人工智能技术相比,ChatGPT的优势十分明显,也为数字政府建设带来了全新发展契机,为数字政府建设提供无限想象的巨大空间。

首先也是最重要的,ChatGPT作为一款聊天机器人,可以让政府和民众之间的沟通交流更加顺畅,大大提升政民互动体验。

无论是通过搜索引擎获取政府部门办事入口,还是拨打政务服务热线寻求帮助,或是在政府网站或政务App查询信息,人们往往会遭遇难题,服务体验也不尽如人意。

政务服务热线也普遍存在打不通、乱派单、答不准、智能客服不智能等局限。

人们往往不知道该找哪个政府部门办事,具体应该寻求谁的帮助以及需要准备什么材料。

ChatGPT所承载的强大语言理解和生成能力,将会对政民互动带来全方位的深层次冲击,使政民互动体验取得实质性改善。

从哪里获取信息,怎么找政府办事,这些老大难问题将迎刃而解,使公民或企业可以轻装前进,更加轻松自如地和政府打交道。

ChatGPT这样的人工智能技术将有助于显著降低人们的学习成本,使人们可以更容易地获取、理解和掌握政府的办事流程,避免办事无门、沟通无路、咨询无人等问题。

ChatGPT的复杂推理能力很强,但还无法达到人类的情感能力,这可能会影响公众与政府的交互体验。

但从公众能办成事、办好事的角度来看,ChatGPT应用带来的政务服务体验改善,必将会远超其他既有做法取得的效果。

图10-2 近年来,我国数字政府建设进入快车道。

各级政府业务信息系统建设和应用成效显著,数据共享和开发利用取得积极进展,一体化政务服务和监管效能大幅提升,“最多跑一次”“一网通办”等创新实践不断涌现。

图为“纠纷解决机器人”

图片来源:中新图片/吕明

其次,在政务服务和公共服务领域,ChatGPT会推进各类服务的智能化、精准化和定制化,大幅提升民众的服务满意度

ChatGPT是一种通用型人工智能技术,未来有望成为万物互联的接入平台、操作系统或基础设施。

基于ChatGPT可以建构和优化一系列服务,并使这些服务之间达到互联互通。

目前各个政府部门提供的服务是相互割裂的,没有从一个完整的人或家庭出发来提供服务,也没有从企业全生命周期对其进行规划。

人们对公共服务的需求是多元的,但是往往得不到政府部门的及时发现、精准识别和定制化满足。

ChatGPT如果能够应用于公共服务体系建设,全方位获取用户的需求和偏好,将会更好地识别和满足人们的需要,并使公共服务的供给和需求之间真正实现双向交互,通过自动化处理政府文件,自动审核政府申请,自动完成政府报表等,从而提高政府的服务效率。

基于ChatGPT而开发的公共服务响应系统,能够为每个人和企业建立数字账户,基于人们的需要来提醒、部署和调度相关部门提供服务。

在ChatGPT这样的技术推动下,未来的政府规模会更小、机构设置更少、组织结构更扁平,政府运行成本也会下降。

再次,ChatGPT会让政府的政策决策更加科学,减少“拍脑袋”决策带来的负面影响。不少政府决策涉及海量数据的汇聚和决策算法的优化,但是目前很多政府部门还缺乏这些能力。

ChatGPT的应用将可以使基于大数据的政府智能决策成为可能,为决策提供相关的各类数据,并界定决策的预期目标和限定条件,更快速地获取有效决策信息,获得多种可供选择的政策方案,从而提高政府决策效率,推动政府决策的智能化加速发展。

虽然ChatGPT的创造力不被看好,但是它在信息加工重组方面的能力超群,有可能提出决策者未曾想到的政策方案,并为政策创新带来契机。

最后,从政府运行和政务处理来看,ChatGPT可以让政府工作人员更加轻松高效地履职。

在各类应用文起草方面,ChatGPT完全可以胜任公文起草工作,发挥优异的辅助功能,并可以根据特定政府部门的特色和风格来定制化准备,使政府工作人员从繁重的文稿准备工作中解放出来。

同时,ChatGPT的引入,还会让政府的组织结构、业务流程和人员安排等方面发生显著改变。

(三)ChatGPT潜在军事应用分析

可以预见的是,各类智能化无人系统与作战平台将在地面、空中、水面、水下、太空、网络空间以及人的认知空间获得越来越多的应用,深刻改变着未来战争人工智能的技术比重。

ChatGPT使用了自然语言处理技术,这类技术是美军联合全域指挥控制(JADC2)概念中重点研发的技术。

2020年7月1日,美国兰德公司空军项目组发布的《现代战争中的联合全域指挥控制——识别和开发人工智能应用的分析框架》报告指出,人工智能技术可以分为6类,自然语言处理类技术作为其中之一在联合全域指挥控制中有明确的应用——可用于从语音和文本中提取情报,还可以监视友军的聊天,以将相关信息发送给个人,提醒他们潜在的冲突或机会。

ChatGPT可以进行自然语言处理和语义理解,其生成式人工智能技术具有强大的文本生成能力,其文本生成能力取得了革命性突破,这类技术能够有效改进战场上的人机交互过程,具有以下应用潜力:

第一,使军事科技创新取得新突破。

ChatGPT技术可以帮助军事科技更好地实现自动化,提高军事科技的效率和精确度,这意味着军事科技的上升空间将进一步扩大,原本许多费时费力的工作会被简化、自动化,我们会将更多的精力投入创新研发中。

例如,军事科技技术可以帮助军事科技实现自动目标识别、自动导航、自动控制等功能,从而提高军事科技的效率和精确度。

第二,发布仿真言论参与网络战。

类似ChatGPT这样的人工智能技术能够针对任何事件产生无限的、近乎免费的“观点”。

这些观点将影响网络上的各类活动,网络用户无法知晓在网络上与之交流的是否为真实人类。

ChatGPT及类似的人工智能程序,与之前的网络水军机器人的不同之处在于,它们不会发送几乎相同的那种复制粘贴的观点,而是可以模仿人类,针对各种主题产生无限的具有连贯性和细微差别的个性化内容,而且它们不仅会主动发帖,还会对其他用户的帖子作出回应,并展开长期的对话。

因此,由ChatGPT或类似的人工智能程序参与的一方将占据网络舆论战的优势地位。

第三,在现代化联合实战中发挥重要作用。

其一,ChatGPT拥有任务分析能力。

在生成式人工智能技术的辅助下,战术级系统可根据接收到的情报报告自动生成态势分析报告,以及对接收的信息分类并确定当前态势以构建动态更新的作战图COP。

其二,ChatGPT拥有辅助决策能力。

通过对情报分析了解,ChatGPT能够结合作战对手的特点、我方的优缺点,给出有价值的参考建议,指挥官可以在瞬息万变、争分夺秒的战场上作出最准确可靠的判断和决策,这对掌握战场动态局势变化和作出部队作战行动安排具有重要意义。

其三,ChatGPT可简化参谋工作流程。

在层级指挥结构中,上级需要接收下级的信息,如果没有报告总结,上级将接收过量的信息。

在计划执行过程中,可利用ChatGPT的摘要生成式方法来自动生成报告总结,从而加快报告的上报速度

其四,ChatGPT可加速情报信息共享。

ChatGPT聊天机器人能够快速处理大量的情报信息,为部队信息共享提供支持。

其五,开展信息战行动。

ChatGPT也有应用在信息战方面的潜力。

ChatGPT会“生成不正确的信息”,“产生有害指令或有偏见的内容”,它很有可能被用来传播虚假信息,如果再使用微妙而复杂的话术来操纵公众舆论,将会进一步分化社会,造成分裂和不信任,这就达到了开展信息战的目的。

同时,ChatGPT在生成培训材料、语言翻译、自动目标识别、军事机器人、在仿真中测试材料开发系统、军事医学、战斗空间自治、情报分析、记录追踪、军事后勤、信息战、无人驾驶车辆、监视、致命自主武器系统、战场环境支持、建模、模拟和战斗训练的虚拟现实和增强现实、自由空战动态、导弹制导的神经网络、通信和网络安全、反潜战中态势感知的数据融合、网络安全和密码学、“群体作战”的群体智能、远程无人机系统的自主飞行控制、人工智能卫星和软件定义卫星、个人可穿戴系统、海量军事数据管理、对抗或颠覆对手的人工智能系统、信息融合、态势感知、路径规划、人机界面、为军事模拟生成响应等方面还有极其广泛的创新性应用。

二 模型即服务形成新的业态

模型即服务,英文简称是MaaS(Model as a Service)。

大模型,又称为预训练模型、基础模型等,是“大算力+强算法”结合的产物。

大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则,基于大模型进行应用开发时,将大模型进行微调,如在下游特定任务上的小规模有标注数据进行二次训练,或者不进行微调,就可以完成多个应用场景的任务。

通俗来讲,就是大公司开发出了一套人工智能模型,这是一个底板。可以把它想象成一个接受过良好基础教育,数理化课程全都得满分,各种基本功都特别扎实的应届毕业生。

这个毕业生基础虽好,但对于专业领域,还是个门外汉。

要是让他做点具体的、特别专业的工作,例如,医疗、教育、销售等方面的工作,他还得再深入学习。

而模型即服务指的是把这个算法的培训过程,分成两个阶段。

第一个阶段是基础教育阶段,这个阶段需要极大的投入,学习基础知识。

这个阶段由科技巨头公司完成,他们相当于模型的创造者,提供一个特别聪明、基本功特别好的“通识型人才”。

第二个阶段需要把“通识型人才”培养成能在某个领域干活的专业人才。

这一步,科技巨头公司并不擅长,这需要由细分领域里的科技公司来完成了,做这个细分领域训练被称为模型打磨者。

(一)大模型科技公司抢占人工智能大模型业态新高地

ChatGPT这一语言人工智能模型的火爆出圈,引发了大众对人工智能应用燃起极大热情的同时,也引燃了人工智能大模型竞争的战火。

2017年,谷歌的阿希什·瓦斯瓦尼(Ashish Vaswani)等提出Transformer架构,奠定了当前大模型领域主流的算法架构基础;

Transformer结构的提出,使深度学习模型参数达到了上亿的规模。

2018年,谷歌提出了大规模预训练语言模型Bert,该模型是基于Transformer的双向深层预训练模型,其参数首次超过3亿规模;

同年,OpenAI提出了生成式预训练Transformer模型——GPT,大大地推动了自然语言处理技术领域的发展。

此后,基于Bert的改进模型、ELNet、RoBERTa、T5等大量新式预训练语言模型不断涌现,预训练技术在自然语言处理技术领域蓬勃发展。

2019年,OpenAI推出拥有15亿参数的GPT-2,其能够生成连贯的文本段落,做到初步的阅读理解、机器翻译等。

紧接着,英伟达推出了拥有83亿参数的Megatron-LM,谷歌推出了拥有110亿参数的T5,微软推出了拥有170亿参数的Turing-NLG。

2020年,OpenAI推出了超大规模语言训练模型GPT-3,其参数达到了1750亿,在两年左右的时间实现了模型规模从亿级到上千亿级的突破,并能够实现写诗、聊天、生成代码等功能。

此后,微软和英伟达在2020年10月联手发布了拥有5300亿参数的自然语言生成模型MT-NLG。

2021年1月,谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上首个万亿级语言模型;

同年12月,谷歌还提出了1.2万亿参数的通用稀疏语言模型GLaM,其在7项小样本学习领域的性能超过GPT-3。

可以看到,大型语言模型的参数数量保持着指数增长势头。

这样高速的发展并没有结束,2022年,又有一些常规业态大模型涌现,如StabilityAI发布的文字到图像的创新模型Diffusion,以及OpenAI推出的ChatGPT, ChatGPT是由效果比GPT-3更强大的GPT-3.5系列模型提供支持,并且这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。

各大科技公司纷纷布局大模型领域,微软将向OpenAI进行价值数十亿美元的投资,以加速其在人工智能领域的技术突破。

此外,Buzzfeed和亚马逊亦在探索ChatGPT的应用场景。

大模型在能力泛化、技术融合、研发标准化程度高等方面的优势让其有能力支撑各式应用,使其正在成为人工智能技术及应用的新基座。

正如发电厂和高速公路一样,大模型将成为各行各业应用人工智能技术的底座和创新的源头。

随着大模型不断的迭代,大模型能够达到更强的通用性以及智能程度,从而使人工智能技术能够更广泛地赋能各行业应用,大模型是人工智能的发展趋势和未来。

在国内,超大模型研究发展异常迅速,2021年成为中国人工智能大模型的爆发年。

2021年4月25日,在华为开发者大会上,华为云发布了盘古系列自然语言处理超大规模预训练模型。

盘古系列模型包括30亿参数的全球最大视觉(CV)预训练模型,以及华为云与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的自然语言处理预训练模型。

其中,盘古自然语言处理大模型由华为云、循环智能和鹏城实验室联合开发,具备领先的语言理解和模型生成能力:

在权威的中文语言理解评测基准CLUE榜单中,盘古自然语言处理大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界纪录,其总排行榜得分83.046,多项子任务得分业界领先,向人类水平(85.61)迈进了一大步。

华为云盘古大模型可以实现一个人工智能大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,并使用ModelArts平台,让人工智能开发由作坊式转变为工业化开发的新模式。

针对视觉图像不同角度以及不同场景的变化,盘古CV大模型采取的方法非常简单。

其大模型有海量数据集,这个数据集规模已经达到了亿级甚至十亿级这样的规模,它能够建模实际场景图像的方方面面。

同时,盘古CV大模型在预训练算法中,集成了10余种数据增强方法,让它通过不同的数据增强,使整个模型具有针对不同数据增强的不变性,来解决如何处理不同视角、不同尺度图像问题,让它进行高效的建模问题。

盘古CV大模型基于全局的对比度自监督学习方法,还进行了许多改进,例如,解决如何来利用弱标签信息,如何把全局的信息拓展到局部来更好建模局部相关关系等问题。

到目前为止,盘古在一个大模型中,搭载模型蒸馏、抽取以及行业大模型,已经适配了10余种预训练模型。

这10余种模型都是通过一个大模型的抽取、蒸馏所得到的,它在相应的行业上,得到了非常大的精度提升,同时也极大地减少了标注代价以及模型迭代周期。

2021年,商汤科技发布了书生(INTERN)大模型,其致力于打通算力、算法和平台,大幅降低人工智能生产要素价格,实现高效率、低成本、规模化的人工智能创新和落地,进而打通商业价值闭环,解决长尾应用问题,推动人工智能进入工业化发展阶段。最初的书生拥有100亿的参数量,这是一个相当庞大的训练工作。

在训练过程中,大概有10个以上的监督信号帮助模型,适配各种不同的视觉或者自然语言处理任务。截至2021年中,商汤已建成世界上最大的计算器视觉模型,该模型拥有超过300亿个参数。

当前发展通用视觉的核心是提升模型的通用泛化能力和学习过程中的数据效率。

面向未来,书生通用视觉技术将实现以一个模型完成成百上千种任务,体系化解决人工智能发展中数据、泛化、认知和安全等诸多瓶颈问题。

书生在分类、目标检测、语义分割、深度估计四大任务26个数据集上,基于同样下游场景数据,相较于同期OpenAI发布的最强开源模型CLIP-R50x16,平均错误率降低了40.2%、47.3%、34.8%、9.4%。

同时,书生只需要10%的下游数据,平均错误率就能全面低于完整(100%)下游数据训练的CLIP(OpenAI发布的一种经典的文图跨模态检索模型)。

通用视觉技术体系书生由七大模块组成,包括通用视觉数据系统、通用视觉网络结构、通用视觉评测基准三个基础设施模块,以及区分上下游的四个训练阶段模块。

在四个训练阶段中,前三个阶段位于该技术链条的上游,在模型的表征通用性上发力;

第四个阶段位于下游,可用于解决各种不同的下游任务。而当进化到第四阶段时,系统将具备“迁移能力”,此时书生学到的通用知识可以应用在某一个特定领域的不同任务中,例如,智慧城市、智慧医疗、自动驾驶等,实现广泛赋能。

书生的推出能够让业界以更低的成本获得拥有处理多种下游任务能力的人工智能模型,并以其强大的泛化能力支撑智慧城市、智慧医疗、自动驾驶等场景中大量小数据、零数据等样本缺失的细分和长尾场景需求。

在以中文为核心的超大规模语言模型领域,2021年4月19日,阿里巴巴达摩院机器智能实验室重磅发布了拥有270亿参数规模的中文语言理解和生成统一模型——PLUG(Pre-training for Language Understanding and Generation)。

PLUG采用了1TB以上高质量中文文本训练数据,涵盖新闻、小说、诗歌、问答等广泛类型及领域,其模型训练依托了阿里云EFLOPS高性能人工智能计算集群。

PLUG超大规模预训练中文理解和生成统一模型,是当前中文社区最大规模的纯文本预训练语言模型,集语言理解与生成能力于一身。

其目标是通过超大模型的能力,大幅度提升中文自然语文处理各大任务的表现,取得超越人类表现的性能。

图10-3 由阿里巴巴达摩院牵头建设的湖畔实验室,研究领域涵盖量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等

图片来源:中新图片/张茵

此前,阿里巴巴达摩院机器智能实验室自行研发的语言理解模型StructBERT与语言处理语言模型PALM均在各自领域取得了SOTA(指目前的最高水平)的效果。

简单来说,StructBERT模型通过加强句子级别和词级别两个层次的训练目标中对语言结构信息的建模,加强模型对于语法的学习能力。

PALM模型则结合了自编码和自回归两种预训练方式,引入Masked LM目标来提升编码器的表征能力,同时通过预测文本后半部分来提升解码器的生成能力。

此次大规模语言模型的训练,阿里巴巴达摩院团队汲取二者所长,提出了一个简单的框架,用来进行语言理解和语言处理联合训练。

相比于GPT系列模型,该大规模生成模型以StructBERT作为编码器,有着很强的输入文本双向理解能力,从而可以生成和输入更相关的内容。

目前,大模型参数规模最高可达百万亿级别,数据集达到TB量级,且面向多模态场景(同时支持文字、图像、声音、视频、触觉等两种及以上形态)的大模型已成为趋势。

据不完全统计,目前涉及人工智能大模型的上市公司主要有中国电信、云从科技、科大讯飞、浪潮信息、拓维信息、拓尔思等。

科技巨头公司在将来会对外开放这些人工智能模型的调用接口。

吸引一些规模较小、但对行业理解更深的玩家,付费使用这些接口,并将模型打磨成真正满足行业需求的应用。

如此,从科技巨头公司到新玩家,都可以获益。

虽然科技巨头公司研发大模型承担了巨额的模型开发成本,但可以从其他行业中收取模型接口使用费,而且避免了过度聚焦到某个特定行业带来的风险。

同时,细分行业中的企业,也不用从头研发,能以更低的成本来使用人工智能大模型。

无论如何,人工智能大模型之战的开场锣鼓已经擂响,各家巨头手握重金换来了入场券,纷纷在牌桌前坐定。

2023年2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年要全面夯实人工智能产业发展底座。

支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

这是地方政府首提对于大数据、大模型方面的支持政策与发展目标。

2023年2月28日,由北京智源人工智能研究院主办的“FlagOpen大模型技术开源体系工作会”成功召开。

为促进人工智能与经济社会发展深度融合,北京智源人工智能研究院将联合中国电子云建立大模型国产算力云平台开放实验室,探索国产CPU的大模型适配部署。

图10-4 2023年2月28日,北京智源人工智能研究院发布大模型技术开源体系“FlagOpen(飞智)”

图片来源:中新图片/孙自法

(二)大模型驱动的AIGC产业应用创新

随着大模型能力的不断强大,基于大模型的智能系统驱动应用端对端创新,使传统任务系统架构大幅简化,同时提升了应用效果和效率,从而加速数据和模型应用闭环建设。

所谓AIGC,指的是利用人工智能来生产内容,其中AI是人工智能的简称,GC则是创作内容。

同传统意义上的人工智能相比,AIGC变聪明了。

毕竟创造力是人类非常特别的能力,但当人们发现AIGC有创造力的时候非常震惊,未来AIGC将是人工智能发展的新方向。

第一代人工智能更多应用在分析、识别领域,而AIGC在大模型的加持下实现了重大突破,它让人工智能有创造内容的能力,是全新的革命,AIGC将会是人工智能的下一波浪潮。

随着OpenAl推出ChatGPT付费定制版本,AIGC的商业化前景开始引起关注。

从娱乐、传媒、新闻、游戏、搜索引擎等互联网领域甚至制造业、交通等传统产业的应用实践来看,AIGC在多媒体内容生成与创作、数字人和虚拟仿真平台三大产品方向潜力巨大。

AIGC实现文本、图片、音频内容专业化生成与创作,短期内有望实现广泛商业变现。

从产品来看,人工智能绘画、人工智能音频、人工智能写作、人工智能聊天等领域目前均有成熟应用涌现,例如,青云智能开放平台年发稿量30万篇,实现新闻稿件自动撰写,平均每0.46秒形成一篇文章,涵盖财经、体育、房产、法律等20多个场景,提升了新闻内容的时效性和规模性。

从商业模式看,API(应用程序编程)接口调用计费相对成熟,基于底层模型的标准化SaaS服务模式将逐步兴起。

以OpenAl为例,开放图像创建和编辑模型DALL-E2程序API接口,已有微软Mixtiles等公司将其集成到自有图像设计工具中,实现海报、幻灯片等图片的生成和编辑,目前已经有超过300万人使用DALL-E2,每天创建的图片数量达到400万张。

OpenAl发布了ChatGPT Plus以SaaS付费订阅形式,为用户提供响应更快的文本生成服务。

AIGC驱动功能服务型数字人出现,创新营销服务、娱乐表演模式。AIGC将大幅度提升数字人的制作效能和交互能力。

传统数字人制作需要通过三维建模技术生成人物,耗时长、计算量大、成本高,使用AIGC仅需用户上传照片/视频即可在1分钟完成建模,成本低,可定制,精度可达到次世代游戏人物级别。

同时,引入对话式人工智能、多模态分析模型还可驱动数字人在多模态交互过程中的面部表情、语言表达,使其交互行为神似人类,例如,腾讯AILb基于AIGC的人工智能口型驱动技术已帮助《重返帝国》《代号:破晓》等游戏实现角色脸部口型动画自动生成。

AIGC驱动的功能服务型数字人已在金融、品牌营销、影视娱乐、生活服务等众多行业进行应用探索。

AIGC驱动的功能服务型数字人通过完成咨询、表演、品牌形象构建等多类任务,可提供较真人更高效、稳定、便捷的服务,实现降本增效。

例如,屈臣氏洞察年轻人需求,推出符合年轻人品味的虚拟偶像代言人屈晨曦Wilson进行品牌推广,低成本完成品牌破圈。

根据国际数据公司(IDC)预测,2026年中国人工智能数字人市场将达1024亿元。

AIGC加速虚拟空间搭建,打造虚拟空间的重要生产力工具,提升3D模型、场景制作能效。

传统3D制作需要耗费大量时间和人力成本,例如,游戏《荒野大镖客2》,先后有600多名美术专业人员历经8年时间才能打造约60平方公里的虚拟场景,而利用AIGC则可快速提升制作效率。

例如,英伟达发布的AIGC模型GET3D具备生成具有显示纹理的3D网格能力,能根据训练的2D图像即时合成具有高保真纹理和复杂细节的3D集合体,可实现每秒生成20个物体的效率和速度。

这项模型可用于构建为游戏、机器人、建筑、社交媒体等行业设计的数字空间。

基于AIGC构建大型虚拟空间可为车联网、交通、工业、医疗等行业训练开发人工智能提供试验空间。

例如,用于自动驾驶算法测试的虚拟仿真平台可以通过仿真合成现实交通场景来训练、测试自动驾驶算法,腾讯推出的TAD Sim自动驾驶仿真平台可以让自动驾驶算法在城市级别的虚拟仿真世界进行测试和学习。

当前,Waymo、腾讯、百度等巨头,以及Autox(安途)、Pony.ai(小马智行)、希迪智驾等自动驾驶初创公司也根据各自的需求,自主研发模拟仿真环境。2023年,运营商需正视AIGC可能带来的压力,进一步加快云和算力平台部署、5G和光纤网络投资。

一方面,由于AIGC在视频、游戏和元宇宙等三维层面应用领域的制作成本急剧下降,工业企业生产、物流供应链以及商业领域广告、设计、大数据精准营销等应用的互联网流量和算力需求将呈指数级增长。

根据工业和信息化部数据,2022年全年移动互联网和固定宽带接入流量分别同比增长18.1%和47.2%,而融入人工智能的物联网终端流量增长高达64.4%,预计2023年AIGC应用将使数据流量消费更加活跃。

作为流量内容生成、储存的重要载体,2022年基础运营商为社会提供服务的数据中心机架数同比净增11.4%,增长量已远不及同期移动互联网等流量增速。

根据OpenAI的研究成果,人工智能训练所需算力指数增长速度远超硬件。

另一方面,借鉴以谷歌和微软为代表的云计算巨头建设大模型分布式算力平台、增加边缘计算设备、加建内容生成效率和质量的做法,运营商应加快云和算力平台部署、5G和光纤网络投资,以应对可能到来的流量洪峰。

三 ChatGPT还会带来什么?

相较以往,人工智能的深度学习能力,对大部分人而言只是一个高深的概念。

ChatGPT通过生成式预训练转换模型,基于人类反馈的强化学习这一方式,让所有人真正接触到“人工智能+深度学习”将会带来何种变化,对人类的生活将会产生哪些影响。

因此,ChatGPT可能会加速人工智能和深度学习理论在经济社会各领域的普及应用。

(一)ChatGPT的未来应用场景充满无限可能

学术界普遍认为,ChatGPT的未来应用场景充满无限可能。从社交媒体到广告创意,从游戏到影视娱乐,从编程到深度写稿,从平面设计到产品工业设计,从文字翻译到外事同声传译等,每个原本需要人类创作的行业都等待被ChatGPT颠覆性重塑。ChatGPT被公认为是继互联网、智能手机之后,带给人类的第三次革命性产品。

互联网开辟了“空间革命”,使人类可以实时与全世界链接,不必奔赴现场,可以通过互联网进行沟通、教学、视频会议,使政治、社会和商业等领域发生连锁变化。

智能手机的出现带来了“时间革命”,通过可拓展安装的各种App应用软件,可以实现最快交易、最速送达,为人类的生活、工作和消费带来巨大变化。

ChatGPT的横空出世,有望形成“思维革命”,替代人类进行创作、创意、解答、咨询、翻译、客服等,改变人类思考和处理问题的方式方法,并由此重塑各行业生态,甚至重塑整个世界。

现阶段的ChatGPT以高度拟人化的对话问答模式带来了更好的交互体验,短期内将促进金融、媒体、医疗等诸多领域自然语言处理的应用。

例如,在金融领域,ChatGPT利用其大模型能够大幅提升语义搜索能力,面对复杂多变的投资理财咨询,能够准确找到满足用户需求的咨询结果;

又如,招商银行信用卡已经基于ChatGPT撰写宣传稿件,写出了“生命的舞台上,我们都是基因的载体”“如果说基因给我们的生命带来了基础,那亲情便是对生命的深刻赋予。

它不由基因驱使,而是一种慷慨的选择”等富有诗意的文案。

在投研方面,业内首份采用ChatGPT撰写的行业研究报告完成度较高,但距专业研究报告仍存在较大差距。

财通证券团队介绍,“ChatGPT在文字表意、标题撰写等方面均具有较高水平”。

在媒体领域,大量的稿件均可以通过ChatGPT进行自动化生产,其独创性和创造力并不输于专业人员。

未来,文字工作者应积极探索新技术帮助其提高生产效率,让ChatGPT起草初稿,人类只需要在其基础上进行修改完善;在医疗领域,ChatGPT可以替代专业人员为患者提供心理咨询、问诊和解答服药建议;

等等。

以教育领域为例,据媒体报道,ChatGPT除在高校占有一席之地外,其适用范围已经下探至学龄前儿童和中小学阶段。

据报道,国内某城市的一位4岁小孩的母亲明确表示,她每天都会登录ChatGPT,和“它”聊会儿天,并把“它”推荐给其他妈妈,解答孩子的教育问题。

部分中小学教师也在思考将ChatGPT融入自己的教学工作,一名刚入职的小学语文教师解释说,小学生由于年龄小、心智尚未发育成熟,在上课时不仅需要教师在知识的学习上提供帮助,而且需要在心理层面对其进行全方位培养。

她经常询问ChatGPT诸如“如何矫正小学生不良行为习惯”“教师如何与内向的小学生沟通”等问题。

由此可见,ChatGPT在各行各业均具有无限的未来应用场景,ChatGPT正在快速走进人类的工作和生活,成为继互联网、智能手机之后,人人都离不开的工具。

(二)ChatGPT对产业的影响

科技创新可以提高经济结构的效率和灵活性,提高企业的竞争力,节约能源、资源和工人成本,推动产业升级,促进供给侧结构的变革,提高产品的质量和生产效率,催生新产品、新技术和新模式,进而促进经济增长。

ChatGPT作为一种创新科技,通过分析大规模数据,在其中找到诸多规律,生成新作品,而不仅限于分析已经存在的东西,在某些情况下,较人类更具创造力,且创造得更好。

未来,ChatGPT处理的领域包括所有知识工作和创造性工作,可能涉及数亿的人工劳动力,使相关领域人工劳动力的效率和创造力得到大幅提高,不仅较以往更快、更高效,而且更完美、更具创意。

首先,ChatGPT能够带来更高的生产率。

与传统的文本识别或语言理解系统相比,聊天机器人系统更加容易使用,可以更有效地了解输入的问句,提高结果的准确性,改变传统的生产和服务方式,让企业更有效地利用有限的资源生产更多的产品和提供更好的服务,在提升效率的同时,降低成本。

其次,ChatGPT的应用可以提升企业的核心竞争力,带来增量利润,促进业务增长,不断改善经济社会结构,带动产业数字化转型和智能化升级。

此外,技术创新可以满足更多的消费需求,促进投资市场的发展。

例如,ChatGPT可以帮助客服进行个性化会话,快速了解客户的需求,分析重点,及时回答客户的提问,能够提高客户的满意度和对公司的信任度。

在此基础上,ChatGPT新技术的应用可以使企业拥有更多的消费者,在拉动营收和利润增加的同时,促进投资市场的发展,最终实现经济的可持续发展。

图10-5 虽然目前ChatGPT还不能给人类的生产生活方式带来根本性的变革,但是它代表着人工智能的发展已经进入一个全新的阶段

图片来源:千图网

科技进步造福人类经济社会,让人类可以提质增效、实现高质量发展。

但是,科技是一把“双刃剑”,如果使用不当,也会对经济社会产生负面效应。

ChatGPT被滥用的问题愈加明显,最常见的是作弊问题。

在美国,北密歇根大学一名学生使用ChatGPT生成的哲学课小论文震惊了教授,得到全班最高分。

有调查显示,89%的美国大学生承认使用ChatGPT做家庭作业,53%的学生用它写论文,48%的学生使用ChatGPT完成测试。据媒体报道,近期,有多所欧美高校对ChatGPT发出禁令。

法国巴黎政治学院宣布禁止学生使用ChatGPT和其他人工智能产品完成报告,除非教师有特定课程需求,否则学生使用ChatGPT完成报告,最终将面临退学处罚;

美国纽约市公立学校规定,只有在进行人工智能与科技相关教学时,才能由教师申请在课堂上使用ChatGPT;

澳大利亚、印度、英国等国的多所大学也限制学生使用ChatGPT,尤其是在校园内以及考试期间。

ChatGPT这类人工智能产品虽然能为学生提供快速简洁的答案,但无法帮助学生培养批判思考与解决问题的能力。

与此同时,ChatGPT创作的内容所有权归使用者所有,但如果生成的内容有侵犯他人知识产权的行为,那么,将产生知识产权纠纷问题。

例如,使用ChatGPT在未经授权的具有知识产权的图片或文字基础上创作的内容,可能出现知识产权纠纷问题。加强知识产权保护、合法性检查、协调和解决、技术防弊以及持续的监管等措施,将是未来应对ChatGPT产生的知识产权纠纷问题应采取的重要措施。

       

【声明】内容源于网络
0
0
数组智控产业发展科技院
以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
内容 986
粉丝 0
数组智控产业发展科技院 以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
总阅读2.5k
粉丝0
内容986