近几个月,人工智能领域的飞速发展吸引了全世界的目光,这主要归功于新产品ChatGPT的横空出世。随后,百度文心一言、Google PaLM API、Midjourney V5等人工智能产品也纷纷跟进。
与ChatGPT的飞速走红相伴的,不仅有人工智能领域的科技大爆发浪潮,也有对于人工智能带来的安全及道德风险的争议。技术发展与数据安全、隐私保护之间的平衡如何把握,将会是人类社会未来很长一段时间面临的挑战。

2022年11月,美国人工智能公司OpenAI推出了人工智能聊天机器人程序ChatGPT,这一产品迅速引爆全球,在两个月内吸引了一亿用户。ChatGPT 全称为聊天生成型预训练变换模型,是一款人工智能技术驱动的自然语言处理工具,其使用了Transformer神经网络架构,即GPT-3.5架构。它能够通过理解和学习人类语言来进行对话,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务,是OpenAI在深度学习方面扩展的最新里程碑。
今年3月15日,Open AI 正式推出了ChatGPT-4。ChatGPT-4在GPT-3.5的基础上,使用微软 Azure 来训练模型,采用基于人类反馈的监督学习和强化学习进行微调,同时从ChatGPT用户那里持续收集数据,以人类干预增强机器学习效果,实现了性能提升,在一系列基准测试中表现优于GPT-3.5。虽然在许多现实场景中能力不如人类,但GPT-4在各种专业和学术基准上表现出了人类水平,在包括美国律师资格考试、法学院入学考试、“美国高考”SAT数学部分和证据性阅读与写作部分考试等多种基准测试中,得分均高于88%的应试者。
OpenAI表示已与多家公司合作,要将 GPT-4 结合到他们的产品中,包括 Duolingo、Stripe 和 Khan Academy。微软表示,新款的必应(Bing)搜索引擎将运行于 GPT-4 系统之上。
GPT的快速发展也对编程行业产生了冲击,专业人士预测GPT将循序渐进地取代一些软件工程师和开发岗位,前哈佛大学计算机科学教授、谷歌工程主管 Matt Welsh甚至预言生成式 AI 将在 3 年内终结编程。
目前,ChatGPT还存在一定的局限,譬如由于训练模型的缺陷、训练数据的偏差,它有时会写出听起来很有道理但不正确或无意义的答案;此外,作为一种英语语言模型,它对其他语言的支持仍然不足。
3月31日,意大利个人数据保护局宣布,即日起禁止使用ChatGPT,并限制OpenAI处理意大利用户信息。意大利成为欧盟第一个禁用ChatGPT的国家。

今年2月7日,百度正式官宣文心一言发布。生成式AI产品文心一言是百度研发的知识增强大语言模型,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感,可以基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知中融合学习具备知识增强、检索增强和对话增强的技术特色。文心一言主要具备五方面能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解以及多模态生成。其中,多模态生成可以实现输入需求后直接生成文字及图片,文字转音频,以及文字生成视频的效果。创始人李彦宏表示,从文心一言的表现来看,它已经具备了很多像人类对自然语言的理解能力、表达能力、逻辑推理能力。相比基于英文的AI应用ChatGPT,文心一言最大的亮点可能在于对中文语言的理解和掌握。
官宣后的一个月内,已有650家企业宣布接入文心一言的生态,以寻求机会。文心一言的发布将为新型云计算、行业模型精调和应用开发三方面带来创业和投资机会,帮助各行业提升效率和促进创新。
目前,文心一言尚未进行产品公测,官方仅在百度智能云的官网开放了文心一言企业版的内测申请渠道。
PaLM 是一个灵活多功能的系统,可以执行各种文本生成和编辑任务。例如,你可以训练 PaLM 成为一个对话聊天机器人(如 ChatGPT),也可以用它进行文本摘要或编写代码等任务。
为了让开发者更容易地训练 PaLM 执行特定任务,谷歌还推出了一个新应用程序:MakerSuite。“通过 MakerSuite,你可以迭代提示语、使用合成数据增强你的数据集,并轻松调整自定义模型”,该公司在新闻稿中说道。谷歌表示,在浏览器中就能完成这种微调工作 —— 而训练和部署所需消耗大量计算资源则由谷歌云处理。
Midjourney V5画的一对中国情侣
与专注于文字的ChatGPT模型不同,Midjourney则专注于AI绘画服务。用户可以通过简单的文本描述来创造出非常逼真和精美的图像。3月15日,Midjourney V5发布了新模型版本,这一版本具有更强的连贯性,擅长解释自然语言提示,分辨率更高,并支持高级功能。
在需求和政策两方面的合力推动下,国内学术界和科技企业相继宣布或将推出类似机器人对话模型,有望推动大模型发展。2月20日,复旦大学发布了类 ChatGPT 模型 “MOSS”,并面向大众公开邀请内测。大模型厂商主要包括百度(文心大模型)、腾讯(HunYuan大模型)、阿里(通义大模型)、商汤、华为(盘古大模型)等企业,也有智源研究院、中科院自动化所等研究机构,英伟达等芯片厂商也纷纷入局。
根据IDC数据预测,2021年中国人工智能软件及应用市场规模为51亿美元,预计2026年将会达到211亿美元。数据、算法、算力是AI发展的驱动力,其中数据是AI发展的基石,中国数据规模增速有望排名全球第一。
[1]https://zhuanlan.zhihu.com/p/614886257
[2]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/
[3]https://docs.midjourney.com/docs/models
[4]https://www.theverge.com/2023/3/14/23639313/google-ai-language-model-palm-api-challenge-openai