大数跨境
0
0

行业前瞻丨续写小说、预测天气,AI还能做些什么?

行业前瞻丨续写小说、预测天气,AI还能做些什么? 阿里云研究院
2021-07-26
1
导读:AI的多种可能

编者按:

续写小说、预测天气,人工智能不再遥不可及,在我们的生活中,它还能创造哪些可能?


导语

人工智能是全球公认的科技前沿发展方向之一,在中国正在迅速发展。根据中国科学技术信息研究所研究发布的《2020全球人工智能创新指数报告》,中国人工智能创新指数在参评国家中排名第2位,仅次于美国。

根据《新一代人工智能发展规划》,到2025年,我国人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力。

随着人工智能在基础支撑、创新资源与环境、科技研发、产业与应用等方面持续发展,将给产业和民生带来福祉。

今天,人工智能已经不再遥不可及,改写小说、预测天气。明天,人工智能还能做些什么?

01

AI续写小说

今年4月,达摩院发布全球最大规模的中文文本预训练语言模型——PLUG(Pre-training for Language Understanding and Generation)。该模型参数规模达270亿,是中文纯文本预训练语言模型,采用1TB以上高质量中文文本训练数据,它集语言理解与生成能力于一身,在小说创作、诗歌生成、智能问答等领域表现突出,还以80.614分刷新了CLUE分类榜单纪录,排名仅次于“人类”组

把经典文学作品交给PLUG,会有怎样的结局?阿云这里挑选了几篇作品让PLUG挑战一下:

《红楼梦》仿写

原文(上)


黛玉只就宝玉手中看了一看,便问道:“还是单送我一人的,还是别的姑娘们都有呢?”周瑞家的道:“各位都有了,这两支是姑娘的了。”


AI续写(下)


黛玉却想道:“我如今是个孤女,他们送的那些东西,还有什么可看的。”因此自己心下不乐,只是独自一个人在那里摆弄那些物事。

原文(下)


黛玉再看了一看,冷笑道:“我就知道,别人不挑剩下的,也不给我。替我道谢罢!”周瑞家的听了,一声儿不言语。

<<<左滑查看原文下半段

《水浒传》仿写

原文(上)


武松在路上行了几日,来到阳谷县地面。此去离县治还远。当日晌午时分,走得肚中饥渴望见前面有一个酒店,挑着一面招旗在门前,上头写着五个字道:“三碗不过冈”。 


AI续写(下)


武松看了,心中想道:“这个酒店好生不识气力,他家又不曾招得一个客人来,怎么开得门!”又走了五里多程,只见有一所村舍,三面墙垣都是矮墙,一面是一条大路。武松看了道:“却好走路!”就墙上钉着一张白纸,写道:“三碗不过冈。”武松把白纸放在面前,走入村中去了。

原文(下)


武松入到里面坐下,把哨棒倚了,叫道:“主人家,快把酒来吃。”只见店主人把三只碗,一双箸,一碟热菜,放在武松面前,满满筛一碗酒来。武松拿起碗一饮而尽,叫道:“这酒好生有气力!主人家,有饱肚的,买些吃酒。”洒家道:“只有熟牛肉。”

<<<滑查看原文下半段

《孔乙己》仿写

原文(上)


孔乙己一到店,所有喝酒的人便都看着他笑,有的叫道,“孔乙己,你脸上又添上新伤疤了!”他不回答,对柜里说,“温两碗酒,要一碟茴香豆。”便排出九文大钱。他们又故意的高声嚷道,“你一定又偷了人家的东西了!”


AI续写(下)


孔乙己也不回答,也不管他们的笑骂。有几个看他不顺眼的,故意叫道,“孔乙己,你又不是小偷,你不至于上当的。我们这儿的人,可从来不把偷字挂着,你又何必怕人家笑你!”其余的人哈哈的大笑。但孔乙己只是吃喝自如,不言不动。

原文(下)


孔乙己睁大眼睛说,“你怎么这样凭空污人清白……”“什么清白?我前天亲眼见你偷了何家的书,吊着打。”孔乙己便涨红了脸,额上的青筋条条绽出,争辩道,“窃书不能算偷……窃书!……读书人的事,能算偷么?”

<<<滑查看原文下半段


《背影》仿写

原文(上)


我看见他戴着黑布小帽,穿着黑布大马褂,深青布棉袍,蹒跚地走到铁道边,慢慢探身下去,尚不大难。可是他穿过铁道,要爬上那边月台,就不容易了。他用两手攀着上面,两脚再向上缩;他肥胖的身子向左微倾,显出努力的样子。


AI续写(下)


他爬不上去,就弯下腰去,用两手扶着铁轨。我看见他的两手在空中挥着,可是他的头却低着,脸在流汗。汗珠从额角上渗出来,滴在草叶子上,落在铁轨上,融成一片小小的水洼。我想我的心和铁轨之间产生了很大的距离。

原文(下)


这时我看见他的背影,我的泪很快地流下来了。我赶紧拭干了泪。怕他看见,也怕别人看见。我再向外看时,他已抱了朱红的橘子往回走了。过铁道时,他先将橘子散放在地上,自己慢慢爬下,再抱起橘子走。

<<<滑查看原文下半段

如何实现这样的“仿写”能力?

原来,PLUG集成了达摩院自研的语言理解及语言生成双模型,并通过构建输入文本双向理解能力显著提升输出文本的相关性。

PLUG采用了1TB以上中文文本训练数据,涵盖新闻、小说、诗歌、问答等领域。未来,PLUG还将扩大参数规模至2000亿级,进一步提升文本生成质量。

文学创作,只是PLUG的能力之一。之后它有望广泛应用于文本生成领域,成为“万能写作神器”。更重要的是,PLUG等超大规模语言模型,对提升中文NLP技术表现有重要作用。

达摩院语言技术实验室负责人司罗表示:“将进一步攻克自然语言处理领域科研难题,完善中文及跨语言人工智能基础设施,让AI没有难懂的语言,探索通用人工智能之路。”

02

AI预测气候

在2020年杭州云栖大会上,达摩院发布天、空、地多源数据精准分析平台AI Earth,该平台可实现短临天气预测能力,预测3小时内1公里网格空间的降水信息。未来达摩院将进一步利用AI技术探索中长期气象预报。

2021年,在由阿里达摩院与南京信息工程大学、国家气候中心、阿里云天池平台等联合举办的业界首个AI气候预测大赛中,对气候的预测又更进了一步。

厄尔尼诺-拉尼娜现象是地球上最强、最显著的年际气候信号,经常导致洪涝、干旱、高温、雪灾等极端灾害的发生,准确预测成为防范的关键。

过去两年,业界开始从传统动力系统预测逐步转向探索AI算法预测。2019年,南京信息工程大学罗京佳教授等发布在《Nature》的论文提出了卷积神经网络(CNN)模型,将预测时效提前到一年半,并取得80%左右的准确率。在今年的AI气候预测大赛中,对厄尔尼诺现象的探索提前到两,挖掘AI新算法。

来自全球13支队伍取得比《Nature》模型更优的性能,AI预测显示,未来2年全球气候平稳,厄尔尼诺等反常气候现象出现概率较低,这意味着今年夏季长江流域出现洪涝灾害几率较低,此外,今年全国还将迎来一个暖冬。

大赛共吸引到海内外2849支队伍参赛,其中13支队伍研发的AI算法模型成绩超越了《Nature》论文模型的39.2分,意味着比原模型取得更长周期、精准度更高的厄尔尼诺预测结果

西安交通大学桑维光带领的队伍夺冠。他们采用了一种全新的分离时空提取模型,交替使用CNN和TCN方法提取时空特征,更有效地降低参数量和过拟合风险。来自全球13支队伍取得比《Nature》模型更优的性能,图为选手介绍模型。

世界气象组织(WMO)秘书长佩蒂瑞·塔拉斯祝贺大赛的举办:“ 人工智能已成为地球预警系统和多灾害预警服务的基本方法,其创新及应用是WMO及成员实现可持续发展目标、解决未来科学问题的最重要领域之一。

中科院院士王会军表示:“ 近年因全球气候异常带来的灾害频发,要求科研人员必须从新技术、新角度寻求突破。人工智能正给气象科学带来新机遇,特别是在对全球和区域气象数据的获取和使用、极端气候和灾害的预测预报两方面,应用前景非常广阔。”


结语

除了续写小说和预测天气,AI在其他领域也大显身手,智能语音机器人协助抗疫、MindOpt优化求解器协助新零售智能营销、城市大脑提升城市管理效率……

作为阿里巴巴旗下的科研机构,阿里巴巴达摩院在机器智能领域拥有五个实验室:语音实验室、视觉实验室、语言技术实验室、决策智能实验室、城市大脑实验室。

致力于探索科技未知,以人类愿景为驱动力,立足于基础科学、创新性技术和应用技术,达摩院在AI领域,还将带来怎样的惊喜?我们拭目以待。



编辑:阿里云研究院 张楠

往期回顾


【声明】内容源于网络
0
0
阿里云研究院
阿里云数智创新研究
内容 456
粉丝 0
阿里云研究院 阿里云数智创新研究
总阅读181
粉丝0
内容456