大数跨境
0
0

你的灵魂画作都去哪儿了?“猜画小歌”背后的5000万组数据

你的灵魂画作都去哪儿了?“猜画小歌”背后的5000万组数据 齐圣科技
2018-07-19
2
导读:转载于:大数据文摘自从退出中国的搜索引擎市场,谷歌大概无时不刻都想”卷土重来“。昨天,这家以搜索引擎著称的巨


转载于:大数据文摘


自从退出中国的搜索引擎市场,谷歌大概无时不刻都想”卷土重来“。昨天,这家以搜索引擎著称的巨头公司用一款微信小程序“猜画小歌”占领了朋友圈“C位”,刷足存在感的同时,还顺便激发了身边一票“灵魂画手”。


比如这样的蒙娜丽莎👇


或者这样的美人鱼👇

就别难为小歌了好吗……


“猜画小歌”来自Google AI的一款小程序,这也是谷歌第一款微信小程序。据谷歌官方博文介绍,用户可以和谷歌的AI组队,在有限的时间内进行速写。在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),AI“小歌”则需要在时间结束前猜出图画中的物体。


当 AI 猜出你图画中的物体时,你就会进入下一轮,你的猜画连胜次数也会相应增加。你还可以分享有趣的素描图,并在体验过程中不断收集新的题目和图画。


据谷歌介绍,“猜画小歌”背后的技术主要是计算机视觉和神经网络,由来自Google AI的神经网络驱动。


当然,在画的停不下来的同时,不少人也充满遗憾,谷歌的这个微信小程序,只是为了在中国刷刷久违的存在感吗?


当然没有这么简单。


其实,这只小程序并非中国首发,早在去年11月,谷歌就上线了一款叫“Quick,Draw!”的线上游戏,也就是“猜画小歌”的网页原版。这款游戏中,玩家也需要在一定时间(20秒内)画出要求的图案,比如骆驼或洗衣机之类的。


游戏界面传送门:

https://quickdraw.withgoogle.com/


这款网页版游戏目前仍然可用,如果在中国大陆的你懂得科学上网,可以点击上边的链接进入,感受一下用鼠标画图的难度,绝对比手指画要艰难许多了。


当然,谷歌后来表示,发布这个游戏的目的远不止让用户开心,真正的初衷是运用这些草图,让计算机学习人如何绘画。(意味深长啊)


大方的谷歌并没有私吞这些网友智慧的结晶,截止今年五月,这款游戏的网页版已经从全球各地收集了五千万份不同的绘画,并且在谷歌上开源了数据库。


这些简笔画不仅整理清晰,还被贴心的做好了标注。感兴趣的同学可以去github或者谷歌自取数据集哦👇


数据集github链接:

https://github.com/googlecreativelab/quickdraw-dataset

数据集谷歌链接:

quickdraw.withgoogle.com/data


这一数据集包含了来自全球100多个国家和地区人们的绘画数据,据谷歌消息,这些数据也被用来优化了本次微信小游戏“猜画小歌”的开发。


但是,基于谷歌网站在中国的境况,中国大陆的画作数据遗憾缺失。


不过,本次谷歌微信小程序上线后,中国画手的信息终于可以补充进来啦,感兴趣的同学也可以坐等数据集的更新了。


想到自己的画作还能被收录进入数据库,为人工智能和人类的进步作出一份微薄贡献,是不是有点小激动呢?


那么,这些数据能用来做什么呢?


这一数据库不仅包含了来自148个国家和地区的人所画的11.9万个不同的圆,也记录了每个玩家的手指(或鼠标)经过路线的坐标。


通过对其中从66个不同国家收集的100多个圆进行一些简单的几何分析,他们发现,不同国家的人习惯于不同的画圆方向:


美国人喜欢逆时针画圆,在近5万个美国人所画的圆中有86%是逆时针画的。恰恰相反,日本人更多习惯于顺时针画圆,800个日本人画的圆中有80%是顺时针画的。


下图是100个来自不同国家和地区的人所画的圆的随机抽样。



英国,捷克,澳大利亚芬兰人跟美国人有大致相同的比例逆时针画圆。


法国,德国和菲律宾人甚至有更高的比例-大致90%去逆时针画圆。在越南,95%的人逆时针画圆。



Quartz分析的数据库显示,大部分国家和地区的人更倾向于逆时针画圆,唯独两个例外:台湾和日本。


这一项目的成果在一年前发布在Quartz上👇

https://qz.com/994486/the-way-you-draw-circles-says-a-lot-about-you/


*大数据文摘在去年十二月已经发布了Quartz这篇文章的编译版,重刊如下,感兴趣的同学可以继续阅读。


如何解释这种差异呢?Quartz也做出了自己的猜测。


一个显而易见的原因是不同国家的语言。人们书写文字的不同方式,从上到下,从左到右或是从右到左,是否能够解答他们绘画方式的不同呢?美国,西欧和拉丁美洲人的口语虽有差别,但书写方式大致相同。然而亚洲和中东却有着与上述国家截然不同的书面文字。


下面几幅图展示了一些代表性文字的书写方式:



比如,先来看看日语中的文字。这里展示了日语中三种文字符号:平假名(hiragana),片假名(katakana)和万叶假名(kanji)。万叶假名基于汉字的表意文字,而平假名和片假名是表音文字。其中,平假名最接近于英文字母,也有最多的圆形笔划,其中大部分圆形笔划都是顺时针方向:


文字あ像英文字母a,是这样书写的:



日语和中文的文字都遵循严格的笔划顺序。整体来看,一个字是从左上到右下的方向书写的。美国罗格斯( Rutgers)大学数学教授书法家黄一知这样解释道:如果你画一条水平线再画一条垂直线,就像数字7一样,那么日文和汉字的书写规则就是把这两条线当做一个笔划,中间也没有停顿。(可以自己从纸上尝试一下)


因此我们的手会自然而然形成习惯去顺时针动,就像汉字“了”代表着一个动作的完成。



基于中文的文字的书写规则在小孩子刚刚拿起铅笔的时候就深深印在他们脑子里了,这也奠定了台湾和日本的人画圆基于相同的书写方式。


三角形绘画方式的相似度在基于中文的语言中更加显著。97%台湾地区的画手和90%的日本人和韩国人都是逆时针画三角形。对比来看,美国人一笔划出的三角形,只有一半多一点的比例是逆时针的。



基于汉字的笔划顺序规定对角线的格式,就像一个三角形,是先从右向左再从左向右的。从“人”这个字,就不难发现这种规律。


另外一组国家的例子也可以让人们更好地理解画圆方式的不同。阿联酋,科威特,阿尔及利亚,约旦,沙特阿拉伯,以色列,伊拉克和埃及在下面画圆方式的分布图中聚集在一起,几乎互相挨着(除了泰国和韩国在中间)。



阿拉伯文和希伯来文包含很多曲线,读和写都是从右向左的顺序。在阿拉伯语中,文字的曲线跟随着手的方向,通常是顺时针,这也更好地控制字与字的间隔。


下面是字母“b”和“n”在阿拉伯语中的书写方式:



如果对剩余国家画圆方式观察更仔细一些,就可以发现其他的一些规律。举个例子,韩语(朝鲜语)的书写系统中有大量的圆形。1500个韩国人所画的圆有72%是逆时针画的。


在泰国的结果中,有64%的圆是逆时针的,而其文字书写同样也包含着大量的圆形笔划。在42个辅音中,几乎所有都是从一个小圆圈开始写。开头的这个圆圈可以顺时针也可以逆时针,但逆时针的圆是顺时针的两倍多。


下面是发音“m”的泰文:



你也许会问另两种充满圆形的文字,缅甸语和格鲁吉亚语的结果如何。


缅甸同日本和台湾结果相近,仅22%的圆形是逆时针的。这支持了我们所得出的结论,但由于样本只有9个,我们不能这样轻易下结论。相似的,格鲁吉亚只有72个数据,所以不具代表性。


剩余的50个国家倾向逆时针画圆。这些国家几乎所有都在使用运笔从左至右、且没有过多圆形笔画的拉丁字母。英语也有笔顺,不过没有那么死板:可能是因为在孩提时期像大多数使用拉丁字母的国家画圆那样一遍一遍地逆时针写“c”和“g”。


那么,究竟什么才是正确的做法呢?


Quaritz在文章中也做出了分析,在20世纪70年代美国为儿童开发的一项名为“torque test”(“扭力测试”)的常见的心理学练习中,孩子们会得到一张纸,上面有这个。



为了帮助研究人员辨明孩子是左利手还是右利手,孩子们被告知要先后用两只手画圆把X圈起来。如果孩子逆时针画所有的圆(被认为是右利手的证据)则被认为是“非标准”。如果孩子顺时针画了一个圆(与左利手相关)都被认为是“标准”。


这些研究表明,不仅文化和写字方式(书法)塑造了人们绘制抽象形状的方式,而且也表明这种趋势随着时间的推移越来越明显。写的越多,习惯越根深蒂固。出于同样的研究目的,我们在全世界范围内收集了90,000个圆,构造了一个规模更加庞大、数据更加一致的数据集用以支撑过去在小规模数据研究中得到的结果。


现代汉语笔顺系统是从汉代盛行的隶书系统演变而来的。隶书书写时间太长,而人们想要写的更快,因此隶书演变成行书,一种半草书风格,最终演变成今天的笔画。根据书法家黄的说法,使用软毛笔书写能够了解更多的现代中文笔顺规则。


日本人同中国人一样讲究笔顺。在1958年,日本教育部制定了国家级的笔顺准则,建立了统一的标准,避免出现混乱。(如今这些规则被放宽了。)


“我认为我运笔的方式很有效并且写出的字很漂亮”,日本协会语言中心主任TomoyoKamimura说道。“一些成年人书写笔画顺序完全错误,我们轻视他们那样书写,我们认为他们没有接受教育。”


如今,美国的小孩逐步被传授印刷体和手写体的方法,这种方法叫做“快乐书写”。该方法提倡使用“魔法C”,一种逆时针曲线,用在“c,g,q,o”等字母中。因此,美国的学校会鼓励小孩子们逆时针画圆,来帮助他们养成以后第一次书写字母时所需的基本运动技巧。

什么塑造了我们?


我们有无数种微妙的方式,不知不觉地将文化带进我们的世界:绘画的方式,手势的意义以及模拟真实世界的声音。而这是海量数据的核心乐趣所在。


为了测试我们的理论,我们请了一些母语使用日语、阿拉伯语、希伯来语、汉语、泰语和越南语的同事、朋友和家人来画圆圈,虽然这样感觉有点不太好。但他们仍然很高兴的加入了,因为他们除了好奇到底自己是怎么画圆以外,他们也渴望了解一个崭新的领域。


诚然,这世界上还有很多我们不懂的事情。于此同时,对绘制形状的研究在心理学上好像已经过时了。除了一个例外,我们发现所有与文化相关的图形绘制研究以及“扭矩测试”(“torque test”)都是在1997年之前的。


我们可以合理推断一下,全世界的人越来越多通过打字来交流,然而尽管某一天书法的艺术会被遗忘,但到了那个时候,也许我们已经形成了一个全新的以键盘为主导的文化差异呢。


“猜画小歌”背后的技术


“猜画小歌”由来自Google AI的神经网络驱动,该神经网络源自全世界最大的、囊括了超过5000万个手绘素描的数据群,能在规定时间内识别玩家的粗略涂鸦。

神经网络(Neural Network, NN)是一门非常重要的机器学习技术,也是深度学习的基础。它是是一种模拟人脑神经网络结构和功能的数学模型或计算模型,用于估计和拟合函数,由神经元、参数和偏置项三个部分组成基本架构。

在人类看到物体时,会主动将物体归到某些类别。比如说看见一只金毛,大脑会根据中枢神经的指令,对外部刺激做出反应,从而判断出棕色、聪明、温顺等特征并意识到它是金毛。神经网络能做到的,就是让机器接近大脑去“思考”,通过大量积累表象数据,能够凭借直觉感知表象信息。

神经网络之父、深度学习鼻祖Geoffrey Hinton曾介绍道:“很多没有任何逻辑支持的知识都根深蒂固地存在我们的脑海之中。换成机器,情况也同样如此。知识都是来源于现实生活的,有大量案例和具体意义,因而神经网络的优点也就在于此。”

▲神经网络之父、深度学习鼻祖Geoffrey Hinton

神经网络在计算机视觉领域的应用尤为广泛。通过以大量的图像数据集对神经网络进行训练和优化,用神经网络识别图像中的物体已经不再是难题。比如在“猜画小歌”中,AI从大量的已被标注的手绘数据中学习到每个分类的核心特征,理解人们每一笔的下笔走势等细节。被训练好的AI系统从接收到的粗略轮廓中提取匹配的特征信息,从而识别出所画的物体。这一点在玩游戏的过程中也有体现,在画简单物体时,刚勾勒几笔,AI就能识别出来,而对于较复杂的物体,AI识别就需要花费更长的时间去判断。人类来说看不懂的神奇画风,对于见过5000万手绘图的AI而言或许只是小菜一碟。

虽说“猜画小歌”是让我们手绘让AI猜,但AI早已具备了自己画画的能力。基于和“猜画小歌”相同的谷歌Quick, Draw!数据集,去年Google Brain的科学家David Ha和Douglas Eck发布一种新型的循环神经网络(RNN),它不仅能识别人类画的物体,还可以学习自己画画。


这种被称为Sketch-RNN的RNN将从来自Quick, Draw!的大量被分类的人类手绘中收集全面的手绘信息,包括每一笔的顺序和方向,经过训练可以生成新的图画,还能补充人类没有完成的草图。


这种技术可以带来有趣的应用,例如帮助艺术家和平面设计师在他们的工作中提出更创新的想法,甚至可以教人绘图。

自2010年退出中国大陆市场,谷歌的大部分服务与应用程序都被关在大陆门外。来到中国,就要按中国的规矩办事,谷歌显然已经吸收了之前的教训。如今,谷歌的一些应用程序已经在陆续重登这片土地。去年,谷歌翻译安静复出。今年5月,谷歌与中国四家第三方应用商店合作,推出中国版Files Go设备管理应用程序,并将AR和VR开发套件交付予小米应用程序商店,

今年1月,谷歌宣布和腾讯达成专利许可协议,意图在中国市场进一步合作。上个月,谷歌还向中国第二大最有价值的电子商务公司京东投资5.5亿美元。

每天都有数亿活跃用户在使用微信服务,近日微信团队公布最新数据,微信小程序数量已经超过100万,每日人均打开次数4次,54%的打开次数都是用户主动打开。微信小程序的生态繁荣,为谷歌在中国提供了新的立足点,这意味着用户可以绕过Google Play和苹果的App Store接触到谷歌AI技术。

虽说“猜画小歌”小游戏的目标很低,但这将成为谷歌在微信扎根的第一步,未来很可能基于微信这个平台推出更重要的应用程序或服务。

不过随着越来越严格的审查制度和中国对美国科技公司审查的加强,谷歌的进一步扩张依然前路坎坷。

免责声明:部分内容源于网络,如涉及侵权,请直接留言联系。谢谢!


关于齐圣科技  

杭州齐圣科技有限公司是一家专业从事智慧建设、大数据平台搭建、私有云平台建设、人工智能应用的高新技术企业。可为合作方提供“云到端”一站式“互联网+”解决方案。

齐圣科技拥有一支近百人规模的产品研发团队,目前已形成智慧城市建设、互联网金融、智慧医疗、企业云服务平台建设四大主干业务。


【声明】内容源于网络
0
0
齐圣科技
专业从事数字化平台建设的国家高新技术企业,致力于为各级政府职能部门、国资企业、产业载体提供数字化平台建设服务,为“数字政府”、“数字经济”、“数字社会”、“整体智治”等应用场景提供更为全面、更具创新和更加高效的数字化改革解决方案。
内容 108
粉丝 0
齐圣科技 专业从事数字化平台建设的国家高新技术企业,致力于为各级政府职能部门、国资企业、产业载体提供数字化平台建设服务,为“数字政府”、“数字经济”、“数字社会”、“整体智治”等应用场景提供更为全面、更具创新和更加高效的数字化改革解决方案。
总阅读49
粉丝0
内容108