AI如火如荼,区块链进了政治局学习,那么什么是AI,什么是区块链,一句话怎么让人明白呢?
比较常见的例子譬如你写一篇word文字,软件会自动根据上下文做出词语是否出错提示。广义上讲任何编写的代码都是AI,但是目前更加倾向于图像处理、视频处理、自然语言处理和机器学习等。
常见的例子譬如你和张三打赌谁输了请吃肯德基,这时候你录了音发到微博或者朋友圈并且@李四、王五等,李四王五等也分别转发了,这样到时候张三如果想赖账,你拿出当时转发的消息,他就没法抵赖了。
人工智能曾经经历了发展的低估,因为当时的基础理论并不成熟,但是人们的期望很高,后来失败了,也就进入长期的低估,但是这两年中国的异军突起,人工智能突飞猛进,正在脱离实验室,进入日常生活。仅仅是现在的技术水平,就足以模糊现实与虚拟的界限,颠覆一般民众的认知。人工智能目前发展到那种程度呢?下面做一简单总结。
之前的图像处理都是用PS之类的软件人工编辑,一般的算法解决不了。现在已在图像补全、背景处理、样式转换、色彩处理、虚拟显示图像、图像翻译、图像识别等方面取的很大进步。
1、图像补全。左边是原始图片,然后把中间的花盆涂掉,输入模型。模型会自动补全缺失的部分(右图),由于它不知道,那里有一个花盆,所以只会根据没有涂掉的部分,补上地板和扶手。


3、样式转换。识别图片的风格样式(即像素的变化规律),将其套用在另一张图片。



5、虚拟人像。GAN 方法是"生成对抗网络"(Generative Adversarial Networks)的缩写,它是一种革命性的提升人工智能模型效果、生成虚拟图像的方法。
就是两个神经网络互相对抗。一个神经网络负责生成虚拟图像,另一个神经网络负责鉴定假图像。理论上,如果 GAN 训练成功,那么生成的假图像与真图像将无法区分。2014年,这种方法提出以后,快速发展,目前效果已经可以乱真。


6、图像翻译。一种图像通过 GAN 转变为另一种图像,称为图像翻译。空拍照片变成地图、黑白照片变成彩色照片,都是图像翻译的例子。让黑夜变成白天,示意图变成实物图。也可以让春天变成夏天,晴天变成雨天。图像翻译的难点在于,它需要有成对的示例(源图像和相应的目标图像),告诉模型应该怎么翻译,这些示例可能很难创建。但是反过来,只要有配对的示例,就可以翻译图像,不管这种翻译是否合理。还可以把其他人的表情移植到你的脸上,下图分别是愤怒、快乐、恐惧的表情翻译。

7、文本转图像。GAN 最惊人的成果之一,大概就是根据文本生成图像。用户提供一个句子,软件生成对应的图像。原始文本"一只红中透白、长着非常短的尖嘴的鸟",可以得到下面的图像。将来存在可能,根据剧本直接生成一部电影。

二、视频处理
图像处理逐渐成熟以后,人工智能就很容易进行视频处理。目前比较成熟的两个方向是虚拟动作和虚拟人物。
1、虚拟动作。
蓝衣女子的跳舞视频完全是假的,是将左上角舞者的动作套用在她身上,自动生成的。类似之前微软的游戏感情装置Kinect。

2、虚拟人物。
自动生成的根据一张脸的表情和动作,重建另一张脸。最著名的例子是虚拟的奥巴马演讲。2017年,华盛顿大学的团队发表了一段奥巴马的演讲视频。奥巴马其实从未做过这个演讲,是将别人的表情和口型套在他脸上生成的,语音也是合成的。

2018年,新华社与搜狗合作推出了虚拟新闻主播,具有真人的形象,带有声音、面部表情和动作,在电视上播报新闻,已经开通了英语、俄语、阿拉伯语的主持人。

譬如语音助手。谷歌在2018年推出了智能助手 Google Duplex,它会根据你的日程,自动打电话去餐厅订座位。
OpenAI 基金会推出的MuseNet,通过学习数十万段 MIDI 音乐,能做到使用10种乐器,生成一段4分钟的音乐。
据报道,使用 Yelp 网站的数据进行训练的模型,可以自动生成餐厅评论。
一是自动生成三种不同的回复,让用户选择。如果只是简单回应,用户不用自己动手写。另一个功能是,根据用户已经写的内容,预测接下来会写的句子,供用户选择。
毫无疑问,人工智能是很酷的技术,创造出了神奇的产品,有着难以想象的巨大应用前景。
但是,人工智能也是一把双刃剑,模糊了现实与虚拟之间的界限,把我们带上了一条不可预测的道路。作为个人,了解这些技术的进展和潜力,有助于保持一份清醒,享受技术之福的同时,避免它带来的一些副作用。
