大数跨境
0
0

11年前的这部电视剧,突然刷爆年轻人的网络。

11年前的这部电视剧,突然刷爆年轻人的网络。 京东科技集团研究院
2019-06-05
2
导读:雨女无瓜?成为了年轻人的态度。

不知道最近你有没有看到这个表情包

(注重版权,小科自己画了一个,夸我)

第一次看到这些词是不是有点迷茫?以为和大家出现了代沟。


其实这都是出自2008年首播的《巴啦啦小魔仙》电视剧,剧中角色游乐王子讲话自带腔调,就被网友们做成谐音梗了。


雨女无瓜=与你无关

要你寡=要你管

亚子=样子


在知道是口音谐音梗后,当我们再看到类似的句子,就能很快反应出它本来的意思。


跟科妹一起来看看这些你能想到吗~

(点击👇下方空白处浮现答案)

01


咯咯咯噶有咯咯咯噶嘅咯咯👇

各个国家有各个国家的国歌

02


我想次西兰发又片👇

我想吃西兰花肉片

03

你怎么几道我系香港淫👇

你怎么知道我是香港人

04



老板说他老家省份开头是H👇

湖建


05


大扎好,我系骨天乐,我系渣嘎辉。探碗懒月,介系里没有挽过的船心版本,挤虚底艳三番钟,李揍会干我一样,爱象介款游戏。👇

对不起,没有明星授权和游戏广告费,这个我就不翻译了。

如果答案跟你想的差不多的话,你有没有想过,和他们不是老乡的你,为什么能明白这些话真正的意思?

其实首先是因为这些带口音的词句都是基于共有认知的普通话,我们每个人头脑里都有一个“数据库”。发音之后,大脑皮层中的高级语言中枢,会有对应的区域搜索联想相关已知词汇,从而我们能明白正确发音及意思。


带口音的话通过大脑搜索对比就能懂,那现在风靡的人工智能能像人一样听懂吗?


那我们一起来简单看看人工智能语音识别的原理吧~

在进行识别之前我们要做不少准备工作。需要用大量的声音数据训练一个声学模型,再用大量文本数据训练一个语言模型

在获得音频信号后,经过一系列繁琐(但此处省略)的前端处理,把人的语音转化成机器的语音进行解码,最终就能输出为语音识别的文字啦。


虽然一些词句带有地方口音,但它们仍然是普通话,符合语言常识规律。并且口音已经被见多识广的声学模型考虑在内了~所以,人工智能语音识别是可以听懂带口音的普通话的。

 

不过,值得一提的是,虽然粤语、闽南话、吴语对我们来说都是中文。但方言对机器来说,都是区别于普通话的另一种语言噢~


如果希望能识别方言,可以将训练声学模型、语言模型的数据更换为方言数据,再加上一个方言词典,机器就能准确识别你说的方言啦。


怕正文太长你们没耐心,文章最后挑了几个知识点出来随便聊聊:

知识点附赠1

一般来说,声学模型学500小时以上就可以简单使用,商用的声学模型一般需要学习5000小时以上。机器尚且需要大量时间学习,害怕被ai取代的你今天学习了吗?

知识点附赠2

在语音识别中,困难的并不只是口音、方言,现有的技术已经可以熟练处理来自一个人的语音。但当进入复杂的环境,那些我们能轻松与人声区别开的噪声、混响、回声等,都成为了语音识别亟需攻克的问题。作为人类还总是能有轻易优于机器而不自知的能力呢。

知识点附赠3

不同的学习数据训练的模型是不同的。比如科妹训练的模型可能会输出:“我想买8个苹果吧。”而科妹老板训练的模型可能输出的就是:“我想买8个苹果8。”

知识点附赠4

用siri读雨女无瓜,它听不懂也搜不出来。

不信你试试。

来留言区跟我们聊聊对人工智能的期待和看法吧(聊聊各地口音方言也行!)~


最后,如果你看到这儿了,对于知识点1,你可以自豪地说一句今天也学习了噢!喜欢今天内容的话,记得点个右下角的在看!

【声明】内容源于网络
0
0
京东科技集团研究院
1234
内容 3258
粉丝 0
京东科技集团研究院 1234
总阅读1.7k
粉丝0
内容3.3k