随着人工智能产业发展大热,机器学习、智能语义、智能语音、知识图谱等概念逐渐进入大众的视野,要想理解人工智能到底是怎么一回事儿,就必须理解人工智能背后的这些概念。
机器学习与人类的学习过程其实很相似,机器学习的概念就是让机器拥有和人一样的学习能力,把通用规则和成功经验进行信息存储并消化,然后进行更快的能力升级。机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。类似人类在接触过很多事物、经历后获得的“经验”和“规定”一样。

以识别苹果为例,我们把不同种类的苹果都输入到机器意识中对机器进行训练,在一段时间后,机器就能识别各种各样的苹果,因为机器已经对苹果的各种特点进行了归纳并且自行下了定义。同样的,在围棋比赛中也是,阿尔法狗通过机器学习训练,在遇到不一样的棋局时,机器能够生成不同的应对方法,这个过程因为机器的学习归纳能力提高而不断缩减时间,机器在经过特意训练的某一方面能力也随之不断提高。
真正意义上的人工智能产品都必须是包含学习能力的,所以市场上只要能看到的产品都会涉及机器学习。
智能语音语义包含语音合成、语音识别和自然语言处理(NLP)三项主要技术。三项技术发展都不算早,目前也还处于上升阶段,并不是十分成熟。
其中语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。

语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音、断句等问题,准确率会大打折扣。目前业内普遍宣称的97%识别准确率,更多的是人工测评结果,只在安静室内的进场识别中才能实现。
智能语音应用范围极广,被科大讯飞、捷通华声、思必驰、云知声等企业运用在教育、客服、电信、家居等行业。
智能语义是自然语言处理技术,其中涉及语言学、计算语言学、机器学习,以及认知语言等多个学科,指运用各种方法,学习与理解一段文本所表示的语义内容。
智能语义技术底层是基于语义分析的大数据平台,能够识别中文语义;融合计算机网络技术、自然语言技术(NLP)和新媒体传播分析;这样分别可以实现海量信息的抓取和分析、信息文本内容的识别和过滤、信息传播分析和内容监控。

智能语义分析又可进一步分解为词汇级语义分析、句子级语义分析以及篇章级语义分析,具备智能语义分析能力的机器通常拥有对词、句子和段落进行理解分析的能力。一般来说,词汇级语义分析关注的是如何获取或区别单词的语义,句子级语义分析则试图分析整个句子所表达的语义,而篇章语义分析旨在研究自然语言文本的内在结构并理解文本单元间的语义关系。简单地讲,智能语义分析的目标就是通过建立有效的模型和系统,实现在各个语言单位(包括词汇、句子和篇章等)的自动语义分析,从而使机器像人一样理解整个文本表达的真实语义。
近年来,智能语义发展十分迅猛,已经在围棋对弈、自动驾驶、图像识别、语音识别等多个领域取得了突破性进展,国内内已有索菲亚、腾讯智聆、Giiso资讯机器人等智能语义产品面世。
知识图谱是一种语义网络,即一个具有图结构的知识库。一个物体涉及到各种各样的关系,把这些关系一个不落并按照一定的逻辑汇总起来,就是一个知识图谱。
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的,把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律。

知识图谱最先运用于智能搜索引擎技术,相对传统搜索引擎技术,智能搜索引擎核心技术包括自动推理技术、本体知识系统、专家系统等,它更注重与其他科学相融合、个性化搜索、智能化比较高。而知识图谱被认为是下一代搜索引擎,因为它以用户为中心,可以准确且智能地理解用户需求,并为用户提供全面服务。
知识图谱与机器学习、智能语义均是相互依存、相互交叉的概念,是人工智能产品均会涉及的底层技术。天机智讯正是依托了智能语义、知识图谱等AI底层技术,才能针对用户画像提供个性化资讯,成为每个人口袋里的聚合类资讯追踪机器人。
(以上资讯均为AI机器人小智编写)
▼


