按套路,是不是先要说明一下自己关注聊天机器人已经很久了,有多久?
现在90后都不了解MUD是什么了吧?应该连聊天室也没见过。
80后还记得以前聊天室内被关小黑屋的经历么?
虽然现在纯碎的聊天室基本没有了,演进为即时通讯工具,还有一类以 XX+ 的价值存在,比如主播室里你勾搭网红的工具:

再比如看片时候的弹幕:

聊天室虽然灭了,但是可以看到交流的需求还在,正如上面所说,很多场景和应用都需要人和人之间的交流。但是,也像互联网社交刚开始流行的时候说的那句话一样,你不知道你电脑连接的那头和你聊天的那个是人还是一条狗。
10几年前写聊天室系统的时候就期望实现一套自动聊天程序,那时候还不知道有神经网络、深度学习,当然也没有现在这样的计算机算力,连大数据的概念也没有,那时候Ali的马总淘宝都还不起眼,TX的马总还在考虑要把小黑鹅卖了。
无知的我写了一个正则匹配引擎,加上一堆预设的回答和自动服务,构建了我的第一个聊天机器人。依赖于当时在学生会工作的资源,拿到全校学生的信息,以前学校周边餐饮服务电话信息,这个聊天机器人,会帮聊天对象根据生日找到有缘人,以及提供外买点餐服务。网站取名——无缺网,当时心是有多大啊。
现在回想,大言不惭地说这不就是世纪佳缘和美团的Demo吗?!当时教电商课的老师叫我坚持,被我“义正言辞”的“拒绝”了,我要承担社会责任感(当时毕业生求职的先进派思想),我要去国门,我要去做一个码头工人。
扯远了,实际没做下去,是因为算法是我的弱项,到后来数据量和响应速度必需用算法和统计方法来优化时,我就缴械投降了。发现需要涉猎的领域太多了,分词技术、统计学、语义识别等等,已经没法用既定的正则引擎去解决。
几年来还是一直在关注聊天机器人的发展。近几年,得益于大数据和深度学习,Chat Bot技术越来越贴近需求场景。Chat Bot应用场景也越来越多,技术的成熟,真正解决了人类重复、单调的工作任务。
Chat Bot 的背后
互联网公司大量数据的积聚,借助深度学习,在以下几个领域有成熟的应用,语音识别、语义识别、推荐算法等等。

而且已经能够实现端到端的输入与输入出,也就是说,可以用手势、语音、摄像头作为输入,通过场景识别、上下文识别、用户画象等等后端处理,结合场景,也以图像、语音、视频等方式进行输出和反馈。

所以在交互方式上基本不存在问题,我们只需要将该技术引入到应用环境即可。
Chat Bot现状
我就不考虑自建Chat Bot了,10几年前就放弃了,那作为终端用户,怎么来引入 ?
目前有好多家提供AI Service的平台都有提供Chat Bot的服务,Chat Bot作为 AI As a Service中的认知服务(Cognitive Services)存在,大大降低了终端用户使用的难度。用户不需要去理解深度学习,也不用去写算法,更不用去搭建庞大算力的AI平台。
下面介绍几个,不打广告。
Bot Framework
微软的(https://dev.botframework.com),早些年这货还叫LUIS,现在已经集成要Azure中。

微软的BOT Framework可以把语音转成文字,识别文字的语义,后端可以配置主义识别结果和业务接口的关联关系,由AI自动识别将输入中的关键字对应到业务接口,并且传入查询条件。
比如:以股票查询为例。只需要设置关键字,和查询业务接口的关系。用户只需要通过自然语言提问:“今天XXXXX的股价是多少?”,“XXXX股票今天行情如何?”...类似问句在后端会自动转换为XXXX股票的查询请求。然后将结果返回。
另外一类好用的功能就是知识库、Q&A的自动回答。你只需要把你的知识库或者客服常用问题的答案扔给BotFramework,它会自动学习,在用户输入问题时,自动给出最佳的答案。而不是传统的关键字全文搜索。
目前也有很多微软的Partner可以提供量身定制的服务,这里可以介绍一下王公子团队的产品(没有给任何广告费):





Chat Bot 在集装箱码头行业的应用场景
集装箱码头公司的主要C端客户是货代和集卡司机。船公司、口岸相关其他用户基本不会无聊到需要一个机器人来调用一下尽情和解答人生疑难问题。
so,利用自然语言交互和人工智能,面向集卡司机和货代,提供智能化客户服务这是一个很棒的应用场景:
用语音就可以查询业务
不用打字开车安全
业务进行过程中等待的时候可以调戏一下机器人
对于码头来说,客服人员心情好了,也省了一些客服人员
场景一:自然语言业务查询
不用开发,通过配置就可以实现语义与业务接口的关联,实现自然语言查询接口。比如集卡司机可以通过语音询问:
“XXXX船,什么时候截关?”
“XXXX船,还能进箱吗?”
“我还能进XXXX船的箱子吗?”
都能关联到船期截关时间查询的接口。
场景二:业务输见问题的引导
将码头公司日常业务指南提供给AI,实现知识库的自动问答。系统自动通过理解语义关联到最佳的回答,提供给用户。

场景三:聊天解闷对象
Bot Framework一般都自带常规的“陪聊”服务,比如类似“小冰”这样的机灵少女。

场景四五六七八.....:基于运营的智能客服
不能说,弄好了再告诉你们。
能做的很多,再引用一张王公子团队的PPT页:

-----------------------------------邪恶的分割线--------------------------------------
还需要解决的问题
问题一:语音交互下降噪的问题
集卡司机驾驶室一般环境比较嘈杂,司机口音重(口音现在不是最大问题),加上噪音,语音识别比较困难。
问题二:虽然端到端已经的打通,但是作为输出端的自然语言反馈门槛还是较高
就是说目前在不开发的情况下很容易能做的语音转文字,然后提交查询,但是返回只是文字,就算是文字再转语音,这个转换目前还是比较生硬。
问题三:缺少融合的产品级平台
目前Chat Bot service 各家各有所长,但是没有一个取各家所长能自主融合的平台。比如,地方方言识别能力 讯飞做的比较强,那么在语音识别上用讯飞,在语义模型和业务接口匹配上微软比较强,那这个环节用微软。或者多家引擎并行查询查询 ,最终根据返回结果评分,取最好的返回给用户。
这个是我们的期望。
期望下一步的演进,最后上张图,希望我们不被替代。

上图为国产人型机器人

