
不管你之前有没有真正关注过,不可否认的是,机器学习早已覆盖了你的生活。从自动推荐看什么电影、点什么食物、买什么商品,再到个性化的在线电台和从照片中识别好友等等,这些服务的核心都是机器学习算法。
机器学习是人工智能应用的重要研究领域之一,也是人工智能和神经计算的核心研究课题之一。对机器学习的讨论和机器学习研究的进展,必将促使人工智能和整个科学技术的进一步发展,如何培养机器学习能力以满足科技和生产提出的新要求是目前研究的重中之重。
目前,机器学习已有十分广泛的应用,例如:在看新闻时,APP会自主推送一些我们感兴趣的新闻、在我们使用的智能工具或软件中的语音识别功能、一些通过面部表情识别心情的软件、甚至还有人们熟知的Alphago战胜李世石的围棋比赛……这些常见的场景中都可以看出机器学习现已渗透进我们的生活中。
自2017年起,机器学习与自动驾驶、制造业、金融业、零售业等行业也产生了更为紧密的融合,并开始实现大规模的商业应用。
自动驾驶汽车在公路上行驶,必须能够实时响应周围的情况,这一点至关重要。这意味着通过传感器获取的所有信息必须在汽车中完成处理,而不是提交服务器或云端来进行分析,否则即使是非常短的时间,也可能造成不可挽回的损失。
根据自动驾驶的拟人化研发思路,自动驾驶系统原理可理解为感知—认知—决策—控制—执行五层。通过传感器实现感知作用,并根据所感知信息完成处理与融合,对信息达成一定的认知和理解,在形成全局整理理解后,通过算法得出决策结果并传递给控制系统生成执行指令。

因此,机器学习将是汽车数字基础设施的核心,使它能够从观察到的环境条件中进行学习。对于这些数据,一个特别有趣的应用是映射——汽车需要能够自动响应现实世界的周围环境,以更新地图。因此,每辆车都必须生成自己的导航网络。
自动驾驶已经成为近两年传统车企与科技公司争夺的热点领域,大众、本田、丰田、福特、通用、博世等传统车企或零部件企业通过自主研发或合作等方式,开发自动驾驶汽车;高通、三星、英特尔等公司通过开发自主驾驶芯片来抢占自动驾驶领域的一席之地;谷歌、特斯拉、亚马逊、微软等科技巨头更是通过技术优势提前布局自动驾驶。
在我国,自动驾驶更是提到了国家战略的高度,全国各地纷纷启动无人驾驶汽车示范区项目。去年4月,百度开放自动驾驶平台,帮助汽车行业及自动驾驶领域的合作伙伴快速搭建属于自己的完整的自动驾驶系统。
当然,自动驾驶技术还未完全成熟,很多人都料到无人驾驶汽车发生事故是不可避免的。就像今年3月,出现了全球首例无人车致死事件,当事件发生时,还是很震惊,没想到事故会严重到致人死亡,更没想到致死事故会发生在人类安全员还在车上的时候。
机器学习的核心技术与制造商每天要面对的复杂问题相一致。从努力保持供应链的高效运行,到按时生产专门定制的产品,机器学习算法有能力在生产的每一个阶段带来更高的预测准确性。

对制造商们来说,最关心的事情就是找到一种新方法,在保证产品质量的前提下更快适应客户。根据麦肯锡调查报告、普华永道的数据等可靠数据来源,机器学习技术会通过以下十个方面改变制造业。
1、通过机器学习技术,半导体制造商可提高30%产量,降低废品率,优化芯片生产;
2、资产管理、供应链管理和库存管理是人工智能、机器学习和物联网应用最热门的领域;
3、MI驱动过程和质量优化可以有35%的提升,可视化和自动化提升34%。未来5年,分析、API和大数据的整合使工厂联网率增加到31%;
4、机器学习可减少50%供应链预测误差,减少65%销售损失;
5、机器学习可以提高需求预测的准确度,降低能源成本和价格差异,同时也能准确反映价格的弹性和敏感性;
6、使用机器学习自动进行库存优化,可提高16%的服务水平,增加25%的库存能力;
7、机器学习整合实时监控,可优化车间操作,实时了解机器负载和生产进度查询;
8、提高多个生产场景的生产效率和准确性,降低多场景50%的成本;
9、通过机器学习的精准预测和预测结果,节约35%测试和校准时间;
10、机器学习和整体设备性能结合,可提高产量、提高维护的准确性,加大工作负载能力。
金融行业以其拥有的大量数据而闻名——从交易数据到客户数据,以及两者之间的所有数据。未来,这一数据会越来越多,而金融机构也越来越希望能够充分利用他们所拥有的海量数据。迄今为止,金融机构已经使用各种统计分析工具进行大量的分析,但对海量数据的实时分析与排序仍然是一项挑战。
与机器相比,人类的大脑容量对思维有一定的限制作用。人类最多只能同时集中处理 3-4 件事情,而机器的处理能力是人类的几千倍。在金融领域的多个方面,机器比人类表现得更好。

速度:这无疑是机器的第一大优势。我们都知道在股票市场进行股票交易非常困难。人们通常在历史数据、图表和公式中进行大量的分析,以预测股票的未来,还有些人仅仅是随机下注,这些行为听起来都十分忙乱且耗时。机器学习算法能够对成千上万个数据集进行精确的深入分析,并可以在短时间内给出简洁准确的预测,有助于减轻人们在大数据整理和分析方面的麻烦。
可靠性:在处理财务问题时,建立个体信用评级系统是十分必要的。银行、投资公司、股票市场每天都要进行多达数十亿美元的交易。因此,我们必须信任处理此事的公司或个人。由于人性中可能存在的偏见和自私,有些人往往会在金钱交易过程中进行诈骗。为了解决这类问题,嵌入了机器学习的机器在处理请求时可以做到零腐败。
安全:此前,勒索软件 WannaCry 攻击了世界各地的计算机,这表明,我们仍然易受黑客和网络安全方面的威胁。机器学习则通过将数据分为三个以上的类别建立模型,以此预测欺诈或异常情况。而手工审查成本高、耗时长、误报率高,并不适用于金融业。
精度:人们没有能力或不喜欢做重复单调的任务,这种重复劳动往往会产生许多错误,而机器可以在无限时地执行重复任务。机器学习算法会做数据分析的苦活,并在人类需要的情况下推荐新策略,还能够比人类更有效地检测到微妙的或非直觉的模式,从而识别出欺诈交易。此外,无监督机器学习模型可以不间断地分析和处理新数据,然后自动更新自身模型以反映最新趋势。
如今的在线推荐技术已经变得越来越复杂。诸如引入社交网络推荐等更多的数据源,在线推荐的数据也变得更加详实、更加细分化。例如,如果你曾在线浏览猫粮的信息,那么你可能会看到与猫相关产品的推荐广告。电商网站将通过更多数据源的购买趋势和客户数据,提供更加个性化、更精准的推荐信息。
电子商务已经历了部署机器学习的早期阶段,另外,该技术也渐渐地应用在线下实体店的购物。零售商能够在消费者进入商店时分析消费者的行为和动作,用于帮助消费者找到合适的商品和适当的优惠。通过视频分析,零售商将能够分析消费者正在查看哪些商品,甚至是商品包装上的某个部分,无论是价格、功能还是图片。通过分析这些消费者购买数据,可以为零售商提供消费者最可能购买商品的最佳建议。

麦肯锡的一项研究提供了很多例子,量化了机器学习后,这些技术改变了零售商运营和竞争方式所带来的潜在价值,例如:
1、采用数据和数据分析的美国零售商供应链业务已经看到,过去5年运营利润率增长了19%。使用数据和分析来改善商品销售,包括定价、分类和展示位置优化,使得运营利润率又提高了16%。
2、个性化广告是当前机器学习最强大的用例之一。其他具有较高潜力的零售用例还包括优化定价、根据旅行和物流的实时数据优化编排计划,还有优化商品销售策略。
据福布斯称,美国零售商有潜力实现净利润60%的增长和年生产力0.5%-1%的增长。但是,实现这一价值还存在着障碍,例如缺乏分析人才,企业内的数据孤岛。这时候就需要机器学习和人工智能了。人工智能和机器学习可以帮助减轻推动利用可用数据所需的分析任务。当部署了一个全公司范围的、实施的分析平台时,机器学习将成为所有公司职能优化决策所依赖的事实来源。
虽然现在说到机器学习,基本上都会想到算法+数据,也因为这两方面的限制,就会对机器学习产生限制。针对存在的问题,专家给出的预景是利用学件(Learnware)来解决。所谓学件,即模型 (Model)+规约 (Specification)。把模型当成是工具箱里面的工具一样,每个都有自己的规范和使用场所,我们根据自己的数据与任务需要按照规约选取合适的,组合来解决当前问题。

其中,模型部分需要有如下特征:
1、可重复使用性:一个训练好的模型,可以根据用户需要,只利用少量数据,就可以得到对当前问题的加强或者适应。
2、可进化性:训练好的模型,能够感知环境的变化,主动地进行适应。这是为了处理不同任务要求,以及不同模型规约的问题。
3、可理解性: 得让用户对模型有一定程度的理解。
对于规约部分,也有三个维度的方案:
基于逻辑的,从训练数据中生成逻辑条款;基于统计的,将训练数据一些重要统计信息作为规约;基于简单数据的,或者直接从数据中选出一些比较有代表性的数据,展示出来。当然,也可以借鉴软件工程的知识,给出更多的选择。
针对上述特征的满足,数据科学与机器学习功能正越来越多地被各类行业所采用,并渗透至多种应用领域。在未来,机器学习可真正为不同行业创造出不同层次的价值。

厦门南讯软件科技有限公司(NASCENT)创立于2010年,公司创立以来,致力于为零售企业提供客户关系管理方法的研究与创新,为零售企业提供数字化、智能化的客户资源系统解决方案,帮助企业建立品牌体验、智能营销体系、客户数据分析,最终帮助零售企业完成以客户为中心的运营模式转型。近8年来南讯软件累计服务超过53.4万家国内外品牌,覆盖4亿多中国终端消费者。

