2018年回顾及2019年趋势预测(上)
本文是TalkingData University翻译自KDnuggets一篇文章的前半部分。
原文作者是KDnuggets的Gregory Piatetsky,文章来自专家小组对2018年的回顾和2019年的预测。
点击【阅读原文】可查看英文原文
和过去一样,我们为您带来新一年专家的预测综述和分析。我们向每位专家提问的问题是:
2018年数据科学与分析的主要发展是什么?您预测2019年的关键趋势是什么?
以下答案来自Meta Brown, Tom Davenport, Carla Gentry, Bob E Hayes,
Cassie Kozyrkov, Doug Laney, Gregory Piatetsky, Bill Schmarzo, Kate Strachnyi, Ronald van Loon, Favio Vazquez和Jen Underwood。
虽然我们询问的是关于数据科学和分析的发展与趋势,但在大多数答案中,AI都是关键话题。专家们的答案所涉及的主要包括AI的进步,包括真实的和炒作的,数据科学和分析的平民化,包括自助服务、数据科学在内的自动化,GDPR,AI风险,实时分析等等。

Meta Brown,@metabrown312,Data Mining for Dummies的作者,A4A Brown, Inc的总裁。从事培训管理层和技术人员之间的有效沟通。
2018年的热门主题是人工智能。 在最近的记忆中,人工智能可能比其他任何分析应用带来了更多讨论。可悲的是,大部分讨论都没有多大意义。
计算机先驱艾伦·图灵(Alan Turing)设想计算机具有可与人类智能相媲美的能力。人工智能将无法分辨计算机生成的对话或是人类对话。
但想想现在人工智能应用的交互。像Siri或Alexa这样的个人助理可能有用,但几乎不可能以相同方式不被察觉的与人类互动。为在线帮助应用程序提供支持的聊天机器人非常令人失望。问一个现实生活的问题就会很快知道它背后没有真正的大脑。
根据图灵的定义,人工智能尚未存在。纽约大学心理学和神经科学教授加里·马库斯说,对人工智能的最大误解是“人们认为我们离它很近”。
我们确实拥有有用的计算机驱动逻辑的应用程序。他们不像人类一样思考,但他们速度快,一致性高,这些都是有价值的特征。这些应用程序使机器能够进行实际工作,例如标记潜在的欺诈性交易和操作汽车。
尽管人工智能有明显的局限性,但公众甚至科技界都充斥着不切实际的需求和期望。夸张到令人担心。它也开始令一些人失望,还有更多的失望即将来临。
Tom Davenport, @tdav,巴布森学院信息技术与管理首席特聘教授,国际分析学院联合创始人,MIT数字经济研究员以及德勤高级顾问
我们研究所也在预测年度趋势,其中预测一些脱颖而出:
组织越来越关注模型部署率 - 根据 Rexer Data Science 调查显示,只有10-15%的公司“几乎总是”部署结果,另外50%的公司仅“经常”部署。余下35% - 40%的公司只偶尔或很少成功部署分析模型。我曾经遇到过一些组织表示他们的成功部署率低于10%。当然,未部署的分析模型是没有经济价值的。2019年公司需要衡量和提高其部署率。
平民数据科学家 和商业分析师将被广泛接受。 图形和基于搜索的分析的兴起,以及数据科学领域日益自动化的机器学习,意味着我们将看到业余爱好者所做的大量分析工作。对抗这种趋势是一场必败之仗,所以不如接受并设置边界。这也意味着量化专业人员要么需要转向高度复杂和困难的建模任务,要么需要理解业务问题并解决组织变更问题。
Carla Gentry,@dat_nerd,咨询数据科学家,分析解决方案的所有者。
2018年是数据科学和分析的辉煌一年,但我们也看到了无论是否有人才和经验来支持需求,人工智能,神经网络和机器学习都在爆炸式增长。同样,无论是否存在误差风险、人才和经验,人工智能在医疗领域和警务中的应用都有所增加,我认为有些人已经忘记了,在这些例子,以及可穿戴设备和物联网中,数据等同于生活(Google Home, Alexa等)。
2019年将有更多同样的流行语,公司开始意识到神经网络需要从成千上万或数百万的例子中学习,更糟糕的是,每当你想要神经网络识别新类型的项目时,你必须从头开始(或至少是耗费时间)
人才是另一个问题,除了Geoffrey Hinton,Yejin Choi或 Yann LeCun,真的都不是神经网络的专家,所以不要指望有一个很大的,可供招聘的人才池。
数据科学在一些例子中是收集数据的洞察力,但期望我们成为AL、机器学习或神经网络的专家是不正确的想法,因此必须更加仔细地探索差异。并且在新的科技未来,新手用户将不得不重新参与竞争。我担心的是,人们缺乏对机器学习方式真正的理解,以及如何使用人工智能可以减少暴露公司/算法/市场的弱点带来的伤害。
所有这些技术的推进都值得庆贺,但你要明白,如果弄错了会有一系列后果!
Bob E. Hayes,@bobehayes, 是Business over Broadway的研究员,作家咨询顾问以及出版人,拥有行业组织心理学博士学位。
数据科学和分析领域持续关注机器学习的所有方面,包括强化学习,聊天机器人及其对社会的影响。
在2019年,我预计人们越来越关注人工智能的道德伦理,包括隐私和安全问题。
人们越来越重视理解算法如何引导特定的决策; 我们不仅需要知道机器学习有助于我们做出决策,还需要知道它是如何工作的(它是如何做出决策的)。此外,美国公司将会重点关注他们如何使用消费者的个人数据。加利福尼亚州通过了“加利福尼亚州消费者隐私法”(将于2020年1月生效),我希望其他州可以跟随加州的领导。
我很担心利用人工智能/机器学习在生产和传播假新闻方面的增长。Deepfakes表明,人们可以轻松制作视频内容,展示人们并没有说过的内容,或者以人们没有做出的行动来行事。正如马克斯·泰格马克所说,认识到人工智能如何变坏并不是恐惧,这只是“安全工程”。
对数据专业人员来说,虽然有很多方法可以学习数据科学,如训练营,MOOC和大学,但我希望看到以分析的方式教育非数据专业人员(例如,经理和一线员工)的尝试有所增长。
Cassie Kozyrkov,@quaesita,是Google Cloud的首席决策工程师。喜欢统计,人工智能,数据,双关语,艺术,科幻小说,戏剧,决策科学。
2018年的主要发展之一是数据科学的平民化。云技术使人们无需先为Kubeflow等工具构建数据中心,就可以为资源密集型大数据和AI应用程序提供动力,从而为没有基础架构专业知识的人们提供可扩展的数据科学。这种使每个人都能获得数据科学工具的趋势将在2019年加速发展。
本文来源: TalkingData数据学堂
-End-
活动主题
投票参与抽奖,赢取价值 ¥ 1580 活动入场券门票
活动时间
2018年12月18日-2019年01月02日
(免费获得活动入场券截止日)
2019年01月04日(星期五)
(幸运儿公布日期)
活动规则
动动手指,选出您最感兴趣或最喜爱或最想支持的议题(每人仅限一次投票机会)投票成功后,再把截图及个人信息(公司、职称、姓名、电话)发送至微信后台,即可参与学会投票活动。
活动须知
(一)将在参与者中随机抽出10人,邀请参与第二届数字化技术开放日,并获得价值 ¥ 1580 入场券一张,每人限一张;
(二)统一将于2019年01月04日由学会秘书处电话联系核实及公布幸运儿。


