有时候我们会设想,未来是否会发展出一种更加智能的模式来取代现有的产品设计迭代方法诸如经典的可用性测试。众所周知,尼尔森与 1995 年提出了可用性的概念,基于这一概念产生出了一系列与可用性相关原则和测试方法【1】【2】。这些原则和方法历经20多年不论是对于当初的门户网站还是当前的移动应用都依然经典。其中可用性测试是一种常见的用户研究方法,非常适用于在设计流程以及上线流程中来评估产品设计质量。可用性测试需要考虑三个关键要素:即测试环境或场景,任务设计,以及可用性问题评级(基于数据采集和分析)。
但是这套经典的产品设计迭代方法需要耗费大量的人力、物力、财力和时间,另外,可用性测试还受限于前期对于测试场地场景的高昂的投入和建设,以及测试过程中一些客观条件的影响,诸如受试用户的数量、质量等,只有为数不多的注重产品设计质量以及在各方面资源充足的公司和企业才能够负担且长期进行。
图片来源 Tesla, http://www.tesla.com
然而,2018年10月26日,特斯拉在北美地区推送的“Navigate on Autopilot”及其背后的设计模式让我们看到了机器学习在产品迭代过程中的发挥的巨大潜力。
“Navigate on Autopilot”是一项主动引导功能,在驾驶员的监督下,可以引导车子自动上下高速匝道,可以实现换道建议、高速出口交汇处和出口导航,同时为用户在高速上规划最适合最高效到达目的地的路径。输入导航目的地之后,驾驶员可以选择为该行程开启“Navigate on Autopilot”,然后通过方向盘右侧的档杆启动 Autopilot 激活该功能;在进行自动换道操作时,需要驾驶员拨杆操作确认后才能进行变道操作;在不开启“Navigate on Autopilot”的情况下,Autopilot 功能也可以正常使用。“Navigate on Autopilot”功能首先会以影子模式运作,特斯拉会根据数百万公里的真实驾驶来验证其性能【3】。
【图:特斯拉自动驾驶行驶里程】
图片来源 MIT, https://electrek.co/2018/07/17/tesla-autopilot-miles-shadow-mode-report/
其中,所谓的影子模式(Shadow-Mode)【4】即无需车辆启动 Autopilot 系统,Autopilot 系统也可以在后台运行,系统不采取实际动作,但是会记录自己应该采取什么动作。这样在人类驾驶员导致交通事故时就可以对比分析,看看自动驾驶是不是可以避免事故。影子模式的强大之处在于随着特斯拉测试车辆数量和行驶数据的积累,可以利用高精度 GPS+IMU(惯导)来进行定位,采用 MapBox(一种用于定制设计地图的开源映射平台)和 Valhalla(一种开源导航引擎)+ 在跑的这几十万辆车子的各类传感器获得的路况信息来搭建自己的地图和导航系统。
下图左边是普通的低精度导航地图路径,而右边则是特斯拉通过影子模式通过数据积累绘制的高精度导航地图,通过对比可以看出,高精度导航地图可以呈现更详细更丰富的路径规划与选择,以应对实时变化的路况变化采取不同的自动驾驶策略。
【图:基于影子模式的高精度导航地图对比】
图片来源 Tesla Motors, https://mashable.com/2015/10/14/tesla-high-precision-digital-maps
这还不是最关键的,马斯克说特斯拉的车辆与车辆之间已经形成了一个庞大的“车队学习网络”,所有车都为数据共享做贡献。“When one car learns something, they all learn it. ”“当一辆车获悉某些信息时,其他车辆也可以很快得到更新”。这种学习能力让特斯拉 Autopilot 得以更快的进化。特斯拉通过影子模式描绘的高精度地图近似于人体的循环系统血管分级,这为导航的精确定位与路径规划奠定了坚实的数据基础,同时影子模式还能有效地避免了人工干预对于自动驾驶决策的影响。
因此,随着5G通讯、大数据和人工智能等技术的普及,很多业务模式能够更加智能的进行自我评估和迭代而无需人工干预,这也包括基于互联网开发模式的产品设计的评估和迭代。
影子模式倘若应用在当前的产品设计迭代中,那么意味着无需主动定期招募目标用户、选择和撰写测试任务脚本、收集数据分析和产出报告,而是通过终端系统后台感知并记录自然场景下用户使用产品的每个基于真实需求所需要完成的任务路径数据,终端系统不采取实际测试任务指示,但是会对比完成同样任务时自己默认规划的最优任务路径。
这样,当用户实际任务路径数据累积成为任务“路径流量”,通过绘制出高精度任务路径地图【5】和用户实际的任务路径流量判断每个任务完成情况是否符合终端系统预期的数据,尤其是当该任务路径下流失的用户流量或者某些任务路径的用户流量超出阈值时,系统会定位评级出该任务路径所在产品设计的具体问题。
接下来,系统根据定位的问题会生成多个测试方案,在投放到测试用户之中,再继续进行记录和对比,选择出与自己默认规划的最优任务路径最吻合的方案。影子模式的强大之处在于随着受试用户使用时间和任务路径数据的积累,可以在后台生成基于该用户自己完成的高精度任务路径图,系统能够记录和学习该用户特有的使用偏好进而结合该用户的个人用户画像分析该用户使用行为和心理预期,最终为该用户迭代出适合该用户偏好的最优产品设计方案。
基于此模式,我们可将自我产品设计评估与迭代分为:感知,理解,定位与决策四个部分,周而复始,循环往复。
采集的数据越客观“精度”越高,对后续评估与迭代越具有参考价值。而以往的用户测试所收集的数据大多来源于具有引导性的用户任务场景中,因此数据不可避免或多或少地受到非客观的显性重要性影响。
所谓显性重要性(Explicit Importance)影响即明确提出确认意图的测试任务让用户完成,而受试用户在任务执行过程中容易受到测试环境下意图明确的暗示而做出违背自己意愿的选择【6】。因此,受试用户会在传统测试方法中有时并不能反映自然场景下用户使用产品的真实情况。而影子模式的感知记录能更好地避免由于显性重要性误差而产生的不利影响。
此外,有别于在自然场景为主的产品设计迭代时代所获取的产品流程中记录用户数据,因为所得到的用户数据都是“低精度”的,类似于人工驾驶相较于智能驾驶所需要的导航地图质量差别,无法满足精准的用户行为研究与体验问题分析。因此需要在每个界面获取更多类型以及更为详细的打点数据。
打点数据就好比安装在自动驾驶车辆上的传感器,不断感知和记录用户在使用产品时所产生的数据:产品版本标识,功能/服务 ID,使用时间,地理位置信息,网络状态,用户 ID,界面控件/组件 ID,手势操作事件(包括有效事件和无效事件的记录)以及事件对应的时间戳,任务路径 ID等等;
其中获取的产品版本标识,功能/服务 ID,使用时间,地理位置信息,网络状态等数据主要用于用户使用场景的重绘;
而获取的用户 ID,界面控件/组件 ID,手势操作事件(包括有效事件和无效事件的记录)以及事件对应的时间戳,任务路径 ID等数据主要用于创建独立用户在完成各个任务下操作路径的绘制;
由于影子模式的数据采集避免了显性重要性的影响,能够让数据分析集中在对用户行为的判断和理解。
如图所示,不同的任务路径可以反映不同的用户行为,从而得到可能存在的产品设计问题:

基于使用场景的重绘与用户操作路径的统计,结合用户个人的基本信息或画像,来更为准确地判断用户偏好和理解用户行为【7】:
1.用户画像数据:属性数据即元数据的采集,可以定义人群数据的数据,用于标定人群身份的基础属性。比如:性别、年龄、地域、婚姻状况、学历、所在行业、收入等级等,用户画像所采集的数据稳定度强,所定义的用户人群不改变或改变缓慢;
2.场景重绘:在用户使用过程中通过移动设备获取的产品版本标识,功能/服务 ID,使用时间,地理位置信息,网络状态等数据重绘用户使用的场景;
通过元数据、场景数据并结合详细的行为数据识别和分析得到用户的不同行为:

【图:小米钱包绑卡用户行为分析示例】
但是并不一定同样的问题对不同偏好的用户都会产生可用性问题。例如有的用户偏好倾向手动输入银行卡信息的交互操作可能对于偏向更快捷的扫描输入银行卡信息交互操作用户而言反而会导致可用性较差,这取决于用户输入信息习惯,心理安全感甚至与硬件设备条件限制等诸多与用户画像与使用场景相关。
因此这些不同行为偏好可以迅速定位出具体的可用性问题,并据此针对不同的用户展示不同的迭代方案。
广泛流传的“二战轰炸机中弹统计”是一个很有名的关于幸存者偏差(Survivorship Bias)的案例:
图片来源 Walker Donohue, http://blog.idonethis.com/7-lessons-survivorship-bias-will-help-make-better-decisions/
据传在二战时期,盟军决定对轰炸机防护装甲改进以加强轰炸机的防弹能力。于是他们对战斗任务结束返回的受损部位的中弹情况进行统计,发现主要受损部位集中在机翼。所以,盟军最初据此认为应当加强机翼的装甲而减少机腹的装甲。
最后的结果则是:能够统计出来的样本对象都是能最终返航的飞机,而那些被击落没有返航的则无法被统计和分析。据此推论若一架飞机某个部位中弹较多并且还能返回恰恰说明该部位不需要加强,因此应该考虑在那些没有弹孔或者弹孔少的机体部位中分析找出致命部位,因为那些部位中弹后飞是无法返回的【8】。
基于“幸存者偏差”理论,以往的数据的采集和统计往往基于那些能够完成任务或者是有愿意完成任务的用户,而更为重要的可用性问题则有可能集中在那些中途无法完成任务而流失的用户身上:即首要应该考虑在那些未完成任务的用户操作路径数据中分析找出用户流失最为意外和严重的任务操作路径。则有可能导致更为重要的可用性问题无法被统计和分析。以往普通的用户任务操作路径统计非常单一,而高精度的用户任务操作路径数据的统计能够更为精准的对可用性问题进行定位和评级。
此外,由于有了用户画像与用户ID数据的统计和分析,目标用户能够更为容易地被确定,所产生的任务操作路径数据相对其它类型用户也更具评估价值。
在特斯拉 Autopilot 中主要通过视觉算法获取路况信息,通过八路摄像头全开 + 大数据 + 算法优化 + 自家导航的完善使 Autopilot 更加智能。并从之前的单车道 ACC(Adaptive Cruise Control,自适应巡航控制) + LKA(Lane Keeping Assist,车道保持辅助)到之后的半自动变道,再到现在的自动上下匝道,同时可以根据车速和行驶路径的变道,特斯拉给 Autopilot 赋予了更大的权限【9】。

基于特斯拉的 Autopilot 设计模式,对于前面提到的不同偏好的用户,有可能同样的设计方案会造成不同的结果。在理解用户行为的基础上产品设计的评估与迭代更加智能化,可以自主决策如何进行产品设计迭代:通过实时监控该类用户任务操作路径的数据,并不断自主迭代出最适合该类用户偏好的产品设计,做到更懂用户以至于能够自主决策和控制整个产品设计的“进化”方向,这也将会导致产品设计将会千人千“面”,以满足不同用户的偏好需求。
产品设计的品质在每个阶段的衡量标准是不同的,因此它的评估与迭代在每个阶段的方法和目标也会是不同的:例如在最早时期的标准就是能够让不同的人去适应于一个标准、通用产品而不出错和可用,而随着互联网、大数据和人工智能等先进平台和技术不断深入发展,可以想象,互联网公司产品设计的评估与迭代的衡量标准将是如何更懂“我”和更了解“我”,如何能够自我“进化”地去适应每个不同的人。
参考文献
1.Jakob N., MOLICH, R. Heuristic evaluation of user interfaces [C]. Proc. ACM CHI'90 Conf, Seattle, WA, 1-5 April 1990, 249-256.
2.Jakob N. Heuristic evaluation. In Nielsen, J., and Mack, R.L. (Eds.), Usability Inspection Methods [M]. John Wiley & Sons, New York, NY, 1994.
3.Introducing Navigate on Autopilot. The Tesla Team, https://www.tesla.com/blog/introducing-navigate-autopilot, 2018.
4.Introducing Software Version 9.0. The Tesla Team, https://www.tesla.com/blog/introducing-software-version-9, 2018.
5.张旭:《交通标志的获取、确定交通路路线的方法、装置及系统》[P],中国发明专利,CN201410852738.0,2014年。
6.Measuring Explicit vs. Implicit Importance in Customer Satisfaction Studies. Openmet Group, https://www.openmet.com/en/enmeasuring-explicit-vs-implicit-importance-in-customer-satisfaction-studies-htm.htm, 2014.
7.Kara P. Why Designers Think Users Are Lazy: 3 Human Behaviors. Nielsen Norman Group, https://www.nngroup.com/articles/lazy-users, October 2015.
8.Survivorship bias. Wikipedia, https://en.wikipedia.org/wiki/Survivorship_bias, April 2017.
9.GeekCar:《特斯拉的自动驾驶进阶:一面天使,一面魔鬼》, http://www.sohu.com/a/272708260_120865,2018年。