信息系统(ISs)的在现代社会中的广泛使用,使得事件记录数据(日志数据)变得无处不在。我们去医院接受检查时各种医疗设备会产生日志,在ATM机上存取款时机器会产生日志,去政府事务中心办事时,订购电影/旅游/餐饮等电子票券时都会根据各自的流程产生各式各样数量庞大的日志记录/文件。
一方面,越来越多的事件得以记录,从而可以提供关于过程历史的详细信息;另一方面, 在竞争和飞速变化的环境中改善和更好的支持业务过程这一需求日益突显。而面对此种数据, 仅靠简单收集和人工观察显然不能够解决人们所关心的一些问题:如观察异常, 判定违规因素, 识别业务瓶颈, 预测相关数据及现象, 进行推荐和优化(数据/流程)等。因此过程挖掘(Process Mining)由此而生。
导入日志数据到RapidMiner
我们截取了这份日志数据中的Case1部分记录,数据中包括了活动名称,活动对象(工位),活动时间(开始/结束)等数据。
首先,我们将日志数据导入RapidMiner,这里注意ProM支持标准事件日志格式XES(可扩展事件,eXtensible Event Stream)。
注意
右边是Read Log算子的参数,需要设置导入XES文件的路径。这也是这个简短流程中唯一需要设置的算子。
RapidMiner运行后的结果
一个基于Petri网的流程图。
图中包含了若干Transition(方形节点,即日志文件中的各项活动)和Place(圆形节点,此例中可以理解为各活动之间的“静止”状态),从这张图可以清晰地看出流程各节点和工作流走向。
请关注我们,获取更多数据挖掘知识!






微信ID:rapidminerchina
长按左侧二维码关注