大咖说
“大咖说”是由工控中国策划发起的人物专访类栏目,旨在发掘工业控制系统产业链典型企业家代表、行业专家的前沿洞见,通过深度访谈对话,了解企业前沿动态、掌握工控产品及解决方案的自主可控进程及行业应用情况,共同构建工业控制系统创新生态。
姚羽 庚顿董事长/总经理
“工业级时序数据库的应用主体是业务,不是新技术的堆砌,也不是炫技和玩概念。工业乃国之重器,做工业核心基础软件和做实业都是一样的道理,要跟时间做朋友,才有市场和未来,也就是说做基础软件一定要耐得住寂寞,啃得动骨头,顶得住诱惑。如果什么挣钱做什么,什么概念热就跟着一窝风上,可能最终将一事无成,尤其是在这些关系到国计民生的领域,所有的商业炒作最后都是竹篮打水一场空!”
姚羽:时序数据只是最近几年新炒出来的叫法,20多年前它们叫工控实时数据库。2000年以前,国内工业生产过程用的实时数据库基本上来自欧美的一些工业巨头企业,也有一些DCS或PLC厂家根据数据库原理自己做一个简单的文件系统,能读写、查询就成。2000年8月初北戴河举行的中央办公会上,朱镕基总理表示,“如果不能成功地完成向广东送电1000万千瓦的任务,我总理辞职”,也就是那年,电力体制改革启动了。大形势下,当时的发电行业对运行优化、设备检修、节能降耗等需求非常旺盛,劳动力成本也越来越高,大家纷纷上线厂级监控信息系统SIS(Supervisor Information System,简称SIS),一下子把国内实时数据库市场搞火了,当时发电企业面临的最大问题是,进口的实时数据库非常好用,但价格极其昂贵,而发电企业还不得不买单,因为本土实时数据库厂商一个都还没有。我们庚顿的时序数据库也正是那年开始研发的。但这要从1995年说起。
1995年,庚顿创始人潘亚利老师当时刚大学毕业3年,正准备去中科院自动化所读研究生,没想到报到之前,被任命担任于文虎院士实验室副主任,著名电力专家、机械振动与故障诊断领域工程院院士于文虎院士(1941-2001)任主任,原因是要做一个项目,这个项目名称为《大型火电机组性能与振动故障远程在线分析与诊断系统》。1998年项目完成,28岁的潘亚利老师获得国家科技进步二等奖,当年一等奖是袁隆平院士。从那以后,潘亚利老师开始在火电机组故障快速诊断分析及运行参数优化做了大量工作,成为发电行业最早一批SIS专家,2000年起组织人马研发国产时序数据库,对标国外产品。2005年潘亚利老师参与起草火电SIS标准之后,本土时序数据库的研发也驶入了快车道,2007年8月,潘亚利老师和他的几位志同道合者组成创业团队,在中关村成立北京庚顿数据科技有限公司,并于当年正式发布庚顿时序数据库1.0,9月份验证成功10月份在火电厂完成首次成功交付。
2008年是一个重要的节点。当时国产时序数据库虽然功能、性能上已经基本能满足发电企业的需求,但数据写入速度、查询速度还不尽如人意,同时用户在使用实时数据库的过程中也提出需要配套数据采集产品。当时发电厂普遍采用的都是西门子、施耐德等国外DCS,不同的用户采用的自动化系统也各不相同,所以需要我们根据用户的情况开发各种各样的接口协议。
2010年,国产实时数据库已经基本实现国产化替代,用户群体从发电拓展到石油石化、钢铁等众多流程工业企业。2012年,基于实时数据库的组态产品正式上市。2016年庚顿等时序数据库成长为国产化替代的生力军,市场份额基本占据国内实时数据库的小半个江山。2019年,庚顿实时数据库单次写入速度达到700万次/秒,技术上全面赶超国外品牌,应用场景更为丰富,涉及设备互联、智慧环保、智慧能效、设备状态检修等众多应用场景。2022年,国产时序数据库实现纳秒级时间戳及双活零切换、零丢失,广泛应用于风电、水电、光伏发电、核电及军工、航空航天等众多领域,经历了这些以后,我们逐渐从保障生产连续运营过渡到以基于实时数据的高级数据分析阶段,服务于企业的数字化转型及高质量、低碳化发展,开启了向人工智能过渡的探索之路,实现了实时数据采集、存储、计算到工业现场组态的有机融合,持续挖掘工业实时数据价值。
姚羽:公司的发展战略,有以下几个转变:
第一,从传统的实时技术和数据库技术服务于生产监控的理念,转变为以工业实时数据分析应用为主,生产监控为辅的理念。在2019年以前,我们重点放在支持企业生产业务连续性,但我们发现实时数据库还有更大的价值。首先,工业级时序数据库环境生态与一般的时序数据库在对业务的理解上存在着区别。传统应用断网,如果不能立刻恢复影响是有限的,但工业级时序数据库上如果断网,可能整条生产线都毁了。其次,传统应用的理念在工业级时序数据库上有很多不适用的地方,传统应用实际上都是集中在TcpIP协议上的,但是在工业级时序数据库上有太多的工业协议,它追求的是整体的安全性和可靠性,这在理念上与传统应用不同。工业级时序数据库需要服务于设备状态检修、环保控制、能耗节降等,这意味着需要更快的采集、写入、查询、算力等能力。如果把工业设备各个节点的流量全部采集下来,第一,采集的工程量非常大;第二,传输占用的带宽也非常大;第三,储存、还原、分析、处理同样需要非常大的工程量。因此,整套的数据库系统比原来的工业控制系统投入多太多。再次,工业级时序数据库包含着广义的业务特征、组态特征甚至涉及到工业设备安全和工艺工业生产的特征。时序数据库厂商的技术发展路线最早都是由数据类型、业务连续性衍生出来的,从工业级时序数据库的角度,95%以上都需要首先实现监控的需要。如果用这些东西去指导整个的数据理念或者实时数据技术体系,那么当面对真正的数字化转型需求时,不懂业务的话完全解决不了用户的需求。因此,不懂用户业务的的数据库已经完全不适合用在现代工业体系上了。
第二,从关键设备传感数据为主的数据采集范围,转变为工业数字设备、工控设备、工业组态、工艺流程等都列为数据采集的范围,延伸数据资产视角,从数据资产全生命周期的角度考量实时数据质量。因为更高级的数据应用的目的,包括出决策数据分析的大部分情况是在数据采集环节,我们把工业组态也视为数据资产,等于把这些资产都作为重点的监控对象,用类似大数据的理念,及时采集、存储更为全息、更为全面的生命周期、更高质量的实时数据。因此,作为核心工业基础软件,工业级时序数据库从某种程度上讲等同于工业化AI的基础设施。
第三,从主备转变到全双活应用。要从更安全的角度去做实时数据存储,始于保障生产连续性和生产安全,但要从企业运营的角度思考实时数据的体系。从感知发现异常,到分级监管掌控,再到动态恢复这一循环往复而实现信息系统乃至生产系统的安全运行。从传统的一主一备单系统转变为综合软硬件实现故障预防、业务连续、容错高可用双活系统,综合发现、综合防控、动态运维是针对目前保障生产连续性的基本手段,可惜的是太多的时序数据库厂商和用户都没有看到这一点。
第四,我们从基于常规的X86硬件架构、Linux/Windows操作系统这些基础设施转变为基于龙芯/飞腾/鲲鹏等国产芯片、麒麟/统信/欧拉等国产操作系统、信创云系统,同时把安全按照信创体系化的需求做到了全系统信创体系。企业系列产品完成了从1.0(日志收集、查询分析)到2.0(自定义数据体系、从采集到管控、运维服务)到3.0(以大数据为视角、以更快速度为主的态势感知、工业级时序数据分析推演和追溯,以动态运维为基础的服务)的包括工业数据存储、工业数据检测、工业数据交换、工业数据审计、工业数据审计、工业日志审计、工业监测预警平台、工业综合数据采集探头等多个产品线的升级换代,并完成了向龙芯、飞腾、鲲鹏、海光、兆芯等多个硬件平台的移植以及向麒麟、统信、凝思、欧拉、深度、中科红旗、中兴新支点、中科方德、国防加固专用版等多个操作系统平台的适配,并完成了多个国产化端云边配套软件的开发。下一步准备向4.0(工业实时数据资产平台)、5.0(与人工智能融合)出发。
姚羽:遇到的困难太多了,但幸运的是,正是这些困难成就了我们。例如在国产化生态不健全的这段时间,我们跟龙芯、飞腾、统信、麒麟等完成了所有的适配。再比如,国产化的产品体系也不算太成熟,原则上是没有用户愿意和我们一起承担开发风险的。但庚顿非常幸运,我们的用户愿意和我们共同成长,一起犯了很多错误,但也一起解决了很多问题,而这个宝贵的过程,恰恰成了庚顿数据库不断迭代的过程。用户是我们的老师,也是我们的战友。
姚羽:流程工业企业数字化转型的难点有两个,第一是投入巨大 ,大量设备需要改造,增加数据采集类型和测点,第二是业务复杂,业务经验和知识软件化困难,建模周期较长,IT专家与OT专家配合不容易,目前大多数基于实时数据的数据分析应用不成熟,复用率较低,信任成本也比较高,短期内难以见到效果。
针对这些问题,我们专门成立了庚顿工业化数字科技研究院,我们的研究院里云集了各类行业OT专家,针对关键行业的业务进行分析,准备推出一些有规模需求的数据应用解决方案,但试错成本可能会比较高,但我们的核心用户目前已经着手在设备故障诊断、智慧节能、低碳化等方面做出尝试,我们也在积极参与。
姚羽:工业互联网跟物联网的引入都是随着工业数字化浪潮的推进,进一步深化和推进了工业级时序数据库的概念。工业互联网就是用现代手段把不同的行业、产业链、专业串联在了一起。工业物联网是工业数字化的基础,通过万物互联使各种现代数据的采集、分析、处理更具规模化、批量化、智能化、知识化,从而实现人们梦想中的智能、便捷和自动化,同时也给时序数据库带来了巨大的挑战。
近10年来,电力信息化系统建设水平持续发展,数据融合、实时监视已经不构成技术障碍。作为SIS基础的实时数据库应付数据融合、海量数据存储、展示均已经驾轻就熟。如何推动电厂实现厂级运行操作优化实现智能化生产成了当下工业级时序数据库产品角力的重点,这也正是SIS发展的第二阶段。可以说在第一个阶段,国内时序数据库厂商一时没跟上趟,国外一些传统时序数据库品牌趁机挺进并占据了中国市场。目前所处的第二阶段,挑战与机遇并存,国内时序数据库厂商能否应对挑战,抓住发展机遇,后来居上,值得期待。
庚顿是十五年前就是冲着这个挑战和机遇来的。庚顿工业级时序数据库就是要把别人做得好的方面,如数据融合、海量数据存储、检索、监视等,做得比他们不差;把别人欠缺的部分,如性能计算、优化分析等帮助用户提高实时数据使用价值的方面,做出来。企业经营管理水平与厂级生产优化水平如同信息化水平与人们对它的认识一样,是相互为因,相互为果的。虽然刺激企业经营管理水平提高的外部条件还有待完善,但可以预见厂级生产优化、设备运营、节能环保等水平的提高必将推动企业经营管理水平的提高。
姚羽:目前国内流程工业国产化替代和数字化转型已经是大势所趋。在电力系统华能、国能、华电等五大发电集团基本已经或正在进行DCS国产化进程,作为底层工业实时数据采集和存储的工业软件,工业级时序数据库可能赶上了风口期。但从技术和应用的角度上讲,如果国产软件在性能、功能等能力上赶不上用户应用的现实需求,也一样没有机会。
目前大部分企业采用的依然是国外实时数据库软件,之前采购的时候都没有考虑到安全,欠账严重,电力安全等同于国家安全。我们从各种新闻、会议上都可以看到我国对信创的关注和投入,已经有不少大型央企开始关注基础核心工业软件的自主可控,国外品牌的实时数据库市场份额正在逐年下降也是不争的事实。
其次我国已经把数字化转型、高质量和低碳化发展作为国策,从这一点上来讲,对国产工业级时序数据库也算利好。尤其近年来,以核电为代表的流程工业对生产安全性、可靠性的要求提到了更高级别,所以对于国产时序数据库的超高可靠性、超高稳定性、绝对可信性的要求也越来越高,对于相对更为成熟、更懂流程工业业务的国产工业级时序数据库而言,得到了更多的应用场景和实践。毕竟数据库是用出来的,国产工业级时序数据库拥有更多的时间的历练和场景的修炼,经验也更加丰富,软件也更为成熟,年轻的时序数据库厂商需要更多的时间追赶。
姚羽:总的来说有以下几点:
大。工业级时序数据库不仅存储容量大,且测点的数量大,必须能够同时管理多达几十甚至上百万个测点的时序数据,甚至不同测点数量的产品还需要针对不同的客户需求而特别开发,但是真实现场环境可能就给你两台普通的PC刀片服务器进行完成系统的部署。
准。工业级时序数据库的特点是每一个数据都是一个时间的函数,如果有1万点就有1万个时间函数,不仅要存1万个数据,还要存下来1万个时间函数。当然,这个过程一定会出现失真。因此,采取技术手段将这种失真保持在一定范围内,尽可能符合客观事实,这是一个重点。针对准的问题,工业级时序数据库需要兼顾效率与准确度的采样算法和行业认可的工业压缩算法,这样才可以拿出相应的措施来保证数据质量满足生产优化和安全性的需求。
快。海量数据的存储量、检索量、压缩量和解压缩量都非常大。工业级时序数据库是既是实时数据库,也是历史数据库。如果速度太慢则无法实现实时的管理价值,因此,海量情况下的存和取的速度都至关重要,否则海量数据只能沦为垃圾数据。为了达到更快的速度,就得在压缩和解压缩技术上下更多的功夫,在速度问题上得达到世界顶尖水平。
易。从技术角度上讲,工业级时序数据库实际上是实时数据的融合、处理平台。但把分散在企业内部不同位置的实时数据融合到一个平台上来也只是第一步,只有将这些数据用于提高管理水平,才能真正发挥其价值。只有将数据加工成信息甚至知识,才是工业级时序数据库提供数据融合与处理平台的更高目标。所谓易,指的是工业级时序数据不能只提供简单的融合能力,而是在这个基础上提供了一系列帮助用户将数据用起来的工具,将其转化成信息和知识,提升用户的效益。具备这样的能量,工业级时序数据库厂商得在电力等领域或相关行业领域拥有足够的知识积累,例如包括性能计算、耗差分析工具、操作优化指导、负荷分配、报表生成、小指标竞赛组织等一系列工具。正是工具的开放性,才能很容易让用户将自己的知识和经验融入其中,知识和经验的结晶才成为现实的可能。
安。安指是信创的基因安全,抛开政治话题不说,要从技术根本上,从可能出现安全问题的硬件、操作系统、中间件和安全应用上做到自主可控可信,尽量减少威胁的产生和存在,那些用开源软件改一改就想来这里说是自主可控的。
姚羽:工业级时序数据库的主体和受益人是国家,关乎于国家安全。因此,我想建议政府强力推进各行业企业的安全标准体系,建立由政府安全基金支撑下的安全测评检测机构。同时,政府要引导建立工业级时序数据库标准,保证工业级时序数据库厂商的产品能够互联互通、无缝对接,这是关键。政府应该引导信创生态的良性循环,限定时间支持优先采用信创产品。
姚羽:作为业内的从业者,我们需要深刻地认识到工业核心基础软件必须保障工业企业的生产和生命安全,我们需要建立强烈的责任心。其次是我们的服务。我们需要将我们把工业时序数据管起来的同时,为用户提供高质量的实时数据的同时,认真地与企业实现用户共创,将各种先进的数据技术与企业的业务深度融合,挖掘数据价值,服务于企业的数字化转型全生命周期,勇闯难关,在知识模型化和软件化及高复用方面扎下去。
工业级时序数据库的应用主体是业务,不是新技术的堆砌,也不是炫技和玩概念。工业乃国之重器,做工业核心基础软件和做实业都是一样的道理,要跟时间做朋友,才有市场和未来,也就是说做基础软件一定要耐得住寂寞,啃得动骨头,顶得住诱惑。如果什么挣钱做什么,什么概念热就跟着一窝风上,可能最终将一事无成,尤其是在这些关系到国计民生的领域,所有的商业炒作最后都是竹篮打水一场空!
姚羽,生于1986年,毕业于武汉大学计算机学院,曾供职世界500强物联网核心部门。超10年以上实时数据库研发、解决方案和服务经验,多年IT & OT团队管理经验,工业软件领域领军人物。
采访 | 添翼 撰稿 | 小樱 魔力
编辑 | 小樱 责编 | 麦麦 添翼

