大数跨境

基于工业互联网体系架构的矿井大数据平台设计与实现

基于工业互联网体系架构的矿井大数据平台设计与实现 矿山安全天地
2022-07-25
1
导读:工业互联网是工业系统与新一代信息通信系统深度融合的新型应用模式,是新基建的重要组 成部分和促进两化融合的抓手。

分享是最大的支持,关注是最好的鼓励

©煤炭科学技术2022年第6期



基于工业互联网体系架构的矿井大数据平台设计与实现

张晓霞李首滨上海李 昊 

煤炭科学研究总院有限公司 矿山大数据研究院北京 100013)


摘 要工业互联网是工业系统与新一代信息通信系统深度融合的新型应用模式是新基建的重要组 成部分和促进两化融合的抓手为推进煤矿智能化改造和升级探索通过煤炭工业互联网平台的建 设充分利用物联网大数据人工智能等先进技术手段对煤矿企业生产各环节产生的数据进行采 集存储加工处理和分析利用打通信息和系统孤岛实现数据融合和共享为安全高效生产提供分 析和决策支持首先基于工业互联网产业联盟发布的工业互联网平台整体框架结合业界应用实践, 围绕煤炭行业特殊应用场景研究适合于矿井的工业互联网平台解决方案同时通过分析研究煤炭 行业业务数据特征根据不同层级工业互联网平台的定位尝试给出了工业互联网平台在煤炭行业落 地部署时矿井级集团级行业级等不同层次工业互联网平台的功能和协同关系然后进一步深入设 计了一种适用于矿井的云边端一体工业互联网平台技术方案满足矿井智能化生产过程管控需求并 重点对工业互联网平台的核心支撑大数据平台技术体系进行研究以数据为导向设计了大数据平台 整体功能架构和技术架构针对大数据平台的核心技术组件选型搭建试验环境利用在某矿井综采 工作面实际采集的数据进行试验验证证明整体架构和技术路线可行大数据平台的数据存储访问、 计算等关键性能指标符合预期。 


关键词工业互联网矿井大数据平台智慧矿山边缘计算


基金项目

中国煤炭科工集团有限公司科技创新创业资金专项重点资助项目(2019-2-ZD002)

作者简介

张晓霞(1969—),女,北京人,助理研究员,硕士。E-mail:zhangxiaoxia@ ccteg-bigdata.com


引 言


物联网大数据和人工智能云计算是智慧煤矿 的三大支撑[1] ,随着煤炭行业工业化和信息化的逐 步深度融合采用先进的信息化技术解决煤炭行业 在智能化智慧化转型中的问题成为迫切需求智 慧煤矿物联网技术与装备是智慧煤矿关键核心技术 之一[2] ,随着物联网技术的发展和快速应用现有 煤矿各类监控系统已经实现了对于煤矿生产关键信 息的基本感知并通过综采工作面自动化系统的应 用大幅促进了智能化开采技术的创新发展[3] 。然 而不同厂家的产品基于本企业标准生产其数据接 口与平台各异数据独立进行处理相互之间缺乏通 信与融合数据孤岛与数据碎片化现象严重因而难 以形成有效的数据分析模型与算法分析结果也就 缺乏准确性难以指导生产[2] 。


针对智慧煤矿建设中面临的上述挑战行业专 家和学者指出需要研究通过边缘计算和云计算服 务实现设备数据互联[3] 。同时基于分布式计算技 术通过大数据计算框架构建智慧矿山多源异构信 息大数据服务平台对井下各类通信协议进行转换、 对各类传感器采集的信息进行数据格式统一数据 抽取数据清洗数据转换与校验数据建模数据挖 掘与深度融合并通过建立统一的数据服务接口为 上层 应 用 提 供 统 一 的 数 据 服 务, 实 现 数 据 的 共享[4] 。


首先阐述了工业互联网工业互联网平台边缘 计算和边缘云平台的基本概念和技术体系研究不 同层级煤炭工业互联网平台的功能和定位然后运 用工业互联网平台体系架构和技术借鉴工业互联 网平台在其他行业的落地经验进行了解决方案设 计相关技术研究和试验验证提出了矿井工业互联 网平台设计方案以及矿井工业互联网 PaaS 平台的 核心支撑大数据平台技术实现方案为智慧矿山建 设提供大数据基础平台能力数据管理和分析能力、 数据建模和应用支撑能力。 


工业互联网技术体系和发展


1 工业互联网概述和技术体系


工业互联网是新一代信息技术与制造业深度融合的产物通过实现人物的全面互联构建全要 素全产业链全价值链全面连接的新型工业生产制 造和服务体系成为支撑第四次工业革命的基础设 施[5] 。工业互联网的核心是通过更大范围更深层 次的连接实现对工业系统的全面感知并通过对获 取的海量工业数据建模分析形成智能化决策


可以看出工业互联网的核心要素是数据从感 知控制数字模型决策优化 3 个基本层次形成数据 核心功能通过自下而上的信息流和自上而下的决 策流形成了工业数字化应用的优化闭环[6] 。从体 系架构发展上工业互联网产业联盟在 2016 年 8 月 发布工业互联网体系架构 1.0,到 2020 年 4 月发布 工业互联网体系架构 2.0,基本形成平台网络安全 三大系统网络是基础安全是保障[6] ,工业互联网 平台是整个工业互联网的核心通过网络平台安 全三大功能体系构建全面打通设备资产生产系 统管理系统和供应链条基于数据整合与分析实现 IT( Information Technology) 与 OT ( Operation Tech⁃ nology)的融合和三大体系的贯通[6] 。


1.2 工业互联网平台构成及应用现状


工业互联网平台是面向制造业数字化网络化、 智能化需求构建基于海量数据采集汇聚分析的 服务体系支撑制造资源泛在连接弹性供给高效 配置的工业云平台[7] 。


工业互联网平台包括边缘层平台层和应用层 3 个关键功能组成部分边缘层通过大范围深层 次的数据采集以及异构数据的协议转换与边缘处 理构建工业互联网平台的数据基础平台层包括 IaaS 层和工业 PaaS ,IaaS 层提供云计算基础设 施包括服务器、 存储、 网络资源和虚拟化, 工业 PaaS 层基于通用 PaaS 叠加大数据处理工业数据 分析工业微服务等创新功能构建可扩展的开放式 云操作系统应用层形成满足不同行业不同场景 的工业 SaaS 和工业 APP,形成工业互联网平台的最 终价值[7] 。


国内工业互联网平台发展迅速,IT 企业和 OT 企业根据自身的背景和优势从不同的切入点进行发 展形成了一些典型的工业互联网平台目前各类 型平台数量已有数百家[5] 。由于不同行业的诉求差异比较大各行业的工业互联网平台侧重点和应 用场景也各不相同


相比传统的工业运营技术和信息化技术工业 互联网平台的复杂度更高, 部署和运营难度更 大[5] 。工业互联网平台是一项长期艰巨复杂的 系统工程整体上尚处在发展初期技术水平还不能 满足全部工业应用需求还需要很长时间才能真正 达到成熟发展阶段[5] 。


1.3 边缘计算及边缘云 


边缘计算是指在靠近物或数据源头的网络边缘 侧融合网络计算存储应用核心能力就近提供边 缘智能服务的开放平台[8] ,可以缓解网络传输减 轻云端压力工业互联网边缘计算从 2016 年开始 研究发展迅速目前已有产业化应用


边缘云的概念是相对云计算提出的是结合云 计算技术的核心和边缘计算的能力构筑在边缘基 础设施之上的云计算平台提供边缘位置的计算网 络存储安全等弹性服务并与中心云和物联网终 端形成云边端三体协同的端到端的技术架构


边缘计算目前的探索中有 IT 厂商终端领域 厂商和通信领域厂商由于既有积累和行业经验的 不同给出的方案各有不同实现方式上也采用不同 的开源框架和底层技术存在各自的局限性。 


矿井级工业互联网平台设计


2.1 煤炭行业数据特点


智慧矿山建设中从技术层面煤矿数据的获取 利用智能决策是需要重点突破的方向之一[9] 。煤 矿数据按照数据来源可以分为智慧感知生产执行、 安全保障生产经营综合决策 5 个业务域[10] 。按 照数据特点来看,“非实时长周期数据业务决策 型数据主要集中在煤矿的设计管理供应链管理、 生产计划制定外销管理成本分析等经营管理领 域实时性短周期数据本地决策数据则主要 集中在智能化工作面智能化掘进工作面和基于视 频识别的联动控制等生产系统领域[11] 。


根据上述两类煤炭业务数据特点非常适合采 用工业互联网平台云端体系架构进行一体化 设计和部署低延时实时响应运算用边缘计算技 术进行数据采集及处理长周期运算量大的模型 训练数据分析等通过云计算进行集中处理分析


2.2 不同层级煤炭工业互联网平台定位 


工业互联网平台实施框架贯穿设备边缘企业 和产业 4 个层级通过实现工业数据采集开展边缘 智能分析构建企业平台和打造产业平台形成交互协同的多层次体系化建设方案[6] 。在煤炭行业, 根据数据特点和矿井集团行业不同层级的业务目 标工业互联网平台的落地应该是多级分布式混合 云的架构模式通过设备层边缘节点边缘云与中 心云构成端云一体化协同平台设备层和边 缘节点组成边缘系统在矿井层和集团层构建企业 级工业互联网平台在全行业层构建煤炭行业级工 业互联网平台整体部署层级如图 1 所示


图 1 煤矿工业互联网平台部署层级


设备层包括矿井采掘运等各类生产运输设备, 是在物物物人信息集成中需要被感知的对象通过 部署大量传感器和摄像头等感知设备获得设备信息 和生产过程信息


边缘节点主要解决煤矿井下各种设备通信协议 不一致的问题提供煤矿井下设备生产环境人员 等数据的采集实时接入并负责协议解析和预 处理


矿井边缘云平台实现生产数据的汇聚通过大 数据平台进行数据整理加工分析利用支撑智能安 全生产类应用系统


矿井中心云平台进一步整合设计数据运营数 据管理数据服务数据等实现生产数据与管理信 息化系统数据的互联互通和深度共享打通设计生 产运营管理等各个环节实现全矿井的安全生产、 高效管理


集团级工业互联网平台汇聚来自不同矿井的数 据资源在更高层级进行数据互通满足集团级综合 运营管理指挥调度等业务需要


煤炭行业级工业互联网平台的主要目的是构建 产业工业互联网平台打通产业上下游资源促进生 态体系建设


可以看出矿井边缘云平台是整个煤炭工业互联 网平台体系的桥梁是 OT 和 IT 的融合点通过边缘 云平台可以实现综采工作面掘进工作面等生产过 程控制数据环境安全监测数据与已有 ERP 等运 营管理数据之间的打通充分发挥煤矿企业级大数 据平台数据综合分析挖掘能力实现生产效率经营 管理能力的提升从技术上通过边缘云平台可把 大量已有先进 IT 技术和平台软件应用于全矿井


重点研究矿井级工业互联网平台聚焦边缘云 平台 PaaS 能力建设通过大数据平台提供大数据存 储计算数据治理数据建模可视化分析等核心 功能


2.3 矿井工业互联网平台技术方案 


面向矿井级的工业互联网平台设计上分为井 下边缘侧平台和地面边缘云平台两级平台平台整体技术方案如图 2 所示


图 2 矿井工业互联网平台技术方案


井下边缘侧平台由边缘侧数据采集平台和边缘 计算环境两部分组成数据采集平台负责接入来自 综采工作面掘进工作面等自动化控制系统的设备 数据生产过程数据通过感知技术和物联网技术获 取的安全监测数据环境感知数据视频监控数据、 工程数字化信息如地质变化数据等全矿井实时数 据主要功能为设备接入协议解析边缘数据处理 及缓存边缘计算环境负责支撑数据和智能应用运完成推理决策等智能服务用于矿井生产现场的 实时控制反馈边缘侧平台对采集到的数据进行必 要的预处理后同时上传到边缘云平台用于统一存 储和分析利用技术实现上边缘侧主要以智能网 关方式来实现在合适的硬件资源和操作系统之上, 通过软件方式实现各种工业总线协议的接入和转 换通过容器等技术提供数据和智能应用运行环境, 选用开放式边缘计算框架如 KubeEdge 提供云边协 同运行环境进行大规模边缘设备的管理等


地面边缘云平台在 PaaS 层构建大数据平台支 持全矿井生产安全环境地质变化等相关异构数 据接入汇聚和处理分析是整个生产执行系统运行 的核心支撑同时负责进行模型算法的离线训练和 迭代更新并将更新后的模型算法反馈到边缘侧边缘云平台的 IaaS 层根据实际应用场景可选择传 统的服务器部署方式或者采用虚拟化等技术提供 计算存储等资源的灵活调度


边缘云平台向下与边缘侧平台构建边缘云端协 同而它本身已经是云平台向上可以与矿井中心云 平台构建多云/ 混合云协同框架实现与煤矿经营管 理系统办公系统企业管理等信息化系统之间的信 息互联互通从而进一步与煤炭行业工业互联网平 台实现数据互联互通促进产业协同


矿井工业互联网大数据平台架构


3.1 大数据平台功能架构 


大数据平台整体设计借鉴互联网领域及其他行 业建设数据中台的理念采用分布式存储和计算技 术从功能上提供数据智能的平台和能力实现 全矿井多源异构数据的一体化访问处理和管理整体功能架构如图 3 所示


图 3 矿井工业互联网大数据平台功能架构


数据采集平台从数据时效性上提供来自传 感设备自动化控制系统的实时数据获取同时提供井下和地面各种业务系统非实时数据的接 入从数据类型上提供结构化数据半结构化数 据和非结构化数据接入数据接口上支持关系型 数据库、NoSql 数据库文件系统消息队列等多 种接入方式


数据存储和计算平台采用分布式存储和计算, 融合数据湖和数据仓库技术提供统一的海量数据 存储和管理并能够随着数据体量的增长随需进行 扩展


数据治理平台负责数据整合和管理通过系统 化的方法体系和相应的工具进行数据加工处理解 决数据准确性质量共享安全等问题逐步为企业 形成大数据资产


数据分析与建模提供数据查询统计分析算法 模型服务从简单的统计汇总到利用人工智能技术 进行建模可逐步形成 AI 开发管理能力


3.2 大数据平台技术架构 


基于 Hadoop 的大数据技术在全球各大公司及 技术爱好者的支持下形成非常庞大也非常复杂的 开源体系和生态矿井工业互联网大数据平台在技 术架构设计和组件选型上主要围绕煤炭业务需求, 采用业界比较成熟稳定的开源技术框架辅以必要 的商用基础套件兼顾技术的成熟度和前瞻性整 体技术架构和组件选型如图 4 所示


图 4 矿井工业互联网大数据平台技术架构


采集平台需要覆盖到各种类型数据的接入方 式技术选型上主要从组件架构的合理性易于二次 开发应用广泛等方面进行考量日志和文件采集 使用 Flume,可以直接写 HDFS 并支持压缩方便扩 展实时采集使用 StreamSets,支持可视化开发不用 编写代码即可完成数据的采集和 ETL。离线数据同 步使用在性能和资源利用率方面具有优势的 DataX 或 Sqoop。ETL 使用简单实用的开源工具 Kettle。


大数据基础平台的选型存储方面考虑到煤炭 大数据的类型包括表音频视频日志等多种形 式[18] ,在 HDFS 基础上采用 Kudu 或 HBase 满足低延迟快速随机读写需求的场景时序数据使用 In⁃ fluxDB,其高性能和高压缩比适合工业环境传感器 数据的存储关系型数据使用简单并易于扩展的 MySQL,文档型数据使用查询性能优异操作方便的 MongoDB,key-value 型数据使用 Redis,具有极高的 性能并支持丰富的数据类型。MPP 数据仓库选用 GreenPlum,主要基于其强大的并行计算能力和海量 数据管理能力非常适合作为 OLAP 数据仓库计 算方面离线计算使用核心的 MapReduce,流计算使 用业界最前沿且经过实践验证的 Spark、Flink;语音 识别使用较常用的开源项目 Simon,视频分析使用性能良好应用广泛的 OpenCV。机器学习数据建模 使用 MLFlow、Kubeflow,MLFlow 优势在于提供了端 到端的机器学习生命周期管理且与具体的机器 学习库无关,Kubeflow 特点在于原生支持 Kuber⁃ netes。


数据治理以 Atlas 为基础具有数据血缘集中 策略引擎安全和生命周期管理等核心治理能力可 以基于此进行扩展增加数据资产管理的相关功能


数据分析平台的查询分析可视化根据不同 场景选择不同技术方案查询检索使用 Solr 或 ElasticSearch,Elastic Search 使用全文倒排引擎检 索速度快分布式架构有很好的扩展性数据分析 可选择 Impala、Kylin、Presto,其中 Impala 兼顾数据 仓库实时和批量等优点适合海量数据实时查询 分析可视化展现使用 Redash 或 Metabase,Redash 简单易用提供丰富的 RESTful API 接口方便二 次开发;Metabase 界面漂亮友好图表可视化选项 丰富灵活


其他无特殊需求采用 Hadoop 体系框架通用组 件, 如 资 源 管 理 器 YARN, 分 布 式 服 务 协 调 Zookeeper,资源隔离和调度 Kubernetes 


图 5 大数据平台试验验证系统


实验室技术验证


为了对大数据平台所选关键技术组件进行测 试搭建了如下实验室技术验证系统


使用已部署至工作面的北京天玛智控科技股份 有限公司的 SAM 综采工作面自动化系统简称天玛 公司 SAM 系统中采集的数据为试验数据对大数 据存储计算查询能力进行试验主要工作内容包 括设计标准化接口从天玛公司 SAM 系统采集数据、 进行数据集成完成大数据平台入库存储开发任务 调度平台进行大数据任务编排和算法运行通过数 据服务接口供前端应用调用


数据采集入库查询性能测试结果如图 6 所示, 平台选用的技术组件在数据入库性能数据查询时 间和并发数上均优于 Hadoop 传统的 Hive 组件满 足综采工作面写入和查询的场景需求平台计算能力通过乳化液泵油温异常模式识别 模型训练[20]进行测试结果如图 7 所示训练过程 中原始数据为几万行数据处理过程中需要对数据 进行时间维度的升采样”,数据量会扩大到几十万 行对于计算资源以及计算速度要求较高可用于验证大数据平台计算支撑能力从结果看模型在训 练及计算过程中达到了预期效果


图 6 试验平台与原生 Hadoop 性能对比


图 7 算法模型训练验证


结 论


1)从数据角度出发用工业互联网体系框架设 计了云边端一体化的煤矿矿井级工业互联网平台技 术方案。 


2)完成了矿井大数据平台架构设计和技术选 型提供数据的采集治理分析挖掘支撑矿井智 能化安全高效生产。 


3)以综采工作面自动化系统数据作为试验数 据进行技术验证整体方案可行关键技术组件性能 得到了验证。 


从工业互联网平台特别是边缘云计算的架 构技术应用场景来看各行业都有适合自身的 定制化方案没有统一标准虽然针对矿井生产 自动化实际应用场景从总体框架功能架构技术 架构给出解决方案但仅仅是起步探索还没有达 到解决实际现场应用复杂场景的要求特别是部 署架构需要结合现场网络条件矿井已有信息化 条件等在部署实施时进行进一步研究并寻找可落地 方案


参考文献(略)

请在看、点赞、分享三连击,让更多人看到!

免责声明:本文所载内容系网络资料,无法联系版权所有人,如文章文字、图片存在侵权行为,烦请联系公众号运营人员,微信号:qjd2013,我们会予以删除!


【声明】内容源于网络
0
0
矿山安全天地
及时报道矿业安全大事,宣传矿山安全先进人物,推荐矿山安全最新科研成果,普及矿山安全知识,提供矿山安全相关产品,全方位为矿山安全和矿山经营者、矿工服务。
内容 1841
粉丝 0
矿山安全天地 及时报道矿业安全大事,宣传矿山安全先进人物,推荐矿山安全最新科研成果,普及矿山安全知识,提供矿山安全相关产品,全方位为矿山安全和矿山经营者、矿工服务。
总阅读895
粉丝0
内容1.8k