12 月 3 日、4日,2022 Apache IoTDB 物联网生态大会在线上圆满落幕。大会上发布 Apache IoTDB 的分布式 1.0 版本,并分享 Apache IoTDB 实现的数据管理技术与物联网场景实践案例,深入探讨了 Apache IoTDB 与物联网企业如何共建活跃生态,企业如何与开源社区紧密配合,实现共赢。
我们邀请到宝武装备智能科技技术中心主任工程师徐少锋参加此次大会,并做主题演讲——《Apache IoTDB 在宝武装备远程智能运维平台中的使用案例》。以下为内容全文。
大家好,我叫徐少锋,来自宝武装备智能科技有限公司。今天我给大家带来的案例是《Apache IoTDB 在宝武装备远程智能运维平台中的使用案例》。
今天要讲的包括四部分,第一部分是平台整体情况;第二部分是平台技术目标;第三部分是平台遇到的问题;第四部分是 IoTDB 的实践。
01 平台整体情况
首先,我们来看平台的整体情况。
随着工业互联网的迅速发展,2020 年工业互联网带动经济发展规模达到 3.14 万亿,经济发展贡献率达到 11%,新增就业率达到 255 万。智能运维是工业互联网重要的应用方向之一,应用市场规模占比达到 30.5%,2020 年后的疫情时代,居家办公、远程医疗、远程教育和智能运维是重要的发展趋势。
让我们来看一下 2018 年到 2020 年工业互联网的发展态势。我们来看看经济规模,在 2018 年的时候就已经达到了 1.42 万亿,在 2019 年的时候就已经达到了 2.13 万亿,在 2020 年的时候就已经达到了 3.14 万亿。再看看经济贡献率,2018 年的时候工业互联网对经济的贡献率达到了 6.7%,2019 年的时候对经济的贡献率达到了 9.9%,2020 年的时候对工业的经济贡献率达到了 11%。再看看新增就业,2018 年的时候新增 135 万就业人口,2019 年的时候新增 206 万就业人口,2020 年的时候新增 255 万就业人口。再看看 2020 年工业互联网应用情况,其中数据金融服务、数字化设计仿真工艺、安全管理、客户关系管理、财务人力管理、供应链管理、分布式规模制造、全流程系统优化、设备健康管理、能源与排放管理、质量管理、生产监控分析、生产管理优化,这些是主要的应用方向。其中设备健康管理占比达到了 30.5%,也就是我们宝武智维正在做的这个方向。
智能运维我们来看看它的发展:从最初的被动式维护,到预防性维护,到基于状态的维护,再到预测性维护,经历了四个阶段。我们来看看这四个阶段发展规律,从早期的被动式维护,也就是事后维修,事后维修就是说生产事故已经发生了,发生了资产的损坏、工业设备的损坏,有可能是设备本身的损坏,也有可能是带动了周边的一些设备的损坏,甚至是更大的规模的损坏。当这些损坏发生之后,然后我们再来维修,这样的损失是很大的,但是这样的话比较简单,就是把损坏的那些设备、相关联的设备更换成新的,但是这样子的话成本太大,虽然简单但是成本太大,损失太大。
然后又发展到了预防性维护,就是定期维修、可靠性维修、故障模式、影响危害分析等,通过组合的方式来进行处理,可以从一定程度上减少损坏的影响范围。再后来发展到了基于状态的维护,根据需要维修,定期进行监控与评估,进一步降低了成本,但是这样所做的复杂程度进一步提高。再到近期的预测性维护,要做到预测性维护需要做的事情是非常复杂的,比如说搜集大量的数据,基于数据做 AI 的分析,但是这样子的话可以提前发现一些问题,在事故还没有发生的情况下,提前预测到设备即将损坏,及时将设备更换下来。这样成本是更低的,破坏的影响也是更小的,但是这样做的话需要的技术复杂度是非常之高的。
让我们来看看国内外相关技术发展现状与趋势。从国内外设备运维技术发展现状来看,基本是在某类设备或某条生产线上的点状智能化应用,尚未实现全流程、全工序、跨地域的智能化应用。
我们首先来看看美国大河钢厂,建立基于云的超级计算服务,数据库涵盖约 41 万条物料清单,3 万张图纸及 4.5 万份文档。安装超过 5 万个传感器,探索预知维修。
我们再来看新日铁住金,新日铁住金引进人工智能数据分析平台 DataRobot,提供云计算的合并数据分析环境,提高设备维护效率。新日铁名古屋制铁所在线监测的设备为 1253 台,监测的结果为制定检修计划和内容提供直接依据。
我们再来看看 POSCO,建立设备智能管理中心,初步形成人工智能融合的监测诊断系统。以浦项制铁所二热轧为试点,建立对重要设备以及关键部件异常状况的预测体系,在障碍发生前预测维护合适的时点。
再来看看西门子,西门子的 MindSphere 平台负责传输数据、开发工具、数据分析、集成工业智能应用。数据中心节能效果显著,列车晚点率降低,燃气轮机、氮氧化物减排达到 15% 到 20%。
再来看看阿里云提供的一站式设备接入、设备管理、监控运维、数据流转、数据存储等服务,90% 以上的设备与协议,3 大行业知识图谱,19 个业务模型,7 个行业数据模型以及 20 多个行业算法模型。
最后我们再来看看树根互联,以工程机械为对象,单台设备潜在提升收入可达 10% 到 50%,全生命周期运营管理,实现监控与分析、设备故障维修、设备计划性保养、预测性/预防性维护,设备运营与监管、现场服务。
让我们来看看钢铁行业为什么要开展智能运维?首先是钢铁行业数字化转型的需要,钢铁行业高度自动化,但全口径设备数据在线率不足 1%;以人为主,设备维护经验知识碎片化;设备维护数据没有得到有效开发。钢铁行业工艺流程长、大型化连续化的装备、工况特别复杂、多黑箱、很多不确定性、设备类型特别多、设备之间相互耦合,钢铁产线设备智能运维的命题是一项非常挑战的复杂系统创新工程。
然后是探索和推动工业领域设备管理变革的需要。钢铁行业高度依赖人的行为,经验设备风险难以控制。96% 的点检标准属于定性点检标准,依靠五感的点检稳定性不高。点检员每月没有发现任何异常的情况占到了 17%,90% 以上事故属于点检不周,30% 重复性设备故障与日常点检不到位强相关。
钢铁行业以预防为主,过维修多成本优化空间有限。66 万条检修项目标准中,43% 属于周期项目,定期更换、修理项目占比超 30%。主产线定修周期、时间仍维持在 3 年前水平,关键设备多周期维护,逢停必修、以修代检情况普遍。
分工过细,工作繁杂,劳动效率提升困难。点检、运行、日修、抢修功能分割过细,制约 40% 以上协同资源效率。某基地的点检标准就多达 95 万条,标准执行难度实在太高。点检定修模式,行业内万吨点检人员配置平均水平每万吨需要 1 人,效率提升已遇到瓶颈。
第三个是钢铁行业绿色可持续发展的需要。钢铁行业是典型的高能耗、高污染,围绕装备与工艺革新,开展绿色生产是实现钢铁行业绿色可持续发展的重要手段。保障高能耗设备的高效运行,降低直接消耗;提高设备综合作业率,降低单位能耗;把控环保设备设施状态,支撑环保达标和超低排放。
什么是智能运维?我们需要推动设备运维从“感官判断、经验决策”向“数据判断、知识决策”的数智化升级,综合应用云技术、大数据、物联网、AI、5G 等先进技术,系统开展智能运维新技术、新模式的研究与实践,实现设备智能运维技术的系统创新。通过平台 + 专家系统 + 标准化,将早期的从五感点检、经验判断、人工诊断、人工排产、手工派单、维修组织、维修实施、人工检验的方式,提升到智能采集、智能分析、智能诊断、智能排产、自动委托、推送方案、远程支持、智能检验。
我们的总体目标:宝武智维云通过建成具备低成本、大规模接入能力的远程智能运维软硬件平台,支撑宝武集团多基地设备智能运维的全面快速覆盖,完成“运维一律远程”的使命;建立设备智能运维技术标准和规范体系,开展智能运维工业大数据创新应用,创建智能运维服务新模式,为集团各基地及社会用户提供可信赖、多层次的设备智能运维服务。
我们的战略目标:聚焦冶金工业装备智能服务体系建设与运维,内生式发展与外延式发展相结合,技术引领、数据驱动、知识赋能,基于钢铁生态圈实现专业化基础上的规模化、产业化发展。
什么是内生?基于“亿吨宝武”产业布局,以“运维一律远程”为目标,通过专业化整合融合,推动中国宝武设备管理体系变革,打造中国宝武装备领域产业竞争力。
外延,基于“钢铁生态圈”发展战略,以数据为牵引,平台化为手段,串联产业链上下游资源,共建共享钢铁生态圈智能运维产业服务生态。
我们的预期目标要将百万设备入云、智能运维创新应用。亿吨宝武+钢铁生态圈,有 300 多条产线,150万以上的设备,要实现智能运维远程覆盖,同类产线专业集中。
我们有哪些用户?我们有集团内多基地用户,集团外钢企,钢铁生态圈用户,其他工业用户、园区。有哪些生态伙伴?维修公司、硬件制造商、设备制造商、软件服务商、信息服务商、数据服务商、备品备件。
整体状况,我们的平台覆盖宝武集团全部 15 大基地及多元产业,扩展自钢铁生态圈(如涟钢、林钢、鞍钢鲅鱼圈等),累计接入1000 多条产线,设备超过 44 万台,数据项超 170 万,覆盖钢铁全工序,并持续扩大接入与创新应用。
我们的技术路线,为实现设备智能运维形成了以一个平台、一个专家系统、一套标准化体系为核心技术架构、以面向钢铁全流程的智能运维体系为载体的技术路线,包含四方面技术创新内容。首先是一个平台,然后是一个专家系统,然后是一套标准化体系,最终我们打造面向钢铁全流程的智能运维体系。
02 平台技术架构
刚才我们讲了我们要做什么,现在我们来讲讲为了实现我们的目标,作为程序员,我们要如何从技术角度来支撑我们的业务目标。
作为技术人员,我们的平台的支撑能力要设计得尽可能大些,我们的平台能否搜集全量数据,能否搜集高频数据,能否适时分析数据,能否分析设备的全生命周期数据,能否用少量磁盘存储目标数据,能否用低成本达成目标,这是我要考虑的主要问题。
03 平台遇到的问题
在平台的建设过程中,我们遇到了很多问题,其中很难的问题是传统的时序数据库不能承受我们这个量级的数据。它们的读写性能均不能满足我们的要求,不能用低成本来实现我们的目标。直到我们遇到 IoTDB。
04 loTDB 的实践
通过对 IoTDB 的实践,我们来观察 IoTDB 是否能达成我们的目标。
首先,偶然的机会我们发现了 IoTDB,并对 IoTDB 做了实验,我们来看看 IoTDB 能否搜集全量数据。如果 IoTDB 能将整个基地所有产线、所有装备的数据都搜集起来,那多好。如果 IoTDB 能将所有基地、所有产线、所有装备的数据都搜集起来,那太好了。如果是这样子,那么 IoTDB 涉及的设备有多少?涉及的时间序列有多少?涉及的频率有哪些?我们估算了一下,涉及的装备有数百万,涉及的时间序列达到千万,涉及的采集频率有小时级、分钟级、秒级、毫秒级等。
那么 IoTDB 能否搜集高频数据呢?比如搜集 1 毫秒的、4 毫秒的、10 毫秒的数据呢?我们试验过的时序数据库,有的时序数据库遇到高频数据写入的时候出现锁的问题,性能下降很多,但是我们发现 IoTDB 在这方面处理的很好,可以长时间稳定写入高频数据。
让我们来看看 IoTDB 是否能够分析设备全生命周期数据。有的大型装备需要使用 10 年以上,这样我们需要观测大型装备长周期的变化趋势,IoTDB 是否能够做到呢?我们做了实验,IoTDB 单时间序列我们造了 2000 亿个时序点,做降采样查询到 100 万个点,时间在 10 多秒到 30 秒上下。
让我们来看看 IoTDB 能否用少量磁盘存储目标数据。与同类数据库产品相比,IoTDB 去除了不必要重复存储的字段,节省了大量存储空间;IoTDB 采用复合压缩算法,压缩效果较好,目前观测约为 1/10。
我们再来看看 IoTDB 能否用低成本达成目标呢?由于 IoTDB 单机写入速度较快,稳定性高,这样子我们可以用少量的服务器来写入数据,节省了大量的服务器。IoTDB 的 insertTablets 接口写入速度可达 3000 万每秒,IoTDB 的 insertRecords 接口写入速度可达数百万每秒,视CPU情况而定。
我们经过对 IoTDB 的实践,对 IoTDB 的效果比较满意。IoTDB 能够用少量的服务器写入整个基地的数据,甚至是整个集团的数据。IoTDB 的查询能够覆盖长达十年的设备数据降采样分析。IoTDB 为我们节省了大量的服务器。
目前在我们的案例里,IoTDB 的使用场景如图所示,用来搜集整条产线、整个基地乃至整个集团的设备数据,给专家们分析查询使用。
谢谢大家,我的演讲到此结束。
更多内容推荐:
• 了解更多 IoTDB 应用案例
• 回顾 IoTDB 2022 大会全内容