多模态
在工业系统里数据种类、数据格式以及数据结构非常多,结构关系复杂。一个汽轮机里面会有上万个零部件,一个复杂装备的制造企业,它的数据种类多达三百余种,所以在工业领域里会存在数据多模态特征。
高通量
即无论是生产设备还是智能装备有可能是24小时不间断产生数据的,我们以分、秒的频率采集数据,在很多应用场合甚至是毫秒级的数据。这些数据的数据量非常大,海量的设备与测点,数据采集频度高、数据吞吐总量大、数据的实时性要求高,呈现出工业大数据的“高通量”特征。
强关联
真正做一个产品设计的时候,它涉及到学科与专业是非常多的,比如设计复杂装备的时候,不仅仅是涉及到结构分析,流体力学、声学、动力学、电磁辐射等等各个学科的数据都要进行关联。数据之间的“强关联”反映的就是工业的系统性及其复杂的动态关系。
基于工业大数据的特点,工业大数据的数据分析与消费互联网领域里的数据分析是有相当大的差别的。消费互联网大数据的分析对象更多的是以互联网为支撑的交互,工业大数据实际上是以物理实体和物理实体所处的环境为分析对象,物理实体就是我们的生产设备以及生产出来的智能装备及复杂装备。在商业数据里面关注数据的相关性关系,但是在工业领域里面一定要强调数据因果性,以及模型的可靠性,一定要提升分析结果的准确率才能把分析结果反馈到真正的工业控制过程中。
企业应用工业大数据面临的技术挑战。企业普遍面临数据基础薄弱的境况,企业收集的数据不够,甚至没有数据。企业真的要在数据转型有战略上的调整,它才会有较大的投入,如果它没有这种战略规划的时候,很难负担得起专业数据人才的成本。市场上也缺乏工业大数据所需的复合型人才。另外每个工业领域里都有独特的知识领域和机理形成的行业门槛,没有一个普适性的解决方案可以在工业领域里通用。行业解决方案,只会对某一个行业才能发挥相应的价值。
企业应用工业大数据面临的管理挑战。很多合作伙伴或者客户初期并不知道数据和业务问题之间怎么关联,怎么和业务结合都不清楚,不知道数据到底能不能解决业务问题。有的企业有应用工业大数据的愿景,但是业务与工业大数据的实施路径都没有统一。
工业大数据的挖掘就是把工业物联网数据与跨产业链数据以及企业信息化数据相结合,把分散在企业各个角落里的数据进行整合,挖掘这些数据融合所能产生的价值。
大数据不仅仅是物联网数据采集与存储,包括数据的管理、分析与反馈,需要在数据生命周期内构建一个闭环系统,构建这个闭环需要一个过程,不可能一蹴而就。同时,大数据的应用会涉及到企业内部管理流程和经营理念的变革,工业大数据是把工业领域内三类数据进行融合应用,真正发挥大数据的价值的场景不仅是智能制造,同时也包括产业互联网里业务模式创新,所以相应的经营理念和管理机制都要发生变革。这是企业在管理方面面临的最大的挑战。所以有时候大家会看到,工业企业的大数据应用甚至都不仅是一个企业的CIO所能牵引的,这需要整个企业在战略层面去推动,要有明确的数据驱动的业务战略规划。
通常来讲,在与企业规划工业大数据业务落地可以从两个维度与企业一同进行思考。一方面是从业务驱动角度来看,要思考企业的整体业务目标是什么,为了实现这个业务目标要做什么样的转型以及哪方面的能力提升,具体的业务提升和转型方向是什么;为了实现业务目标,理想的业务流程是什么,如何让这个流程跟数据流进行相应的结合和映射。这是一个由上而下的思考过程,是企业的高层管理者、战略管理者进行思考并牵引,通过中间管理层完善与丰富,最后落地实施的过程。很多时候大数据应用确实可以解决业务问题,但也可能解决不了所有的业务问题。大数据应用真正帮助企业的不仅仅是在于具体业务问题的解决层面,它是要让企业构建对数据驾驭的能力,当企业具备了这种能力后,才能够真正让企业在内部的生产管理、对外的经营模式上产生变化,真正形成持续的创新与应用的能力。
如何利用数据进行驱动。第一是去看现在手里有什么样的数据,这些数据从哪儿来,如果没有这些数据要怎么收集,以及这些数据的特点到底是什么,是时序数据、时空数据、智能产品产生的数据、生产设备产生的数据,数据量到底有多大;第二是对这些数据有了了解以后,这些数据怎么保存、管理、使用,另一个比较重要的则是数据质量怎么保证。第三是用什么样的系统、什么样的工具保证数据存储、数据管理、数据处理?同时这些数据到底如何进行集成、关联,不仅仅要把设备产生的数据拿来进行分析管理,还要在分析过程中关联周边的环境数据、地理数据等跨界数据。