你可能或多或少已经在各种演讲和文章中看到过知识图谱(KnowLEDge Graph)的身影,这一名词在2018年被Gartner第一次加入新兴技术成熟度曲线。正如其名,它是一系列显示知识发展进程与结构关系的不同的图形,用可视化的技术,描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。
与数据和表格有所不同,知识图谱由节点和连接线段组成。很多企业正在其平台和产品中运用这种技术,因此到了2019年,知识图谱在Gartner成熟度曲线中的位置快速前进,这意味着其正在快速成熟。
由于知识图谱非常适合分析从非结构化资源中提取的数据,包括隐式的提供结构和内容的元数据,常被用于描述客观世界中,各种实体或者概念之间的彼此关系。
越来越多的企业将知识图谱应用在物联网和工业互联网领域,他们运用知识图谱充分挖掘事物背后客观的隐性关系,将这种隐形关系转化为可计算数据,并且以可视化的形式展示在人们面前。
知识图谱让我们将分析的重点放在了探索各种“关系”上,包括隐性关系。最近,当我邀请走向智能研究院执行院长、工信部CPS发展论坛副秘书长、工业互联网领域的专家赵敏参与物联网智库组织的直播活动时,知识图谱引起了我们的共同关注。
物联网是不是只能把已知要素联接起来,表达已知的物与物之间的关系?
还是可以把未知关系的物与物也联接起来?
未知的关系要怎么联接,联起来以后做什么?
针对这些问题,赵敏以《新基建中的佼佼者:基于知识图谱的工业互联网》为题,进行了一次精彩的演讲,本文将我在聆听中的收获与你分享。
01一个未被提及的指标:联接度
目前绝大多数的工业互联网平台,联接了“看得见、摸得着、想得清”的已知工业要素,建立了这些要素之间的数据采集、互可操作、协作控制等关系,形成了全新的工业管理逻辑,创造了巨大的经济效益。
但这还不够,如果想要进一步发展,一个未被提及的公式跃然纸上,那就是联接度。
联接度=已经联接的要素/未被联接的要素
工业互联网的“第一性原理”,就是要广泛地联接各种机器设备和工业系统,由此而实现“联接-管控-优化-效益”的基本逻辑。
因此,工业互联网的联接范围,从一开始就不局限于企业边界之内,而是以跨越企业的“价值链”,甚至是以联接各种企业的“价值网”作为起点,联接企业内外部要素,特别是在用工业品,向基于云的新价值体系探索。
这时,联接度是评价工业互联网发展的重要指标。
在联接度的计算公式中,分子是指“可见要素”,包括看得见、摸得着、想得清的工业要素,它们大多数已经实现了联接;分母是指“不可见要素”,包括看不见、摸不着、想不清的工业要素,以及这些要素之间的隐形关系。
为什么分析联接度尤为重要?举一个现实中的例子。今年2月,媒体报道了一则“山东省司法厅厅长因疫情防控不力被免职”的新闻。乍一看,你可能会好奇,山东司法厅厅长与武汉新冠肺炎的关系是什么?经过分析与挖掘之后,我们看到了一条清晰的关系路径:
山东任城的狱警→有武汉亲戚→到武汉探亲→过程中感染了山东任城狱警→再感染其它干警→继续感染在押犯人→造成任城重大疫情→导致省委追责→结果任城监狱长、书记被免职→最终造成山东司法厅长被免职。
这些关系是常人无法全部获知、并且立即能够在非常抽象的场景下想得清楚的。就像我们在工业场景中,各种产品与系统越来越复杂,如果出现质量问题或者设备故障,如果关键要素及其关系没有被清晰的记录、分析和系统化呈现,很难锁定真实源头一样。
“联接度”是描述工业互联网的“地基”是否真正牢固的一个评价指标。提高联接度,可以通过两种方式:第一是增大分子,联接更多的工业要素,我们常说的“人、机、料、法、环”,都是可见要素;第二是减少分母,推断出不可见的工业要素,找到规律并且将其实现联接,包括各种隐形关系更要分析出来。
这个看似不可能完成的任务,可以借助知识图谱来得以实现。
02知识图谱将“三不”变为“三可”
知识图谱是人工智能的一项重要分支技术,与工业互联网的结合是一个新的技术发展方向,而人工智能和工业互联网都被列入了新基建的重点范畴。从今年开始,知识图谱可能会异军突起的趋势愈发明显。
在工业互联网领域,知识图谱的价值在于将“三不”变为“三可”。“三不”和“三可”是指:
过去不可见的要素可见;
过去不可计算的要素可计算;
过去不可联接的要素可联接。
这些不可见、不可计算、不可联接的工业要素,可以分为多种情况,我们分别举例来说。
1. 已经知晓其存在的要素,但是难以捕捉其关键信息,无法进行联接。
我们知道复杂产品的缺陷一定存在,但是关键难题是找不到缺陷在哪里。例如,宇航器的发射,每次我们并不知道是不是会成功,失败的概率还是挺高的。这种复杂产品,我们知道其中一定有缺陷,但是不知道是哪个大部件、哪个小零件上的缺陷,最终可能导致发射失败。
最典型的例子是在1986年,挑战者号航天飞机刚刚发射就爆炸了,这可以说是人类航天史上最惨痛的事故,里根总统专门下令组织了一个调查委员会,著名的物理学家费曼就是其中的成员。最后他发现事故的原因是一个小小的塑料密封圈,在低温下这个密封圈变形了,由此酿成了事故。
费曼是怎么发现这个问题的呢?过程挺传奇的。他的一位同事早上上班,车坏了,自己动手修车,那个车上也有个密封圈,这位同事灵机一动,赶紧给费曼打电话,费曼这才按照这个思路去调查。
不关键的缺陷,即使有了也问题不大,但是关键的缺陷,就会造成大问题。10,000个环节哪怕有9,999个没问题,但是碰到一次关键缺陷,就很可能导致严重事故。除了宇航器,我们身边的汽车和各种精密设备,都是相似的实例,复杂产品很难准确判断具体会在哪里出错。
2. 已经知晓其存在的要素,可以捕捉到其关键信息,但是技术上无法联接。
有些物理对象,即便捕捉到了关键信息,在技术上也无法联接。最典型的例子是大跨度的悬索桥,柔性很高,相对容易产生振动,而且找不到完全消除振动的好办法。我们较难判断它在什么样的风速下就发生了振动,颤振、弛振、共振、抖振等,只能一发生振动就停止通行。
比如5月初,广东虎门大桥发生异常抖动,桥面呈现波浪形涌动。这种悬索桥振动的主要原因是在特定的风环境条件下的桥梁涡振现象,并非桥梁质量问题。
事后调查发现,虎门大桥采用的是流线型的断面设计,本身的风阻较小,发生涡振的概率也比较小。但由于近期虎门大桥在修吊杆和主缆,桥梁两边放置了临时挡墙(俗称“水马”)防止车撞,“水马”把桥上通风的部分堵住,形成了一堵墙,因而造成了涡振的现象。
在工业现场,很多基础设施和大型设备包含多种参数,它们的“脾气”人类并不掌握。
3. 已知、未知要素之间的隐形关系是更为复杂的情况。需要首先确定其隐形关系的存在,然后通过推理和计算找到其关键信息,再设法建立联接。
例如,一袋酸奶出现质量问题,到底是在生产过程中哪个环节出现的问题?我们是极难追溯的,这时很多要素之间的隐形关系需要预先建立。
再举个例子,一个工厂采购了多台德国知名品牌的立式加工中心,但是其中一台总是出现X轴方向超差的问题,奇怪的是其余几台都没有遇到类似情况,操作员曾经想:难道是遇鬼了?经过长时间的分析,工厂逐一排除了传动部件松动的问题、热变形的问题,以及X轴本身变形的问题…
最终,一位颇有经验的专家来诊断才看出原因所在,因为机床的地基存在问题。操作员将机床移开之后发现,地面已经塌陷了一个小坑,说明地基的确存在问题,是由于地基的变化引发了机床的变形。
知晓了这些隐形关系,有助于我们进一步顺藤摸瓜,发现那些原本我们并不知道其存在性的工业要素。理清各种要素之间的关系,对研发、生产和管理等环节,有可能会产生巨大的好处和帮助。
03利用联接“关系”,撬动深层价值
知识图谱的重要性在于,它推进了异构数据结构化的过程,让数据建立联接关系,为各种算法的介入提供了一个核心支撑。没有它,很多数据的访问是松散的。
在推进工业智能的过程中,有两个大的支柱,第一是知识图谱,其次才是深度学习。现阶段我们最应该重视的是知识图谱,而且很多工业领域的核心企业已经围绕知识图谱进行布局。
在《“中国智造”如何走出与“工业4.0”不同的道路?这家巨头用知识图谱给出答案》一文中,我曾经介绍了西门子在这方面的进展。
西门子的物联网服务事业部就以知识图谱为抓手,帮助企业推进数字化转型。西门子认为,如果工业想用好人工智能,无法绕过的路径是先建立知识图谱。如果不把前期的语义模型和知识图谱搭好的话,人工智能很可能只是一个空中楼阁。
基于知识图谱已经建立的模型,持续的采集和积累数据,才能为后面的数字化和人工智能应用铺好路。当有了知识图谱以后,人工智能才有可能实现最后的终极目标,就是所有的设备完全自主、自治。
施耐德电气则与企业级的知识图谱平台Stardog合作,构建了智能建筑领域的物联网知识图谱,打通了建筑物管理、居住舒适度调节、电源监控等数据孤岛,分析和集成来自无数物联网传感器和系统的信息,同时降低了开发者和工程师的工作量,实现最优化的智能建筑运营。
国内的初创企业智通科技在2020年初,发布了全新的知识图谱产品:通图Smart.KG,它拥有知识图谱的构建和全过程的可视化操作能力,帮助企业将数据隐形关系显性化,残缺关系完整化,并提供不同场景的图谱智能化服务,目前已经在食品饮料、纺织、能源等行业取得了一定的应用进展。
知识图谱的构建思路包括“自下而上”和“自上而下”,分别适合不同的场景。基于知识图谱已经建立的模型,持续的采集和积累数据,才能为后面的数字化和人工智能应用铺好路。利用知识图谱作为数字孪生的基础,打造一个可持续使用、可持续开发的数字化平台,这才是关键。
知识图谱就像语义世界的百科全书,更确切的说,这是一套物联网设备可以使用的百科全书,它是一个活着的数字孪生。
预计基于知识图谱的工业互联网平台,在今后一段时间将会获得业界青睐,具有较大的发展动能与应用潜力。
最后,诚挚感谢清华学长赵敏在文章写作过程中,给予我的极大帮助。
本文小结:
知识图谱让我们将分析的重点放在了探索各种“关系”,包括隐性关系。
在工业互联网领域,知识图谱的价值在于将“三不”变为“三可”。“三不”和“三可”是指:过去不可见的要素可见;过去不可计算的要素可计算;过去不可联接的要素可联接。
在推进工业智能的过程中,有两个大的支柱,第一是知识图谱,其次才是深度学习。文章来源:物联网智库