业界把大模型在消费端的落地比作“平原战”,而把在工业制造领域的落地比作“山地战”、“高原战”,后者比前者的难度要复杂得多。
最近,IDC中国副总裁兼首席分析师武连峰在一场大会上分享了一项有意思的数据:他们在调研了全球800多个样本、中国100个样本后发现,在生成式AI应用这件事上,什么都还没有做的中国企业只占7%,低于全球12.7%的占比。
这意味着,大量的中国企业已经在尝试部署大模型和生成式AI。金融、教育、医疗、能源、汽车等各行各业都能见到企业探索大模型的身影。甚至连蒙牛,也在今年8月对外发布了业界首个营养健康领域模型MENGNIU.GPT。
而在诸多参与者中,涵盖了能源、电力、化工、汽车、制造等细分行业的工业领域,也被认为是将被大模型带来巨大变革的重要板块。
工业场景有其特殊性,一方面它关乎国计民生,是经济和产业发展的基本盘,2022年占GDP的比重达到33.2%。另一方面,这个领域极其复杂且细碎,目前国内规模以上工业企业数量超过40万家,覆盖41个工业大类、207个工业中类、666个工业小类,其中存在着大量的场景和业务痛点。
过去几年,国内工业制造领域经历了智能制造与AI1.0阶段的洗礼,不少企业已对AI应用有了相当程度的认知,并完成了不少场景的智能化升级。而大模型的到来,正在为这个领域带来新的机遇和挑战。
01拿锤子找钉子
年初大模型火了之后,最先兴奋和行动起来的是在工业领域服务多年的各种智能化服务商。此前,在如何将AI更好地用在工业这件事,他们已经看了、想了好多年,但很多功能和畅想一直碍于技术限制,难以真正出来好的效果。
“相当于钉子一直在那儿放着,只不过是锤子行不行的问题。”中工互联科技集团董事长智振告诉数智前线,大模型的出现,正好带来了一把好用的“锤子”,尤其是随着多模态大模型的逐步推进,将有望把工业领域的应用场景完全打开。
业界的普遍共识是,AI大模型将会融入工业企业的研发设计、生产工艺、质量管理、运营控制、营销服务、组织协同和经营管理等方方面面,极大加速这个领域的智能化升级进程。
市场机会也在迅速膨胀,有数据预测,综合我国工业IT支出以及全球大模型增长水平,预计2026年我国工业大模型市场规模将超过5亿美元,五年复合增长率达116%。
可以看到,面向工业这一重要市场,华为、百度、腾讯、阿里、微软、谷歌等国内外大厂,都在加快大模型落地实践。众多科技公司也纷纷行动,中工互联在今年6月推出了智工·工业大模型,智能制造企业思谋科技也在11月初推出了工业多模态大模型IndustryGPTV1.0。
早前就在工业数据等上面有着比较多积累的各大工业互联网平台,也几乎都在探索与大模型的结合。海尔旗下的工业互联网平台卡奥斯,推出了以开源通用大模型为基础的工业大模型COSMO-GPT。科大讯飞投资成立的羚羊工业互联网平台,也推出了由讯飞星火提供技术底座的羚羊工业大模型。
实际上,不少业内人士都看好大模型与工业互联网的结合。北京信息化和工业化融合服务联盟理事长闫同柱告诉数智前线,工业互联网平台下方有终端软件,中间有操作系统,但还缺少一个大脑,大模型可以充当这个大脑。而工业互联网平台沉淀了大量人机料法环测的数据,也能反过来满足大模型的大数据需求。
科大讯飞董事长刘庆峰分享的数据也证实了这种相互促进,在推出工业大模型后短短一个月零3天,羚羊工业互联网平台的用户总量就增长了59%,平台服务企业次数暴增88%。
供应端动作频频,需求方的态度和动作也在显著变化。“上半年,大家都在观望,主要是我们去找客户。”但到下半年,智振明显发现,工业客户的主动性在加强,许多企业开始主动找到他们,探讨可能的场景,咨询最新的功能和已经落地的案例集。
“工业客户普遍会关注两个问题,一个是以前人能做的工作,想让大模型替代;一类是以前其他技术实现不了的,现在想让大模型来实现。”智振观察,几乎所有企业,都希望通过大模型实现降本增效,但也有部分企业是为了保持技术壁垒和先进性,而率先关注和应用大模型。
百度智能云资深人士也告诉数智前线,文心一言公测后,一大批央国企非常重视大模型技术的应用场景探索,其中也包括不少工业企业。“这些大客户会拿一些原来自己难处理的场景,来跟我们探讨,想用大模型去解决问题”,该人士说。
尤其是能源、电力等传统行业,以及以汽车、新能源等为代表的高端制造业,由于本身对智能化有着更高的刚需,且资金相对充裕,在这波大模型热潮中,反应最为迅速和积极。
比如在对安全生产需求极高的矿山领域,据知情人士告诉数智前线,矿山大模型几乎已经成为落地最快的一个行业。百度、华为、腾讯等大厂都在这一领域有所实践。
但除了一些跑在前头的先锋企业,工业制造板块毕竟还是一个比较传统的领域,行业里的企业普遍对新技术应用更谨慎,大部分仍然还处在观望状态。
闫同柱观察,尤其是传统制造业本身的数据量不是太大,大模型的门槛目前又相对较高,大模型到底能带来多大价值,投入产出比如何,“他们还看不太清楚”,而这都会影响其在大模型上的投入进度。
02“明年是应用爆发年”
工业领域各种细分场景众多,不仅涉及研发设计、生产制造、售后运维等诸多环节,细碎且复杂,不同细分行业间,场景也有很大不同。随着各家大厂与科技公司在大模型落地工业上的持续推进和探索,不少行业内企业已经开始梳理各种可能引入大模型能力的场景。
一位行业内人士坦言,部分企业最初对大模型应用的期望其实有些高估,但目前来看,大模型在制造业的应用落地,没有想象得那么好,也没有想象得那么差。
智振则告诉数智前线,过去半年间,他们接触到了大量客户反馈来的需求,有些客户提出的需求会很细节,但当他们一步步拆解到技术层面后会发现,其中一些需求目前还比较难打通。
比如在前端的研发设计环节,有客户向他们提出,希望用大模型实现将老图纸转化为3D图纸的功能。但中工互联实践发现,目前用一张图片自动转化为3D游戏相对容易,但工业对精度要求非常高,要想用大模型将二维的CAD转化为三维CAD,解决设计环节中重复性工作的问题,还比较困难,但一旦实现,“将带来巨大变革”。
业内人士观察,由于工艺机理复杂,研发设计环节普遍距离真正看见价值还有较多痛点待解,但一些简单的功能目前已经可以实现。比如有企业将自己过往多年沉淀的方案库与大模型进行结合,当客户提出需求后,就能快速匹配方案库里的方案。
实际上,在工业领域,最先将大模型用起来的,仍然是代码生成、文档整理、内部知识问答等最具普适性且相对外围的场景。由于容错率相对较高,且容易出效果,这也几乎是所有行业在大模型应用上收获战果的首要阵地。
腾讯云智能制造首席专家邴金友介绍,在知识问答场景,他们帮一家汽车厂完成了汽车手册的知识化,能让大模型代替一部分销售的工作;国内一家飞机制造厂也曾找到他们,提出将企业内部管理流程、管理办法训进大模型,实现了报销申请等的自动化、智能化。
中工互联也在智能问答、代码生成等场景,实现了不错的落地效果。智振透露,他们给企业做的专家系统,已经能达到90%以上的准确度,大模型写成的代码,能够替代20%-30%的编程量。目前,智工·工业大模型已在能源、化工等领域落地近10个项目,覆盖智能设备运维、工业网络安全分析、智能质检等多个场景。
除了前端的设计研发,后端的售后运维与内部管理等环节,一些厂商正也正在位于中间端的生产制造环节,探索利用大模型的生成能力,来帮助企业在工业场景中进行瑕疵检测。思谋科技SmartMore联合创始人刘枢举例称,在工业场景,真正有缺陷的图片数据往往是比较难收集的,这会直接影响缺陷产品的检测率。而现在,他们通过大模型数据生成的技术,能将断胶这种缺陷的漏杀率从1%降到0.01%。
工业互联网企业卡奥斯,则打造了基于大模型的人工智能装配系统,来解决离散制造业效率低的痛点。根据官方披露信息,该系统可实现洗衣机工厂产线非加工时间减少不小于20%,工艺设计环节效率提高不小于30%,换产调试环节效率提高不小于50%。
另外,大模型和小模型的结合,也是业界目前看到比较能够见到成效的一个方向。
东莞一家汽车电子企业,由于一辆汽车上PCB线路板用量多达100多块,设计工程师们以往在加工生产时,往往需要将涉及到的大量参数转换后再加工,很容易出错。但大模型来了后,这家企业和腾讯一起探索了大模型与OCR小模型相结合的方法,能直接将图纸识别出来,结构化后变成可复用的东西,将参数传给对应的加工机器。
更多的场景还在不断被探索。业界认为,随着大模型的持续发展和多模态技术的逐渐成熟,工业领域的应用场景将进一步打开。
“明年可能会是大模型在各行各业应用的爆发年,我特别看好多模态大模型未来的应用支持,一旦把多模态做了,并且轻量化以后,场景就太多了。“智振表示,他还看好大模型在端侧和边缘侧的应用,“未来的体量可能远远超过现在的想象”。
03数据,仍然是难点
今年以来,对于大模型落地工业,业界一直有个形象的比喻——把大模型在消费端的落地比作“平原战”,而把在工业制造领域的落地比作“山地战”、“高原战”。一句话总结就是,大模型落地工业,要比落地消费端,困难和复杂得多。
邴金友告诉数智前线,他们与大量工业企业,尤其是制造业企业进行了交流,发现大模型与工业的结合,仍然存在成本、人才、数据,以及大模型技术本身这几方面的难点。
企业落地大模型的成本,不仅包括算力成本、部署成本,还包括试错成本、人力成本等。目前,落地大模型成本高达数百万到千万。而很多制造业企业的毛利本身相对较低,在新技术投入上相对谨慎。
而从技术本身来看,邴金友认为,大模型的幻觉问题决定了它目前还是概率产出,但工业里面要么是经济产出,需要100%正确,要么需要干预,也即大模型能不能跟原来传统的数字技术结合起来,就像人同时有左脑、右脑一样。
数据是一个更难解的痛点。
一方面,工业领域虽然场景众多,存在大量数据,但碎片化现象明显,各家企业对数据的采集、治理等的水平也参次不齐,甚至有大量企业可能在历史数据采集方面并不充分。
闫同柱举例称,过去有大量工业知识和工业数据,都只存在于老工程师、老专家们的头脑和电脑里,并没有及时转化为企业知识资产,逐渐就在人才交替中被遗失掉了。“就像我国的石油勘探技术,全球都认可,但随着老专家离职或者离世,有些知识就断掉了,导致很多新员工进来后又得从头进行摸索。”
另一方面,我国数据要素市场还在发展早期,尚未建立起比较完善的数据共建共享、数据产权界定等机制,再加上工业企业普遍十分重视数据安全,数据不出企业或园区是刚需,工业领域存在严重的跨行业、跨场景数据壁垒问题。实际上,数智前线获悉,目前几乎所有工业企业在布局大模型时,都会要求私有化部署。
成本、人才、大模型本身的困难,都需要时间的推移和技术的不断进步,去逐渐填补。数据的问题,却需要大模型服务提供方和大量的工业企业,注入更多的主动性,从现在开始,着手去解决。
中工互联在今年10月推出的万企赋能计划,就有一项内容是针对数据问题展开。“所有小企业只要你提供数据,我们训练完就可以免费使用。我们要尝试一下,明年有没有企业愿意把数据拿出来,加到一个平台里面一起来做。”智振说。
中国电信旗下智库平台——天翼智库的报告也显示,合作正在成为解决数据问题的主要办法,一些行业的数据共建共享基础较好,正在开展实践,如东北大学、阿里等单位构建了15个以上的面向钢铁、纺织等产品表面缺陷公开数据集。
国家政策层面同样在加速推动数据的互联互通,今年8月,财政部曾发文表示,数据资产入表将于明年1月1日起实施。“这是一项比较长远的规划。”智振认为,基于这一趋势,未来像他们这样的厂商在训练工业大模型时,将有机会找到一些大型的数据发行集团,拿到训练所需的高质量工业数据。
业界观察,大模型在工业领域的应用落地,将会是一个渐进式的发展,虽然目前仍有许多难点需要突破,但其价值将在未来一段周期内逐渐释放。
在这种大背景下,不少业内人士建议,工业企业应该尽快拥抱大模型。简单来说,企业不一定现在就要投入特别大的精力和金钱,立马自己训练一个模型,但一定要多关注这方面的进展,提前进行场景规划、数据储备等工作。