2023年,虽然工业机器人版块并没有迎来业内期盼已久的“行业大复苏”,但在“机器人+”政策以及人形机器人、GPT大模型、具身智能等各种概念的利好之下,工业机器人的热度有增无减,甚至在今年上半年还实现了销量上的正增长。
据高工机器人产业研究所(GGII)数据显示,2023年H1,工业机器人销量15.19万台,同比增长10.98%。GGII预计,2023年中国工业机器人全年销量约33.3万台,同比增长9.90%。
不仅在销量上保住了正增长趋势,在融资层面也仍旧强势,尤其是机器视觉领域。
据高工机器人产业研究所(GGII)数据显示,2023年Q2,中国工业机器人领域融资事件23例,涉及融资金额约14亿元人民币;按融资案例分布来看,2023年Q2融资案例数量最多的是工业机器人本体(26%),其次是机器视觉和零部件领域(22%);融资金额最大的领域主要是核心零部件(33.57%)和机器视觉(23.43%)领域。
然而,在机器视觉持续火热的背后,国内机器视觉市场规模正在逐步扩大,国产机器视觉企业也凭借新的差异化发展路径,逐步崛起。
GGII数据显示,2022年中国机器视觉市场规模170.65 亿元(该数据未包含自动化集成设备规模),同比增长23.51%。其中,2D视觉市场规模约为152.24亿元,同比增长20.21%,3D 视觉市场约为18.40亿元,同比增长59.90%。
GGII预测,至2027年我国机器视觉市场规模将超过560亿元,其中,2D视觉市场规模将超过400亿元,3D视觉市场规模将接近160亿元。
面对机器视觉领域的持续火热,有企业负责人却表示:“其实,我觉得行业前两年是有‘虚火’的,但是任何一个行业都类似,这个‘虚火’本身代表了对于赛道的认可。而这两年的‘虚火’有一个很大的好处,就是基本上大家认为人工智能与3D视觉在机器视觉解决方案中已经走通,技术上已经不存在问题,当前的要务就是如何才能把方案落地,并更加突出性价比。”
也正是在这样的背景之下,跨维智能凭借创始人的“热爱”与深厚的技术优势成功脱颖而出,并为机器视觉领域注入全新的发展思路。
跨维智能创始人贾奎博士的一句话,更是直接道出了当下3D视觉领域的问题核心:“我们需要用AI的能力解决物理世界三维的感知问题。”
“AI+3D”的技术路径,在业内并不算是新鲜的名词,但AI对3D视觉算法的渐进式优化并没有解决行业痛点,项目的非标定制化问题仍然存在。跨维智能倡导一条基于100%合成数据和AI能力平台的新一代3D视觉算法生产模式,以无人化、标准化的视觉算法生产流程打破了视觉项目非标定制的瓶颈,产品化的交付能力让行业看到了3D视觉技术普及的希望。跨维智能作为一家以AI为内核的企业,其新一代3D视觉解决方案已经成功落地在越来越多的具体案例中,而且还提出了基于物理世界模拟的生成式AI 2.0的概念。
那么究竟何为“生成式AI 2.0”?又有何魔力?要想揭开个中奥秘,或许还需从跨维智能本身来寻找答案。
躬身入局
据悉,跨维智能是一家专注于3D视觉软硬件产品研发的高科技人工智能企业,其致力于将先进的三维几何深度学习技术应用于工业智能化领域,为客户提供AI视觉算法、3D智能相机和高性价比的软硬件一体化3D视觉解决方案,让机器人以灵活主动的方式完成复杂环境下基于3D视觉的定位、识别、引导等任务。
成立一年内,跨维智能就成功完成两轮近亿元融资,目前已获得来自松禾资本、真格基金、联创资本等知名机构投资,并由此引发了资本圈以及业界的高度关注。
那么,当初跨维智能是基于何种初衷选择了AI作为入局3D视觉的主要方向?据贾奎博士透露,2016年回国后,其在华南理工大学便选择用新型AI作为攻克三维感知的研究方向,彼时该校还建立了“几何感知与智能”实验室。
也正是基于这样的长期技术积累,让贾奎博士看到了AI在三维感知层面的商业化潜在机会。
贾奎博士表示:“用AI来做三维感知,它本身有两大应用方向,第一是泛机器人的感知,其次是虚拟现实的增强,不管是前者还是后者都存在着现实三维空间中的感知问题。而经过了前期的技术沉淀,我们需要考虑从兴趣到产业化的机会,为此,选择了与机器人相关,譬如机械臂、无人车、人形机器人等。如何让这些机器人能够真正具备智能决策的能力,这就涉及到眼和脑的协同,倘若缺乏对三维世界的感知,那么机器人相关产品便不能做出相应的决策,它也就不是一个智能体。当然,这里面还有很多的应用方向,但为何跨维偏偏选择去赋能机械臂相关的操作感知决策?关键一点就是我们要垂直打穿一个业务落地方向。”
正是基于这样的发展方向,跨维智能在产品层面也屡获突破。今年5月底,跨维智能发布了一款专为工业生产领域设计的Xema系列3D相机产品,该款产品一经推出在业界就引发了巨大关注。
技术开源
“我们此次推出的产品为Xema北极鸥系列开源相机,在小/中/大不同的工作视野下,跨维智能Xema系列划分了Xema-P/S/L三款相机,以合适的价格、优质的技术方案,为不同的工业应用场景提供可靠的相机硬件方案。用户可根据实际应用场景及使用需求,选择相应的相机型号。”跨维智能相机部负责人吴迪介绍道。
据了解,跨维智能Xema北极鸥系列开源相机不仅提供先进的API接口和SDK二次开发软件包,使用户能够以极大的灵活性进行二次开发。同时,通过开源平台,用户还将获得对3D相机的完全掌控权。
“我们其实是希望通过开源的模式,来降低整个工业界对3D成像硬件的研发成本。因为当下普遍存在着这样一个现象——每家企业都希望自己研发而不是采购别人的3D相机,如此,每家企业势必就得从零开始研发,这对整个社会而言是巨大的浪费,与其如此,大家还不如把力量合在一起,研发出最通用、效果最好的3D相机。现在,我们在技术上有一些优势,所有我们把自己的代码、设计图纸通过开源的方式,向整个工业界揭开,希望通过这样的方式来促进行业乃至社会的发展进步。”谈及开源的初衷时,吴迪如此说道。
对于跨维智能而言,开源只是迈向理想路上的第一步,打造3D视觉大模型实现“降本增效”方为其真正目的。
生成式AI 2.0
目前,3D视觉在工业制造的落地方面,依旧存在着诸多难点和痛点,譬如碎片化、多变等需求。以拆垛为例,可能是拆箱子、拆带子,也可能是混合的拆垛、拆木板、拆电器门板等;还有工件,可能是半无序的工件,也可能是完全无序的工件,高反的工件或者是异形工件和大长宽比,所有的这些需求也就决定了场景定制化落地,纵然有些软件产品的辅助,但仍存在着不同程度的定制调优。
面对这样的复杂情况,在贾奎博士眼里,生成式AI无疑是最优解。
但当前的生成式AI本身也有局限性,以图文为主,侧重通过对自然语言的理解尝试对需求做出示意性的反馈,但无法保证精度,因而在科技、工程等领域应用受到诸多限制,要想打破这样的局限,就必须将生成式AI与物理世界结合,为此贾奎博士认为:“基于物理世界模拟的生成式AI,是生成式AI 2.0”。通过这样组合,生成式 AI便可预测物理世界中的千万种、甚至上亿种可能性,形成有价值的合成数据。
以机械臂的抓取为例,通过仿真模拟平台掌握了“光线对场景目标的反射、折射影响”等物理规律,生成式 AI就能预测模拟出一个瓶子,在不同场景光照下,周身不同的反光程度;一堆钉子,所有可能出现的散落状态等。
而这也恰恰是跨维智能的优势所在,通过生成式AI不仅能够轻松解决了业内普遍存在的痛点和难点——据了解,目前业内大多数企业都是采用自行采集真实样本的方式来开发或训练算法,但自采的方式不仅成本高、效率低,加上终端应用场景碎片化,数据通用的概率相对较低,需要经过一系列的优化,这无形之中又增加了数道工序,性价比极低。
对此,贾奎博士曾表示:“用五六年、上千个案例积累的真实数据,通过合成数据,几天就能完成。相比于人工采集与标注数据,合成数据的成本能够实现几个数量级的降低。”
最关键的还是,在训练效果上,合成数据能够更优于真实数据。由于本身就是基于物理规律合成,合成数据天生自带绝对精确的标注,这就意味着,AI学习起来效率非常高。另外,合成数据的“全面性”是真实数据难以比拟的。
“跨维智能其实就是用新型的AI对物理规律进行建模,让机器人的感知更智能、更精确,然后做出更好的决策,从而赋能到垂直场景,解决工业制造等领域所需的柔性抓取操作需求。”
据介绍,跨维智能旗下的生成式AI产品,目前,无需使用一张真实图片就可完成机械臂复杂场景作业的3D视觉模型训练,仅通过使用合成数据训练的模型引导机械臂的柔性操作,便可以实现现场99.9%以上的稳定抓取。
相较于行业传统定制化开发的模式,企业基于生成式AI 2.0,就可以利用通用大模型,实现产品模块化开发,做到开箱即用的部署,进而实现同行业直接拓展,不同行业也能有效复用,3D视觉行业的商业化难题也就迎刃而解。而这恰恰是跨维智能所憧憬的行业未来,贾奎博士承诺,跨维智能从3D合成数据到基于AI平台的3D视觉算法等中台能力未来也将向行业开放。
虽为新生代企业,但跨维智能的大局观、长期主义及开放性,都为行业带来了全新气象。俗语有云:“相聚为始,并行乃济,无欲则成”。只有足够开放,才能聚众智、合众力,从而推动3D视觉行业的全面繁荣发展。