以 3D 之名，围攻「智能制造」，AI 视觉独角兽们的新战场

导语：3D视觉的使命，是重塑制造业的生产、商业模式。

进入2022年，智能制造成为政府“两会”中的热门词汇。

一方面，国家发改委、工业部、科技部等八部门发布了关于印发《“十四五”智能制造发展规划》的通知，提出国家级的顶层设计；另一方面，各地方政府，如北上广深等一线城市，都已经出台相应政策细则，为推进智能制造提供制度保障。

而在实现智能制造、推动产业升级过程中，机器视觉作为不可或缺的技术，承担起让机械“看得懂、看得细、抓得牢、送得快”的桥梁作用。

换句话说，要让机器代替人力，首先要给机器装上“双眼”，使之能够“看得见”，然后才能像人一样工作，这就是机器视觉。

作为人工智能的一个分支，机器视觉具备人所不能拥有的优势：精度高、可适用于危险工作环境，并且识别效率高，可无间断工作等等。实际上，机器视觉并非新事物，已经被广泛应用在外观检测与识别、货物分拣等工业流程之中。

目前的机器视觉仍以2D为主，即通过摄像头拍到物体平面的照片，然后通过图像分析或比对来识别物体，其局限在于只能观测到物体平面的特征，成像精度容易受照明条件影响，因而适合一些对技术要求不高的中低端制造业。

在一些高端制造领域，例如生物科技、精密半导体等对测量精度要求极高的产业，传统的2D解决方案已经不能满足需求，3D视觉正逐渐崛起，成为市场新宠。

从2D到3D：不止一个维度的区别

3D视觉，即通过3D摄像头采集物体的三维坐标信息，通过算法实现三维立体成像。

与2D视觉系统相比，3D视觉的优势在于，多一维度的信息数据（主要是空间坐标），能满足对体积、形状、距离等信息测量的需要。并且，3D视觉不容易受照明条件的影响，其成像精度远高于2D视觉，同时，其快速处理信息的能力也非2D视觉系统可比。

举个简单的例子：在涉及曲面、有弧度的物体测量时，2D视觉只能拍出平面图，很难反映出物体的真实情况；3D视觉拍出的是立体图，能呈现出物体的曲面、弧度、深度等真实信息，对机器或者人而言更具参考价值。

随着制造业的智能化升级，市场对于3D视觉的需求也在不断提升。根据美国市场研究机构Grand View Research的报告，到2027年，全球3D机器视觉市场规模预计将达到34.6亿美元，预测期内，市场的复合年增长率预计为14.7%，是一个潜在的蓝海市场。

掘金志了解到，当前3D视觉在智能制造中的应用已从单个场景发展到整个生产线的赋能，涉及定位、引导、生产、分拣、装配等多个环节。

以智能手机生产流程为例：在2D视觉时代，应用场景最为广泛的是质检，即尺寸与缺陷检测，涉及主板、零部件及包装三大部分。3D视觉可以直接覆盖这些流程，在检测精度、速率上更胜一筹，并且将应用拓展到上料、生产、检测、封装等场景，实现对原有产线的智能化改造，在上下料、分拣、搬运等环节需根据产品种类的不同实时规划并完成作业任务。

这实际上为厂商的柔性生产提供了便利。在C2M商业模式的带动下，企业需要根据用户实时订单来决定生产规模，以往的机械化生产属于批量生产，柔性很弱，3D视觉提高了工业机器人及自动化设备的智能化水平，使其具备按照实际生产需求来灵活变化生产各种产品。

例如，冬奥期间大火特火的冰墩墩，出现了一“墩”难求的情况。那么厂商需要实时调整生产策略，灵活配置生产原料、生产数量及质检部署，多生产“冰墩墩”，少生产“雪容融”，整个生产环节，都可以利用3D视觉来减少人力成本、提高生产效率。

因此，3D视觉与2D视觉并不简单的是1个维度的信息差异，多一维度信息带来的对生产模式及效率、商业模式的改变，才是其核心要义。

不过，上述例子都是理想状态下的预设。现实情况是，3D视觉虽然具备诸多优势，但要实现广泛应用，还有许多难题要解决。

3D视觉之难：场景、成本

和消费类电子不同，3D视觉在智能制造领域的应用，由于场景碎片化，显得更为复杂。

熵智科技创始人赵青在接受雷峰网采访时曾表示，3D视觉技术的应用落地面临两大难点：

3D视觉技术对于应用场景要有强适应能力；

3D视觉技术和运动规划技术的衔接。

首先，制造业的生产场景非常复杂，3D视觉在实验室中的效果，可能在实际场景中无法体现，这就要求3D视觉对于应用场景具备强适应能力。例如，在反光、暗黑、覆膜和远距离等条件下是否依然可以准确感知、识别出物体。

其次，3D视觉在感知到物体的三维信息后，需要与运动规划技术进行衔接来完成任务。这又涉及避碰检测、手眼坐标转换、节拍优化和力控等技术。

但机器本身很难像人一样，大脑发出指令就能完成动作；机器需要对输入的信息进行解读，并且将指令传送到各个部分，进而执行命令。其中一个环节出错，就会导致任务失败。

最后，技术本身很难通过标准化来实现对各场景的适配，甚至在同一场景上，对技术的要求都各不相同。比如，在产品的缺陷检测上，厂商的标准是不一样的，对于缺陷的定义也各不相同，很难做一个标准化的缺陷检测工艺。

除了场景化难题之外，3D视觉所依赖的传感器（主要为摄像头）也还无法实现在保证抗环境光干扰能力强、测距精度高、分辨高的同时，降低成本，提高性价比。

因此，目前 3D 视觉的应用主要依据使用场景和预算来选择相机，然后根据相机成像结果来进行定制化的算法开发。这种成本高、周期久的开发模式严重限制了 3D 视觉在实际场景中的应用。

国产3D视觉技术之路：困难重重

根据中国机器视觉产业联盟的统计，国内机器视觉行业以中小企为主，销售额在1亿元以下的企业占据83.5%，而基恩士的销售额早已突破百亿（2020年为321.61亿元），相比较而言，国内过亿营收的企业为奥普特（2020年为6.42亿元，仅为基恩士的2%）。

可以说，在以2D视觉为主的机器视觉领域，全球市场已经形成基恩士和康耐视垄断的局面，而3D视觉技术的出现，被视为改变当前格局的技术推力。

作为新技术，3D视觉所面临的场景化难点，是所有企业都必须解决的问题。目前无论是国外的基恩士、康耐视，还是国内的安防巨头，如海康威视；亦或者诸多AI视觉公司、机器视觉公司，在3D视觉技术领域，都处于同一起跑线上。

不过，相较于国外巨头，国内企业先天性存在三个不足。

对场景的理解。

不论是基恩士，还是康耐视，都已经成立数十年，且占据着机器视觉的绝大部分市场；多年的积累使其在探索3D视觉的应用时更具优势，许多场景难点都可以基于以往经验做试探，减少不必要开支。

国内企业成立时间较短，对场景的理解需要一步步探索，甚至多走弯路，为此付出高昂的时间、资金成本。

缺乏硬件能力。

机器视觉的主要逻辑是，对收集到的图像信息进行分析处理，智能设备根据处理的信息做出相应判断。这一过程中，镜片以及镜头的质量对获取图像信息的准确性起到非常关键的作用。

国内多数公司以软件算法切入，集中在应用层，缺少相应的硬件能力。国内3D视觉的核心相机大部分为外购，包括IDS、康耐视、基恩士、佳能等，而在镜头方面，高端市场仍为徕卡、施耐德、尼康、富士等国外品牌所垄断。

稳定的客户群体。

对于客户而言，随意更换合作伙伴，很容易增加试错成本。即便是新技术，客户也往往愿意选择已经有过合作的技术供应商。显然，国外巨头具备绝对优势，而国内企业要发展，只能一步一步“升级打怪”，以技术和产品获取用户信任，逐渐建立起属于自己的客户群。

这反映出一个深刻的现实：在新技术面前，企业都是平等的，但老牌企业仍然可以依据自身的业务生态，对新（小）企业实施降维打击。

因此，国内企业要追赶国外巨头，除了技术突破以外，还需要建立起稳定的生态圈，这是一个漫长而艰难的过程。

结语

当前，3D视觉在消费电子上的广泛应用，对机器视觉公司产生了极强的刺激效应。智能制造作为下一个蓝海市场，越来越多的企业开始探索以3D视觉来赋能企业生产的路径。

但与消费电子不同，智能制造很难出现现象级应用，整个市场需求都是碎片化的，因而不可能复制前者的发展模式，企业必须在实际场景中去寻找最佳落地解决方案。

对于国内企业而言，先天性的不足并非不可逾越的障碍，需要付出比国外巨头更多的时间和精力，去理解场景、钻研技术，一步一个脚印夯实基础，然后追赶。这不仅需要视觉公司的努力，也需要光学、制造业等多个产业的共同进步。雷峰网雷峰网(公众号：雷峰网)

参考资料：

https://blog.csdn.net/kangjielearning/article/details/109249539

https://m.thepaper.cn/baijiahao_15594039

https://en.wikipedia.org/wiki/Machine_vision

https://36kr.com/p/773813443523845

https://www.leiphone.com/category/robot/2kHE427wIXhOtN1n.html

https://baijiahao.baidu.com/s?id=1715395976735890506&wfr=spider&for=pc

https://www.leiphone.com/category/aijuejinzhi/SwQdNwJfSL8wLISo.html

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

Click to rate this post!

[Total: 0 Average: 0]