上海橙显电子科技有限公司

距离颠覆成像技术的新纪元，还有多远？

不论是成像技术，亦或是三维感知，其实都属于深度感知的范畴。虽然目前市场对于深度感知技术的需求呈井喷状态，但是能够提供成熟产品和方案的公司却屈指可数，造成这一现象的核心原因就是技术门槛过高。

针对感知层而言，有一个里程碑事件是深度传感器的普及。2009年，微软Kinect 诞生是当时的一个大事件，是人工智能感知传感器中的革命性的里程碑，从此以后大家终于可以很方便和低成本地获取3D信息了；另外，计算机视觉长期存在两大难题：图像理解和三维重建。一直以来，求解3D都是人们的梦想，最初它需要拍两张或多张照片，费很大的劲儿来重建。但今天有了sensor，人们直接可以测量3D，它一下就开启了今天和未来的很多应用。但是，Kinect V2是基于连续波间相法的ToF（Time-of-Flight）深度相机，它存在不能抗阳光，不能远距离工作的缺陷。而另一种获取三维数据的方式是通过机械扫描式激光雷达，但它同样存在无法解决的缺陷：产能受限成本高、数据稀疏空间分辨率低，限制了它们的应用范围。现阶段常见的深度感知解决方案，主要依靠深度摄像头，在获取平面图像之外，还可以获取图像中的深度信息，比如说三维的位置以及尺寸等信息，这也就让计算机获得了环境和对象的三维立体数据。

从技术角度来细分的话，深度感知摄像头目前有如下三种解决方案：

结构光：目前应用最广泛的深度感知方案，基本原理是由结构光投射器向被测物体表面投射可控制的光点、光条或光面结构，并由图像传感器获得图像，通过系统几何关系，利用三角原理计算得到物体的三维坐标。上文中提到的Kinect 1代就是使用的这项技术。

双目视觉：只需安装两个摄像头，利用双目立体视觉成像原理，通过两个摄像机来提取包括三维位置在内的信息进行深度感知。因为没有涉及光学系统，所以双目视觉解决方案的成本较低，但是该项技术对于硬件设备的要求又相对较高。

ToF：飞行时间（Time of Flight）技术的缩写，基本原理是传感器发出经调制的近红外光，遇物体后反射，传感器通过计算光线发射和反射时间差或相位差，来换算被拍摄景物的距离，以产生深度信息，此外再结合传统的相机拍摄，就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。ToF是受环境影响最小的技术，不过由于其分辨率不高，所以并不适用于高精度需求的应用场景。