赋予机器感知三维世界的眼睛
时间:2022-03-18 16:36:01 | 来源:行业动态
时间:2022-03-18 16:36:01 来源:行业动态
人类拥有与生俱来的3D环境感知和理解能力,这是因为我们用两只眼睛来捕捉图像,通过大脑处理形成立体视觉,从而辨认物体的形状方位、他人的动作,轻松自然地跟这个三维世界交互。
能否让机器也能感知三维世界呢?或许很多人会想到给机器添加一颗摄像头。但普通RGB摄像头拍摄的现实世界的影像,仅能采集场景中的色彩信息,无法采集物体和摄像头之间的距离和方位。也就是说,无论场景中的三维结构有多么丰富,对机器来说都是一个平面,一个二维世界。
3D视觉技术,就是赋予机器感知三维世界的信息和能力,并给我们带来颠覆性的价值。试想一下,将汽车立体模型通过增强现实(AR)技术投射出来,客户可360度观看,还能开车门,由此直观地提出意见,而不是一张张翻看照片;或者派无人机探索森林或洞穴,一边前行一边绘制周边场景的三维地形,而不是我们拿着一张平面地图亲自探险
事实上,3D视觉技术目前已经在工业界取得成功,但在消费领域,受限于3D感知硬件的成本和体积、计算能力等困扰,很多场景并未激活。除了扫地机器人等个别终端外,我们的智能手机等移动设备,还处在二维世界里。但近几年,3D视觉技术终于开始走向个人终端,机器认知世界的新大门正在打开。