“结构光+ToF”双剑合璧,这家公司用技术融合开启机器人全场景感知时代​

频道:保险市场 日期: 浏览:37257

电子发烧友网报道(文/吴子鹏)从扫地机器人到机器狗,再到人形机器人,具身智能已从概念照进现实。作为人工智能与机器人领域交叉的前沿方向,具身智能显著提升了智能体与物理世界的交互水平。在具身智能系统实现过程中,3d 视觉感知是底层核心技术之一,它通过实时捕捉、解析三维环境信息,赋予智能体空间理解与交互能力。

在接受电子发烧友网专访时,光鉴科技创始人、CEO 朱力表示,机器人是具身智能的典型形态,而机器人与现实物理世界交互的前提,是能够精准感知周边的空间环境。以人形机器人抓取水杯为例,只有精准识别杯子的位置和形态,才能顺利完成这一动作。“光鉴科技专注于智能视觉感知技术的研发与应用,核心目标就是让机器人具备精准的空间感知能力。”​

3D 视觉感知的发展现状和挑战​

3D 视觉感知技术通过提供深度、形貌、位姿等三维信息,弥补了 2D 图像的不足,正在重塑智能体的感知系统。据 Yole group 统计数据显示,2022 年全球 3D 感知市场规模为 82 亿美元。随着智能驾驶无人机智能家居等应用领域的蓬勃发展,预计到 2028 年,全球 3D 视觉感知市场规模将扩张至 172 亿美元,期间年复合增长率达 13.2%。

然而,在高速发展过程中,目前 3D 视觉感知技术路线非常多元,主要包括双目视觉、结构光、飞行时间法(ToF)和激光雷达(LiDAR),具体实现逻辑如下:​

·双目视觉:通过两个摄像头模拟人眼视差,利用图像匹配计算深度信息。不过,在低光、反光环境下,其精度会下降,且探测距离有限。​

·结构光:原理是向物体投射结构性光束,这些光束会因物体表面形状不同而产生变形,通过高差变化和间隙计算深度和物体间距离。但该技术主要缺点是有效距离短。​

·ToF通过发射连续光并测量光往返时间来计算目标距离,适用于中远距离测距,但需要克服相位噪声等问题。

·激光雷达:通过发射激光脉冲并测量回波时间 / 相位,利用点云构建 3D 环境地图。不过,获取高精度点云的硬件成本通常较高,且功耗也较大。

朱力认为,目前的3D 视觉方案各有优劣。例如,结构光近距离精度高,但远距离误差大,可比喻为 “近视眼”;ToF 远距离表现良好,但近距离精度不足,类似 “远视眼”。然而,像机器人这样的智能体,探测距离需要同时覆盖近到远的场景。受限于传统传感器能力,机器人往往需搭载多套传感器,导致系统复杂且成本高昂。光鉴科技的创新之处在于,提供了业界首创的单模组实现结构光和 ToF 技术融合,近距离借助结构光、远距离依靠 ToF,实现 3 厘米到 8 米宽范围的精准感知,满足了机器人全场景覆盖的需求。

“该方案的难点在于光学设计与算法协同,需要同时精通硬件系统、光学设计和算法开发,避免过度依赖外部芯片算力,通过自研高效算法实现软硬件深度融合,在提升性能的同时控制成本与功耗。” 朱力强调。

光鉴科技Nebula 系列 助力机器人智能感知升级​

当前,机器人行业正处于高速发展阶段,各细分赛道都迸发出强劲的发展动能。根据 IDC 等研究机构发布的数据,2024 年全球智能扫地机器人市场出货量达 2060.3 万台,销售额为 93.1 亿美元,同比分别增长 11.2% 和 19.7%;若扩大到整个清洁电器市场,2024 年市场规模则达到 200 亿美元,同比增长 8%。

朱力指出,机器人行业正经历硬件快速成熟与场景深入结合的阶段。扫地机器人已成为成熟产品且在持续迭代,配送、清洁等场景也有成熟产品落地。随着 AI 技术的发展,机器人智能化和通用化水平将进一步提升。机器人的执行系统主要涵盖传感、感知、规划和执行四个维度,光鉴科技聚焦最底层的传感和感知环节,为机器人提供高效的空间环境理解解决方案,使其具备更精准的数据服务于规划和执行环节。​

目前,光鉴科技面向机器人市场已推出Nebula 240和 Nebula 400 等多款产品,为机器人构建领先的 3D 视觉能力。其中,Nebula 240是光鉴科技针对扫地机器人领域推出的深度相机,其搭载的sToF技术融合了结构光的高精度与ToF的高分辨率,利用结构光主动投射的编码光斑,有效抑制传统ToF的多径干扰,大幅提升测距精度,使扫地机器人在近远距离中都能实现高精度3D视觉感知,实现真正意义上的优势互补。

wKgZO2gsUbSAGfIgAAaO8p_mNyM322.png

Nebula 240,图源:光鉴科技

当前,扫地机器人主要通过线扫描激光雷达构建 3D 地图,该方案简单且成熟。线扫描激光雷达获取的是截面信息,无法识别立体障碍物。而扫地机器人要实现智能化发展,获取三维环境信息必不可少,尤其是在带机械臂的高端机型中,精准的 3D 感知更是实现物体抓取的核心前提。而具备sToF技术的Nebula 系列深度相机,仅通过单一模组就可以获取到机器人避障和导航的所有视觉信息,并在不同场景中发挥信息协同作用,感知能力进一步加强。

此外,线扫激光雷达凸起的安装方式,导致扫地机器人机身较厚,难以进入沙发和柜子底下,覆盖能力受限。而Nebula系列则可以安装在产品内部,不仅可以优化产品结构,降低硬件空间和成本,使扫地机器人更加轻薄,并且也进一步增强了其工作覆盖范围和脱困能力。

朱力称,“Nebula 240进入扫地机器人市场是光鉴的核心技术与客户痛点需求结合的典型案例,其核心价值在于帮助客户。客户本身有识别维度升级以实现智能感知的需求,同时希望将扫地机器人设计得更加轻薄,Nebula 240 精准契合了这些需求。”

他以扫地机器人最核心的清洁功能举例,对于地面上的水渍、油渍、牛奶渍或灰尘等污渍,若扫地机器人能够精准识别到具体的污渍种类,系统就可针对性地进行清洁。在Nebula 240 mipi 上,光鉴科技已实现多种传感信号的融合,搭配地面障碍物分割算法、细线/污浊物识别算法等多种深度感知算法,使扫地机器人能够更加精准识别目标物,实现更加高效清洁。​

而光鉴科技的另一款深度相机Nebula 400则是针对商用机器人场景。由于商用机器人具备多样复杂的工作场景,所以需要精准的空间信息,为其提供关键数据支撑。而Nebula 400通过3D 结构光和ToF技术相结合,为机器人提供近距离超高精度和远距离高精度的深度信息感知能力,满足其在复杂环境中对导航与避障的需求,提供更加精准、适配的 3D 视觉感知方案。

为了适配商用机器人多样的工作环境,Nebula 400拥有98°(H)×75°(V)的超广视场角,能够为其提供范围更广、畸变更小的视野范围,有效提高机器人在复杂场景中的工作效率与安全性,搭配光鉴科技自主研发的彩色深度融合、3D SLAM以及目标识别等多重算法,使其具备更出色的避障和SLAM能力。

Nebula 400 深度相机,图源:光鉴科技

从这两款深度相机的介绍可以看出,光鉴科技并非单纯的硬件方案供应商,在硬件、软件和软硬件融合方面都颇具造诣。朱力表示,“光鉴科技非常注重感知计算部分,帮助客户更充分地利用已有算力,并降低系统复杂度。我们在软核结构光深度算法方面积累深厚,并在此基础上开发了包含感知、融合、路线规划在内的完备工具箱,不断拓展服务边界。无论客户需要标准的硬件和算法,还是系统化的方案,光鉴科技都有能力满足。”​

像搭乐高一样构建 3D 感知系统

当前,模块化设计已成为机器人系统设计的主流方式,显著提升了系统开发的效率和灵活性。朱力将其形象地描述为像 “搭乐高积木” 一样构建系统。为此,光鉴科技开展了以下几方面工作。

首先,打磨软硬件所涉及的技术环节,使其达到成熟且高效的状态,推进 3D 感知模块的标准化,通过技术创新解决机器人与物理世界交互的基础问题。光鉴科技将类似于汽车 3D 点云识别的能力引入机器人行业,开发了一套软硬件高效融合的系统,目前已在行业顶级会议上发表,后续将逐步向全行业开放。

其次,开展产业协同,通过感知和计算的深度融合实现极致效率的系统。目前,光鉴科技正与一些计算芯片企业合作,将公司算法塑造为 IP,通过芯片固化实现相关功能,以获得比通用计算芯片更高的效率。如前文所述,光鉴科技在软核结构光深度算法、污渍检测、3D 识别等方面已储备了丰富的算法,正致力于推动这些算法在客户项目中快速落地。

然后,加强数据保护。传统成像摄像头获取的信息与人眼所见相同,隐私泄露风险较高。光鉴科技的3D深度相机产品均为非影像视觉,所产生的信息专为机器人服务,天然具备隐私保护优势。同时,该公司还致力于在系统前端加入数据加密和签名等保护功能,进一步提升数据安全性。

最后,注重前沿创新。机器人行业发展日新月异,无论是核心技术还是产品形态都在不断变化。以机器人不可或缺的 AI 技术为例,朱力表示,目前像深度学习这样的小模型,已在光鉴科技产品中全面应用;而AI 大模型将使视觉感知能力更加通用,这项技术虽处于行业早期,但光鉴科技已与相关团队展开全面合作。从产品形态来看,人形机器人未来潜力巨大,目前已有相关产品搭载了光鉴科技的 3D 视觉感知方案。

结语​

在具身智能加速落地的进程中,3D 视觉感知作为智能体与物理世界交互的 “眼睛”,正从技术分野走向融合创新。光鉴科技以结构光与 ToF 技术的深度融合为突破口,打破传统 3D 视觉方案的场景局限,通过 Nebula 系列深度相机实现避障、导航和感知的全覆盖,更以软硬件协同设计降低系统复杂度,推动机器人从 “功能单一” 迈向 “智能通用”。

推荐阅读:

加拿大国防部确认派出军舰和巡逻机追踪俄舰队

美元走弱和中国需求预期推动铜价触及2年高点

国家能源局:10月底我国可再生能源发电总装机突破14亿千瓦 占比接近50%