摘要: 人形机器人技术创新的关键在于感知-决策系统。视觉方面,TOF+双目视觉成为主要技术路径之一;触觉方面,仿人力控、电子皮肤是核心创新点;决策方面,基于多模态LLM的RobotGPT将促使机器人实现自然智能。机械系统技术相对成熟,关注降本增效。
核心观点:
1
人形机器人未来综合形态预测
(资料来源:本翼资本整理)
2
感知-决策系统融合创新,驱动人形机器人技术变革
传感器发展趋势:智能化、可移动化、微型化、集成化和多样化。早期的机械式传感器(19世纪末 - 20世纪初)如压力计、温度计,为传感技术奠定基础。20世纪中叶,电子化与半导体时代带来了光敏电阻、压电传感器等,实现更精准感知。随后,微机电系统(MEMS)时代出现微型化传感器,如加速度计。21世纪的纳米技术与智能传感阶段兴起,纳米传感器、智能网络传感器等应运而生,实现高精度、智能化。传感器发展趋势可概括为智能化、可移动化、微型化、集成化和多样化。智能化方向包括传感功能集成、数据处理、双向通信等,以及智能传感器与人工智能结合;可移动化涉及无线传感网技术应用,如智能家居、农业、林业监测等;微型化领域以MEMS传感器为主,提高精度、实现集成化和智慧化等;集成化指多功能一体化传感器的发展;多样化方向突破在新材料技术下出现各种新型传感器。
(资料来源:本翼资本整理)
传感器发展的核心技术瓶颈可总结如下:(1)硬件材料的功能性迭代(金属器械-半导体-纳米材料);(2)软件技术和算法开发的加持。相比于注重现有设备的集成化、微型化以及具有可移动条件的改进式发展,新材料,特别是超导、纳米、生物材料研发的进展更有希望助推传感器技术实现颠覆性突破。以下部分将智能机器人领域所使用的核心传感器分为:视觉传感器、力传感器两大类进行行业现状和技术发展趋势的讨论。
(资料来源:《全球传感器未来发展趋势及4大重要领域》、本翼资本整理)
区别于计算机视觉,机器人视觉的核心任务路径是实现图像-行动的转化:计算机视觉是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量,用计算机技术将图像处理成为更适合人眼观察或传送给仪器检测的图像。过渡到机器视觉层面,其保留了底层技术的关键设计,但也面临新的挑战。对机器人而言,感知只是一个更复杂、具身、主动、目标驱动的系统的一部分。因此,机器人视觉必须考虑到它的输出(比如物体检测、分割、深度估计、3D重建等),机器人视觉获取的信息所指引的决策结果最终需要落实到现实世界的行动上。简而言之,计算机视觉获取图像并将其转化为信息,而机器人视觉则将图像转化为行动。
(资料来源:维基百科、《The Limits and Potentials of Deep Learning
for Robotics》、本翼资本整理)
(资料来源:《The Limits and Potentials of Deep Learning for Robotics》、本翼资本整理)
综合视觉传感方案的几种可能实现路径:基于以上三点趋势预测,综合市面上各厂商3D视觉传感器产品配置的调研,我们认为人形机器人综合视觉传感方案有如下三类配置:①TOF+多摄像头;②结构光+定制化算法设计;③双目视觉+TOF。
(资料来源:《3D深度相机调研》、本翼资本整理)
①TOF+多摄像头
以Microsoft的Kinect v2深度视觉传感器产品为例,其基于飞行时间TOF测量原理,闪光红外光照亮场景,光线被障碍物反射后,每个像素的飞行时间由红外相机记录,内部,波调制和相位检测用于估计到障碍物的距离。配合另一侧的颜色传感器,最终能够形成一个有几何结构和颜色贴图的完整高质量的三维模型集合,从而使视觉信号的传输更加真实准确。
(资料来源:《3D深度相机调研》、本翼资本整理)
②结构光+定制化算法设计
以Pickit公司用于机器人引导的3D视觉系统Pickit M-HD为例,其特点在于采用定制的机器人教学法。在操作方面,M-HD解决方案的机器人教学方法与Pickit的低分辨率产品完全一致。这一简单过程包括三个步骤:(1)告知3D相机要拾取的零件,以及进行拾取的工具,让Pickit将学习这两方面的内容;(2)告知Pickit在哪里可以找到料箱,并教导零件的最佳抓取位置;(3)Pickit告诉机器人下一个最容易拾取的零件在哪里,同时在操作中预测并防止与障碍物和其他零件的碰撞。
③双目视觉+TOF
基于双目立体视觉的深度相机类似人类的双眼,和基于TOF、结构光原理的深度相机不同,它不对外主动投射光源,完全依靠拍摄的两张图片(彩色RGB或者灰度图)来计算深度,故也被称为“被动式”双目深度相机。双目视觉法存在两个明显的技术缺陷:1)对环境光照非常敏感;2)不适用于单调缺乏纹理的场景。通过对比这一方案下的一种专利技术与单一双目视觉技术的流程(下图),双目视觉方法与TOF方案的结合相当于引入了帮助确定立体区域视差的约束条件,从而提高对单调场景的辨识度,并降低环境光照的干扰。
图十:双目视觉+TOF 视觉传感方案解释
(资料来源:《一种结合tof技术和双目视觉的深度信息获取装置及其方法》专利说明书、本翼资本整理)
图十一:依托三条技术路径的人形机器人视觉功能实现预测
(资料来源:EE Times China、本翼资本整理)
图十二:一维、多维力传感器的不同适用场景
图十三:机器人扭矩传感器示意图
(资料来源:宇立官网、本翼资本整理)
图十四:PapilArray传感器的技术要点解释
(资料来源:Contactile官网、本翼资本整理)
图十五:一种具有可变刚度的软性装置构造示意图
(资料来源:Robohub、本翼资本整理)
柔性电子皮肤的技术目标实现:柔性电子皮肤指附着于机器人表面的柔性纳米功能材料,敏感材料、结构设计、多模态感知是电子皮肤技术进步的方向。目前柔性电子皮肤的具体技术路径尚不明晰,原创程度和创新性强,主要由初创公司占据市场。总体来说,其技术目标实现的三阶段是:附着在设备表面充当外衣-发展出灵敏的传感系统-进一步实现自我修复功能。根据GII预测,到2030年全球电子皮肤市场价值将达到268亿美元,在2023-2030年预测期间的复合年增长率为19.73%。电子皮肤目前的可实现场景主要集中在以医疗保健监测为主题的可穿戴技术设备。
图十六:柔性电子皮肤的技术目标实现三阶段
(资料来源:本翼资本整理)
图十七:人形机器人电子皮肤的核心技术瓶颈
(资料来源:本翼资本整理)
图十八:一种能够提高灵敏度、增大量程的自填充微结构电子皮肤设计
(资料来源:《从数字新基建到机器人电子皮肤》(郭士杰,2023)、本翼资本整理)
ChatGPT向RobotGPT过渡的设想路径:ChatGPT为实现机器智能提供了可行方案,用于机器人GPT的框架(或称RobotGPT)的一种可能设计如下:其中,奖励机制模型、人工判断下的反馈和增强型学习技术分布在流程的各个模块,能够实现基础程序下机器人的自主学习。Optimus机器智能的亮点在于采用FSD
computer作为计算核心,包含SoC、存储、Wifi等模块,并通过FSD的规划算法控制机器人移动、操作。目前HW3.0芯片单颗算力约72TOPS,最新HW4.0将进一步提升,尽管较人脑在理论算力上存在差距,但在DOJO训练中心的加持下,其综合计算能力远超人脑。
图十九:RobotGPT框架设想
(资料来源:《RobotGPT: From ChatGPT to Robot Intelligence》、本翼资本整理)
图二十:人形机器人传感、决策系统的框架设想
(资料来源:《RobotGPT: From ChatGPT to Robot Intelligence》、本翼资本整理)
3
机械-支持系统锦上添花,提升人形机器人产品力
减速器、伺服电机、控制器为机器人的三大核心机械零部件:传统工业机器人成本结构中,减速器占比最高,成本约占机器人整体的35%-40%;随着机器人机械结构系统趋向复杂,需求量将进一步增大(一个自由度对应一个减速器)。以执行关节为单位分类,减速器配套的伺服电机约占总成本的20%,然后是自研控制器(占总成本的15%),三大零部件合计占比约70%-75%,为机器人成本控制和效率提升的核心影响因素。
(资料来源:华经产业研究院,本翼资本整理) (资料来源:华经产业研究院,本翼资本整理)
图二十三:伺服系统工作流程图
(资料来源:中国工控网,本翼资本整理)
图二十四:一种高度集成的多轴微型伺服系统的结构变化
(资料来源:中国国际电子生产设备暨微电子工业展,本翼资本整理)
图二十五:稀土永磁材料发展历程
(资料来源:公开资料、本翼资本整理)
减速器需求变化的宏观描述:智能机器人的一个关节点对应一个减速器,随着智能机器人形态的人形化发展,特别是灵巧手工艺的进步,单个机器人所使用的减速器数量增长预测如下:以特斯拉Optimus为例,单个人形机器人可能用到的减速器在旋转、线性关节器部分各有14个,灵巧手部分使用12个行星减速器。进一步来看,体量更小的谐波减速器适用于多关机机器人的小臂、腕部、手臂等部位,RV减速器主要适用于工业机器人机身的腰、上臂、下臂等部位。
图二十六:特斯拉Optimus关节执行器设计方案
(资料来源:Tesla AI Day2022 发布会、本翼资本整理)
谐波减速器需求空间测算:假设(1)工业机器人中各类型出货量比重保持不变;(2)工业、人形机器人每台谐波减速器、RV减速器用量基本保持不变,人形机器人以特斯拉Optimus最新发布数据(14个/台)为参考;(3)2030年人形机器人产业初具规模,全球产量达1000万台,CAGR=63.5%且保持不变,即未实现重大技术突破的保守估计(据高盛预测,若2035年后人形机器人实现重大技术突破,CAGR可达94%),工业机器人总体出货量年复合增长率27%。基于以上核心假设,我们预计2023年全球用于机器人制造的谐波减速器需求量为1698万台,2035年达到30,760万台,2050年达到145,405万台,CAGR近24%,谐波减速器市场增长空间广阔。
图二十七:不同种类机器人每台平均谐波减速器用量
(资料来源:各公司官网、中商情报网、本翼资本整理)
图二十八:不变年复合增长率下的2023-2050年全球机器人谐波减速器需求量预测
(资料来源:高盛、中商情报网、中研网、本翼资本整理)
图二十九:运动控制系统的完整控制流程示意图
(资料来源:雷赛智能招股说明书、本翼资本整理)
(资料来源:公开资料、本翼资本整理)
关注机器人结构、充电形式的颠覆性改变:以脊椎动物依靠脂肪组织获得能量、支撑、保护的特性为灵感,一种新型的可充电锌电池已然问世,该电池可以集成在机器人结构中,在充当外壳的同时就像生物脂肪一样储存能量,为机器人提供电力。
图三十一:一种基于电化学和机械技术的毫米级厚度的柔性“电池”皮肤解决方案
(资料来源:《Biomorphic structural batteries for robotics》、本翼资本整理)
图三十二:NVIDIA开发的支持下一代自主移动机器人车队的Isaac AMR新平台概念图
(资料来源:Robohub、本翼资本整理)
安全控制系统提供了机器人集群整体运作的保障:随着机器人及其集群商用化趋势日益凸显,其在协作行为中的秩序、安全性、稳定性成为研究机构的关注点。日前,UBL研究员提出了一个“以比特币等加密货币中的区块链技术确保机器人群协调能力”的新项目,其宗旨在于运用区块链技术使机器人集群能够在无需人工干预的情况下消灭有害(出现系统紊乱的)机器人,从而实现自主且安全的机器人集群部署。其技术思路在于迁移运用于加密货币领域的“智能合约”(Smart Contract)代码体系,阻隔外部操纵或阻止这些代码的可能性,机器人指令会自动执行,而无需信任第三方。
4
人形机器人产业链投资机会梳理
根据人形机器人生态全产业链的软硬件技术发展情况,分机械零部件、AI集成产品、传感器、仿生结构、支持系统、终端产品七部分整理了主要的市场参与者。再考虑产业链不同环节的企业的性质,构建一个标签体系定义其在产业生态中的中观定位,其中,①前沿初创公司;②行业领导者;③价值链整合者三个标签内的市场参与者对行业生态具有重大影响力。
图三十三:人形机器人产业链投资地图
(资料来源:本翼资本整理)
图三十四:人形机器人生态框架下判断标的中观定位的标签体系
(资料来源:本翼资本整理)
(资料来源:本翼资本整理)
荐