在双臂机器人中,VLA(视觉引导定位)算法的相机安装方式(“眼在手上”——分别安装在两机械臂末端,或“眼在手外”——固定在机器人头部/躯干)没有绝对的“更好”,而是取决于具体任务场景、精度需求和操作复杂度。两种方案的核心差异体现在视野范围、定位精度、抗遮挡能力和算法复杂度上,以下是详细对比及适用场景分析:
一、两种安装方式的核心特点与优劣
1. 相机分别安装在两个机械臂上(眼在手上,Eye-in-Hand)
硬件配置:每个机械臂末端(如夹爪附近)安装一个3D相机(如深度相机或立体相机),随机械臂运动而移动。
核心优势:
- 近距离高精度定位:相机贴近目标(如箱子),可获取高分辨率的局部特征(如箱子边缘、把手细节),VLA算法能更精准地计算抓取点的位姿(位置误差可控制在±1mm内),尤其适合双臂协同抓取时的“对称点对准”(如箱子两侧需同时夹紧)。
- 动态跟踪能力:相机随机械臂移动,可实时跟踪目标在抓取过程中的微小位移(如箱子因重力轻微倾斜),VLA算法能动态更新位姿,避免机械臂按“预设轨迹”执行导致的偏差。
- 双臂独立感知:每个机械臂可单独感知自身抓取区域的环境(如左侧机械臂抓箱子左侧,右侧抓右侧),减少双臂视野重叠导致的干扰,适合大尺寸箱子的协同抓取。
主要劣势:
- 视野局限与遮挡:相机随机械臂运动,视野范围小且易被机械臂自身或周围物体遮挡(如左侧机械臂可能挡住右侧相机的视线),需VLA算法配合“避障式视野规划”(如机械臂先小幅移动调整相机角度),增加了算法复杂度。
- 手眼标定复杂:需精确标定“相机坐标系”与“机械臂末端坐标系”的转换关系(手眼标定),且机械臂运动时的振动可能导致标定参数漂移,需定期重新校准,否则会引入定位误差。
- 全局感知缺失:无法直接获取全局环境信息(如周围是否有其他箱子、底盘与目标的距离),需依赖其他传感器(如头部辅助相机)补充,否则可能因“局部视角”导致全局规划失误。
2. 相机安装在机器人头部(眼在手外,Eye-to-Hand)
硬件配置:1-2个3D相机固定在机器人头部(或躯干高处),位置不随机械臂运动,视野覆盖双臂工作空间及周围环境。
核心优势:
- 全局视野与环境感知:可一次性识别多个目标(如堆叠的箱子、周围障碍物),VLA算法能快速完成“目标筛选→抓取顺序规划→双臂工作空间分配”,适合多任务场景(如从一堆箱子中按顺序搬运)。
- 标定简单且稳定:相机位置固定,只需一次“相机坐标系”与“机器人基坐标系”的标定(手外标定),参数长期稳定,无需频繁校准,降低维护成本。
- 抗遮挡能力强:安装在高处(如头部)时,视野不易被机械臂自身遮挡(尤其双臂同时运动时),VLA算法可稳定获取目标位姿,减少因视野丢失导致的重试。
主要劣势:
- 远距离定位精度下降:相机与目标(如箱子)存在一定距离(通常0.5-2m),图像分辨率随距离衰减,VLA算法对微小位姿变化(如箱子倾斜2°)的识别精度降低(位置误差可能达±5mm),难以满足双臂协同的“毫米级对准”需求。
- 动态响应滞后:机械臂抓取过程中,目标(如箱子被抬起时)的位姿变化无法被固定相机实时捕捉(存在视角盲区),VLA算法更新频率滞后于机械臂运动,可能导致“抓取后偏移”。
二、“哪种更好”:取决于任务核心需求
1. 优先选“双臂末端相机(眼在手上)”的场景
- 高精度协同抓取:如搬运大尺寸(>1m)或异形箱子,需双臂在箱子两侧对称抓取(误差需<3mm),近距离相机可提供足够细节。
- 动态/柔性操作:如箱子堆叠不规整(倾斜、部分遮挡),或抓取后需双臂协同调整姿态(如将箱子从水平转为竖直),需实时跟踪目标位姿。
- 小范围操作:工作空间固定(如流水线固定位置取放箱),无需全局环境感知,重点是“抓得准”。
2. 优先选“头部相机(眼在手外)”的场景
- 全局规划优先:如从仓库货架上随机取箱(需识别多个箱子位置并规划抓取顺序),或需避开周围障碍物(如其他机器人、货架立柱),全局视野更高效。
- 低维护成本需求:如工业场景中批量部署机器人,需减少标定、校准等维护工作,固定相机的稳定性更优。
- 中低精度需求:如搬运规则尺寸的纸箱(误差允许±5mm),无需双臂严格对称抓取,头部相机的精度已足够。
3. 主流方案:混合安装(兼顾两者优势)
目前工业级双臂机器人(如ABB YuMi、Fanuc CR-15iA)的主流配置是**“头部全局相机+双臂末端局部相机”的混合方案**,通过VLA算法融合两类数据:
- 头部相机负责“粗定位”:识别箱子的全局位置(如在货架第3层),引导底盘移动到位,规划双臂大致工作区域;
- 双臂末端相机负责“精定位”:接近箱子后,获取局部细节,计算精确抓取点(如箱子两侧把手的中心坐标),确保双臂协同对准;
- 算法层面:通过时间戳同步两类相机数据,用卡尔曼滤波融合位姿信息,既解决全局规划问题,又保证局部操作精度。
三、总结
- 若核心需求是**“双臂协同的高精度抓取”**(如大尺寸/异形箱),选“双臂末端相机”,接受其标定复杂和视野局限的代价;
- 若核心需求是**“全局环境适应与低维护”**(如多箱随机抓取),选“头部相机”,容忍一定的定位误差;
- 若追求**“全能性”**,混合安装是最优解——这也是当前主流双臂机器人的技术路线,通过VLA算法的多传感器融合,平衡精度、效率与鲁棒性。