robo_intro


title: 机器人学导论和坐标系基础 tags: [机器人学, 运动学, 坐标系, 理论基础] created: 2026-04-10 sources: 4


机器人学导论和坐标系基础

一句话摘要:机器人学导论研究机器人机构、运动与控制的基本原理,坐标系变换是描述机器人运动的数学基础,核心是通过齐次变换矩阵在SE(3)空间中表示刚体的旋转和平移。


背景与定义

机器人学是一门交叉学科,融合了力学、机械设计、计算机科学、控制理论和人工智能,研究机器人的设计、建模、感知、规划和控制。机器人学导论作为入门课程,建立了从数学基础到实际应用的完整知识体系。

机器人运动分析的根本问题是如何描述机器人各个连杆以及末端执行器在空间中的位置和姿态。由于机器人是多个连杆通过关节串联/并联而成的开链/闭链机构,每个连杆都需要一个独立的坐标系来描述其位姿,因此坐标系及其变换成为整个机器人学的语言基础。

现代机器人学继承了经典机构学的数学框架,并结合计算几何和线性代数发展出一套简洁高效的描述方法,核心就是利用特殊欧几里得群SE(3)来描述三维空间中的刚体运动。


机构分类:串联 vs 并联

在机器人领域,串联机构(Serial Mechanism)并联机构(Parallel Mechanism)是两种最基础的机械结构形式。它们在结构逻辑、载荷能力和控制难度上有着本质的区别。

1. 串联机构 (Serial Mechanism)

串联机构就像人的手臂,由一系列连杆通过关节依次首尾相连,形成一个开环运动链。

  • 结构特点: 每一个关节都需要承载其后方所有连杆和关节的重量。
  • 优点:
    • 工作空间大: 能够覆盖非常广阔的范围。
    • 灵活性高: 容易避开障碍物,运动学求解相对简单(正运动学容易)。
  • 缺点:
    • 刚度低: 悬臂梁结构导致末端精度受载荷影响大。
    • 累积误差: 每个关节的误差会逐级放大。
    • 有效载荷比小: 电机通常安装在手臂上,自重巨大,能搬动的重物相对较轻。
  • 典型应用: 六轴工业机器人(机械臂)、SCARA 机器人。

2. 并联机构 (Parallel Mechanism)

并联机构由末端平台(动平台)通过至少两条独立的运动链与基座(静平台)相连,形成闭环结构。

  • 结构特点: 动平台的位置由多条支路共同支撑和控制。
  • 优点:
    • 刚度高、精度高: 结构稳定,误差不会像串联机构那样累积,而是会被"平均化"。
    • 速度快、动态响应好: 电机通常固定在基座上,动平台自重极轻,加速度极大。
    • 承载能力强: 载荷由多个支路共同分担。
  • 缺点:
    • 工作空间小: 受到支路物理干涉的限制,活动范围非常有限。
    • 控制复杂: 反向运动学容易,但正运动学(给定关节位置算末端位姿)极其困难。
  • 典型应用: 飞行模拟器(Stewart 平台)、Delta 机器人(蜘蛛手,常用于分拣)、并联机床。

3. 核心差异对比表

特性 串联机构 (Serial) 并联机构 (Parallel)
结构形式 开环运动链 闭环运动链
工作空间 很大(相对于自身体积) 很小(且存在奇异点)
定位精度 较低(误差累积) 很高(误差均化)
承载能力 弱(悬臂受力) 强(多点支撑)
运动速度 较慢(自重重,惯性大) 极快(运动部件质量轻)
运动学计算 正解简单,反解复杂 正解复杂,反解简单

如何选择?

  • 如果你需要大范围作业、翻转角度大或需要在复杂的空间内绕过障碍物,串联机构(机械臂)是首选。
  • 如果你需要极高频率的抓取(如传送带分拣)或微米级的定位精度并联机构(Delta 或 Stewart)优势明显。

核心原理

坐标系的基本概念

在机器人学中,我们通过为每个连杆建立坐标系来描述其空间位置:

  • 点的位置:用3×1位置向量 p = [x, y, z]^T 表示
  • 刚体的姿态:用3×3旋转矩阵 R 表示,其列是刚体坐标系三个轴在世界坐标系中的单位向量
  • 齐次变换:将旋转和平移合并为一个4×4矩阵,方便进行链式计算

常见坐标系类型

坐标系 位置 作用
世界坐标系/基坐标系 {B} 固定在地面/机器人底座 全局参考系,所有其他坐标系都相对于它描述
连杆坐标系 {i} 固定在每个连杆上 描述连杆自身的位姿
工具坐标系/末端坐标系 {T} 固定在末端执行器上 描述工具/夹爪相对于机器人基坐标系的位姿
目标坐标系 {G} 固定在目标物体上 描述机器人需要到达的目标位姿

旋转矩阵

旋转矩阵 R ∈ SO(3)(特殊正交群)满足: - 正交性:R^T R = I (R的逆等于转置) - 行列式:det(R) = 1 - 列表示:第j列是目标坐标系j轴在基坐标系中的投影

R = [
  [r₁₁, r₁₂, r₁₃],
  [r₂₁, r₂₂, r₂₃],
  [r₃₁, r₃₂, r₃₃]
]

齐次变换矩阵(HTM)

将旋转和平移组合成一个4×4矩阵:

T = [
  [R, p],
  [0, 0, 0, 1]
]

其中: - R ∈ ℝ^(3×3):旋转子矩阵,表示姿态 - p ∈ ℝ^(3×1):平移向量,表示原点位置 - 最后一行固定为 [0, 0, 0, 1]

齐次变换矩阵属于 SE(3)(特殊欧几里得群),变换满足封闭性:多个变换依次相乘仍是一个SE(3)元素。

变换复合

如果已知: - ^A_T_B:坐标系B相对于A的变换 - ^B_T_C:坐标系C相对于B的变换

那么坐标系C相对于A的变换为:

^A_T_C = ^A_T_B · ^B_T_C

这就是矩阵链乘法则,是机器人正向运动学的核心。串联机械臂的末端位姿就是各个连杆变换矩阵依次相乘得到:

T₀ₙ = T₀₁ · T₁₂ · T₂₃ · ... · T₍ₙ₋₁₎ₙ


关键特性

坐标变换方向

  • 主动变换:点不动,坐标系动 → 变换右乘
  • 被动变换:坐标系不动,点动 → 变换左乘
  • 机器人学惯例:通常使用被动变换,即"固定世界坐标系,描述物体运动"

SE(3) 性质

  • 封闭性:两个齐次变换相乘仍是齐次变换
  • 结合律:(T₁T₂)T₃ = T₁(T₂T₃)
  • 可逆性:任意齐次变换都有逆变换 T⁻¹ = [ [R^T, -R^T p], [0, 0, 0, 1] ]

欧拉角/角轴/四元数

旋转除了旋转矩阵,还有其他表示方式:

  • 欧拉角:三个旋转角(滚转pitch、俯仰yaw、偏航roll),直观但存在万向锁问题
  • 角轴表示:旋转轴 + 旋转角,适合导数计算
  • 四元数:单位四元数 w + xi + yj + zk,紧凑且无奇异性,常用于SLAM和路径规划

应用场景

应用 说明
正向运动学 给定关节角,通过DH参数和变换矩阵乘积计算末端位姿
逆向运动学 给定目标末端位姿,反求关节角,需要SE(3)分解
运动规划 在笛卡尔空间中规划末端轨迹,每个路径点都是一个SE(3)变换
机器视觉 手眼标定求解机器人基坐标系到相机坐标系的变换
SLAM 估计相机运动就是估计相邻帧之间SE(3)变换
仿真环境 在模拟器中可视化每个连杆坐标系,帮助调试算法

最新进展(2025-2026)

  • 2025:深度学习方法开始直接学习SE(3)空间上的分布,用于姿态估计和抓握生成,比传统分解方法更鲁棒
  • 2024:SE(3)扩散模型在三维物体生成和姿态预测上取得突破,成为机器人抓取领域研究热点
  • 2023:大规模语言模型开始能理解和推导机器人坐标系变换问题,初步具备运动学求解能力

相关概念

  • [[齐次变换矩阵]]:本文核心数学工具,组合旋转和平移
  • [[正向运动学]]:利用坐标系变换乘积计算末端位姿
  • [[Denavit-Hartenberg]]:DH参数法,连杆坐标系的标准建立方法
  • [[特殊欧几里得群]]:SE(3)数学理论基础
  • [[旋转矩阵]]:SO(3),姿态表示
  • [[手眼标定]]:求解机器人基坐标系到相机坐标系变换

参考来源

Comments (0)