外观
术语和概念
约 1023 字大约 3 分钟
2025-12-11
术语和概念
| 场景分类 | 名词 | 含义 |
|---|---|---|
| 项目 & 作业 | 项目 | 一个项目包含多个作业,可以自由切换不同的作业。 |
| 作业 | 一个作业中包含当前作业运行所需的各项配置,包括相机、机器人、工件、视觉参数、ROI 等,一个作业仅对应一个场景(拆垛、有序上下料、无序抓取、定位装配),且不可修改。 | |
| 工件属性 | 网格文件 | 是指用于存储三维模型数据的文件格式,主要包括OBJ、STL和PLY等格式。 |
| 点云 | 点云是一组在三维空间中具有坐标信息的点的集合,每个点都包含至少三个坐标信息(X, Y, Z),用于精确描述物体表面的几何形态。 | |
| 手眼标定 | 手眼标定 | 确定机器人坐标系(“手”)与相机坐标系(“眼”)之间的相对位姿(位置+姿态),使视觉系统能精准引导机器人完成抓取作业。 |
| 内参 | 描述相机内部属性的参数,描述相机本身的光学特性,与相机在世界坐标系中的位置无关。这些参数在相机的使用过程中保持不变。 | |
| 外参 | 是相机在世界坐标系中的位姿参数(旋转矩阵+平移向量),描述其空间位置和朝向。 | |
| 欧拉角 | 是描述三维空间中物体姿态的一种方式,以 3 个角参量(俯仰角、偏航角和翻滚角)来表示物体在三维空间中的转动。 | |
| TCP | TCP(Tool Center Point),工具中心点,指的是位于末端工具尖端的点。为了完成如工件抓取等任务,当让机器人移动至空间的某一点时,其本质是让工具中心点移动至该点。 | |
| 视觉模型 | 视觉模型 | 深度学习模型,可对输入的图像进行推理,得到物体的掩膜、边界框、关键点、分数等推理结果。 |
| 关键点 | 三维模型中具有明确语义或几何意义的特征点 ,用于描述目标的局部结构或全局姿态,在基于关键点的姿态估计中,通过检测这些点的位置来推断目标的整体姿态(位置 + 姿态)。 | |
| 位姿 | 表示物体在空间中的 位置 (Position)和 姿态 (Orientation)的集合。 | |
| 掩膜 | 用选定的图像、图形或物体,对处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程。用于覆盖的特定图像或物体称为掩膜。 | |
| 边界框 | 是计算机视觉与机器学习中用于定位目标对象的 矩形框 ,通过坐标标注目标的位置、大小和范围。 | |
| 视觉流程 | 粗匹配 | 粗匹配是将模版点云的关键点与模型对实际点云预测的关键点进行匹配的过程。 |
| 精匹配 | 精匹配是将模板点云与实际点云进行匹配使实际点云中的工件姿态与模板点云的工件姿态尽量重合,进而优化实际点云中的工件姿态的过程。 | |
| ROI | 在机器视觉、图像处理中,从被处理的图像中框选出来需要处理的区域,称为感兴趣区域,在 PickWiz 中,需要分别设置 ROI 3D 和 ROI 2D。 |
