机器视觉

计算机根据输入的二维图像来分析、理解原来三维物景的过程和技术,又称计算机视觉,是人工智能的一个重要分支。计算机视觉的实现过程是:首先将输入的图像变换为便于进一步处理的图像,称图像预处理,接着抽取图像的特征,建立图像基元,并判定图像所属的类(见模式识别);然后是理解阶段,根据事先存储的知识对输入图像本身及其所反映的物景进行描述或解释。在人工智能的早期研究中,景物分析的术语常用来强调三维物景与二维图像处理的区别(见图像分析)。

机器视觉的研究是从 20世纪 60年代中期美国学者L.R.罗伯兹关于理解多面体组成的积木世界研究开始的。当时运用的预处理、边缘检测、轮廓线构成、对象建模、匹配等技术,后来一直在机器视觉中应用。罗伯兹在图像分析过程中,采用了自底向上的方法。用边缘检测技术来确定轮廓线,用区域分析技术将图像划分为由灰度相近的像素组成的区域,这些技术统称为图像分割。其目的在于用轮廓线和区域对所分析的图像进行描述,以便同机内存储的模型进行比较匹配。实践表明,只用自底向上的分析太困难,必须同时采用自顶向下,即把目标分为若干子目标的分析方法,运用启发式知识对对象进行预测。这同言语理解中采用的自底向上和自顶向下相结合的方法是一致的。在图像理解研究中,A.古兹曼提出运用启发式知识,表明用符号过程来解释轮廓画的方法不必求助于诸如最小二乘法匹配之类的数值计算程序。

70年代,机器视觉形成几个重要研究分支:

(1)目标制导的图像处理;

(2)图像处理和分析的并行算法

(3)从二维图像提取三维信息;

(4)序列图像分析和运动参量求值;

(5)视觉知识的表示;

(6)视觉系统的知识库等。

机器视觉的应用主要有检测和机器人视觉两个方面。

(1)检测:又可分为高精度定量检测(例如显微照片的细胞分类、机械零部件的尺寸和位置测量)和不用量器的定性或半定量检测(例如产品的外观检查、装配线上的零部件识别定位、缺陷性检测与装配完全性检测)。

(2)机器人视觉:用于指引机器人在大范围内的操作和行动,如从料斗送出的杂乱工件堆中拣取工件并按一定的方位放在传输带或其他设备上(即料斗拣取问题)。至于小范围内的操作和行动,还需要借助于触觉传感技术。

机器视觉技术比较复杂,最大的困难在于人的视觉机制尚不清楚。人可以用内省法描述对某一问题的解题过程,从而用计算机加以模拟。但尽管每一个正常人都是“视觉专家”,却不可能用内省法来描述自己的视觉过程。因此建立机器视觉系统是十分困难的任务。

参考书目
  1. D.H.Ballard and C.M.Brown, Computer Vision, Prentice-Hall Inc.,Englewood Cliffs, New Jersey,1982.