CVB工具:Manto
主要的应用领域:
1. 手写体识别
2. 人脸识别
3. 文本的分析(仅用于英文和数字)
4. 指纹识别
5. 其他的模式识别项目(如面部表情的识别)
Manto主要应用领域是模式识别,pattern是包含于一个给定图像的子矩形内的。对于分类器来说,这个子矩形必须有相同的大小,而被搜索的场景可以任意大。例如:如果用32*48 RGB来训练分类器,那么所用的pattern也必须用32*48 RGB的图像。
训练通过准备项目的要求的模式识别分类所要求的样本数据开始,将这些数据提供给Manto。例如:用于识别灰度的手写的阿拉伯数字(图像大小28*28)时,就必须准备相同大小的灰度图像,且每个图像都要包含一个手写数字,同时定义正确的分类名称(或分类编号)。这种类型的数据叫做样本图像列表(SIL)。开发包中包含有一个Teach程序和许多的库函数帮助生成样本图像列表集(SIL’s)。
一旦创建了SIL,就要将其传递给Manto使用库函数CreateMCFromImageList来生成分类器(MCF)。因此,SIL中必须要含有新的分类器所要求的信息,并且必须保证这些信息对于项目要求是准确和充分的。例如在手写体识别项目中,如果SIL中不含有任何关于数字“5”的样本,则MCF也就不会识别出“5”;在人脸识别项目中,如果SIL包含人脸的特征而没包含非人脸特征,结果将是MCF将在不合适的地方错误地识别为人脸。这将使得MCF变得毫无意义。如果所要求的分类都有,Manto能够正确运行。一般地说,SIL包含越多的样本,它的识别准确率越高。
生成的MCF可用来从背景图像中查找各类感兴趣的模式。功能函数MCSearch返回最匹配的位置,以及对应的分类名。如果在MCF中仅有一个可接受类,那么MCF中至少要有2个类型,另外一个是被拒绝类型。
另一方面,如果MCF中有很多类型,且要搜索的区域是由单个点组成,MCSearch用来做搜索时,两步逼进法可以提高识别速度和准确率。用此方法可在人的面部识别中取得好的效果。开始先使用人脸/非人脸分类器识别,然后将分析的结果交由可识别12个人的分类器进行分类。