物体识别
尝试用创建三维模型方法去做物体识别。通常,事先定义一些基本的几何形状,然后把物体表示为基本几何形状的组合,然后去匹配图像。这时候识别问题变成了一个匹配问题。在三维模型库中去搜索可能的视角投影,跟待识别的图像进行匹配。如果找到较合适的匹配,就认为是识别成功了。
但是这么做并不是很有效。首先,很多物体很难用所谓的基本几何形状去描述它,特别是一些非刚体,比如动物;其次,对于一类物体,它可能会有丰富的类内差异性,即使是同一个物体在不同的姿态下也不一样,不可能每一种姿态都预先创建一个三维模型模板;第三,即使解决了之前的问题,如何才能准确地从图像中提取出 这些几何形状也存在困难。
基于模型的物体识别方法
现在主流的物体识别的基本方法都可以集合为一类:基于模型的物体识别。基于模型的物体识别方法首先需要建立物体模型,然后使用各种匹配算法从真实的图像中识别出与物体模型较相似的物体,它的主要任务就是要从二维或三维图像抽取的特征中,寻找出与模型库中已建好的特征之间的对应关系,以此来预测物体是什么。
这个方法主要涉及到两个难点,一是如何选取合适的图像特征以及如何改进,二是如何恰当的定义物体模型并建立抽取的特征与模型库中特征的对应关系。
物体识别的困难与前景
虽然物体识别已经被广泛研究了很多年,研究出大量的技术和算法,物体识别方法的健壮性、正确性、效率以及范围得到了很大的提升,但是现在依然存在一些困难以及识别障碍。这些困难主要有:
获取数据问题:
在不同的视角对同一物体也会得到不同的图像,物体所处的场景的背景以及物体会被遮挡,背景杂物一直是影响物体识别性能的重要因素,场景中的诸多因素,如光源、表面颜色、摄像机等也会影响到图像的像素灰度,要确定各种因素对像素灰度的作用大小是很困难的,这些使得图像本身在很多时候并不能提供足够的信息来恢复景物。
物体识别行业应用
新零售行业
通过识别商品的包装,判断商品的属性。比如消费者进店后拿了又放到其他位置打乱商品原来的的顺序与管理。可在后台链接语音系统,当商品发生错乱时,基于用户语音提醒,方便商品的管理,减少了商超的分拣员;当商品的货架缺货时,可自动提醒后台增补货源以对货仓进行清查;以及对该类商品的统计分析,每周每月的消费量等。