基于内容像检索技术-像检索
王逢娟
摘 要: 基于内容的图像检索是一种利用图像的视觉特征(颜色、纹理、形状等)进行图像检索的技术。本文研究利用颜色特征进行图像检索的三个关键问题:颜色的表示、颜色特征的提取和基于颜色的相似性度量。本文利用Visua1 C++6.0实现图像检索系统,系统功能:用户以给定示例图的方式检索本地图像库中的相似图片,用户只需根据提示选择示例图和想要检索的图像库,系统会自动对示例图和图像库进行特征提取,并计算示例图与图像库中每幅图片的相似度,最后按相似度大小排序输出显示给用户。
关键词: 基于内容的图像检索;颜色特征;CBIR
1.引言
随着互联网的发展,我们能够更加便捷、经济的接触到数字媒体(例如视频、医学图像、卫星图像、地震数据、气象数据、扫描文本、音乐数据等)。我们需要解决的问题是如何在浩如烟海的多媒体世界中准确找到自己所需要的信息。多媒体数据库发展的一个重要研究领域就是基于内容的图像检索技术。
图像内容的主要特征是颜色、纹理和形状。颜色是表示一幅图像最简单、有效的特征,由于颜色具有与生俱来的旋转不变性(rotation-invariance)和尺度不变性(scale-invariance),对大小、方向都不敏感,表现出相当强的鲁棒性,所以在基于内容的图像检索中,颜色是使用最广泛的特征之一。
2. 图像检索的一般步骤
(1)特征提取
提取图像数据符合检索要求的、用户感兴趣的特征,特征提取可以是全局性的,如整幅图像,也可以是针对某个目标,如图像中的子区域等。
(2)图像匹配
在特征提取之后,需要适当的判别准则(常用的度量准则是距离度量法),从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。
(3)结果输出
将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。
(4)特征调整
对系统返回的结果可通过浏览来筛选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,生成一个新的查询。
3.颜色特征表示
颜色特征是图像视觉最直观、最重要的感知特征之一。用户只要输入想要查询的颜色特征,在颜色特征库中进行信息的匹配。基于颜色的特征提取方法能较好的表示图像的颜色信息。目前颜色特征的提取方法主要有:颜色直方图、颜色集、颜色矩、颜色聚合向量和颜色相关图等颜色特征的表示方法。我们采用最常用的颜色直方图进行系统设计。
Swain和Ballard于1990年提出了颜色直方图,先将颜色空间划分为若干个固定的子空间,然后对每幅图像统计属于各子空间的像素数目。它所描述的是不同色彩在整幅图像中所占的比例。这种方法具有计算简单、对平移和旋转不敏感等优点,但因为不包含色彩的空间位置信息,无法描述图像中的对象或物体。
4.图像的相似性度量
为了实现图像检索的目的,我们对提取到的特征都要进行相似度计算,最后根据计算的结果选择输出检索的结果图像。相似度是以数值的形式来表示两个对象之间的相似程度的度量结果。
4.1相似度计算公式
4.1.1距离相似测度
我们的理论研究采用的是几何模型,将图像的特征看作是坐标空间中的点,特征点之间的距离表示两个点的接近程度。我们用数学表达形式表示以下几种距离:
假设有两幅n维特征矢量的图像X和图像Y分别表示为:
X(x1,,x2,…,xi,,…,xn);
Y(yl,y2,…,yi,,…,yn)
1) 欧氏(Euelidean)距离公式
欧氏距离公式是一个常见的衡量两个对象相似的公式,图像X和图像Y之间的距离定义为:
当Sim(X,Y)越大时,两幅图像在这一特征上的差异就越大,当Sim(X,Y) 越小时,两幅图像在这一特征上就越相似,这个公式符合人们对于图像差异的视觉感受。
2) 绝对值距离公式
运用这个公式得到的结果相对于欧氏距离公式其相似的精确度略差,有可能缩小差异大的图像的相似度计算结果,使检索得到的图像的数量扩大。但绝对值距离公式运算简单,运算结果误差小,当特征量较少时,其效果还是能达到要求的。
3) 加权距离公式
加权距离公式是对上述绝对值距离公式的改进,其根据实际中得到的特征量在整体特征中所占的比重来加上一个相应的权值,表达式如下:
其中就是相对应第i个特征分量的权值,对于不同类型的图像及不同的特征分量,其权值是不同的。加权距离公式能够充分体现检索中两幅图像之间在某一特征上的相似性,在不同的检索要求中可以通过调整不同的权值来检索以达到更好的效果。
4.1.2 相关相似测度
相关相似测度主要体现了两个对象之间的相关性,可以根据相关计算结果来判断两个对象是否相似。本文采用直方图交叉计算公式作为相关相似测度。
直方图交叉计算公式是一个以求取两幅图像相同点程度的公式,其以数学中的交集计算为基础,数学表达式如下:
如果两幅图像特征分布相同,则其计算的结果为O;当两幅图像完全不同时,结果为1;其它情况结果落在0到1之间。这个公式可以明显地区分出不相似的图像。
5.系统的设计与实现
我们开发了基于颜色特征的圖像检索系统,考虑到可扩展性和使用便捷性,采用Visual C++6.0程序设计语言,在Windows 7下完成。该系统涉及到颜色模型、特征提取算法,距离度量函数等方面的设计,支持用户以给定示例图的方式检索本地图像库中的相似图片,用户只需根据提示选择示例图和想要检索的图像库,系统会自动对示例图和图像库进行特征提取,并计算示例图与图像库中每幅图片的相似度,最后按相似度大小排序输出显示给用户。
系统主要包括查询接口,图像处理,特征提取,特征匹配,结果显示五大模块。
基于颜色特征的图像检索系统具有以下特点:
(1)灵活:用户选择的事例图像既可以本地主机上的任何一幅图片也可是本地任意一个图像库检索与事例图片相似的图片。
(2)方便:提供图形化用户界面,方便用户操作。
6.小结
本文对基于内容的图像检索技术作了较全面的介绍和研究,重点研究了基于颜色特征的图像检索方法。如何有效地综合颜色、纹理、形状、空间位置关系以及语义特征来对图像进行查询势必会成为一个热门研究方向。因此,从基于图像内容的查询及其用于Web环境的深度而言,今后在这些方面还可以进行一些更深入的研究。
参考文献
[1]曹奎.基于颜色的图像检索技术研究.华中科技大学博士论文.2002.
[2]庄越报. 智能多媒体信息分析与检索的研究[D]浙江大学博士论文 .1998.
[3]李鹏杰,杨树元.一种基于内容的图像检索系统ImageHunter[J]微机计算机 应用 .2001, (5):139-141.
[4]王绍棣.基于内容特征的图像和视频检索系统[J]计算机工程与应用. 2001, (7):113-117.
[5]徐杰,施鹏飞.基于内容的图像检索技术[A].中国图像图形学报.2003.9.978页.
[6]向世明.Visual C++数字图像与图形处理[M]北京:电子工业出版社,2002.
[7]Marshall Brain, Lance Lovette. Developing Professional Applications in Windows 95 and NT Using MFC [M]北京:机械工业出版社,1999.
[8]徐曼,等.基于内容的图像检索技术[J]计算机应用,2001(9).
[9]胡学龙主编.C---程序设计一从面向过程到面向对象.北京:机械工业出版社,2001.7.
[10]李兰友等.visualc++.NET图形图像编程.北京:电子工业出版社.