一种分块自适应文字图像边缘检测新方法

2018年11月26日 14:14来源于:科技创新与应用

宋建民+++张玉平+++陈敏江

摘 要:传统Canny算法通过比较图像梯度值与人为给定阈值,进行图像边缘提取,无法自适应确定阈值。一些基于改进的最大类间差算法(Otsu算法),通过计算梯度直方图和类间方差极大值的,自动寻找出Canny算法需要的分割阈值实现对传统Canny算法的改进,对于文字图像边缘提取效果并不好。本文利用梯度直方图峰值搜索的方法设定Canny算法的上阈值,通过对图像分块计算,自适应处理亮度不均的文字图像。

关键词:边缘提取;自适应阈值分割;Canny算子;峰值搜索

引言

当前,数码相机,智能手机等设备普及式的应用方便了随时随地的采集图像,基于图像的即时处理技术得到了广泛的应用,如车牌识别,指纹识别,光学字符识别(OCR),图书扫描等。边缘检测是图像分割、机器视觉的基础,从图像中提取目标物体,准确高效的边缘提取算法对非常重要。

传统的边缘检测算子,Sobel,Prewitt,Robbert等[1-2]在实用中检测图像边缘时效果并不理想,Canny算子具有较好的检测性能,在图像处理领域有广泛的应用。然而,传统的Canny算法阈值是人为固定的,这就限制了它的性能。在实际使用中,图像的采集受光线,传感器性能等因素影响,含有较多的噪声,一张图片出现亮度不均的情形,这时难以确定一个的固定阈值。针对Canny算法阈值固定的问题, 雒涛、唐路路等[3]提出用Otsu算法自适应计算Canny算法的阈值[4-5]。

在OCR应用中,文字分割提取是重要的一环。对于很规则的文本图像,有成熟文字分割提取方法,对于亮度不均的文字图像,Derek B等创造了很好的自适应阈值的方法,用于提取扫描图书中的文字。对于文字大小不规则,亮度不均的图案,需要用更有效的方法提取字符。

本文针对复杂的文字图像,利用边缘检测,并结合自适应阈值处理的方法提取文字边缘。

1 Canny算法简介

Canny边缘检测算法的步骤为:

1.1用高斯函数对图像进行低通滤波,平滑,I(x,y)=G(x,y)*f(x,y),其中f(x,y)是原始图像,G(x,y)是二维高斯函数:

1.2 计算平滑图像个点的梯度:

利用偏导数计算梯度幅值及角度:

1.3 对梯度幅度进行非极大值抑制,保留极大值点作为候选边缘点。具体方法是比较当前点与沿梯度方向两侧两个相邻点的梯度幅度,若不是最大,则作为非极大值抑制掉。

1.4 边缘判别与边缘连接。设置高低两个全局阈值,对于梯度值大于高阈值的作为边缘点保留,梯度值小于低阈值的作为非边缘点删除。对于梯度值介于高低阈值之间的点,判断其八邻域中有没有超过高阈值的边缘点,有则判定为边缘点,否则判定为非边缘点。

2 类Otsu改进算法简介

Otsu方法是利用类间方差最大化的方法确定图像分割的阈值[6]。它的思想是统计背景图像和目标物体的灰度值,通过判定背景与目标这两个类间方差最大值得到分类阈值。

图像总像素数,灰度级为[0,L-1],灰度级i出现的概率为,pi=ni/N,设分割阈值为T,划分背景与目标两个类,分别对应灰度区间[0,T]及[T+1,L-1],在灰度直方图中显示为两个峰,其均值为?滋0,?滋1,出

现概率为 , ,图像总的灰度均值为

?滋T,类间方差为,

计算方差?滓■■的最大值,求得分类阈值。

文献[4],[5]提出的改进方法,将灰度值替换成图像的灰度梯度值,得到梯度值的统计分布,类似Otsu方法,通过计算灰度梯度值的类间方差最大值得到。

3 梯度图分块提取阈值

对于文字图像的边缘提取来说,整个图像的边缘像素点的比例很小,往往小于5%。这时利用梯度值集中在0附近,利用Otsu类间方差计算分割阈值都接近于0,分割效果不好。图1是本文所用图例,图2是其梯度直方图。

图1 待处理的文字图像

本文对梯度图像的直方图进行峰值搜索。经过平滑的梯度直方图,第一峰值点(梯度值P1)对应于背景梯度值,在0附近。其它值点对应于文字边缘梯度。如图3所示,局部峰值对应于文字边缘。

本文通过峰值搜索,找到第二峰值点(梯度值P2)。利用P1,P2计算Canny边缘提取的上阈值(TH),我们取TH=0.7*P2+0.3*P1。

对于图像亮度分布不均匀的情形,一个全局阈值并不能反应图像局部的统计特征,基于开运算闭运算进行对比增强效果并不理想。对图像的同态滤波计算量过大,不利于实时处理。因此,我们利用对图像分块处理的方法,利用上述方法分块计算图像的分割阈值。对本例图像,等比例分成3×3共9块,分别对每块进行梯度直方图峰值搜索,自适应计算Canny边缘的上阈值,处理结果见图4。

4 结束语

我们对比了上述几个方法的对图例1的处理结果。图5是直接利用Canny边缘提取方法得到的图像,图6是利用梯度峰值搜索,对梯度图像进行全局计算得到Canny方法的上阈值,提取得到的边缘图像。

比较上述各方法,尽管梯度图分块提取阈值得到的图像边缘不如直接进行Canny边缘提取得到的文字图像清晰,但利用Canny算法直接进行边缘提取包含光照不均产生的噪音,若对整个梯度图像计算Canny阈值容易丢失文字图像信息。利用梯度直方图峰值搜索的方法设定Canny算法的上阈值,通过对图像分块计算,可自适应应处理亮度不均的文字图像。后续研究将改进梯度图分块提取阈值算法以提高其清晰度,使之成为最为实用的方法之一。

参考文献

[1]冈萨雷斯.数字图像处理:二版[M].北京:电子工业出版社,2007:463-492.

[2]John Canny. A Computional Approach to Edge Detection [J]. IEEE Trans. Pattern Analysis and Machine Intelligence(S0162-8828),1986,8(6):679-698.

[3]OTUSU N. A threshold selection method from gray-level histogram[J].IEEE Transactions on Systems,Man and Cybernetics,1979,9(1):62-66.

[4]雒涛,郑喜凤,丁铁夫.改进的自适应阈值Canny边缘检测[J].光电工程,2009,36(11):106-111,117.

[5]唐路路,张启灿,胡松.一种自适应阈值的Canny边缘检测算法 [J].光电工程,2011,38(5):127-132.

[6]冈萨雷斯.数字图像处理:matlab版[M].北京:电子工业出版社,2005:305-307.

[7]Derek B,Gerhard R. Adaptive Thresholding using the Integral Image[J].Journal of Graphics,GPU,and Game Tools,2007,12(2):13-21.

作者简介: 宋建民(1976-),男,河北曲周人,讲师,硕士,主要研究方向为算法设计与分析、图像处理。

 
免责声明:

     本文仅代表作者/企业观点,与【名品家电网】无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,仅供读者参考,并自行核实相关内容。

     【名品家电网】刊载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

      如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行;新闻纠错: lwl#youngchina.cn

关键词: 阈值 梯度 图像