2002年1月
第23卷 第1期
通 信 学 报
JOURNAL OF CHINA INSTTTUTE OF COMMUNICATIONS
Vol.23 No.1 January 2002
一种基于脉冲耦合神经网络和图像熵的自动图像分割方法
马义德1,2
摘 要:90年代发展形成的脉冲耦合神经网络(PCNN)模型特别适合于图像分割、边缘提取等方面的应用研究,但众所周知,PCNN模型图像分割效果不但取决于PCNN模型中各个参数的合理选择,而且同时还取决于循环迭代次数的确定选择准则,通常循环迭代次数N的选择通过人工交互方式来确定。正因如此选择合适的准则来确定N是PCNN图像分割的关键,但目前还没有文献提出一个合适的准则来解决这个问题。本文结合图像统计特性和PCNN参数模型提出了熵值最大准则。该准则实现了PCNN神经网络的自动图像分割。对于PCNN的理论研究和实际应用具有非常重要的现实意义。
关键词:脉冲耦合神经网络;图像分割;熵;统计特性
中图分类号:O 236 文献标识码:A 文章编号:1000-436X(2002)01-0046-06
戴若兰1 李 廉2
(1. 兰州大学 干旱生态国家重点实验室,甘肃 兰州 730000;2.兰州大学 信息科学与工程学院,甘肃 兰州 730000)
Automated image segmentation using pulse
coupled
neural networks and image’s entropy
MA Yi-de1,2, DAI Ruo-lan1 , LI Lian2
(1. The State Key Laboratory of Arid Agroecology, Lanzhou University, Lanzhou 730000, China; 2. School of Information Science & Engineering, Lanzhou University, Lanzhou 730000, China)
Abstract: Pulse-coupled neural network(PCNN) based on Eckhorn’s model of the cat visual cortex find many applications in image processing, including segmentation, edge extraction et al. As all known, the performance of the image segmentation depends not only directly on the adjustment of PCNN parameters and the statistical properties of image but also on the cyclic iteration times N of PCNN. If the parameters have been properly set, it turns out to be essential to select a suitable criterion to determine N. While N is usually determined by means of visual judgement which decreases the efficient
收稿日期: 2001-03-02;修订日期: 2001-10-11
基金项目: 国家自然科学基金资助项目(39770375);甘肃省自然科学基金资助项目(ZS001-A25-008-Z) 作者简介: 马义德(1963–),男,甘肃临夏人,兰州大学副教授,博士,主要研究方向为生物信息数字图像处理技术、DSP与信号实时编码技术;戴若兰(1951–),女,湖南湘潭人,兰州大学高级工程师,主要研究方向为生物医学数字图像处理技术、GIS、GPS等;李廉(1948–),男,山东阳谷人,兰州大学教授,博士生导师,主要研究方向为计算数学、数字图像处理技术等。
第1期 马义德等:一种基于脉冲耦合神经网络和图像熵的自动图像分割方法 ・47・
of PCNN image segmentation. This article raises a new method to implement the image segmentation automatically based on the PCNN model and the entropy of image. It is the criterion of maximal entropy of segmented binary image of PCNN output. According to this criterion, the iteration times, N, is determined automatically.
Key words: pulse-coupled neural network; image segmentation; entropy; statistics
1 引言
人工神经网络本身具有的分类属性是实现图像边缘检测、区域分割的基础,目前基于传统神经网络的图像分割算法[1~6]研究较多,而由Echorn神经元模型[7, 8]修改得到的脉冲耦合神经网络PCNN应用研究是20世纪90年代才开展的工作,Echorn的神经元模型是直接观察猫的视觉皮层神经细胞,并模拟其视觉神经细胞活动而得到的人工神经元模型。正因为PCNN
~
模型[711]算法直接源自于哺乳动物的视觉特性研究,其非常适合于图像分割、图像平滑及降噪等应用。PCNN为单层神经网络模型,这点有别于传统多层网络,因此非常适合实时图像处理环境。目前理论很难解释PCNN数学模型参数与图像分割效果之间的关系,其理论探讨
~
及应用研究正在进行[711],如Alexei N.Skourikhine[9]将PCNN算法应用于复杂纹理的图像分割,并比较了加入抑制项前后两种分割效果,同时指出寻找合适的分割判断准则对PCNN分割处理至关重要;Thomas Lindblad[10]比较了小波变换和PCNN各自的特点。PCNN与以往经典神经网络模型相比,不需要训练过程即可实现图像分割,但PCNN需要恰当设置其数学模型中各种门限参数、衰减时间常数、加权因子、连接系数等,才能实现最佳分割。一般获得较好分割效果需实验多次选择这些参数,特别是其循环迭代运算次数的确定是一个难题。而在参数选定情况下,循环迭代次数直接关系到分割结果的好坏。为此本文提出基于图像熵值的一种PCNN图像分割算法,该算法用熵值最大准则确定循环迭代次数,进而实现基于区域的最佳自动图像分割。
2 算法原理描述
如图1为PCNN的一个神经元数学模型,图中F就是第i、j个神经元的n次反馈输入Fij[n],Sij为输入刺激信号(这里为图像像素构成的矩阵中第i、j个像素的灰度值),β为连接系数,Lij[n]是连接项,Eij[n]为动态门限,Yij[n]是PCNN脉冲输出值,Uij[n]为内部活动项。它们满足如下的数学关系式
Fij[n]=exp(– αF)Fij[n–1]+VF∑mijkl Ykl [n–1]+Sij Lij[n]=exp(– αL)Lij[n–1]+VL∑wijkl Ykl[n–1] Uij[n]=Fij[n](1+βLij[n]) Yij[n]=1,if Uij[n]>Eij[n] Yij[n]=0,otherwise Eij[n]=exp(– αE)Eij[n–1]+VE∑Ykl [n–1]
其中,内部连接矩阵M、W(一般W=M)的Mijkl、Wijkl分别为Fij [n]、Lij[n]中Ykl[n]的加权系数,αF、αL、αE分别为Fij [n]、Lij [n]、Eij [n]的衰减时间常数,VF、VL、VE分别为Fij [n]、Lij [n]、Eij [n]中的固有电势。
正如图1所示,PCNN神经元接受反馈输入Fij [n]和连接输入Lij [n],然后在其内部神经元活动系统形成内部活动项Uij [n]。当Uij [n]大于动态门限Eij [n]时,PCNN产生输出时序脉
・48・ 通 信 学 报 2002年
冲序列Ykl [n]。
·Yij
WI偏置E·F输入
连接
EU脉冲产生
Y
·
图1 脉冲耦合神经网络神经元模型
若在PCNN的一个神经元Ni中输入一个恒定反馈F=Si(归一化像素灰度值)且无连接输入L(或者β为零),则可以证明PCNN产生恒定周期[11]的脉冲序列Y[n]。若此时还有其W领域内其他神经元Nj与Ni互联,且Nj输入为Sj,则Ni的输出Yi连接到Nj,同样Nj输出影响Ni的激发。如果在t=0时Nj、Ni被复位,也即除了输入Si、Sj外,门限E、连接输入L等都为零,则第一次两个神经元都被激活。于是PCNN都有脉动输出Yi、Yj,然后内部活动项U和动态门限E分别增加。当Ui、Uj分别大于动态门限E时,第二次又有脉动输出,反之则没激活,此时输出为零。
二维图像矩阵M×N可以理解为M×N个PCNN神经元模型,其每一个像素的灰度值对应为每个神经元的输入Sij。当内部连接矩阵M、W所在邻域内有灰度值相近的像素存在时,则其中某一个像素激发产生的脉动输出将会引起附近其他类似灰度像素对应神经元的激发,产生脉动序列输出Y[n]。显然序列Y[n]包含有图像区域信息、边缘、纹理特征等信息。这样输出序列Y[n]构成的二值图像就是PCNN输出分割图像。这就是PCNN进行图像分割的简单原理。
众所周知,熵是图像统计特性的一种表现形式,反映了图像包含信息量的大小。本文通过一系列实验提出了一种基于熵值的图像区域自动分割算法。因为对于绝大多数图像来说,不管采用何种分割算法,一般分割后图像熵值越大,说明分割后从原图得到信息量越大,分割图像细节越丰富,因而总体分割效果也应越好。这一点进一步得到了我们实验的验证。将此特性应用于PCNN图像分割中,得到了本文提出的一种基于熵值的区域分割自动算法。具体地也就是PCNN在每次循环迭代运算时,计算其分割输出的二值图像Y[n]的信息量也即熵值H1(P) H1(P)= –P1*log2P1–P0*log2P0
其中P1、P0分别表示Y[n]为1、为0的概率。求出取得该熵最大H1max(P)时迭代次数Nmax。于是循环迭代次数为Nmax时PCNN输出的Y[n]构成的二值图像,即为在PCNN其他各项参数一定情况下,总体分割效果最佳的输出图像了。
3 算法模拟实验
这里采用图2(a) 枸杞植物体细胞胚胎发生研究中枸杞体细胞图像和图3(a) lena图像进行分割模拟实验。
(1)实验设计
为了求得最大熵值时的N值,在PCNN模型参数中预先设定一个较大的迭代次数(如N=1000),先求得最大熵值。然后得到此时的Nmax和对应PCNN输出Y[n],即为本文总体分割
第1期 马义德等:一种基于脉冲耦合神经网络和图像熵的自动图像分割方法 ・49・
效果最佳时的区域分割图像。
(2)实验证明对于植物细胞采用表1的参数分割效果好。表2为求得熵值与循环迭代次数N。这里内部连接矩阵W=M,是一个5×5的方阵。其中每一个元素数值为中心像素到周围每个像素的欧几里德距离的平方的倒数(r-2)。
(3)同样实验证明对于Lena采用表3的参数分割效果好。表4为求得熵值与循环迭代次数N。这里内部连接矩阵W=M,是一个3×3的方阵。其中每一个元素数值为中心像素到周围每个像素的欧几里德距离的倒数(r-1)。
表1
参 数 取值
植物细胞分割时PCNN基本参数
αL 1.0
αE 1.0
αF 0.1
VF 0.5
VL 0.2
VE 20
β 0.1
表2
N H1(P)
植物细胞分割时PCNN循环迭代次数N与分割图像熵值H1 (P )
1 0
2 0
3 0.9486
4 0.9486
5 0.9486
6 0.9478
7 0.9478
9 0.6188
11 0.1537
表3
参 数 取值
Lena分割时PCNN基本参数
αL 1.0
αE 0.2
αF +∞
VF 0.5
VL 0.2
VE 20
β 0.1
表4
N H1(P)
18 0.8673
Lena分割时PCNN循环迭代次数N与分割图像熵值H1(P )
19 0.8670
20 0
23 0.0031
28 0
29 0.0031
30 0.9998
31 0.8699
32 0.7539
4 实验分析
(1)从图2、图3、图4可以看出,图3(a)枸杞细胞图像在n为3、4且熵为最大0.9486时分割效果优于n为9熵为0.6188时分割。图4(a)的Lena图像在n为30且熵为最大0.9998时分割效果优于n为18熵为0.8673时分割。显然分割图像熵值越大,分割图像总体效果越好。当熵值最大时分割效果最好。这进一步验证了本文前述思路的正确性。
10.80.60.40.2010.90.80.70.60.50.40.30.20.10
10
20
30
40
00
5
10
15
20
25
30
35
40
10.90.80.70.60.50.40.30.20.100
10
20
30
40
50
60
70
80
(a) 植物细胞分割(b) 局部植物细胞分割
图2 PCNN循环迭代次数n与分割图像熵值H1(P)关系曲线
(c) Lena分割
・50・ 通 信 学 报 2002年 (a) 原图(b) n=3且熵相同最大0.9486(c) n=9熵为0.6188(d) n=4且熵相同最大0.9486图3 枸杞胚性细胞分割结果 (a) Lena原图(b) n=30熵最大0.9998图4 Lena图像分割结果
(c) n=18熵为0.8673 (2)从图2、图3、图5以及表2、表4可以看出,实验中有时求得两个完全相同最大熵值。这种情况又细分为两种结果:一种是迭代次数出现周期性重复,还有一种是两个完全相同的最大熵值对应的恰好是同一幅二值分割图像或者两个取非的二值分割图像。对于PCNN模型来说这是正确的,因为对于同一个被分割图像来说,分割后一样的熵值对应同样的一种分割结果。
(3)从图2、图3、图4、图5还可以看出,循环迭代次数N的选择直接关系到分割图像熵值的大小。也就是说,N对于特定的图像和PCNN参数来说有一个最佳取值。该值的适当选择使得分割图像总体效果达到最佳;同时还可以从图5看到,N过大已没有必要。因为过大N值反而增加执行时间,或者有时甚至使分割图像熵值更小,分割效果更差。
第1期 马义德等:一种基于脉冲耦合神经网络和图像熵的自动图像分割方法 ・51・
(a) 原图
(b) n=3熵相同且最大为0.9552(c) n=4熵相同且最大为0.9552
(d) n=5熵相同且最大为0.9552
图5 枸杞胚性细胞局部图像分割
5 结论
PCNN参数的选择和图像统计特性直接决定着分割图像的性能。通常循环迭代次数N的选择通过人工交互方式来确定。正因如此选择合适的准则来确定N是PCNN图像分割的关键,但目前还没有文献提出一个合适的准则来解决这个问题。这里结合图像统计特性和PCNN参数模型而提出的熵值最大准则,对于PCNN的理论研究和实际应用具有非常重要的现实意义。因为该准则实现了PCNN神经网络的自动图像分割。
另外,我们的实验进一步表明PCNN基本参数的选定与图像的统计特性、图像的几何分布特性[7]有着直接的关系,但具体理论分析还需进一步探讨。 参考文献:
[1] SZIRANYI T, ZERRUBIA J, et al. Cellular neural network in markov random field image segmentation[A]. Proc CNNA'96[C]. IEEE,
Seville,1996,139-144.
[2] TZANAKOU E M, SHEIKH H, ZHU B. Neural networks and blood cell identification[J]. J of Med. Systems, 1997,(21): 4:201~210 [3] SPREEUWERS L J. Neural network edge detector[A]. Proc SPIE[C]. SPIE: San Jose, CA, USA, 1991,1451:204-215.
[4] ALEXANDRA P, HILARY B. Neural network platform for recognizing a sequence of cell images[A]. SPIE Proceedings Applications
of Artificial Neural Networks III[C]. Orlando,FL,USA,1992, 1709:1061-1070.
[5] WANG T, ZHENG C, LI D, et al. Self-organization neural network based ultrasonic heart image segmentation[J]. Journal of
Biomedical Engineering (Chinese), 2000, 19(3):355-360.
[6] CHAO C H, DHAWAN A P. Edge detection using a Hopfield neural network[J]. Optical Engineering, 1994,33(12):3739-3747.
[7] KUNTIMAD G, RANGANATH H S. Perfect image segmentation using pulse coupled neural networks[J]. IEEE Trans on Neural
Networks, 1999,10(3):591-598.
[8] ECKHORN R, REITBOECK H J, et al. Feature linking via synchronization among distributed assemblies: simulations of results from
cat visual cortex[J]. Neural Compututation,1990, 2(MIT):293-307.
[9] SKOURIKHINE A N. A APulse couple neural network for image smoothing and segmentation[A]. International Symposium on
Computational Intelligence[C]. Kosice, Slovakia,2000.
[10] THHOMAS L. Inherent features of wavelets and pulse coupled neural networks[J]. IEEE Trans on Neural Networks,
1999,10(3):9204-1092.
[11] JOHNSON J L, PADGETT M L. PCNN model and applications[J]. IEEE Trans on Neural Networks, 1999,10(3):480-498.
[9]