http://www.gissky.net- GIS空间站

我要投稿 投稿指南 RSS订阅 网站资讯通告:
搜索: 您现在的位置: GIS空间站 >> 技术专栏 >> 地理信息 >> 正文

基于贝叶斯网络的面向对象的地表覆盖图斑半自动解译研究

作者:虞 欣,杨…    文章来源:2014测绘学    点击数:    更新时间:2015-2-4
摘要:针对在北京市第一次地理国情普查内业作业人员进行人工解译或判读过程中,常常会遇到“可以定位,无法定性”的情况,本文提出一种基于贝叶斯网络的面向对象的地表覆盖图斑半自动解译的方法。该方法是在内业作业人员利用高分辨率遥感影像“勾绘”图斑的基础上,针对那些“可以定位,无法定性”的图斑,再利用贝叶斯网络进行地表覆盖图斑的解译,将其作为内业作业人员解译或判读的一种辅助工具。特别是当遇到外业人员无法或很难到达的区域,本文提出的方法更是一个较好的解决办法。实际上,本文提出的方法也可以作为质量检查的一种辅助工具。此外,本文经过相关的实验与分析验证了本文提出方法的可行性和有效性,但也存在一些不足之处,这些都作为将来进一步深入研究的内容。

1引言

2013228日,为全面掌握我国地理国情现状,满足经济社会发展和生态文明建设的需要,国务院下发《国务院关于开展第一次全国地理国情普查的通知》(国发[2013]9号),决定于2013年至2015年开展第一次全国地理国情普查工作。该项普查工作主要是利用最新的经过正射纠正的高分辨率遥感影像,先由内业作业人员在室内通过人工解译或判读的方式采集获取有关的地理国情信息,接着将内业解译的结果,移交给外业作业人员,然后外业作业人员到实地进行必要的调查与核实后,将其结果反馈给内业作业人员,由内业作业人员进行相应的整理与编辑,形成最终的普查成果,即地理国情信息。相比之下,人们熟知的人口或经济普查模式,主要是普查人员通过到现场调查的方式来获取有关人口或经济等方面的普查信息,这种先外后内的普查模式与上述内--内的地理国情普查模式显然不同。从这个角度来看,与人口或经济普查模式不同的是,地理国情普查模式在外业调查与核实之前,增加了一个由内业作业人员利用高分辨率遥感影像通过人工解译的方式采集地理国情信息的环节,恰恰是这一环节,可以大量地减少外业作业人员的工作量。或者说,在采集获取地理国情信息一定的前提下,内业作业人员采集的地理国情信息越多,外业作业人员到实地调查与核实的工作量就越少。由此看来,与人口或经济普查模式相比,地理国情普查模式一方面可以在一定程度上减少外业工作强度;另一方面,提高了普查工作效率,节省了普查成本。同时,它也充分体现地理国情普查的高科技优势。

然而,在内业作业人员进行人工解译或判读过程中,也常常会遇到“可以定位,无法定性”的情况。具体来说,在此次地理国情普查中,与地表覆盖相关的一级类有10个,二级类有46个,三级类有77个。比如:一级类的园地有7个二级类,其中有一个二级类果园,它又可以细分为三个三级类,即乔灌果园、藤本果园和草本果园。如果内业作业人员不具备丰富的影像解译经验和知识,虽然可以依据地物类型在高分辨率遥感影像上所表现纹理结构的不同,确定不同地物的边界范围,却很难准确地解译或判读该地物所属的类型。实际上,地球表面上的地物类型繁多,而且类似于“橘生于淮南则为橘,生于淮北则为枳”的情况也不少见。因此,影像解译的经验和知识的积累和准确掌握需要一个长期的过程。另外,由于对于遥感影像来说,同物异谱或同谱异物的情况也时有发生,所以这些情况对内业作业人员的准确解译或判读都产生了一定的难度。在这些情况下,为了保证普查成果的准确性,内业作业人员往往将那些内业“可以定位,无法定性”的疑问图斑,移交给外业作业人员,由他们到实地进行调查与核实,进而确定地物的属性类别。可是,有时外业作业人员也无法或很难达到或进入实地,比如:高山地、管理严格的住宅小区或单位院落等。

因此,基于上述的实际情况,本文提出了一种基于贝叶斯网络的面向对象的地表覆盖半自动解译方法,其基本思路是通过从图斑中提取高分辨率遥感影像内在所蕴含的统计性纹理特征和结构性纹理特征,借助于一定数量的训练样本学习得到贝叶斯网络的结构和参数,充分利用贝叶斯网络的推理优势,将外业作业人员到实地调查与核查工作转交给贝叶斯网络来进行影像解译或判读。该方法在一定程度上可以用于解决那些内业“可以定位,无法定性”的疑问图斑,对于外业人员无法或很难到达进入区域的情况,更是一个较好的解决办法。

本文提出的方法是在内业作业人员利用高分辨率遥感影像“勾绘”图斑的基础上,再利用贝叶斯网络进行地表覆盖图斑的解译。在文本中之所以称之为面向对象的半自动解译是考虑到以下一些原因。由于前期内业作业人员参与地物边界的“勾绘”,得到一个个不规则的多边形区域,也即图斑(在本文中也将它称之为对象)。由此看来,解译前期过程中就已经有一定程度的人工参与成分,这部分也是与通常的面向对象的影像自动解译或自动分类的不同之处。或者说这两种方法的主要差异在于图斑或对象产生的方式不同,一种是人工“勾绘”,另一种是计算机通过一定的算法自动生成。所以,从这个角度来看,本文提出的解译方法是半自动的。反过来,正是因为人工“勾绘”的图斑,它是一个相对单一属性类型的图斑,与通过计算机自动生成的图斑相比,一般来说人工“勾绘”的图斑内部的同质性更好,有着更加准确的地类边界。在这种情况下,可以更加容易、更加准确地提取关于这个图斑的统计性纹理特征和结构性纹理特征,而不用考虑由于通过计算机自动产生的图斑所引起的误差,这对后续解译的准确度或分类精度都会有一定的帮助。本文的组织安排如下:第二部分着重介绍一下贝叶斯网络的基本概念,第三部分阐述贝叶斯网络在地表覆盖解译中的应用,第四部分通过相关的实验结果来验证本文提出方法的可行性和有效性,最后做一个简单的小结以及对未来研究工作的展望。

贝叶斯网络

2.1 基本概念

关于贝叶斯网络的这个概念最早是由美国加州大学的Pearl,在深入研究图的拓扑结构与变量间条件独立性这两者之间关系的基础上,于1986年首次提出[1-4]。这在当时仅仅是引起了人工智能领域研究者的广泛关注和青睐。直到人们发现Naïve Bayesian Network(有时成为简单贝叶斯网络或朴素贝叶斯网络)在影像分类领域的“卓越表现”,贝叶斯网络才开始进入分类领域研究人员的视野[5-6]。实际上,贝叶斯网络是贝叶斯统计学和图论相结合的产物,它一方面用图论的语言直观、定性地表述节点与节点之间的依赖关系;另一方面它用概率论的语言来定量地刻画这种依赖关系的程度,以下图1为例,来说明贝叶斯网络的基本概念。

 

图1 贝叶斯网络示意图

在图1中,Burgary,Earthquake,JohnCalls,MarryCallsAlarm表示五个节点或概率论中的随机变量,其中有向边表示两个节点之间的依赖关系,从上图中可以直观地看到这五个节点之间的依赖关系。比如:Burgary节点指向Alarm节点,这表明Burgary节点是Alarm节点的父节点,反过来,Alarm节点是Burgary节点的子节点。图中的(条件)概率表则表示节点与节点之间的相互依赖强度,比如中间的那张条件概率表的第二行,它表示当Burgary节点和Earthquake节点,这两个节点同时发生时,Alarm节点节点发生的概率大小,即这三个节点之间的依赖强度。

 

2.2 推理模型

由于贝叶斯网络结构和复杂性的不同,贝叶斯网络有多种类型,其中最简单要属于简单或朴素贝叶斯网络,这种贝叶斯网络的特点是,所有子节点相对父节点是相互独立的。然而,在现实世界中,子节点之间的这种相互独立性是很少见的。一般情况,更多的是节点与节点之间存在着某种依赖关系。因此,本文在将贝叶斯网络应用在地表覆盖解译研究时,考虑到从对象中提取的特征往往是相关的这一原因,主要选用Tree Augmented Naive Bayesian NetworksTAN,树型贝叶斯网络)进行应用研究,其推理模型如下,具体的推导过程可以请见参考文献[6-8]

TAN中的任意一个节点,记为子节点的父节点集(即)。在下面的表述中,用大写的英文字母表示随机变量,相应的小写字母表示该随机变量的观测值,也即样本值。假设服从正态分布,两者可以组成一个维的正态随机向量,即

                                 (1)

通过下式可以计算所有节点的联合概率

                   (2)

上式中,为类别变量,表示相应的类别,为类别的总数。然后有条件概率可以得到

 (3)

由于是一个与无关的常量,所以有

                (4)

最后根据最大后验概率最大的准则进行判别(推理),即

3贝叶斯网络在地表覆盖解译中的应用

3.1 特征提取与描述

特征提取与描述在影像分析与理解中一直是一个非常重要的内容,其中纹理特征研究的最多,在实际的应用中也比较普遍。通常,人们大致把纹理特征分为两类:统计性纹理特征和结构性纹理特征[9-10]

在统计性纹理研究中,用的最多的莫过于灰度共生矩阵法,有时也称空间灰度级相关方法,它通过对影像灰度级之间二阶联合条件概率密度的计算来表示纹理特征,比如:

(1) 角二阶矩(能量)

                               (5)

角二阶矩反映了图像灰度分布均匀程度和纹理的粗细度。

(2) 

                       (6)

熵是图像信息量的度量。

(3) 逆差矩

                            (7)

    而在结构性纹理特征方面,主要是通过小波变换的方法来提取或描述。在利用小波构造特征时,小波基的选择不同会影响到对影像的特征提取。在本文的实验中,选择Symlets小波,影像经过Symlets小波变换后,分别提取一尺度的近似分量LL中的均值、水平细节分量LH中的方差和垂直细节分量HL中的方差。 选择Symlets小波的原因在于它是一个双正交的小波,其支撑长度为2N-1N表示小波的序号),滤波器的长度为2N,消失矩为N,具有近似的对称性,更加有利于影像中结构信息的提取[11-12]

3.2 应用举例

  

树型贝叶斯网络在影像分类中的应用

图2为树型贝叶斯网络在影像分类中应用的一个例子。图中为属性类别节点(变量),变量为从某待分类单元中提取的某个纹理特征,可以是统计性纹理特征,也可以是结构性纹理特征。根据上述贝叶斯网络的定义有

3.3主要步骤

为了更好地表述本文提出的方法在高分辨率遥感影像地表覆盖图斑解译中的应用,现将主要步骤归纳如下。

从所有的地表覆盖图斑中选取一定数量的样本作为训练样本;

根据§3.1的相应公式提取训练样本中每一类的统计性纹理特征和结构性纹理特征;

通过样本的先验信息和样本的特征信息进行训练或学习,得到类似于图2的贝叶斯网络结构和相应的网络参数;

根据§3.1的相应公式提取测试样本(或待解译的地表覆盖图斑)中的统计性纹理特征和结构性纹理特征;

利用式(3)计算出类出现的后验概率

以后验概率最大原则对地表覆盖图斑进行解译或分类,即

对地表覆盖图斑解译或分类结果进行评价,即通过分类后统计得到的混淆矩阵,计算各类的分类精度和总的分类精度。

 

实验与分析

4.1数据情况

在本文的实验中,所有的实验数据都全部来自用于北京市第一次全国地理国情普查的彩色高分辨率遥感影像,获取时间在2013年的秋季,平原区的空间分辨率为0.19米,山区的空间分辨率为0.48米,遥感影像覆盖北京全市域。为了验证本文提出方法在地表覆盖图斑解译中的应用的可行性和有效性,同时考虑突出研究问题的主要矛盾,尽量减少其它地表覆盖图斑类别的干扰。在本文的实验中,在地表覆盖中选取了一级类林地(0300)中的二级类乔木林(0310)作为研究对象,其中乔木林有三个三级类:阔叶林(0311)、针叶林(0312)和针阔混交林(0313),这三个三级类,一方面对于内业作业人员的初期特别混淆,另一方面,这些类别在北京市山区出现的频率较高,这些山区通常不易到达。下图3显示了每类中具有代表性的一幅样本图像,在本次实验中三类地表覆盖图斑各采集100个样本,并通过实地的调查与核查每一个图斑的边界范围(即下图中的红线范围)和相应的类别属性。

a)阔叶林

 

b)针叶林

               

 

c)针阔混交林

每一类的一幅代表性样本图斑

    上图3中,红线区域范围表示某一种地表覆盖类别的实地范围,大小和形状不尽相同。其中(a)表示阔叶林,(b)表示针叶林,(3)表示针阔混交林。

 

4.2结果分析

    在地表覆盖图斑解译的过程,训练样本和分类方法的选择不同,都会不同程度地影响最后解译或分类的精度。在本次的实验中,在分类方法方面选用目前影像分类领域中使用最普遍的最大似然法。另外,在贝叶斯网络方法中,选用贝叶斯网络中最简单的简单(或朴素)贝叶斯网络方法进行相关实验,以便与本文提出贝叶斯网络方法做比较实验。实验过程中,首先在每一类的100个样本随机地选取一定数量的样本并提取每一个样本的统计性纹理特征和结构性纹理特征,作为训练样本对贝叶斯网络进行训练得到贝叶斯网络的网络结构和相应的参数,接着对剩下的样本作为测试样本进行测试,在此基础上,得到每一种情况下相应的混淆矩阵,从而计算出总的分类精度,其结果如下表1。

 

不同训练样本和分类方法下的分类精度

N

5

10

15

20

25

30

MLC

78.94%

80%

82.35%

87.5%

86.67%

85.71%

NBC

82.11%

82.22%

85.88%

87.5%

88%

87.14%

TAN

83.16%

83.33%

88.24%

89.41%

92%

91.43%

 

在上表1中,第一行中的N表示训练样本的数量,第一列表示不同的分类方法,其中MLC是表示最大似然法,NBC表示简单(或朴素)贝叶斯网络,TAN表示树型贝叶斯网络,表中的分类精度以百分比的形式表示。从上表1中,可以得出以下几个结论:

(1)本文提出的方法是可行性,并且是有效的;

(2)随着训练样本的数量的增加,三种分类方法的分类器的推理性能(或分类精度)有所提高。当训练样本的数量达到20左右,其分类精度基本趋于稳定。

(3) 三种方法中,最大似然法和简单(或朴素)贝叶斯网络两种方法的分类效果基本相当,而本文提出的树型贝叶斯网络方法的分类精度都优于其它两种方法。

小结

本文的方法是在北京市第一次地理国情普查内业过程中提出的,经过相关的实验与分析验证了本文提出方法的可行性和有效性。但是,在本文的实验中,只是将一级类林地(0300)中的二级类乔木林(0310)作为研究对象。从图3的(b)中,也不难发现同一一级类的不同二级类之间的图斑解译或判读也容易发生混淆。因此,这也是将来的一个研究方向。另外,从本文的实验中,虽然本文提出的树型贝叶斯网络方法的分类精度都优于其它两种方法,但其分类精度还不能达到100%,在下一步的研究工作中,可以进一步研究哪些纹理特征的提取和描述,更加有利于提高计算机在地表覆盖图斑解译或判读中的推理能力或分类精度。

 

实际上,在地理国情普查的内业工作中,还存在另外一种情况,就是由于内业作业人员对地表覆盖类型的定义或概念理解不准确,导致影像解译或判读不正确,即归类错误(图斑类型与实地不符)。在今年开展的第一次全国地理国情普查前三批的过程质量监督抽查过程,国家测绘产品质量检验测试中心的专职质检人员发现了一定比例的图斑分类错误的情况,比如:旱地表示为果园,绿化草地表示为阔叶林,大面积林地错归类为绿化林地等等。因而,从这个角度来看,本文提出的方法,也可以作为内业作业人员解译或判读的一种辅助工具,即在内业作业人员进行内业解译或判读时提供一种辅助信息,避免或尽量地减少由于内业作业人员对地表覆盖类型定义或概念理解不准确带来的判读错误。所以说,本文提出的方法也可以作为质量检查的一种辅助工具。通过该方法,可以快速定位那些计算机半自动解译或判读的类型与内业作业人员人工解译或判读类型不一致的图斑。基于这个自动检测结果,质检人员可以有的放矢,可以到实地重点检查这些图斑。因此,这种方法一方面可以减少抽查的随机性(或盲目性);另一方面可以提供工作效率,更好地保障普查成果的质量。

 

一般来说,如果内业作业人员具有足够的经验和知识,再考虑到目前计算机能够掌握的解译经验和知识相对有限,或者说所提取的特征和解译方法有限。在通常情况下,人工解译的准确性要高于计算机自动解译的准确性。反过来,这两种解译或判读方法的不一致性或差异,也可以为计算机自动解译研究带来一些启发,或者说这些差异性可以帮助计算机更好地去模仿人工解译的模式或方法。或许在将来的某一天,计算机解译的模式可以真正代替人工解译的模式,以上这些内容便是将来需要研究的内容。

参考文献

1. Ritaban Duttaa, Author Vitae, Anthony G. CohnbAuthor Vitae, Jen M. Muggletonc. 3D mapping of buried underworld infrastructure using dynamic Bayesian network based multi-sensory image data fusion[J]. Journal of Applied Geophysics. Volume 92, May 2013, Pages 819.

2. Jerónimo HernándezGonzález, Author Vitae, Iñaki Inza Author Vitae, Jose A. Lozano. Learning Bayesian network classifiers from label proportions[J]. Pattern Recognition. Volume 46, Issue 12, December 2013, Pages 34253440.

3. L. Enrique Sucara, Concha Bielzab, Eduardo F. Moralesa, Pablo Hernandez-Leala, Julio H. Zaragozac, Pedro Larrañaga. Multi-label classification with Bayesian network-based chain classifiers[J]. Pattern Recognition Letters. Available online 20 November 2013.

4. X Wu, X Wen, J Li, L Yao. A new dynamic Bayesian network approach for determining effective connectivity from fMRI data[J]. Neural Computing and Applications. 2014(24):P.91-97.

5. Marina Velikovaa, Peter J.F. Lucasa, b, Maurice Samulskic, Nico Karssemeijer. On the interplay of machine learning and background knowledge in image interpretation by Bayesian networks[J]. Artificial Intelligence in Medicine. Volume 57, Issue 1, January 2013, Pages 7386.

6. 虞欣郑肇葆基于语义特征和贝叶斯网络的航空影像建筑物及灌木分类[J]. 测绘学报, 2010, 39 (3): 245-250.

7. Xin YUBogang YANG, Pingxiang CHEN, Guangjun JIAHaitao ZHANGTexture Classification of High-resolution satellite images Based on Bayesian Network Augmented Naive Bayes[C]XXII International Society for Photogrammetry & Remote Sensing , Melbourne2012.08.25-09.01.

8. 虞欣,杨伯钢,北京市地理国情普查试点的实践[C],地理国情监测技术与应用研讨会暨第三届全国高分辨率遥感数据处理与应用研讨会,武汉,2013.11

9. 虞欣,贝叶斯网络在影像解译中的应用研究[M], 测绘出版社. 180千字,2011

10.YU Xin, ZHENG Zhaobao, ZHANG Haitao, YE Zhiwei, 2008. Texture Classification of High-resolution satellite images based on Bayesian network augmented naïve Bayes[C]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. Vol. XXXVII. Part B7. Beijing, pp.497-501.

11. Baatz M, Schäpe A. Object-oriented and multi-scale image analysis in semantic networks[C]. Proceedings of the 2nd International Symposium on Operationalization of Remote Sensing, Enschede, ITC, 1999:16-20.

12. Jinn Ho, Wen-Liang Hwang, "Wavelet Bayesian Network Image Denoising[J]," IEEE Transactions on Image Processing, volume 22, number 4, pages 1277 – 1290April 2013.

Tags:地理国情,贝叶斯网络,面向对象,地表覆盖,影像解译  
责任编辑:gissky
关于我们 - 联系我们 - 广告服务 - 友情链接 - 网站地图 - 中国地图