第29卷第2期许昌学院学报Vol. 29. No. 2 2010年3月JOURNAL OF XUCHANG UNIVERSITY Mar. 2010 文章编号:1671 -9824 (2010) 02 -0081 -03 空间数据仓库综述葛凡,祝玉华(河南工业大学研究生院,河南郑州450001)摘要:叙述了空间数据仓库的概念及其功能特征,根据其与GIS、空间数据库的关系概括出其结构框架,分析了空间数据仓库的发展现状,并根据现状提出存在的问题及解决方法.关键词:空间数据仓库;空间数据库;GIS;空间数据立方体中图分类号:文献标识码:A在信息获取技术日益发达的今天,面向事务处理的地理数据库已不能满足决策者及企业界的需要,因此,更大范围(时间、地区)的信息共享及有效决策就成为-个研究热点.作为数据库技术和GIS相结合产物的空间数据库技术(SpatialData Warehouse) ,就是为满足这种新的需求而提出的空间信息集成方案.本文根据当前的空间数据仓库的发展情况,结合其发展特点,总结出了当前空间数据仓库发展的突出问题,并提出了相应的解决方法.1 空间数据仓库的概况 空间数据仓库的基本概念数据库的创始人. Inmon定义数据仓库川为支持管理的、决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合.空间数据仓库是建立在传统的数据库基础上,依靠数据库实现对数据的高效存储,二者之间的区别在于其应用不同.因此,在数据组织、集成上有很大的差别:空间数据库作为源数据库负责数据的日常处理及一般的空间分析功能;空间数据仓库根据用户的要求对空间数据库中分散的、多糠的空间数据进行集成和分析,截取不同时段上的信息,将数据的时间属性和空间属性紧密地结合起来,通过模型构建分析和比较,进行数据挖掘发现隐藏在数据中的信息,从而为用户提供决策服务. 空间数据仓库的功能及特征从组成上,空间数据仓库有三方面的功能:从分散、独立的空间数据库中获取空间数据,即数据lETL[2包括数据抽取(extract)、转换(transform)、清洗(cleaning)、装载(loading),建立空间数据仓库;对数据的存储、管理和检索;数据集成及数据挖掘.空间数据仓库相比于空间数据库有以下特征:1. 空间数据仓库是面向主题的传统的GIS数据库是面向对象的,根据应用对数据进行组织,空间数据仓库是面向主题的,在空间数据库的基础上进行更高层次的数据组织和分析.1. 2. 2 空间数据仓库是集成的空间数据仓库建立在GIS数据库的基础上,在进行决策时利用元数据对空间数据库里的地理空间数据进行抽取、转换,从而得到有用的的信息,把空间数据库中面向对象的数据转向面向主题的数据,实现决策支持.1. 2. 3 引用时间维在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把收稿日期:2009-07 -15 作者简介:葛凡(1984一),女,河南南阳人,在读硕士研究生,研究方向:地图制图学与地理信息工程.
82 许昌学院学报2010年3月不同历史时期的空间数据组织到一起,使数据具有时间属性.1. 2. 4 空间方位概念的引入自然界是个立方体,各空间对象之间有一定的方位关系和相互联系,弓|入空间立方体的概念,对地理对象进行多方面、多层次的概括,有助于进行GIS多维空间信息分析. 空间数据仓库的结构框架日……一用一可工系一视…正统一-一-化EE 空间数据仓库是在GIS空间数据库的基础上,-D利用数据库技术、元数据技术、网络技术对海量地理h一空间数据进行集成、管理、查询分析、分发及应用,空间数据仓库的总体框架如图1所示(其中实线框架内为空间数据仓库系统的研究内容,虚线框架内为其它系统的研究内容).地理空间数据库位于空间数据仓库的最底层,这些数据可能来自不同单位,表示不同时期由不同软件系统管理,它们相互独立,形i地理空间数据库及其它数据源i成各式各样的异构数据,成为空间数据仓库的数据图1空间数据仓库的总体框架源.应用系统位于最顶层,它通过统一标准的数据接口提取地理空间数据为多种应用系统服务.空间数据仓库系统位于中间层,它提取地理空间数据库中的数据,经过空间数据仓库进行数据集成转换,为应用系统提供数据.由此而看见空间数据仓库是一个多源数据共享、处理机制.在网络技术、数据仓库技术日益成熟的今天,根据用户的不同需求,以空间数据仓库系统为平台,访问多个地理空间数据库,进行数据挖掘和GIS多维空间分析,为多种应用系统提供全面、科学、实用的决策支持. 空间数据仓库的现状自1996年美国的Edwards教授和美国的ESRI公司将数据库理论与技术引进GIS领域以来,空间数据仓库的研究工作一直吸引着GIS从业者极大的兴趣.目前,还没有专门成立有关研究空间数据仓库的学术团体,但与之相关的这方面学术讨论会逐年增多,如ESRI公司的全球性用户大会、SSD国际会议、数字地球国际会议、GIS国际会议等.空间数据仓库理论、技术及其产品已在很多领域取得较为明显的经济效益,尤其在美国,如纽约的长岛铁路系统,它是全美最大的由计算机控制的铁路系统,它建立了一个全企业范围内的空间数据仓库,用于为每个部门提供详细雨精确的铁路基础设施信息.在我国,空间数据仓库理论与技术大概在20世纪90年代末期,北京大学遥感与地理信息系统研究所在这方面做了不少工作.到目前为止,一些应用的理论及实施方法在一些论文中已经提出,但空间数据仓库在各领域的应用实例还很少见.2 空间数据仓库研究中存在的问题及解决方法根据空间数据仓库的总体框架,目前空间数据仓库研究的重点有:空间数据的ETL,空间数据仓库元数据管理[3]、GIS多维空间分析[4J三方面.ETL是指从源系统中提取数据,转换数据为一个标准的格式,加载数据到目标数据存储区,是空间数据仓库的构建过程中不可避免的问题,可以有以下两种解决方案:一是把数据源中的数据分为空间数据、多种数据库数据、XML文档数据三种形式,分别设计数据转换工具;一是借助元数据管理、开发专用的ETL转换工具基于特定的软件,结合具体情况进行空间数据的集成转化.前一种方法需要对数据进行分别处理,在加载过程中要求空间数据仓库系统的储存、更新、管理数据效率较高;后一种方法由于引人元数据管理,对数据的要求比较高,在实施时劳动强度比较大,可引人智能技术,提高空间数据ETL自动化和分析集成的水平.笔者认为介于元数据在GIS中的重要地位[幻,后一种实现方法的前景是比较诱人的,这是因为元数据是用来描述地理空间数据集的内容、质量、状态等其他特性的数据,它们在实现地理空间数据仓库的过程中起着重要的作用:指示空间数据仓库如何从多个地理信息数据库中提取出数据种类、数据标准等方面不
83 第29卷第2期葛凡,等:空间数据仓库综述同的地理空间数据;指示应用系统如何从空间数据仓库中提取出标准的集成的地理空间数据,为用户提供地理空间数据产品服务等.目前对空间数据仓库元数据的研究主要集中在地理空间数据元数据的研究上.国际上有三个组织对地理空间数据元数据标准进行了大量的研究,这三个组织分别是:美国联邦地理数据委员会(FGDC)、欧洲地理信息标准化委员会(CEN/TC287 )以及国际标准化组织(ISQ)地理信息/地球信息业技术委员会(ISO/TV211).在国内有中国可持续发展信息共享元数据标准、NREDIS信息共享元数据内容标准等.但对空间数据仓库元数据的研究还是一片空白,当前可见的是武汉大学吴金华提出的空间数据仓库元数据的研究问.GIS因为其空间分析功能而逐渐发展起来,但随着空间分析功能的深入研究,对空间数据的时间维、专题维的考虑日益成为GIS空间分析的重点,在空间数据仓库中引入时间信息维、专题信息维,可以大大提高了GIS空间分析的能力.目前国外提出空间数据立方体(SOLAP)技术,将来自不同领域的地理空间信息、专题信息1、专题信息2、…、专题信息n、时间信息按维的形式组成一个易理解的超数据立方体,用地理空间维、专题维、时间维来描述空间对象,通过维的不同操作可产生不同的空间分析结果,以满足多维空间分析和概括的需求,实现GIS多维空间信息分析功能,进一步为用户提供决策支持,笔者认为这无疑为GIS的发展提供了更为广阔的空间,大大的拓宽了GIS的应用范围.3 小结总的来说空间数据仓库可以解决传统数据库无法解决的问题,有效地实现空间数据的深层次分析和挖掘,提供更为实用的决策服务.当前随着经济的发展,空间数据仓库被引用到农业、交通规划、城市规划等中,它的发展可以有力的支持数字城市、数字地球的建设,其发展前景广阔,但需要解决的问题仍相当多,需进行进→步的完善和发展.参考文献:[ 1 ] Inmon W H.数据仓库[M].王志海,黄辱款,田盛丰,等译.北京:机械工业出版社,2000.[2] 田扬戈,边被苓.空间数据仓库的ETL研究[1].武汉大学学报:信息科学版,2007,32( 4) :362 -364. [3J 张立,龚健雅.地理空间元数据管理的研究和实现[1].武汉测绘科技大学学报,2000,25(2) : 127 -130 [4J 邹逸江.空间数据立方体分析操作原理[J].武汉大学学报:信息科学版,2004,29( 9) :822 -825. [5] 吴金华.空间数据仓库的元数据研究[D].武汉:武汉大学, OverV˝ew of Spatial Data Warehouse GE Fan,ZHU Yu-hua ( Graduαte School, Henan Unit用rsity0/ Technology, Zhengzhou 450001 ,China) Abstract: This paper sums up the definition and functional feature of spatial data warehouse and gives its structural frame based on its relationship with GIS and spatial database. It also analyses the development situation of spatial data warehouse and puts forward the problems and solutions. Key words: spatial data warehouse; spatial database; GIS ; spatial data cube 妻任编辑:周伦