网格体系结构研究
徐庆征1,2
1西安理工大学自动化学院,西安 710048
2西安通信学院,西安 710106
E-mail:syesun@
摘 要:计算机和通信技术在上个世纪末的迅猛发展,促使计算机网络在经历了互联网时代
和Web时代之后,进入到网格时代。网格作为下一代 Internet的基础设施是最近研究的热点,
在世界上引起了前所未有的关注和重视。本文介绍网格的基本概念,对网格体系结构作具体
分析,最后指出网格技术的发展趋势。
关键词:网格;网格体系结构;趋势
1 网格的基本概念
到目前为止,关于什么是网格还没有一个普遍接受的定义[1]。
全球网格研究的领军人物、美国Angonne国家实验室的资深科学家、美国Globus项目的
领导人Ian Foster曾在 1998 年出版的《网格:21 世纪信息技术基础设施的蓝图》一书中这样
描述网格[2],“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、
大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功
能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更
强,让人们透明地使用计算、存储等其他资源。”
2001 年,Ian Foster等人进一步将网格计算和它的基础构件定义[3]为支持动态的、可扩充
的分布式虚拟组织(VO,Virtual Organizations)中可控的和平等的使用和共享资源的协作
系统。网格技术聚焦于动态的、跨组织的资源共享,可以克服现在的静态资源配置的限制,
而不是和其他的分布式计算技术竞争。
2002 年 7 月,Ian Foster从三个方面更清晰的定义网格[4]。他认为网格是一个满足如下三
个条件的系统:(1)能协调不服从集中式控制的资源。(2)使用标准的、开放的、通用的
协议和接口。(3)提供非常的服务质量。
由上述的定义或描述中,可以看到网格的基本特征主要包括[5,6]:分布性、共享性、动
态性与异构性、管理多重性等。
2 网格的体系结构
网格的体系结构就是关于如何建造网格的技术。它必须能够标识出网格的基本组成部
分,能够清除地说明网格各组成部分的关系以及它们集成的方式或方法,还必须能够对各部
分的功能、目的、特点、网格运转的机制等进行清晰地描述。显然,网格体系结构是网格最
核心的技术,是网格的骨架和灵魂,只有建立合理的网格体系结构,才能够设计和建造好网
格,才能够使网格的效能得到最好的发挥。到目前为止,最流行且最有影响的网络体系结构
是五层沙漏体系结构[7]、开放网络服务体系结构OGSA[8]以及国内的织女星网格体系结构[9]。
五层沙漏体系结构
- 1 -
五层沙漏体系结构是Foster等在早些时候提出的,具体体现在Globus Toolkit 版本中,
它在世界范围内上千个网格中的得到广泛应用,成为一个网格体系结构的事实标准。五层沙
漏结构成功解决了通用的网格平台所面临
的异构性、扩展性以及适应性等问题,主要
侧重于定性的描述而不是具体的协议定义,
因此很容易从整体上进行理解。结构如图 1
所示。
Application
(1)构造层(fabric):网格构造层的
基本功能是控制局部的资源,向上提供共享
访问这些资源的接口和界面。构造层面对的
资源非常广泛,可以是高性能计算资源、大
型数据库存储系统、目录、高速网络资源、传感器和远程设备等。构造层应该实现的基本功
能包括:查询机制、资源管理能力等。
(2)连接层(connectivity):连接层的基本功能是实现各个孤立资源之间的安全的数据
通信。它定义了核心的通信和认证协议,用于网格的网络事务处理之中。通信协议允许在构
造层资源之间交换数据,要求包括传输、路由、名字解析等功能。在网格环境中,建立在通
信服务之上的认证协议提供加密的安全机制,用于识别用户和资源,以解决连接层的安全认
证问题。
(3)资源层(resource):资源层的主要功能是实现对单个资源的共享。资源层建立在
连接层的通信和认证协议之上,提供数据访问、状态与性能信息访问等服务,定义的协议包
括安全初始化、监视、控制单个资源的共享操作、审计以及付费等。五层沙漏体系结构中资
源层与连接层是协议层次结构中的最核心部分,形成了沙漏结构的瓶颈部分,因此这个协议
集合要小,而且尽量标准化。这些协议要能够抓住涵盖不同资源类型的基本共享机制,但是
又不能够对高层协议的类型和性能有约束。
(4)汇聚层(collective):汇聚层的主要功能是协调多种资源的共享,协同完成任务,
主要包括目录服务、资源分配、进度安排、业务代理、资源监视和诊断、负载控制、软件发
现、安全认证、计费等。汇聚层协议与服务(包括 API/SDK)描述的是资源的共性,并不
涉及资源的具体特征。汇聚层可分为通用的汇聚层和面向特定问题的汇聚层。
(5)应用层(application):作为网格体系结构的最高一层,应用层是在虚拟组织环境
中存在的,与资源的距离最远。应用层由用户的应用程序构成,应用程序通过调用下层提供
的服务,再通过服务调用网格上的资源实现,为了便于应用程序的开发,需要大量支持网格
计算的库函数。
五层沙漏结构的核心思想主要表现在:共享、互操作、协议、服务以及 API/SDK。
开放网格服务体系结构
开放网格服务体系结构 OGSA(Open Grid Services Architecture)是继五层沙漏体系结构
之后出现的最重要、最新、最主流的网络体系结构,被称为是下一代的网格结构。它是由全
球网格论坛(Global Grid Forum, GGF)OGSI 工作小组于 2002 年 6 月制定的。这个结构的
Collective
Resource
Connectivity
Fabric
G
rid
P
ro
to
co
l A
rc
hi
te
ct
ur
e
Transport
Internet
Application
Link In
te
rn
et
P
ro
to
co
l
图1 网格体系结构和 Internet协议的
A
rc
hi
te
ct
ur
e
对比
- 2 -
出现也标志着网格从以科学计算研究为主的范围扩展到主流商业计算环境的方方面面,这也
是网格体系结构目前最新的发展阶段。
OGSA 同样也是 5 层结构,自下而上依次为:构造层、连接层、资源层、汇聚层及应用
层。但其自身还有以下特点:
(1)以服务为中心的结构:如果说五层沙漏结构是以协议为中心的“协议结构”,实现
的是对资源的共享,则 OGSA 就是以服务为中心的“服务结构”,实现的将是对服务的共享。
在 OGSA 中,服务所指的概念更广,包括各种计算资源、存储资源、网络、程序、数据库、
仪器设备等,简而言之,网络上的一切实体都是服务。这种观念,有利于通过统一的标准接
口来管理和使用网络实体。
(2)统一的 Web Service 框架:Web Service 解决了发现和激发永久服务的问题,而在
网格应用环境中,大量的是临时性的短暂服务,例如一个计算任务的执行等。为了使服务的
思想更加明确和具体,考虑到网格环境的具体特点,OGSA 在原来 Web Service 服务概念的
基础上,提出了“网格服务”(Grid Service)的概念,用于解决服务发现、动态服务创建、服
务生命周期管理、通知等与临时服务有关的问题。基于网格服务的概念,OGSA 将整个网格
看作是网格服务的集
合,但是这个集合不
是一成不变的,它是
可以扩展的。这反映
了网格的动态特性。
网格服务通过定义接
口来完成不同的功
能。服务数据是关于
网格服务实例的信
息。因此网格服务可
以简单地表述为“网
格服务=接口/行为+服
务数据”。图 2 是对网
格服务的简单描述。
在目前 OGSA 的定义中,只有 grid service 接口是必需的,而其它的接口都是可选的。
其它接口
(可选的)
grid service
(必需的)
服务数
据元素
服务数
据元素
服务数
据元素
实 现
z 服务数据的访问
z 显示撤销
z 软状态生命周期
绑定特性:
z 可靠激活
z 认证
标准接口
z 通知
z 授权
z 服务创建
z 服务注册
z 管理
z 开发
面向特别应用
的接口
运行环境
(C、J2EE、NET、…)
图 2 网格服务示意图
织女星网格体系结构
徐志伟等人在分析比较现有网格
技术的基础上,提出了织女星网格的体
系结构设计。织女星信息网格的指导思
想是 VEGA,即通用服务(versatile
services )、 辅 助 智 能 ( enabling
intelligence )、 全 局 一 体 ( global
uniformity)、自主控制(autonomous
- 3 -
网络操作系统
网格应用
服务器
其 它
服务器
网络浏览器
GSRL
GSRP
协议
GCP 协议
网络硬件
图 3 织女星网格的层次结构
control)。织女星网格体系结构分为 3 个层次,即硬件层,操作系统层和应用层。图 3 给出
了织女星网格的层次结构。网格硬件包括广域分布的计算资源,如高性能计算机、贵重仪器
以及互联系统。网格操作系统是基于网格硬件开发的系统软件,完成资源管理、数据管理、
协议处理并提供应用编程接口。网格应用层向网格用户提供一体化、透明的使用模式。
3 网格的发展趋势
可以预见,网格将朝着标准化、技术融合以及大型化方向发展[10,11]。
标准化趋势
就像Internet需要依赖TCP/IP协议一样,网格也需要依赖标准协议才能共享和互通。目
前的网格计算系统已经有许多成功的使用实例,但是还需要进一步的标准化,以适应各种复
杂计算的需求。网格的跨越问题是一个重要的研究方向[12]。目前,包括全球网格论坛GGF
(Global Grid Forum)、对象管理组织OMG(Object Management Group)、全球网络联盟W3C
(World Wide Web Consortium)以及Globus联盟在内的诸多标准化团体都正在积极开发网格
的体系结构,试图争夺网格标准的制定权。
技术融合趋势
融合将成为网格技术发展的主旋律。随着网格向应用加速,网格将逐渐向着最佳的技术
组合方向演进和融合。现在许多企业的应用已经开发多年并运行良好,要将这些原有的应用
平滑移植到建好的网格系统平台,需要多种技术的融合和企业间的进一步支持和相互之间广
泛合作。
在 OGSA 出现之前,已经出现很多种用于分布式计算的技术和产品。例如,1987 年,
SUN 公司就推出了开放网络计算(Open Network Computing),1989 年分别出现了 OSF 的
DCE 和对象管理集团 OMG 的 CORBA,1996 年微软推出了 DCOM。但这些机制互不兼容,
严重到了同一家公司的产品都不兼容的程度。
基于 OGSA 之后,网格的一切对外功能都以网格服务来体现,并借助一些现成的、与
平台无关的技术,如 XML、SOAP、WSDL、UDDI、WSFL、WSEL 等,来实现这些服务的
描述、查找、访问和信息传输等功能。这样,一切平台及所使用技术的异构性都被屏蔽。用
户访问网格服务时,根本就无需关心该服务是 CORBA 提供的,还是.Net 提供的。
大型化趋势
网格技术向大型化方向发展表现在以下两个方面。(1)投资巨大。美国政府在网格技术
的基础研究上,每年投入的经费高达 5 亿美元。美国军方正在实施的全球信息网格(GIG,
Global Information Grid),预计在 2020 年完成,国防部每年在信息技术上的投资高达 220 亿
美元,GIG 的经费存在于其中的各种项目中。IBM 在 2001 年 8 月宣布,将投入 40 多亿美
元进行“网格计算创新计划”(Grid Computing Initiative),计划在全球建设 40 家数据中心,
建立由 50 台服务器组成的实验网络。英国政府宣布投资 1 亿英镑,用以研发英国国家网格
(UK National Grid)。(2)性能更强。美国能源部 DOE 支持的科学网格(Science Grid)用
622Mbps 的 ESNet 网格连接了能源部的两台超级计算机,网格计算能力达到每秒 5 万亿次,
存储能力达到 千万亿字节。美国国家科学基金 NSF 支持的 TeraGrid 将连接位于 5 个不
同地方的超级计算机,达到每秒 20 万亿次的计算能力,并能存储和处理近 1 千万亿字节的
- 4 -
数据。欧洲的 DataGrid 涉及到欧盟的 20 多个国家,是一种典型的“大科学”应用平台。2002
年 11 月,日本产业技术综合研究所网格计算研究中心宣布,在由多台个人电脑通过网络连
接组成网格计算环境下,实现了日美之间创纪录的 707Mbps 的数据传输。
4 结束语
网格是一个全新的研究领域,是一种关系科研、教育、经济、社会和国防的重要的国家
网络基础设施。据美国《福布斯》杂志预测,网格技术将在 2004~2005 年出现一个高峰,
推动信息产业市场的持续高速发展,在 2020 年产生一个年产值为 20 万亿美元的大产业。
我国的网格计算研究起步不久[13],由中国科学院牵头的“国家高性能计算环境(NHPCE,
National High Performance Computing Environment)”项目和由清华大学牵头的“先进计算基
础设施(ACI,Advanced Computational Infrastructure),北京上海试点工程”两个网格计算
项目已取得初步成果。网格建设需要国家政府的重视及投入,需要从局部到整体进行建设。
论文仅就网格的定义、基本特征、典型的网格体系结构、网格技术的发展方向进行了分析与
阐述,希望能对我国的网格技术发展有一定的促进作用。
参考文献
[1]都志辉,陈渝,刘鹏.网格计算[M].北京:清华大学出版社,2002
[2]Foster I, Kesselman C. Grid: Blueprint for a New Computing Infrastructure[M]. Morgan: Morgan-Kaufman,
San Fransisco, 1998
[3]Forster I, Kesselman C, Tuecke S. The Anatomy of the Grid: Enabling Scalable Virtual Organizations[J].
International Journal of Supercomputer Applications, 2001, 15(3): 200-222
[4]Foster I. What is the Grid? A three-point checklist[J]. Grid Today-DAILY NEWS AND INFORMATION FOR
THE GLOBAL GRID COMMUNITY, 2002(6)
[5]龚强.关于网格特征的研究[J].信息技术,2004,28(10):1-2
[6]谭勇.网格体系结构研究[J].湖北民族学院学报(自然科学版),2004,22(4):86-89
[7]Foster I, Kesselman C, Tuecke S. Cluster computing and the grid[A]. Proceedings First IEEE/ACM
International Symposium[C]. Brisbane Australia: IEEE, 2001. 6-7
[8]Foster I, Kesselman C, Nick J, et al. The physiology of the grid: An open grid services architecture for
distributed systems integration [EB/OL]. 2002-01
[9]徐志伟,李伟.织女星网格的体系结构研究[J].计算机研究与发展,2002,39(8):923-929
[10]杜晋瑞,戴光明,刘鹏.网格体系结构标准的演变与分析[J].信息技术与标准化,2005(8):20-25
[11]胡引翠.网格计算技术的应用及其发展趋势[J].测绘通报,2005(3):23-26
[12]孙九林,李爽.地球科学数据共享与数据网格技术[J].地球科学——中国地质大学学报,2002,27(5):539-543
[13]罗作民,张景,李军怀,谢长生.网格计算及其关键技术综述[J].计算机工程与应用,2003(30):18-22
- 5 -
Research on Grid Architecture
Xu Qing-zheng1,2
1School of Automatic, Xi'an University of Technology, Xi'an China 710048
2Xi’An Communication Institute, Xi’An China 710106)
Abstract
With the rapid development of computer and communications technology in the last century, the
computer network is accessing to grid era after Internet era and Web era. As a next generation Internet
infrastructure, grid is the recent hot research in the world. In this paper, the basic concept of grid is
introduced, the grid architecture is analysised, and the trend of grid is concluded.
Keywords: Grid;Grid Architecture;Trend
作者简介:徐庆征(1980—),男,山东临清人,助教,在读硕士,主要研究方向为现代信
号处理、网络规划。通信地址:西安市西安通信学院二系电讯交换教研室,邮编:710106,
邮箱:syesun@。
- 6 -