i .;
电子政 务 建设 中的信 息编 码 标 准化 探讨 木
汤 晶,陈家训
(东华大学 计算机科学与技术学院,上海200051)
摘 要:针对政务信息化建设中出现的“信息孤岛”及共享信息资源缺乏等问题,论述了G2G协
同工作元数据标准化研究的重要性。首先提 出了元数据标准的概念和总体结构 ,然后分另Ij介绍 了规范
化设计数据元 、代码和主题词的原则、方法和通用要求。
关键词 :元数据标准 数据元 信 息编码 主题词
政务信息化的逐步深入 ,促进 了政府工作的规范化 ,
提升 了政府工作的透明度及政府工作效率 。然而 ,随着电子
政务网络的逐步应用 ,一些原本不太明显的问题 日益突出,
例如:政务网上共享资源严重缺乏,已建立的政务信息 系统
成为众多的“信息孤岛”。造成上述问题的原因主要是人们
对政务信息的统一规划与设计没有引起足够的重视。相当
多的部门在电子政务建设中投入了大量的人力 、资金 ,而忽
视了标准化工作 ,只考虑到 自身系统需求 ,没有意识到各系
统之间的相互联系。这样不仅严重影响信息生产和信息服
务的经济效益,更造成 国家有限资源的巨大浪费。因此 ,在
电子政务建设中,通过标准化来实现系统 和部门间的数据
交换与共享 已经成为电子政务的必然要求。与电子政务建
设不可分割的数据标准化 ,尤其是作 为信息处理之基础的
信息编码标准化工作 ,越来越受到人们的重视 。
政务信息编码标 准化是信息编码标准 化工 作的一个
专业领域和分支 ,其核心是将信息分类 编码标准化技术应
用到 电子政务系统中 ,减少信息传递 的环节 和层次 ,促进
电子政务信息系统的数据 自动处理和系统间 的数据交换
与资源共享 ,保证信息的准确性 、有效性和一致性 ,促进技
术和业务上的互联、互通 、互操作。
l 信息编码标准化 的概念
信息(Information)是指 为某个特定 目的或在一定 范围
内集合起来的数据,而数据(Data)~0可 以被认为是有含义事
件的符号表示 ,一个单一含义可 以被用 于许 多不同的事
件。信息编码是将事物或者概念 (编码对象 )赋予具有一定
规律性 、易于计算机和人识别 与处理 的符 号 ,形成代码元
素集合。信息编码标准化 (Standardization of the informa.
tion coding)就是将信 息按 照科学 的原则 、方法进 行分类
并加 以编码 ,经有关方面协商一致 后由主管机关批 准发
·上海市科委科研基金 (编号 :03DZ05015)
— — 4 ——
布 ,作为有关单位在一定范 围内进行信息处理 和交换时共
同遵守的准则。信息编码标准化工作就是要从系统的角度
出发,在一定范围内,根据所有有关方面的利益并在其参
加下 ,把大量 的、分散的 、杂乱无章的信息 ,根据系统管理
的需要进行有目的、有秩序的组织 ,并予以定义、命名,确
定内容 、范围、表达方式等 ,使得每种信息在一定的分类体
系中都有一定 的位置和编码 ,以便在一定 的范围内实现管
理上 的共同认可并建立统一的语言、统一的标识 。
人们通 常借 助代码进 行手工方式或计算 机方式的信
息检索和查询。在用计算机方式进行信息处理时 ,信息编
码标准化显得尤为重要。统一的信息编码是信息系统正常
运转的前提。美 国从 1945年起就开始研究信息编码标准
化问题 ,1952年起正式着手物资编码标 准化工作 ,经过 6
年的时间完成了国家物资分类编码 。我 国从 1979年起着
手信息编码标准化工作 ,该项工作经历 了从单一标准发展
到体系标准 、系列标准,从 一个研究领域发展到多个领域 ,
从基础标 准向高新技术领域开拓的过程 ,逐 步建立 了一个
较完整的国家信息分类编码标准体系。国家信息分类编码
标准体系如图 1所示 。该体系直观、易于分析 ,较全面 、系
统地对整个信息分类编码进行 了标准化 ,对各级信息系统
建设具有普遍 的指导意义。
2 政务信息编码标准体系
政务信息资源涉及范 围非常广泛 ,包括政府部 门为履
行管理 国家行政事务 的职责而采集 、加工 、使用的信息资
源 ,政府部 门在业务过程中产生和生成的信息资源 ,由政
府投资建设的信息资源 ,以及 由政府部 门直接管理的信息
资源。同时 ,业已颁布多个与 电子政务领域相关的信息编
码国家标 准 ,因此 ,应根据国家信息编码标准体系 的框架
结构 ,结合 电子政务的实际情况 ,建立合理 、统一的政务信
《微型机与应用》2005年第 6期
维普资讯
信息编码标准体系
; !;
『 论I 定I l基础标准f I l 兰
标
准
化
法
术
语
原
则
方
法
信息编码在高新
技术领域的应用
啡 商务系ll自动化I1 ¨各领域 统中的l I系统中I I 翟 『I中的应 应用J J的应用I J⋯⋯。l l 用
区域 、
场所、
地点
信息
编码
标准
体系
时尚和
计量
单位
系统
标准
体系
机构
编码
标准
体系
人力资
源、自
然资源
和环境
信息编
码标准
体系
经济
结构
与经
济指
标标
准体
系
社会福
利 、社
会保障
和劳动
安全标
准体系
图 1国家信息分类编码标准体系
息编码标准体系的总体框架。构造科学、完整、有序的信息
编码标准体系,旨在汇集并参考现有国家标准,提出待制
定的相关国家标准。一方面明确标准制定工作的需求,另
一 方面反映标准化现状,为政务系统设计人员提供参考,
为进一步采用国际标准和国外先进标准提供支撑。
2.1标准体 系建立的指导思想
政务信息编码标准体系是电子政务信息标准化建设中
的一项基础工作。它不仅涉及政府运作的各部门、各业务环
节,而且涉及政务系统的总体设计、详细设计及其对信息集
成的需求,是一项涉及面广且十分繁杂的工作。建立信息编
码标准体系的主要目的不仅是进行理论研究,更重要的是
为政务系统设计人员提供资料和信息,提示设计人员密切
注意、积极采用国家标准,在国家标准尚未覆盖的领域,可
根据实际工作需要引进和采用国际先进标准,或借鉴业已
成熟的先进工业标准,切不可“自立门户”,否则必然会造成
巨大的人力、物力和财力浪费。因此,在政务信息分类编码
体系的分析设计过程中,坚持“着眼全局,兼顾各方,方便用
户”的指导思想,以使信息分类编码标准体系在电子政务信
息管理及政务系统后续开发与运行过程中发挥作用。
2.2政务信息编码标准体 系的结构
基本政务信息编码标准体系表由总表和明细表两部
分组成。总表分三个层次:第一层次为门类;第二层次为类
别 ;第三层次为项 目。
总表第一层次包含以下四个方面的内容:
(1)管理标准。由标准制定主管单位制定政务信息编码
工作的有关管理规定,这是电子政务建设中开展信息编码
工作的管理基础。规定中应明确开展编码工作时各相关单
位应承担的责任及需要完成的工作,形成的信息代码标准
如何管理及维护等内容。
《微型机与应用))2005年第 6期
组织
管理
信息
系统
标准
体系
物品
及其
相关
体系
的编
码标
准
科学技术
(包括文
献、专利、
标准、档
案等信
息)标准
体系
其
他
标
准
体
系
f2)基础标准。这些标准是由标
准制定主管单位贯彻和必须遵循
的、全国统一的基础性通用标准和
规定,是所有信息编码标准的技术
基础和方法指南 ,具有较长时期 的
稳定性和指导性 。
f3)业务标准。此项工作是建立
政务信息编码标准体系的关键,它
是针对政务应用领域(经济管理、国
土资源、信息产业、城乡建设等)的
标准,对具体的政务系统建设具有
指导意义。标准制定主管单位应根
据政务信息编码标准体系的总体
框架 ,结合政府内各部门的实际需
要 ,在直接采用国家或行业已有信
息编码标准的同时,自行编制待制
定的信息编码标准以形成具体的业务标准。
(4)相关标准。相关标准是与电子政务相关的专门领域
标准。虽然 目前还未正式颁布电子政务相关标准,但各项
标准的编制工作正在有条不紊地展开。《电子政务标准化
指南(征求意见稿)》和《电子政务六项标准(征求意见稿)》
都可作为参考的依据。
政务信息编码标准体系如图2所示。
政务信息编码标准体系
A.管理标准
A.1标准化工作管理标准
B.基础标准
B.1标准化工作基础标准
C.业务标准
D.相关标准
标
准
项
目
图 2 政务信息编码标准体系
明细表是 由总 表进 一步细 化 、扩展 而成的 ,有若干个
细目。标准体系所包含的A.1、B.1标准明细表如表 1、表 2
所示 。
3 信息编码标准化的方案步骤
(1)明确信息编码原则
一 5 一
一一一一一一一一;.一一 一一
维普资讯
i ;
表 1 A.1标准化工作管理标准明细表
序号 标准号 标准名称
1 建议制定 GB 信息编码的管理规定
2 建议制定 GB 信息编码的维护方法和规定
3 建议制定 GB 信息编码的注册规定
表 2 B.1标准化工作基础标准明细表
序号 标准号 标准名称
1 GBgr 7026—1986 标准化工作导则 信息分类编码的编写规定
2 GBgr 7027—20o2 信息分类和编码的基本原则和方法
3 GB,I’1Ol13 分类编码通用术语
4 GB,I’1771O一1999 数据处理 校验码系统(idt ISO 7064:1983)
5 GB,r 13016—1991 标准体系表编制原则和要求
6 GB,r 13959—1992 文件格式分类与代码编制方法
7 GB,r 16733—1997 国家标准制定程序的阶段划分及代码
8 GB,r 10o91—1989 事务特性表定义和原理
在对具体的电子政务信息编码时,必须遵循六项基本
原则。④系统性 :将编码对象按一定的规则加 以系统化 ,并
形成一个合理科学的分类体系。②一致性/兼容性:尽量参
考与之相关的国家标准 ,力求最大限度地与国家标准一致
或兼容。⑧惟一性 :在一个分类编码标准中,每一个编码对
象应只有一个代码,一个代码只惟一表示一个编码对象。④
可扩展性 :代码应留有适当的扩充容量 ,以适应不断扩充的
需要。⑤简明性 :代码结构应当尽量简单 ,长度尽量短 ,以便
节省存储空间和减少代码的差错率。⑥规范性:代码的类
型、结构以及编写格式要规范化 ,以提高代码的可靠性。
(2)采集信息
即明确编码对象,通常由标准主编单位提 出预定的应
用需求内容,相关单位提供信息。
(3)确定编码规则 ,建立信息编码模型
根据编码对象的性质和属性 ,选择适 当的编码规则。
编码规则 中应给出该标准的分类依据和采取的分类方法 ,
并给出标准所采用的代码类型、代码结构及编码方法 。通
常应由标准主编单位提出编码规则草案 ,经标准主管单
位、使用单位等部门共同讨论通过后确定。
信息编码模型是用来描述信息编码规则的一种工具。
通过信息编码模型,就可以对信息编码进行统一描述 。不
同的信息编码 主要体现在分类编码规则 的制订 以及信息
编码中码段(一个编码内具有意义的各分段信息称为码段)
的划分。流水号是根据信息本身所隶属 的类别由系统进行
自动排号的一种常用局部编码方式。流水号作为一种特殊
的局部编码 ,并没有严格 的编码规则 ,而是一种定 义在应
用领域 中的特殊规则 。对这种特殊码段 ,可 以通过对规则
的抽象而认为它也是一种特殊的编码规则。
一 个信息对象如领导活动信息 、公文等 ,都对应有一
个信息编码 。一个信息编码可 以包含 0~n个分类码段和
0~n个流水码段。码段对象定义一个字符集。因此 ,可以获
得信息编码的面向对象模型 ,如图 3所示。
— — 6 ——
图 3 信息编码模 型
(4)代码设计
编码规则确定后 ,应按此规则为编码对象编制代码。
编码时可人工编码 ,也可开发相应的编码器程序 由计算机
完成编码工作。在代码设计的过程中,必须采用系统工程
的观点 ,树立全局和整体观念 ,以系统整体最优为 目标 。要
考虑与其他信息 的内在联 系,作到相关代码兼容 ,提高代
码的适应性 ,减轻数据采集及填报工作量 ,减少数据冗余。
还应该注意那些 常常可能造成彼此 相互冲突的要求 ,例
如 :如果一种代码结构对于未来 的需要有充足的扩充能
力 ,则它就可能在某种程度上牺牲了其简明性。因此各方
面的问题都必须考虑周全 ,制定折衷办法 ,以达到最佳效
率 。代码设计应当遵循 GB/T 7027—2002(信息分类和编码
的基本原则与方法》或相应 的企业标准。代码编制结束后
应在计算机中形成电子代码表。
(5)编制编码标准
编码标准正文中应给出编码规则及分类与代码表。分
类与代码表是编码标准 中正文部分 的主体 ,由代码 、类 目
名称 、说明(或注释)组成栏 目的表格 ,并根据实际需要 ,可
适当增减栏 目。编制完成的编码标准应履行必要的审批手
续后方可在企业内发布 、实施。
(6)代码维护管理
代码维护管理是信息编码标准化的重要环节。标准制
定 、贯彻实施、维护管理构成了标准化活动的三个不可分割
的组成部分。维护管理 目的是促进标准化正确实施,适应实
际业务管理变化需要。维护管理主要任务是 :收集用户对编
码体系的要求和意见;判别这些意见和要求的合理性 ,确定
是否修改有关代码 ;制定代码修改方案并修改代码 ,报主管
部门批准后具体解决新旧代码的交替转换 ;承担信息编码
使用咨询及人员培训等。维护管理是一项十分重要的工作 ,
常常是牵一发动千钧 ,所以对代码的修改维护应十分慎重,
(下转第 13页)
《微型机与应用)2005年第 6期
维普资讯
生
表 1 HPJ3.V3.、mpiJava和
mpich并行加速比测试对比
并行加速 比 并行加速 比 并行加速比 矩阵规模 处理机数
(HPJava) (mpiJava) (mpich)
2 2.15 1.18 1.44 400 400
4 3.33 2.73 2.67
2 1.67 1.33 1.3l 500
{500
4 3.36 2.O1 2.O8
2 2.1l 1.55 1.54
600{600
4 3.8O 2.27 2.22
4 结 论
本文重点讨论 了 HPJava的特性和计算性 能。测试结
果表明,用 HPJava进行串行矩阵乘法时 ,性能低于 Java及
C的性能。但用于并行运算时 ,其性能显著地高于 mpiJava
及 mpich的性能。本文实现了 HPJava在机群环境下的应
用 ,给研究并行处理 的人员提供了一条实现并行计算的有
效途径。
在实际应用 中,解决大型科学 和数值计算 的并行计算
模式常采用 SPMD模式。HPJava对 SPMD模式提供了有力
(上 接第 6页 )
要由企业权威机构全权负责,要制定详尽 的维护工作计划,
并切实解决好新旧代码的应用交替。
4 制定信息编码标准时应注意的问题
4.1对编码人员的要求
由于信息 分类编 码是与计 算机技术 紧密 相连 的 ,因
此 ,企业 内从事 编码工作 的技术人员 除应 达到企业标 准
化人员一般 要求外 ,还应掌握丰富的计算机技术 ,尤其是
计算机网络技术。首先,从事企业信息分类编码工作的标
准化人员应较全面地掌握本专业的基础理论和专业理论
知识 ,如信息分类编 码术语 、原则方 法 ,国家 相关信息分
类编码标准的内容等;此外 ,该类人员还需掌握计算机网
络管理 、网络数据 库管理 和开发 、工业 自动化控制等知
识 ,对企业计算机技术的现状和发展趋势等有着较深刻
的了解 。
4.2重视编码的应用及管理
经过企业 内各部门的努 力编制出来 的各类信息编码 ,
只有真正应用到相关 系统中去 ,才能体现 出信息分类编码
工作 的价值。因此,必须重视编码 的应用和管理。在一些企
业中,如果编码工作的主管部门即标准化工作主管部门只
重视信息分类标准的编制和发布,而忽视信息分类编码的
应用及应用中存在的问题,则会造成企业建立信息分类编
码标准体系时 ,只注重编制编码标准 ,而对编码的应用疏
于管理的问题 ,其结果 只能导致二个极端 :一是代码利用
率低 ,辛辛苦苦编制出来的代码派不上用场 ;二是企业 内
《微型机与应用}2005年第 6期
的支持,也为分布式数据库的应用和发展提供了一个良好
的框架。更重要的是,HPJava在高性能计算方面正在努力
达到 HPF的性能,势必也给研究高性能计算的人员提供了
一 种基于 Java开发的选择。
参考文献
1 罗省贤,何大可.基于 MPI的网络并行计算环境及应用,成
都:西南交通大学出版社,2001
2 都志辉.高性能计算并行 编程技 术——MPI并行程序设计.
北京 :清华大学 出版社 ,2001
3 Carpenter B,Lee H K,Lim S B et a1.Parallel Paogramming
in HPJava.http://www.hpjava.org,2003
4 Zhang G,Carpenter B,Fox G et a1.The HPspmd model and
its Java Binding.http://www.hpjava.org.1998
5 Lee H K,Carpenter B,Fox G et a1.HPJava:Programming
Support for High-Performance Grid—Enabled Applications.
International Journal of Parallel Algorithms and Applica—
tions.http://www.hpjava.org,2004
(收稿 日期 :2005—01—12)
各部门使用代码混乱,造成代码泛滥。
4.3动态维护信息分类编码
对信息分类编码实施动态维护 ,是企业信息分类编
码标 准主管部门(或编码标准 的主编单位)必须 承担 的一
项工作 。由于企业 内的各类信 息多是在 随时变化 的 ,很
少 有一成 不变 的信 息 ,因此 ,要 求企业 信 息分类 编码 的
主管部门必须时刻跟踪信息的变化 ,对信息分类编码实
施动态维护 。如企业 内的机构变动 、人员进 出 、物 耗使用
等,必然导致与之相关的机构信息编码 、人员信息编码、
物流信 息编码发生 变化 。只 有对 编码实施 动态维护 ,及
时清除代 码表 中存 在的垃圾 数据 ,及时 补充新 的编码 数
据 ,才能保证代码表中存储的数据时刻是企业 内最新的
信 息 。
5 结束语
建立企业信息分类编码标准体系的工作 ,扩展 了企业
标准化工作 的新领域。标准化部 门和标准化人员应 以此为
契机 ,提高企业标准化工作 的管理水平 ,提 高企业标准化
人员业务水平,真正发挥标准化部门作为企业基础技术工
作主管单位在企业的生产 、经营、管理 中的作用 ,使企业的
标准化工作得以持续发展。
参考文献
1 GB/T 7027-2002.信息分类和编码的基本原则与方法.2002
2 丁雅娴,谢民.国家信息分类编码标准体系——信息管理系
统 的基石.世界标准化与质量管理.1999;f5)
(收稿 13期 :2005—01—10)
一 13 —
维普资讯