口TELECOMMUNICATIONS NETWORK TECHNOLOGY No.1 0 NETWORK TECHNOLOGY
多语种域名的研究与发展
俞 阳
摘 要 多语种域名(IDN)对于消除互联网数字鸿沟、保护文化的多样性 ,有着重要的意义。但是
IDN不仅是项技术工程,而且牵涉复杂的政策问题。本文对 IDN的产生背景、发展状况、主要障碍进行
了介绍,重点分析 了中文域名的技 术特点 、实施 流程 ,并提 出了相应的 实施原 则和发展 建议。
关键词 多语种域 名 IDN ICANN ccTLD
1 域名体系结构和 IDN的产生
互联网域名是人们上网寻找信息对象的根据,是各
个站点在网络世界中的门牌号码和地址。域名 自诞生之
日起 ,便使人们摆脱了记忆一连串毫无逻辑联系的 IP地
址号码的烦恼 ,完成了互联网历史上的首次人性化革命。
1.1 现 有域名的体 系结构
全球的顶级域 (ToplevelDomain,TLD)被人为分成
两大类 ,即按照应用类别区分的 “通用顶级域”(Generic
TopLevelDomain,gTLD)和 “国家及地 区名称顶级域 ”
(CountryCodeTop LevelDomain.ccTLD)
l998年 l0月 ,国际名称与编号分配机构(ICANN)在
美国加州南部设立,通过与美国商务部签约 ,负责协调互
联网域名体系和码号资源的管理。相关政策的制定和推行
要遵照 自下而上,一致通过的原则,经过一系列公开、透明
的讨论、投票 ,最终由 ICANN理事会成员表决确立。
对于 gTLD,ICANN通过挑选合适 的注册管理机构 ,
并与其签订授权协议的方式进行监管,并采用“统一争议
解决机制(UDRP)”来处理由注册所引发的投诉;在授权协
议到期后,ICANN保有续约或变更注册管理机构的权利。
对于 ccTLD,除少部分注册管理 机构 (如 日本 的
JPRS)与 ICANN签约外,更多的国家和地区(包括 中国)
选择 自行 管理 各 自 ccTLD 的根 服务 器 ,但 同意 参 照
ICANN制定的国际惯例进行规范化的管理运营。
1。2 多语种域名 (IDN)的产 生和需求 的增长
近 lO年来,随着互联网在世界各地的迅猛发展 ,越
来越多的非英语国家网民开始希望域名能用本地区语言
文字来表示。根据 GlobalReach在 2004年 9月发布的统
俞 阳 中国互联网络信息中心助理研究员
· 4 ·
计报告 (http://glreach.corrffglobstats/)(见图 1),全球有近
65%网民(约 5.82亿)的母语并非英语。而英文域名对于他
们当中很多人来说 ,记忆和使用极不方便。数据还显示,非
英语母语的国家和地区构成了 66%强的世界经济 ;43%的
网民从不讲英语;90%的网民更喜欢浏览母语信息。
Online IL.m guage Populations
Total:801.4 M iIlion
ISept..2004)
8.4% Sl~ni,'sh
9. ‘
图 1 GIobalReach2004年 9月统计数据 图
应 广大网 民的响应 ,国际互联 网业界 早在 20世纪 90
年 代 末期 就 提 出 ,原 本 只 能使 用 63个 ASCII字 符
(“a~z”,“A ”,“0~9”,“一”)的域名,理论上也可以采用本
地语言文字来表示 ,这便是最初的 IDN设想 ,并标志着网
络应用第二次人性化革命即将揭开序幕。
对与互联网用户的意义主要表现在以下几点 :
维普资讯
网 络 技 术 《电信网技术)2005年 10月 第10期 口
f 1)保留当地文化并支持当地互联网用户喜爱的语言;
f2)IDN使用户能够浏览互联 网上的内容 ,并将用于
IDN电子邮件地址 :
f3)用 目标读者喜爱的语言与之沟通 ,因此能够更加
有效地了解 目标读者;
f4)保护 、巩固和拓展现有品牌 、商标和形象 ;确保品
牌在当地市场中的权益,消除任何乱用品牌的现象 ,便于
顾客辨识;
(5)符合国际技术标准 ,是使用域名系统的全球性工
具 ,稳定且可靠 ;
f6)使企业和个人能够构拓展和保护其在世界各地市
场中的网上形象:
f7)不需要将品牌意译或音译成英文单词即可用作互
联网地址的解析 ,使企业或组织能能够更加有效的用客户
所喜爱的语言进入目标市场;
(8)依靠高度安全可靠、可缩放的全球性基础设施为
其提供驱动力。
多语种域名概念的出台给广大非英语母语 国家的网
民特别是占据世界人 口22%强的中国人来说无疑是个福
音。它的发展不但互联网用户有着积极的意义 ,对注册服
务机构而言也是一个业务发展的机会。实现域名的本地
语言化不仅可以促进互联网更快的普及 ,缩小数字鸿沟 .
同时也符合 ICANN尊重各地域文化 .均衡发展全球互联
网的宗 旨。
2 多语种域名(IDN)总体发展状况和阻碍
2.1 技术和政策双管齐下
l999年 l1月 .一批 非英语 国家的互联 网工程师 在互
联网工程任务组(IETF)名下组建了 IDN兴趣小组 。专门
负责处理从英文域名到 IDN转换过程中所面临的技术问
题。在次年 IETF第 47届大会上 .IETF正式成立了 IDN
工作组,重点研究制定 IDN的相关技术标准。
2000年,亚太各国首先展开 了 IDN的自主研究 .纷
纷成立了研究联盟组织(如非洲成立了IDN研究联盟:中
国两岸四地建立了中文域名协调联合会——CDNC:中日
韩三国成立了解决汉字繁简体及异体字等效问题的联合
工程任务组一~JET)。
ICANN 在其 2001年 9月初于蒙得维的亚举行的会
议 上通过 了成立 IDN委 员会的决议 。该委员 会 旨在对涉
及 IDN的政策问题进行总体协调,并向ICANN理事会提
出有关 IDN技术、管理、政策和法律事务等各方面建议 。
CNNIC工作委员会主任委员胡启恒院士出任该委员会委
员。
2003年 6月 20日,ICANN通过并签署 了《多语种域
名实施指导原则》,标志着 IDN工程在全球全面启动。代
表 gTLD注册管理机构主流声音的 VefiSign和 Affilias公
司均明确表示支持该原则 ,中日韩三国更是对此注入了
极大的热情。
2003年 3月 。IETF先后颁 布了 RFC3490,RFC3491
和 RFC3492.分别解决了非 ASCII字符的编码方法 、字符
过滤(不可见的字符不能用于 IDN)以及 IDN应用体系结
构的关键技术问题 。
经过全球各家顶级域名注册管理机构和服务商的共
同努力 ,目前 已有超过 350种的语言(含文字变体 )可供
人们注册和使用域名,形式诸如 IDN.com(gTLD)或 IDN.
cn(ccTLD)。
以全球最大的专业互联网信任服务提供商 VefiSign
为首的世界各大域名注册管理和服务机构纷纷宣布支持
IETF公布的 IDN标准。
2.2 发展的障碍
技术上不存在瓶颈 ,阻碍主要来 自于政策的协调 。
ICANN对任何对互联 网基层设施一根服务器的修改都
十分谨慎。且任何变更都要由 ICANN 报批美国商务部准
许才可执行。
对 于一 个典 型的英语母 语 国家 ,美 国始终 没有给 予
IDN足够的重视。虽然 ICANN曾在 2000年成立了 IDN
特别工作小组 ,但并未长期加以扶持,致使小组在 2001
年提交最终工作报告之后在组织结构上解体。ICANN的
理由是 :IDN相关的一系列技术标准还没有形成 ,《指导
原则》还需要在很大程度上加以完善。至此 ,ICANN将重
担转移给 IETF,只是在每次大会上为 IDN专门安排一个
为期半 日的研讨会 ,以观后效。
IDN在国际上的发展并不均衡。很多有 IDN需求的
国家和地区由于经济和技术实力赢弱而无力研发和推行
IDN。另一方面 ,由于文字和语言在书写习惯(包括方向)和
辨识上的差异,各种语言文字在编码解析方面难易程度不
同,这从根本上决定了全球 IDN发展步调不可能一致。
近来 ,“网络钓鱼”(恶意注册与知名域名拼写近似的
域名 ,故意混淆并从中牟利)问题引起业界哗然 ,由于部
分 IDN 的拼写与某些英文域名过于相近 ,人们很容易受
到 欺 诈 ,甚 至 会威 胁 到 根 的稳 定 ,为此 美 国政 府 和
· 5 ·
维普资讯
口TELECOMMUNICATIONS NETWORK TECHNOLOGY No.10 NE.r、~ORK TECHNOLOGY
ICANN对 IDN 的推行更为审慎 ,以至于 ICANN 总裁
PaulTwomy及理事会主席 VentCerf明确表态要对 IDN
亮起红灯。
3 打破坚冰 。从中文域名开始
虽然 ICANN将一盆凉水泼向饥寒交迫的 IDN,好在
它还留有回暖的机会。相对于其它语种域名发展的停滞 ,
中文域名 由于有着众多技术精英和语言学专家作 为后
盾 ,发展势头之强劲,令业界同行倾慕。
3.1 CNNIC 中文域名 系统
实现中文域名需要解决以下关键问题
(1)要与英文域名的技术和体系结构相兼容
即字符的编码方法 、字符过滤和规范化以及应用体
系结构这三方面兼容 。(RFC3490,RFC349l和 RFC3492
已经解决)基于 CNNIC的评估,该国际技术标准所采用
的 Punycode编码也是对中文域名字段长度的限制最低
但效率最高的一种编码方案。
(2)“.中文”域名的寻根问题
国内 目前已经设 “.中国”、“.公 司”和“.网络”为合法
顶级域,但全球互联网域名体系中还没有设置这类中文
形式的顶级域 ,所以中国必须 自行解决其互通性。国内的
互通可通过设置境内的中文域名根服务器来实现,但全
球的互通就必须取得 ICANN的正式授权。
(3)繁简字体等效
由 CNNIC倡导成立 的 JET所研究制定的 《中 日韩
IDN注册和管理方针》较为全面的诠释了汉字繁简体及
异体的等效原则 ,并在英文句号“.”的基础增加了中文句
号作为 IDN的分隔符,省去了用户在输入域名时切换中
英文输入法的麻烦。该方案已经升级为国际通用的标准
之一 ,被 IETF编号为 RFC3743,并于 2004年 4月 14日
发布。
由于繁简体汉字之间存在一对多、多对一甚至多对
多的对应情况,故此很难通过纯粹的技术方案予以解决 ,
必须配合以相应的注册政策。当前,CDNC已经联合 JET
提出了《多语种域名注册和管理指导方针》的综合性解决
方案,正在逐步完善的过程中。
CNNIC中文域名的技术方案随着 IETF出台的一系
列 RFC得以确定。CNNIC中文域名系统的实现方案是在
“符合内地中文域名用户习惯,保证两岸 四地互连互通”
原则下 ,在 CDNC范围内技术共享,协作开发而制定的。
. 6 .
目前 ,中文域名系统已经正式进入了应用阶段。相
对于其他 IDN,具有明显 的技术优势 :首先 ,高度兼容 ,
全球通用。第二 ,繁简转换 ,两岸互通。第三,使用方便 ,
运用 面广 。
3.2 ccTLD域名的全中文化机不可失
(1)全中文域名
全 中文域名是中文域名发展的最终形态,这其中包
括三个层次的含义:首先,域名形式是全中文的,即“中文.
中文”,且繁简体通用,而不是“中文.tom”、“中文.cn”等含
有 ASCII形式后缀的格式 ;二是中文域名的核心解析技
术为中国自己所有,解析服务器应设在中国境内,而且能
和 ASCII域名体系进行无缝连接 ;三是当域名发生纠纷
时,根据本国的争议解决机制并通过中文域名注册管理
机构授权的境内争议解决机构即可解决争端。
由于IDN化 gTLD要对主根服务器做较大修改,故此
现阶段不易推行 ,但 ccTLD的根服务器多由各个国家和
地区自行负责运营,且国家及地区的称谓相对于 gTLD的
译法更为统一 ,IDN化 ccTLD只需最终修改主根的一个
记录,不会对 DNS的稳定运行造成丝毫影响,故此可行。
(2)时机到来
非英语母语国家的政府逐渐意识到 IpN应用的重要
意义,普遍加大了对 IDN研发机构的支持力度。近一两年
来 ,网民特别是域名注册人对本地 ccTLD的价值有了全
新 的认识,多个 ccTLD的注册数量呈加速增长态势 ,其
中.CN域名增速尤为明显。
从图2可以看出,自2000年 1月推出升级版中文域
名系统以来 ,CNNIC通过长期测试 ,已经掌握了技术要
领 ,完全有能力按照 IETF颁布的技术标准推行 中文化
CN域名 ,且对现行 DNS系统的安全和稳定不造成任何
负面影响。相反 ,如果不及时推行官方解决方案 ,用户出
于迫切的需求 ,很可能盲 目开发或选择替代品,一旦管理
时空,会对互联网的安全稳定构成很大威胁。
CNNIC授 权 的 中国 国 际 贸易 仲 裁 委 员会 (http:
//dndrc.cietac.org/cietac.jsp)和香港 国际仲 裁 中心 (http:
//dn.hkiac.org/cn/cns
_
welcome.htm1)有着多年的域名仲裁
实践 ,在解决中文域名争议方面经验丰富。可见 ,中文化
CN域名万事具备 ,势在必行。虽然很多 ccTLD的多语种
化还存在较大难度 ,全球无法同步实现 ,但中国作为目前
网民数量全球第二,ccTLD域名注册量亚洲第一的互联
网大国,应当率先为各国树立良好的榜样。
(3)实施原则和建议
维普资讯
网 络 技 术 《电信 网技术}2o05年 10月第10期口
/
/
/ 72294#,
/
/
/ 622534
576937
543B∞
/ 504876■
475879I1 ■
∞l1 ■ ■
Jn lreb ■.r 卫^r May I1lL J1d u^g Sep 0ct Nov Dee
图 2 2005年 CN域名 注册增长趋 势图
根据 CDNC会议 的精神 ,两岸 四地(大陆 、香港 、澳
门 、台湾)联合 向 IETF和 ICANN提交 了有关 IDN化
ccTLD的建议书,主要原则包括:
●优先推行多语种化 的 ccTLD,例如“清华大学.中
国”;“联想.corn.中国”;
●为方便起见 ,在推行的初期阶段 ,每个 ccTLD只
选用一种文字(含变体 );对汉字而言就是大陆使用全简
体 ,港 、澳、台选择使用全繁体 ;
●各 ccTLD注册管理机构要获得本国或本地区政
府部门的全面支持 ;
●由ccTLD注册管理机构 自行选择 IDN使用 的字
符集 ;
●向 ICANN提交正式的开通申请 ,并在申请材料中
明确写出推行该 IDN化 ccTLD的优缺点 ;
●将 IDN化的ccTLD以 IDNAPunicode的形式在根
DNS服务器中注册并运行。
此外 ,CDNC还建议 ICANN从其通用名称支持委员
会 (gNSO)和国家及地区名称支持委员会 (ccNSO)以至
于在理事会中选拔一批经验丰富的域名系统工程专家组
建一个独立评估委员会 ,对未来 IDN化 ccTLD的申请进
行公开、透明的评估审核。委员会承担对申请单位资格认
证的职责;申请书需由 ccTLD注册管理机构或由该国家
或地区政府指定的机构提交 ,并需满足的条件是 :该国家
或地区有相当大的1DN市场需求,申请机构需具备足够
的技术力量 、设备 、资金和人力资源 ,得到当地政府 的支
持,即申请时需提交政府部门的书面许可。建议的流程如
图 3所示 。
评估委员会要对估结果进行总结并向公众和 ICANN
理事会发布评估报告 ;当且仅当 ICANN理事会表决通过
申请方资格后方可正式开通 1DN化的 ccTLD注册服务;
如果 ICANN理事会驳回申请 ,申请方需在一段时间内修
改完善其试运行系统 ,待准备稳妥后再次提交 申请 ,进行
下一轮评审流程。
图 3 CDNC 建议的流 程图
3.3 以中文域名带动其他 lDN的发展
中国是世界上最早倡导发展 IDN技术 的国家之一 ,
也是 IDN研发环境相对优越 的国家。我们深切体会到 ,
IDN是项长期且复杂的工程,中国所取得的阶段性成就
可能只是迈向成功的第一步,但它却能在很大程度上鼓
舞同业人士的研发热情 ,从而带动整场信息革命。
4 结束语
本文介绍了 IDN的由来,需求的增长和在全球的发
展态势,强调 IDN不仅是项技术工程,更是涉及到繁杂的
政 策 问题 ,二者 的共 同配合是 1DN 深入发 展的保证 。
IETF和 ICANN对 1DN的发展方向和程度起着决定性的
作用 ,但作为以美国人为主导 的这两大国际互联网组织 ,
其局限性是无法在短时间内消除的。为防止以美国为中
心的英语语言占据互联网单极世界 ,并通过技术极仲裁
标准 ,在互联网世界里拥有绝对权威地位的平衡 ,作为 Et
渐崛起的互联网大国,中国在研发和推行 1DN方面责无
旁贷。虽然实现全中文域名的条件还不十分充足,但从
IDN化 ccTLD作为切入点 ,在确保根 DNS服务器安全及
稳定的前提下向 IETF和 ICANN提出较为合理可行的解
决方案,有利于得到国际社会的认可。制定并实现这一 目
标的重要性并不仅仅体现在经济的 、人文的层面 ,其在带
动其他种类 IDN的发展和互联网治理方面有着更为重大
的战略意义。
(收稿 日期:2005.09-13)
. 7 ·
圆圈囝
维普资讯