网络信息理解与信息共享技术
马建国
西南科技大学信息工程学院
教授 工学博士 mjg_my@
主要内容
研究背景
信息共享技术与信息共享网络的理论模型
大规模并播技术
UCL技术
广播型网格
移动网格
课题背景
带宽瓶颈
信息垃圾
语义障碍
数字鸿沟
课题来源
国家自然科学基金项目:“共享信息的第二
类网络”(编号:60272014)
国家863计划项目:“第五媒体物理链路传
输协议 研究”(编号:2002AA121063)
教育部研究项目:“基于UCL技术的精品课
程平台研究”(教高司2003-218)
四川省应用基础研究项目:“基于UCL的大
规模数据广播传输协议封装技术研究” (课
题编号:03JY029-017-2)
研究体系结构
信息共享理论
信息共享网络
并播技术 UCL技术
信息理解
网格技术
广播型网格 互补结构 UCL协议
文化网格 教育网格 UCL代理 MIS-Grid
网络层
理论层
技术层
结构层
应用层
信息共享技术与信息共享网络的
理论模型
信息共享技术与信息共享网络
的理论模型
物质共享与信息共享
信息系统的传输代价
信息网络的结构特征
典型信息网络分析
理论模型--物质共享与信息共享
世界是由物质组成的,质量、能量和信息是物质
世界的三个重要属性。人们早已认识到,物质的质
量和能量是满足守恒定律的。
物质共享
物质不灭定律指出:物质既不能消亡也不能创造,只能
从一种物质转化为另一种物质。根据这个原理,对于某一物
质质量为M的系统,被n个受体分成n份,则满足以下的守恒定
律:
M = (2-1)
理论模型--物质共享与信息共享
能量共享
同样能量也是既不能创造,也不能消灭。对物质系统间的能
量转换可由热力学第一定律描述。其数学表达式为:
Q = E2 - E1 + A (2-2)
在没有与外界交换能量的封闭系统中,对于一个能量为E的
封闭系统,j个子系统的能量分配满足如下的守恒定律:
E = (2-3)
理论模型--物质共享与信息共享
e1 e2
e4
e3
…
el
m1
m2
m3
m4
…mn
图2-1 总能量为E的系统能量分配 图2-2 总质量为M的系统质量分配
理论模型--物质共享与信息共享
图2-3说明了信息的共享并不是对母体的瓜分,可
以是无失真的复制。更一般的情况下,可以把信息
的共享看成是某种方式的映射关系。
原像:A 复制2:B
2
复制1:B
1
复制3:B
3
复制n:B
n
图2-3 信息的共享——复制
定义2-1:设映射fi:X→Yi , A X, Bi Yi 。记:
(2-5)
称 为映射 下信息集A的一个像,或称信源集A在 关系下的
一个信宿。记:
(2-6)
称 为映射fi 下Bi 原像或信源。
注解:
(1) 在映射fi下Bi 的原像 是唯一的,因为信源是同一的。
(2) 映射fi 的映射关系改变,可以在同一信源下生成不同信宿。
(3) 映射fi 是在理想信道下的情况,没有考虑编码和传输的失真。
理论模型--物质共享与信息共享
理论模型--物质共享与信息共享
定义2-2:当映射fi 的映射关系成为某种特殊的有序
的1-1映射时,即不改变原像的信息量和次序,称为
这种信息的保形映射或信息复制。
显然,信息复制是不改变信源的次序与信息量的一种
特殊映射关系。
定义2-3:信源通过某种映射关系形成信源的像的过程
称为信息的共享。
注解:
(1) 信息的传输可以看成是一种信息的映射或信息的
复制。
(2) 信息的共享并不会损失或者改变信息的原像。
理论模型--物质共享与信息共享
定理2-1:信息的共享不会损失或者改变信源的信息量和信
息次序。
证明:设信源X与信宿Yi构成信息共享关系。由定义2-3可知,
X与Yi形成信息的共享关系,必然会成为一种映射关系,设它
们之间满足映射fi:X→Yi , A X, Bi Yi 。且
(2-7)
为 映射下信息集A的一个像。由式(2-7)可知,映射
并不改变原像或信源 ,且原像或信源式由(2-8)表示,
(2-8)
由定义(2-1)注解(1)可知,此原像或信源唯一。
证毕。
理论模型--物质共享与信息共享
性质1:信息的共享不同于物质的质量和能量
共享,不是一种分配关系,而是一种映射关
系。信息的共享不会对信源造成任何信息的
损失。
性质2:信息的共享中信宿的数量是没有上限
的。因此,从理论上讲对信息共享者并没有
数量上的限制。
理论模型--物质共享与信息共享
在式(2-9)的信息系统中,对信息的分配、编码、
传输、存储、表示和使用环节中,唯有在信息的传
输过程中容易受信道影响,引入信息的失真,因此
根据1948年香农对通信系统的描述可抽象为图2-4
所示[8]。
理论模型--物质共享与信息共享
图2-4描述的通信系统实际上是将一般信息
系统抽象成信源、信道与信宿三个部分。
理论模型--物质共享与信息共享
可以简化成式(2-10)的形式:
(2-10)
由的讨论可以知道,在信息系统中信源
部分与信宿部分并不会对信息的共享造成任何
障碍,唯一可能给信息共享造成障碍的就是信
息的传输过程。下面就分析信息传输过程对信
息共享的限制问题。
信息传输的能量代价[8]
Eb=(焦耳) (2-24)
称为比特传输的能量极限公式。
假设全球50亿人,每人每天需要的信息为1Gbyte,则
信道分别传输这些信息需要消耗的总能量仅为
只相当于1个1W的电灯泡闪亮秒。这是一个
非常小的能量。
理论模型--物质共享与信息共享
信息共享与物质共享的差异为物质共享的本质是母
体的分配或瓜分;而信息共享的本质是母体(比特)
的复制或再生。
由于复制的份数没有上限,因此信息共享本当无冲
突,享用的人数也应当无上限。在信息的传输过程
中由于噪声信道对信息传输的能量消耗也是非常微
小的。
现代科学技术已经提供了复制比特的途径:通过点
对面的电磁辐射,在空域上远程复制比特,也就是
我们通常说的广播,营造无冲突共享的“信息阳光
”,回避用户数目受限问题,满足了人们对共性(高
热度信息)信息的需求。
典型信息网络分析
万维网
良好信息交换结构,不是最佳的信息共
享结构。
广播网
数字电视带动数字广播网络发展,如何
充分利用DVB网络提供增值服务。
网格
资源广泛整合,尽快投入应用。
信息网络
IP数据报
应用层
表示层
会话层
传输层
网络层
数据链路层
物理层
应用层
Internet
物理层
传输层
网络接口层
报文或数据
流
功能 概念性的层次 通过层间的对象
传输协议分
组
特定网络的
帧
OSI七层协议参考模型 TCP/IP的层次结构
信息网络
物理层
通信层
语义层
应用层
物理层
通信层
语义层
应用层
物理层
通信层
管
理
机
制
管
理
机
制
图2-10 具有语义的网络信息分层模型
信息网络的结构特点
信息的交换方式
随机网络与无尺度网络
科学家惯于将所有的复杂网络看作是随机网络。随
机网络中绝大部分节点的连结数目会大致相同,节
点与其它节点的连结数的概率分布方式遵循“钟”
形的泊松分布
与之相反,美国航空网则是无尺度网络的代表。它
存在拥有大量连结的集散节点。在这种结构的网络
中,节点与节点之间的连结分布遵循幂次方律,其
中大部分的节点只有少数连结,而少数节点则拥有
大量连结。从这种意义上来说,这种网络是“无尺度
”的。(Scale-Free Networks)
随机网络例子—高速公路网
无尺度网络例子—航空网
互联网结构特点--无尺度特性
无尺度网络安全的两面性
无尺度网络在遭受意外故障的强韧性能
要优于随机网络
无尺度网络在遭受蓄意攻击(攻击集散
点)的强韧性却非常低
数字系统中的知识金字塔
数字形式的文
本、图像、音
频称为数据;
赋以语义的数
据称为信息;
智慧
知识
信 息
数据数据
数 据
知 识
信 息
知识是信息
在时间与空间
积累的某种结
果;
智慧则是通
过对过去知识
和新信息的巧
妙整合,形成
决策的能力。
从应用层看网络的发展
应用
计算机
网页
应用
网页
计算机
网格
Web
因特网
小 结
信息的语义特征是目前信息研究的重要内容,网络的
层次模型应该依据网络技术的发展制定新的符合现代
网络技术发展的层次模型。网络的层次模型中应该包
括语义层。
信息的共享并不是物质的瓜分。信息的共享是信息的
复制,它主要受到传输信道中热噪声的限制。从理论
上讲,信息的共享并没有障碍。
互联网是一个无尺度网络。正是互联网络的“无尺度
性”才使得互联网在网络安全方面有两面性,即网络
在遭受意外故障的强韧性能要优于随机网络,无尺度
网络在遭受蓄意攻击(攻击集散点)的强韧性却非常低。
小 结
万维网是一种很好的信息交换结构,但并不是很好的
信息共享结构。万维网目前遇到的“带宽瓶颈”、“
信息垃圾”、“语义障碍”和“数字鸿沟”几大难题,
很难完全依靠万维网自身来消除。
正在走入家庭的数字电视具有巨大的市场。如何利用
这些传输网络为广大用户群提供多种数字媒体和数据
的服务在理论和技术上都是值得学术界重视的问题。
网格技术是计算机网络的重要发展里程。网格技术的
核 心 就 是 广 泛 的 资 源 整 合 , 变 “一 对 一 ”的
client/server模式为pervasive/grid模式。
并播技术
并播技术—基本概念
定义3-1:将数据广播的一个信道(在一个8M
有线模拟带宽上传输数据广播信息)划分成若
干的独立经营的子信道,从而形成的相互独
立经营的竞争机制,称大规模并播技术。
定义3-2:数据广播的一个信道所包含的所有
带宽资源称为总带。
并播技术—基本概念
定义3-3:一个基本的带宽资源称子带。
以总带为32Mbps,子带带宽为32kbps为例
32Mbps=4MB/s=
如果把32Mbps分给1024个ICP,每个ICP
32Kbps=4KB/s=
每一个ICP都拥有32Kbps永不断线的常在带
宽,经时间的累积,可以推送大量的数据进入
用户终端。
并播技术—基本概念
定义3-4:传输各子带UCL元数据信息的专有信
道称元带,或称语义信道。带宽一般与子带
相同。
定义3-5:包含一些子带的集合称群。本文定义
包含32个子带的集合,如果子带宽度为
32Kbps,一群的带宽正好为1Mbps。
定义3-6:ICP独立使用的信道称路。可以为一
个子带或N个子带。
并播技术的特点
高效利用数字电视网络,容易形成国家规模的
文化、教育等公共信息资源服务体系,最大限
度地实现全民信息共享。
• 基础设施平台与ICP分离,实现经营运作分开,
信息内容提供者ICP可以获得独立经营的环境,
可以形成良性竞争机制的可持续发展的经营体
系。
• 便于优秀文化、教育资源的广泛整合。
并播技术—两级复用模型
一级数据处理-第一群
节目源1 节目源2 节目源32
一级数据处理-第N群
节目源1 节目源2 节目源32
一级数据处理-第二群
节目源1 节目源2 节目源32
二级数据处理中心(32-/TS)
接收终端1 接收终端2 接收终端i 接收终端n
图3-5 大规模并播的两级复用系统结构
并播技术—数据复用协议栈
1:n32:1 32:1
节目源提供者
Application
DIP
UDP/TCP
IP
Ether Frame
TS
DVB
Application
DIPDIP
UDP/TCP
IP
Ether Frame
MDMP
UDP
IP
Ether Frame
MDMP
UDP
IP
Ether Frame
TS
DVB
一级数据处理中心 二级数据处理中心 接收终端
图3-7 数据复用协议栈结构
MDMP
数据复用的双循环复用器
信源32
信源5
信源4
信源3
信源2
信源1
去第二级复
用器
双循环FIFO 线性FIFO
TP(1,m)
TP(2,m)
TP(3,m)
TP(4,m)
TP(5,m)
TP( 32,
m)
TP(1,2)
TP(2,2)
TP(3,2)
TP(4,2)
TP(5,2)
TP( 32,
2)
TP(1,1)
TP(2,1)
TP(3,1)
TP(4,1)
TP(5,1)
TP( 32,
1)
数据复用的双循环数据结构复用器
复用实验
并播与复用技术小结
建立了大规模并行广播的描述体系,构建了大规模并
行广播系统构架。
以数字视频广播DVB技术为基础,结合IP协议与数据
广播协议,建立了基于数据广播的大规模并行广播传
输层次模型,确立其传输机制与IP/DVB报文封装机制。
建立了大规模并行数据广播的两级复用模型。设计了
基于二维循环FIFO的多路复用与轮播控制机制。在局
域网和DVB-C网络进行了大规模并播技术的两级复用
传输实验,验证了两级复用模型的合理性和可行性。
UCL--信息的内容理解
UCL--信息的内容理解
帧结构、物理地址
IP数据报
应用层
Internet
物理层
运输层
网络接口层
报文或数据流
概念性的层次 通过层间的对象
运输协议分组
特定网络的帧
图4-1 TCP/IP层次结构与信息理解的分层
信息理解的层次
UDP端口
分组
IP地址
应用层中文本文件在
信息理解分层结构
信息层次 内容 举例 理解方法
文件 文件的标
引
新浪网报到:萨达
姆
UCL体系
句 语义 萨达姆躲在一个地
窖里
产生式规则、框架知识表
示、语义网络
词 词义 美英联军 词汇库
数据 压缩算法
等
RAR、ZIP 压缩与解压缩软件
UCL基本概念
目前普遍采用的是将信息空间视为“按地址定
位”的空间,确切地说,是按信息“存储源地
址”定位的空间。如在Internet上广泛应用
URL(Uniform Resource Locator:统一资源定
位器)就是如此,而并不是真正的“资源定位
”。
统 一 内 容 定 位 UCL( Uniform Content
Locator)是网络信息资源的一种属性与内容
描述结构。
UCL的目的是解决网络信息资源的发现、查找、
识别、传输、控制和主动服务等问题。
UCL研究的关键技术
UCL技术规范设计
UCL的标引与传输
UCL的应用与主动服务问题
具有内容标引的网页服务系统
信源采集层
自动采集
手工采集
信源标引层
分类
标引
UCL编码库
信源
信源
信源
传输网络传输网络
内容解析层
数据流控制
UCL解析
资源服务层
信息过滤
建模
智能代理
图4-5 具有内容标引的网页服务系统
UCL编码库
信源空间
定义5-2:信源空间的内容分类是指将信源空
间Ω按照信息资源的某种内容特征而划分成为
有限可列的、具有层次结构的子空间,每一个
子空间都代表了特定的信息内容特征。
设信源空间Ω的基于某种内容属性的内容分类
g,即映射gi:A→Ci。记:
信源空间的内容分类
A
Ci
……
C1
C2
C3
…
g
源端UCL的编码标引与映射过程
ai
UCL框架库
标引
编码
UCL编码库
c(u(ai))
u(ai)
ψ(u(ai),c(u(ai)))
图5-2 源端UCL的编码标引与映射过程
网页信息内容标引元数据规范
类
属
元素名称 中文名 说明 举例
元素编码体
系
资
源
内
容
u
w1
: Group 大类 信息资源的一级分类 体育 行业标准
u
w2
: Subject 栏目 信息资源的二级分类 足球
自定义
u
w3
: Title 标题 新闻标题
中国出线
了!
文本描述
u
w4
: Key
words
关键词
信息资源主题、内容的
关键字或词组(建议使
用受控词汇)
世界杯、
杨晨
中国主题词
分类表、汉
语主题词表
u
w5
:
Description
简介 资源内容的文本描述 ……
文本描述
u
w6
: Language 语言 信息资源所使用的语言 简体中文
ISO 639-2
知
识
产
权
u
w7
: Creator 创作者
信息资源的制作者个人
或组织
新华社 文本描述
u
w8
:
Publisher
出版者
负责信息资源发布的实
体
.
com
URI
外
部
属
性
u
w9
: Date 日期
资源创建的日期或其它
相关的日期
2003-06-
25
W3C-DTF
u
w10
: Type 类型
资源的种类或形式(如
文本、图像、声音、软
件、数据等)
text
DCMI Type
Vocabulary
u
w11
: Format 格式
信息的数据形式、尺寸
以及操作指示
html
IMT
u
w12:
Classificati
on code
分类
代码
资源的学科分类代码
如:
GB/T 13745
-92
中图分类法
u
w13:
expansion 扩充 用户自定义
如:价格
等
行业标准或
自定义
知
识
产
权
u
w7
:
Creator
创作
者
信息资源的制作者个
人或组织
新华社
文本描
述
u
w8
:
Publisher
出版
者
负责信息资源发布的
实体
URI
外
部
属
性
u
w9
: Date 日期
资源创建的日期或其
它相关的日期
2003-
06-25
W3C-DTF
u
w10
: Type 类型
资源的种类或形式
(如文本、图像、声
音、软件、数据等)
text
DCMI
Type
Vocabul
ary
u
w11
:
Format
格式
信息的数据形式、尺
寸以及操作指示
html IMT
u
w12:
Classifica
tion code
分类
代码
资源的学科分类代码
如:
35
GB/T
13745-
92
中图分
类法
u
w13:
expansion
扩充 用户自定义
如:价
格等
行业标
准或自
定义
UCL网络课程的内容标引元数据
UCL 元素 字段类型 字段名称 映射码 说明
L1 课程 字符串 Course *13bit 一个课程对应唯一PID
L2 学科
分类
字符串 Subject *8bit 参照《学科分类与代码》(GB/T 13745
-92)或附录B
L3 年级 字符串 Grade 无 如大学一年级
L4 权益 字符串 rights 无 资源的权益人
L5 作者 字符串 Author 无 身份信息:学校、系、教师
L6 内容
简介
字符串 Description 无 如某章某节,主要内容
L7 适用
层次
字符串 Level 无 如大学本科、专科
L8 学时 整型数 Period 8bit 课程的总学时
L9 日期 日期型 Date 32bit 投入网站的时间
L10 文件
信息
字符串 File_info 无 课程的组成文件的信息
UCL技术的实验研究
UCL的标引(人工标引与自动标引)研究
UCL的两级复用模型实验研究
映射实验研究
UCL解析实验研究
UCL数据流控制实验研究
基于UCL的个人兴趣图谱研究
UCL代理研究
UCL技术的实验研究
解复用、
兴趣模型、
自动下载
自动
标引、
并播
复用、
播出
控制
接口
前端 终端
单向传输
文
化
资
源
或
教
育
资
源
双向互动
报告网页清单
用户
指定下载码 (网站、
栏目或学校、课程)
确定是否阅读(UCL
文字信息)
获得网页全文
指定关注对象(关注
词)
提取重要句子
镜象收存
并行广播
源端
1024
路网
站或
1024
路课
件
UCL在实验网络中的任务分解
框架建立
字段规定、协议规定
标引方式
标引与映射、标引与复用
传输研究
构建传输网络
接收研究
数据流控制、UCL解析、文件管理
使用研究
人机交互、兴趣图谱、智能代理
信源
端
信宿
端
传
输
图6-1 UCL在实验网络中的任务分解
UCL自动标引
图6-2 UCL自动标引示意图
UCL
标
引
库
UCL编码库
UCL结构库
网
页
截
取
文档
转换
UCL字段提取
UCL的映射机制
对于第j群k路的UCL向量可以表示为,则:
我们定义了α 、β、γ三种映射。
α映射:语义信道
β映射:文件头
γ映射:TS包头
α映射
称向量 在元带的映射为α映射。记为
定义总带中含有l群、m路、p元在元带中的α映射
向量为:
IP头 UCLβ映射集 原文件
β映射
γ代码
21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
群编号(1-256)γ
1
路(1-32)γ
2栏目γ3代码
UCL在源端的实验流程图
α映射
数据格式转换、γ映射
QAM/QPSK调制
传 输
自动标引
信源管理
人工标引
一级复用
群标引、β映射
播出策略
二级复用
数据准备
一级复用
数据格式转换
二级复用
图6-3 UCL在源端的实验流程图
传 输
多 路 信 源
数据流控制
存储器
用户
文件管理
Agent
α
α,β
γ
β
α,β 库容提醒
信宿端UCL解析与应用框架
用 户
文件管理
存储器Agent
数据流控制
用户兴趣图谱建立
图6-7 基于媒体网站的用户兴趣图谱 图6-8 基于媒体栏目的用户兴趣图谱
基于UCL的用户肖像模型
下载?
媒体结构到本体
结构的转换
显示
媒体结构库
人机交互
存储
存否?
读否?
本体结构库
用户兴趣图谱建立
AGENT
Y
Y
Y
来自广播型网格信息
下载控制
存储
控制
读写
控制
对搜狐网站自动标引后生成的UCL标引信息
传输层的接收端调谐对话窗
信宿端的UCL解析情况
UCL研究小结
要实现信息的主动服务,首先要对信息的语义
与内涵有足够的理解。信息理解与信息服务也是
分层次的。UCL是实现网络信息理解的一种重要
形式。
建立了信源空间和信源空间的内容分类模型。定
义了内容分类空间的UCL向量,为UCL的规范设计
建立了理论体系。
设计了具有内容理解的网页信息服务系统,分析
了内容标引在系统中的地位和作用,建立了信源
端网页信息内容标引、映射及编码实现机制,设
计了《网页信息内容标引元数据规范》,该规范
经过了标引、传输与应用实验。
UCL研究小结
研究了国际上最具代表性的由NIST工作小
组设计的IEEE 1484标准,分析了我国教育
部2000年开始试用的《现代远程教育资源
建设技术规范》和DLTS工作组的协议体系,
设计了《高等教育信息资源元数据与传输
协议》。该协议对于高等教育资源的内容
标引、传输和应用有一定价值。准备近期
向“教育部现代远程教育标准化委员会”
提交。
UCL研究小结
建立了信源端UCL的两种标引方式,构造了
UCL的多映射机制,并通过了实验验证,为
UCL进入实用化奠定了基础。
完成了信宿端的UCL解析与表示的实验研究,
在此基础上完成了应用γ映射对DVB网络的
数据流控制实验,建立了基于UCL的用户兴
趣图谱,研究了UCL智能代理与主动服务技
术。
广播型网格
广播型网格
定义7-5:信息网络中满足一定条件的信息节点称
为主流节点或主流媒体节点,记为M,用下式表
示:
• 什么是广播型网格?
具有大规模推送能力的,具有源端广泛信息资
源整合的,具有语义标引的信息服务系统。
具有语义信道的广播网格
DVB-C
DVB-T
DVB-S
……
DMB-T
Agent Agent
…
………
...
ICP1
ICP2
ICP3
ICPN
语义
信道
●
●
● ● ●
●
●
●
●
●
●
●●●
●
●●●
●
广播网格的结构特点--沙漏斗模型
信源端:广泛的信息资源整合
信宿端:更加广泛的用户群
低传输代价
无拥塞的传输网络
国家规模文化网格
国家文化网格的缩比实验
设计规模:32群1024路
实验信号总带规模:5群100路
调制方式:64QAM
传输协议在模拟频道的一个8MHz的带宽
内,调制效率为6bit/band,最大可传输
的比特率为:(余弦滚降系数为)
调制效率×模拟带宽÷余弦滚降系数
=6×8MHz÷=
传输内容
教育网格协议分层结构
用
户
层
协
议
传
输
层
协
议
网
络
层
协
议
物
理
链
路
层
协
议
Data
UDP Header
UDP报文
源数据
封装
课程/数据码流课程
标识
UCL
代码
DVB数据
封 装
IP报 文 分
片
IP Header
Data
IP Header
Fragment#1
Data IP Header
Fragment#n
Data
包头 IP_datagram_data CRC
-32
包头 IP_datagram_data CRC
-32
SYNC
0x47
Data
184Bytes
Flags
3Bytes
SYNC
0x47
Data
184Bytes
Flags
3Bytes
SYNC
0x47
Data
184Bytes
Flags
3Bytes
IP报文
大于MTU
传输复用
流
188Bytes 188Bytes 188Bytes
用户包头#1 Data 用户包头#k Data 用户包头#n Data
UCL专用
数据
课程#1
数据码流
课程#k
数据码流
课程#M
数据码流
应用物理链路
DVB/QPSK/QAM/CDMA/GSM/etc.
图7-5 协议分层结构
源数据
用户数据
分组
国家教育网格的用户模型
家 庭
镜 像
仓 储
或 服
务 器
用
户
浏
览
课
件
兴
趣
建
模 智 能
下 载
指定课程或学科
粗选课件
指定关注词
细选课件
提供给用户UCL
信息
实验网络
IP-DVB
网关
IP包
网站镜像
课件分发
实时课堂
源
端
网
络
DVB-C调制器
电视机
CATV电视
网络
分线盒 分线盒
……
用户计算机
DVB-C
机顶盒DVB-C接收卡
图7-7 实验网络
广播型网格的主要特点
源端资源的广泛整合 广播网格同万维网最大区别
是信息资源一体化,用户看到的不是远处数不清
的信息孤岛,而是一个真正的做到了时间、空间、
内容的广泛整合的服务。这个任务由独立运作的
ICP承担。
传输网络无共享冲突 按照互联网的方式传播,一
条信息要经过很多卡脖子的网关和路由器。广播
网格传输网络本质上无冲突、无瓶颈,因为它没
有大量的网关和路由。
广播型网格的主要特点
收端广泛的用户群 收端可以有无上限的用户群,
不会造成“车多必然路堵”的现象。有效地缓解了
带宽矛盾,尤其是无线或卫星信道。
大幅度降低成本,消除数字鸿沟 两个并播转发系
统,年运行经费一亿人民币,如每天在全国范围取
得一亿人时的效益,人时人均成本少于三厘钱,一
亿元的运行费用,只相当建两公里高速公路,国家
完全负担得起。广播成本得以除以用户数目,每个
用户只需承担微不足道的数额,信息服务的成本大
幅下降。
广播型网格的主要特点
消除语义鸿沟 源端使用统一规范的UCL代码,用户
在UCL代理的帮助下可以做到编者与读者的语义沟通。
消除信息垃圾 由于使用了UCL技术,从本质上杜绝
了非法信息的传播,彻底消除了信息垃圾的滋生地。
运营的可持续发展
信源端引入竞争机制,ICP独立经营。容易做到“耕者有其田”。
收端可以使用成熟的CA认证技术,真正做到运营的可持续发展。
由于与数字电视同网传输,充分利用了数字电视传输的技术和巨大的带
宽资源与完善的网络资源。
容易建立信息的社区服务机制,提供一体的,具有统一和地方特色的完
整服务。目前的智能社区已经基本形成硬件环境。
广播型网格小结
广播型网格是传播优秀文化与教育资源的重
要技术手段,广播型网格的建立有急迫的需
求。
研究了广播型网格的信源特征,提出了信息
节点的热度概念,建立了信息节点热平衡方
程,研究了信息的梯度与信息的运动特征,
建立了信息网络的主流节点的概念。
构造了广播型网格的拓扑结构和沙漏斗模型。
广播型网格小结
分析了“全国文化信息资源共享工程”发展中存在
的问题,提出了“国家文化网格”的研究目标,确
立了“国家文化网格”的结构,设计并实施了“国
家文化网格”的缩比实验。
论述了建立“国家教育网格”的必要性和可能性,
提出了“国家教育网格”的研究目标,构造了“国
家教育网格”的结构,设计并实施了“国家教育网
格”地面有线网络的缩比实验。
提出了自主知识产权的传输协议研究,网络信息的
Ontology研究,大规模的播控平台设计,低成本接
收终端研究,多接收方式研究和可持续发展的运营
机制研究是未来广播网格研究的重点。
具有互补结构的移动网格
基于信息共享技术的移动网格
背 景
移动电话的飞速发展,市场巨大,仅2003年
我国手机的一个小小的增值业务--手机短信
的发送量突破2200亿条,手机短信增值服务
市场的规模超过200亿元。
WLAN的发展
人们对便捷的移动与无线服务的需求强劲。
GSM、3G并不能满足这些需求。
信息的交换方式
单位信息传输代价函数
(b) 信息广播网络中单位信息传输代价
n n
F/n F/n
(a) 信息交换网络中单位信息传输代价
图8-3 单位信息传输代价函数
移动网络互补结构的信息共享模式
个性需求
用户
终端
共性需求
单向信道
双向信道
信息
提供
商
MIS-Grid Beyond 3G网络架构
DVB
广播信
道
GSM手
机
窄带
CDMA
其它宽
带移动
设备
3G
设备
WLAN
设备
DAB
GSM
DMB
超3G设
备
WLAN
窄带CDMA
3G交互
信道
MIS-Grid Beyond 3G特点
完全融合的业务。个人通信、信息系统、广播等都依
据用户的需求融合在一个无缝网络中。用户可以以一
种反映个人爱好的方式方便、安全地接入更广泛的业
务和应用。
多种多样的用户设备。用户可以使用各种档次的、可
方便携带的移动设备接入网络。
结构互补的信息共享模式将信息分为两类,把高热度
信息用广播信道传播,满足共性的需求。而个性化的
低热度信息和交互信息则通过点对点的双向信道传送,
这样不仅可以解决信道的拥塞,而且也节省了宝贵的
频带资源。这样一来,也会大大降低对占用带宽很宽
的媒体信息使用费用。
主要贡献
信息共享技术与信息共享网络的理论模型
分析了物质、能量与信息共享的各自特点,
较为系统地阐述了信息共享的理论架构。
建立了信息共享网络的模型,研究了信息共
享网络的基本特征。
建立了网络信息理解的层次结构。
构建了具有内容理解的信息服务系统基本框
架。
主要贡献
大规模并播技术
比较完整的描述了大规模并播技术,建
立了大规模并行数据广播的两级复用模
型。设计了基于二维循环FIFO的多路复
用与轮播控制机制。
在局域网和DVB-C网络进行了大规模并
播技术的两级复用传输实验,验证了两
级复用模型的合理性和可行性。
主要贡献--UCL技术
建立了信源空间和信源空间的内容分类模型。定
义了内容分类空间的UCL向量,为UCL的规范设计建
立了理论体系。
完整的建立了数据广播中的UCL标引、映射、传输、
解析、数据流控制机制,提出了用户兴趣图谱和基
于UCL的用户肖像模型建立方法,并进行了系统的
实验研究。
研究了UCL的人工标引与自动标引方法,并初步实
现了网站镜像中的网页自动标引和两级复用中的标
引机制。
主要贡献--UCL技术
完整的研究了α、β、γ三种映射方法,进行了
三种映射方法的两级映射、传输、解析和应用实
验研究。
研究了网络信息资源的媒体结构和本体结构,提
出了基于媒体结构和本体结构的语义地图概念。
语义地图的建立对于生成用户兴趣图谱以及建立
UCL代理都是十分重要的。
研究了建立用户兴趣图谱的方法,建立了基于媒
体结构的用户兴趣图谱方法,提出了由基于媒体
结构的用户兴趣图谱到基于本体结构的用户兴趣
图谱之间的转换方法。
主要贡献--UCL技术
发现了网络信息资源本体结构研究的滞后和应用的
紧迫性。
设计了具有内容理解的网页信息服务系统,分析了
内容标引在系统中的地位和作用,建立了信源端网
页信息内容标引、映射及编码实现机制,设计了
《网页信息内容标引元数据规范》,该规范经过了
标引、传输与应用实验。
依据IEEE 1484规范、《现代远程教育资源建设技术
规范》和DLTS框架建议设计了《高等教育信息资源
元数据与传输协议》。该协议对于高等教育资源的
内容标引、传输和应用有一定价值。
主要贡献--广播型网格
研究了广播型网格的信源特征,提出了信息节
点的热度概念,建立了信息节点热平衡方程,
研究了信息的梯度与信息的运动特征,确立了
信息网络的主流节点的概念及评判标准。
建立了广播型网格的层次模型、结构模型和沙
漏斗模型,概括了广播型网格的特点。研究了
广播型网格的实现原理、特点和关键技术,进
行了缩比实验研究。
主要贡献--广播型网格
研究了广播型网格的重要应用——“国家文化
网格”。论证了建立“国家文化网格”的必要
性,提出了建立“国家文化网格”的目标,给
出了“国家文化网格”的结构,进行了“国家
文化网格”的缩比实验。“国家文化网格”是
广泛整合数字文化资源如优秀网站、报刊杂志、
专利、数字图书、数字博物馆等,为全民提供
整体的数字文化资源服务。国家文化网格可以
通过互联网、有线电视网、数据广播卫星、地
面无线与移动网络传输。
主要贡献--广播型网格
论证了建立“国家教育网格”的必要性,
提出了“国家教育网格”的目标,给出
了“国家教育网格”的协议分层结构和
用户模型,建立了“国家教育网格”的
有线实验网络,进行了传输实验,提出
了“国家教育网格”需要进一步研究的
几个工作。
作者完成的主要
著作、论文和专利
第一作者论文
Agent Of Data Broadcasting Based On UCL,
2003 IEEE International Conference on
Natural Language Processing and Knowledge
Engineering, NLP-KE'03 Beijing, China. Oct,
2003,IEEE press.
2. MIS-Grid for Future Mobile Communications.
Electronics Technology of
3.数据广播中的UCL标引与传输机制.电子学报
,
4.广播型网格.计算机科学,
数据处理器的FPGA实现.电子与信息学报,
2003, :571-575
6.信息过滤技术及VJ实现.系统工程与电子技术
,, :382-385
7.国家规模远程教育平台实验研究.中国远程教育
,2002,7(186):38-40
8.广播型网格的用户兴趣图谱.电子学报.
9.基于信息共享结构的Beyond 3G网络架构.通信学报
(正在修改)
10.第五媒体实验研究初探.首届中国数据广播论坛论
文集 上海
出版的著作
《电子系统设计》,主编,高等教育出版社,
2004年1月出版,国家级十五规划教材(教育部立
项招标教材);
《EDA技术》,主编,清华大学出版社,2004年3
月出版;
《数字电子技术》,副主编,武汉理工大学出版
社,2001年9月出版;
《电子技术实验》,参编(现代数字部分),武
汉理工大学出版社,2001年9月出版
申报的发明专利
教育信息资源的语义标引方法
登记号:2004100345446
网络信息资源的语义标引方法
登记号:2004100345431
数据广播系统中的UCL嵌入方法
登记号:2004100345395
教育信息资源降低误码率的控制方法
登记号:2004100345427
正在研究的问题
网络融合问题——IP网构造互补结构
活媒体技术(active media)
智能机器人语音识别与控制技术
EDA技术
谢谢大家
希望与大家合作研究
请各位指正