第六章 数字电视与高清晰度电视
6.1数字电视概述
6.1.1 数字电视概念
数字电视指的是将模拟的电视信号变换为数字形式的电视信号
(更先进的电视摄像机应直接获取数字电视信号),然后进行传输、
处理或进行存储的系统,或还原成图像(可先还原成模拟信号)。
数字电视信号的存储媒质
可以是各种半导体存储电路
(RAM、ROM、E2PROM等);
也可以是视频激光光盘(VCD、
DVD)或HDD,后者就是永久
性的存储媒质。为了减小数据
量,常常对数字电视信号进行
压缩编码后再传输或存储。
5.1.2数字电视的优点
(1) 数字电视的抗干扰能力强 ;(2)数字电视机稳定可靠,易于调整,
便于生产 ;(3)数字电视信号便于与计算机或其它数字设备接口;
(4)利用数字电视信号可以实现模拟信号难以得到的信号处理功能 。
6.2 电视信号的编码
6.2.1 电视信号的数字化
模拟电视信号转换为数字电视信号的过程是模拟/数字转换编
码过程 (称可为PCM调制脉冲编码调制,由A/D转换器实现),由数
字电视信号转换为模拟信号则称PCM解调过程(由D/A转换器实现)
。
我们知道A/D转换是对模拟信号进行取样、量化的过程,将连
续 ( 幅度和时间 ) 的信号变离散的 n 位的二进制数字码。设离散值
的最大个数为M,n 与 M 的关系为
2n -1 =M。
A/D转换输出可以是 n 位平行码,也可以是数率为n fS 的串行码(为
采样转换频率)。
量化过程(时域相乘,频域卷积)与频谱
根据取样定理,当信号的最高频率为fm时,应有fS ≥2fm ,实际上
为了便于D/A后利用滤波还原信号,应有fS ≥ fm 。
n = 3,M = 7
频域
时域
理想低通滤
波器特性
取样函数
fS/2
6.2.2 图像信号的编码方案与参数确定
彩色图像信号通常有两种形式:彩色全电视信号(Y/C);亮度
信号/色差信号(Y / R-Y、B-Y,也可称为分量信号)。因此对图
像信号的PCM编码也有全信号编码和分量编码两种,数字电视系统
宜用分量编码,电视接收机中的数字化处理宜用全信号编码。
1.全电视信号编码
(1) 取样频率
由于取样过程是非线性过程(时域相乘),在对对全电视信号
采样量化时,取样频率 f
S
的选择,除了要满足取样定理外,①要考
虑采样后的信号中f
S
与 f
SC
的差频的影响:当 fS=3 fSC或 fS=4 fSC时,
f
S
与 f
SC
的差频将落在Y信号的频谱间隙中。② 应使取样点在屏幕中
的位置固定,且满足正交取样条件。
以PAL制为例,当 fS=4 fSC
时[ fSC=(283+3/4) fH +25 ],
即一行中有(1135+4/625)个取样周期。每帧的取样点个数为整数
{ 625×(1135+4/625)个取样点 },两相邻帧间取样点的位置相同。
相邻行(奇、偶两场)的起始点相隔313×(1135+4/625) 个采样点,
也是近似整数 (仅差),满足正交结构。fS=4 fSC的另一好处
是因fS/2与fm间有较大间隔,可以降低模拟低通滤波器和数字滤波
器的设计难度。(但码率高)
(2) 编码位数
① 量化信噪比
对于经过γ校正的图像信号,一般都采用均匀量化,即用线性
编码。设单极性图像信号的变化范围为0到1,分为2n个量化层,
每个量化层高为2-n。由于均匀分布,量化误差的均方根值:
满量程量化信噪比:
即量化位数每增加一位,信噪比提高6dB。实验表明:当n = 7 、
8(即将信号量化为127至255个层时),人们已很难感到量化的影响
(但对于未经γ校正的图像信号,则需要量化位数应大于11),由上
式可知,对应的量化信噪比约为50~60dB。
② 全信号编码时的数据速率
以PAL制 fS=4 fSC、n = 8(8位A/D转换)为例,总数据速率约为
4××8=
由此可见,数字图像信号的数据速率是很高约。每一帧的数据量为
或。
2.分量编码
分量编码就是对Y、R-Y、B-Y或三个基色分量R、G、B分别编
码,进行并行传输或时分复用传输。
(1) 取样频率 fS 的选定原则和标准
①选定原则
· fS应大于最高频率(Y:~6MHz,色差2 MHz)的倍。
· 为了得到正交的点阵结构,取样频率应为行频 fH的整数
倍。
· fS是50Hz /625行、60Hz/ 525两类行频的公倍数,以为了便
于不同电视制式转换。
· 亮度信号的取样频率与色差信号的取样频率之间有整数倍
的关系,以使两者的取样点能重合或有固定的位置关系。
② CCIR(国际无线电咨询委员会)的分量编码国际标准
对Y / R-Y/B-Y的取样频率为
准。( fS = = 858 fS 525行 = 864 fS 625行,
fH 525行 = )
低标准: 4:1:1/
(2) 数字有效行(内的信号样点数)
数字有效行的数据由每行必须进行处理和存储的取样点构成,
有效行期间包括了正程。两种制式的数字有效行均为亮度信号样点
数:720、色度样点数:360个,便于两种制式的转换。一行的起点
定在行同步前沿脉冲的中部。PAL制的有效行由样点133至852构成,
而正程对应的样点为142至844。
(3) 编码位数和排列
亮度信号和色差信号分别规一化为0~1及~+的范围,
并都编为8位线性码。由于原来的R-Y最大值为,B-Y的最大
值为,故要对R-Y和B-Y进行压缩,压缩比分别为
k R-Y = B-Y =
压缩后三分量Y、(R-Y)、(B-Y)的表示式为:
Y=++
(R-Y)=; (B-Y)=+0. 5B
Y编为自然二进码,双极性的(R-Y)、(B-Y)编为偏移二进制码,
即对应自然码的0,+为255,零电平为128。为了防止信号
过载、直流漂移,256个量化级并不全用。亮度信号的黑白电平对
应于16至235量化级,色差信号则在底部和顶各留16个量化级。
分量编码的数字信号在传输时的数据序列:
(B-Y)Y(R-Y) (Y) (B-Y)Y(R-Y) (Y)
这里(B-Y)Y(R-Y)是空间同一取样点的数字,而(R-Y) (Y) (B-Y)中
的(Y)是仅有亮度取样的空间取样点的数字,它规定在一行的偶数
样点上。 (B-Y)
Y
(R-Y)
Y
(B-Y)
Y
(R-Y)
Y
只对亮度
信号采样
对亮度色度
信号都采样
3.电视伴音信号的编码
由于伴音与电视体制没有确定的关系、编码比较简单。模拟伴
音信号的频带为20Hz至15kHz,高质量的伴音为20Hz至20kHz。对
于15kHz信号取样频率一般取fS=32kHz。对于20kHz信号,取样频
率可取fS=48kHz。取样频率应与图像取样频率保持固定的关系,
从同一时钟源得到。在PAL的分量编码时,若仍采用48kHz取样频
率,就可以保持这种关系: ÷ 375 ÷ 3 × 4 = 48kHz
伴音编码的位数要比图像编码的位数多。这是因为伴音信号的
动态范围大( 90dB 以上),高质量的伴音要求很高的信号噪声比,
应有85~90dB的信号量化噪声比。由上面的均匀量化的信噪比公
式,则均匀量化所需的编码位数为13至14位。在演播室的高质量话
音编码中,若要对低电平的声音仍有高的信号噪声比,编码位数甚
至要取到16位。
伴音信号由于信号幅值分布的特性(非均匀分布,幅值大的概
率小)以及人的听觉持性,也可以采用非线性编码,这样n=11、
12时也可以得到很高的声音质量。虽然伴音编码的位数比图像编码
的位数多,但因是低速编码,反而更容易实现。
6.3 频带压缩编码
◎ 为什么要进行频带压缩编码
一路标准清晰度的数字电视信号的码率是很高的,例如4:2:2
分量编码彩色图像的码率为(+2×)×8=216Mb/s,即便是
采用
模拟电视信号的频带(模拟信号一个频道为8MHz),根本无法实现。
◎ 如何进行压缩
消除电视信号中的冗余成分:
① 空间冗余:相邻象素/行 变化小;
② 时间冗余:相邻帧变化小,具有相关性;
③生理冗余:人的视觉惰性,如对运动的和突变(如轮廓边界)
的图像的分辨力低等
④ 频谱冗余等
◎ 具体的压缩频带方法 :
预测编码(主要消除时间冗余和生理冗余)
变换编码(主要消除空间冗余)
其它压缩码率的措施
6.3.1 预测编码
基本含义:
从已知信号推测未来信
号。
目标:
减小空间和时间冗余 。
在图像预测编码中, 人
们力求根据图像或信息所存
在的相关性,推测未来图
中*人**和国 → 中华人民共和国
1.预测编码的原理
差分脉码调制(DPCM)
像或象素的可能值。大量实验证明,一般图像的相邻两帧只有10%
以下的象素的亮度值会有超过2%的变化,而色度只有1%以下的变
化。毫无疑问,预测编码技术应用到图像处理中是非常正确的。当
然,预测编码仅对非独立信源起作用。
预测值是已各点量化值的线性组合
ai是预测系数 。当序列的统计特性已知时(如相关函数),可以得
到这些系数的最佳值,使得预测值与样值的预测误差最小。
待编码取
样序列
量化后数
字序列
预测值
(1) 非均匀量化编码 + 固定字长
非均匀量化编码:对出规概率大的小信号细量化,对出现概率
小的大信号粗量化。5bit / pel的非均匀量化可以获得与 8bit /
pel
均匀量化大致相同的图像质量。
(2) 均匀量化 + 可变字长编码
根据熵编码原理,对概率大的小差值信号编为小字长码(位数
少,去掉前导零);而对概率小的大差值信号编为大字长码。
DOCM预测编码结构简单,易于实现,压缩效率高;主要缺点
是抗御误码的能力差。
2 .自适应预测编码及运动补偿预测编码
实践证明,人眼观看物体细节的相对分解能力与其空间频率
(物体的细小程度)和时间分辨率(物体运动的快慢)有关。一般
情况下,可以认为人眼在观看物体(或图像)时,最大空间分辨率
与最大时间分辨率的乘积近似为常数。根据这一点,可以对高速运
动的图像赋予较大的量化步长,而给与较高的传送速度;对低速运
动或静止的图像赋予较小的量化步长,而给与较低的传送速度。
运动补偿是一种对活动图像的帧间编码技术,目的是根据活动
图像相邻帧间的时域相关性,尽可能消除这部分冗余。
6.3.2变换编码
将图像中的像素按区域分成一些包括M×N个像素的许多方块。
这些像素点的取样值构成一空间(设为X,Y二维)的数字阵列,然后将
它们变换到由正交矢量构成的变换域中,再对这些变换域中的阵列
系数进行编码发送,接收端通过逆变换恢复原数据。实用的变换有
富里叶变换、离散余弦变换(DCT)、沃尔什(Walsh)变换等。
变换编码压缩数据的原理:图像空间存在相关性,在变换域中,
各空间频率分量是不均匀的,即空间频率低的区域信号幅度大,高频
区域信号幅度小。若根据统计特性,低频部分编 n 大的长码,高频
亮度
部分编 n 小的短码(与
均匀量化 + 可变字长编
码类似),则平均码长和
总的码率都会下降,达到
压缩码率的目的。
离散余弦变换压缩率
最高,有快速算法,能实
现实时压缩;沃尔什变换
易于硬件实现。
6.3.3 其它压缩码率的措施 (利用图像信号的某些特性进行压缩
)
1.亚奈奎斯特取样
根据取样定理,应有fS≥2fm,若不满足此条件,会发生频谱混
叠而失真。然而,由于视频信号存在较大的频谱间隙,如果恰当选
择 fS<2fm采样的频率,使频谱折叠区域落在原信号的频谱间隙中,
就不会发生频谱折叠失真。
视频信号频谱:n fH±m fH, 取
则折叠频率为
低通特性
梳状滤波
的特性 2.同步信号的编码
电视信号的行逆程和场逆程
中,只有同步信号、消隐信号和
色同步信号。它们所携带的信息很少,但占据的时间却很长。数字
化过程中,没有必要对这些逆程信号的全部进行波形取样编码,也
没有必要逐行、逐场传送这些信息,而只要对行、场定时信号单独
编码,插入到图像数字信号中即可。
离散余弦变换DCT编码压缩系统简介
DCT
IDCT
其中:
二维DCT变换是一种线性变换,可以分解成两个一维DCT变
化的乘积。特别是当M=N时,二维DCT变换可用矩阵表示:
例:8×8亮度子块的DCT编码压缩和解码 JPEG
8×8亮
度子块
DC
DCT
第一步:DCT变换
DCT编码压缩
JPEG亮度量化矩阵表
第二步:量化处理降低每个DCT系数的比特数
量化过程是将DCT系数矩阵[F(u,v)]中的每个元素与量化矩阵
[Q(u,v)]中的对应元素相除后,舍去小于以下的小数。例如:
[Q(u,v)]为
量化矩阵。
量化结果
第三步:Z扫描并/串转换
第四步:编码传输
游程编码:
本例为(39,-3,2,1,
-1,1,0,0,0,0,0,
-1,EOB)。EOB表示块
结束,接收端收到EOB后
自动将64个元素中余下的
元素补零。
DCT解码复原
第一步:恢复量化矩阵
将EOB后的元素自动补零
第二步:反量化(IQ)
(619
)
第三步:IDCT
主要原因是
量化所致。
重建后的信号与
原信号相差很小
JPEG色度量化矩阵表
将整幅图像分
解出数个用于
DCT的子块
DCT系数中绝对
值较大的集中在
矩阵的左上角。
将一些绝对值很
小的系数或区块
置零便于丢弃
串/并转换
舍去零系数
量化矩阵复原
恢复DCT系数
图像子块重建
整幅图像重建
传输或存储
20×20
DCT子块
IDCT重建的
100×75图像
活动图像的DCT编/解码示例
100×100
DCT子块
等亮度方块 黑白交错的干扰信号
DCT
结果
量化
结果
特殊图像的例子
重构误差会很大
6.4 电视信号的数字处理
6.4.1概述
利用数字技术对电视信号的处理,不仅能完成模拟处理技术中
的相应,还能完成许多模拟电视中难以完成的各种功能,从而达到
提高图像质量,丰富电视节目等目的。
6.4.2 数字滤波器
1.数字滤波器的作用(略,详见数字信号处理)
2.数字滤波器的基本结构和原理(略,详见数字信号处理)
3.数字滤波器举例
(1) 亮度水平滤波器
滤波器的传递函数 ( a
)
( b
)代入 z=e jω
ω =2πf/fS,当 fS =4 fSC时,
(2) 亮/色分离梳状滤波器
① PAL制行延时T=TH
A至B 的传输函数HY(ω)
代入 z=e jω及ω =2πf/fH
A至C的传输函数HC(ω)
② NTSC制的Y/C分离
· 传递函数取(1行延迟
)
结构图如何画?
幅频特性:
2行延时
· 传递函数取(1帧延迟:T=T
F
, PAL制要延迟 2 帧 )
这种Y/C分离方法适合于静止图像或变化十分缓慢的图像,特
别是静止图像(帧重复),可以获得非常高的清晰度(对同一位置
的像素求和)。由于模拟延迟难以获得高精度长时间延迟,所以这
种方法只能用于数字处理。
(3) PAL色度解调器
U支路的滤波器幅频特性
由于
:
所以
实际延迟与标准
延迟之差极小。
(μs )V支路的滤波器幅频特性
分离后的U、V信号都是
取样频率为fS=4fSC的数字信
号,分别送入锁存器以fSC频
率进行再取样。由于取样时
钟的频率fS=4 fSC,并与色
同步信号严格锁相,实际上
取样时就已实现了FU、FV这
两个数字色度分量分离。位
于fSC零相的采样值为V 分量,
位于fSC 90°(将fSC延迟TS ,即
一个A/D采样周期)的采样值
为U分量。所以利用彩色副
载波fSC作为时钟进行再取样,
fSC零相的再取样值即为V分
量值,fSC延迟一个fS的周期
TS的取样值即为U分量值,
以完成副载频信号至视频信
号的频率变换。
6.4.3 电视信号的时基处理
数字信号的在存储器里的存入、取出由外部的定时信号决定。若
数字电视信号在存储过程中,采用不同的存入和取出的定时信号,
就可以将电视信号在时间上进行变换,这种变换称为时基处理。
1 .数字时基校正
数字时基校正器(DTM)是一种典型的时基处理设备,它主要用于
校正视频磁带录像机〔VTR)重放时输出信号的时基误差(TBE)。
(RAM或SRAM)
用于DTBC的存储器容量一般为10余行以上,而校正的时基
误差可达几十μs甚至更大。
2 .数字时基处理的其它应用
时基变换和处理的原理,还可用于其它方面,例如倍行频或倍
场频显示,隔行/逐行扫描转换,数字式彩色电视制式转换等。这
些都是通过对帧存储器内的数字电视信号进行特殊的读/写控制和
内插处理而实现的。
① 倍行/场频扫描
将电视信号以正常的取样时钟写入存储器,通过数据内插方法
(即将相邻行的数据平均,得到内插行的数据;或者将相邻帧的数
据平均,得到内插帧的数据)进行数据扩展。再以双倍取样频率取
出数据。同时显示时以倍行频扫描,即每场625行显示,这是倍行
频显示技术。也可以重新排列扫描顺序,由隔行扫描改为逐行扫描。
以上两种显示扫描行数都加倍,只是数据的读出顺序不同。倍行频
可以消除行间的闪烁现象。倍场频显示是保持隔行扫描不变,而使
场频加倍(每秒由50场提高到100场。当然行频也加倍)。倍场频显
示既能消除行间闪烁,也能消除场间大面积的闪烁。
②数字制式转换器
将525行和625行两
种制式转换的数字制式
转换器(DSC),也是利用
上述时基变换和行、场
内插等技术实现的。
625=25×25; 525=21×25
6.6 高清晰度电视
6.6.1 普通电视系统存在的缺陷 (以NTSC系统为例)
1.总体上的缺陷
⑴ 宽高比
早期拟订电视规范时,选择了4 : 3的宽高比,因为当时35mm
影片有同样的宽高比,而且观众对此格式也感到舒适。但今天“宽
屏幕”形式很普遍,NHK的研究表明,人们更喜欢5 : 3或甚至2 : 1
的宽高比。
⑵ 有限的垂直分解力 (NTSC系统比PAL系统更明显)
在NTSC制的525扫描行中,只有485行能产生图像,余下的40
行是场消隐期。在最佳的情况下,人们期望分解出485行,但实际
上有一些影响使这个数字大大减少,如凯尔( Kell )系数和隔行系数
等均使可观察到的分解力降低,最多只能达到330行左右。
⑶ 有限的水平分解力
假设水平分解力近似等于垂直分解力。因此水平分解力在满屏
宽约为440行。要达到这样的分解力,需要频率响应的平坦部分达
到左右。NTSC制规定视频带宽的上限也只有,此
频率上限不能随便扩展,因为电视额道的划分大多互相紧邻。
⑷ 严重受限的色度分解力
根据对人类视觉系统的研究结果,人眼对彩色的分辨力是有限
的,因此决定利用这一点对色度系统的频率响应也作同样的限制。
虽然这种方法已证明是使色度信号符合原先单色传输标准的极好方
法,但目前节目制作设备却正在发生变化,为了尽量减小图像的劣
化,采用RGB基色或Y、B - Y、G - Y分量进行编辑。
2.隔行缺陷
⑴ 行间闪烁
⑵ 爬行
⑶ 移动物体的垂直和对角线轮廓会发生畸变(锯齿化现象)
3.其它各种缺陷
⑴ 静态光栅(可见行结构)
由于电视机屏幕尺寸的增加和质量的改进,观众开始能看到组
成一帧图像的各扫描行,许多人对此感到不快,使扫描点单纯地散
焦,会产生使水平清晰度同时下降的缺陷。按照NTSC制标准,观
众要在图像高度的7倍处(PAL制是6倍)才可以避免看到行结构。在
这个距离上,观看者不会有身临其境的感觉,相反是感觉在看“一
只盒子中的图画”。
⑵ 大面积闪烁
研究表明,人眼可观察到频率非常高的场景亮度变化,它取
决于视场和亮度电平。就正常的观看电平来讲,欧洲的PAL和
SECAM的50Hz场频对许多人来说可能是太低了。测试表明,
100Hz的场频对避免大面积闪烁效果是很好的,当然这时接收机的
成本会有较大的增加。
⑶串色
串色看起来就像新闻播音员身上花呢短上衣的异常彩色编织
图案的效果,这是由于NTSC将高频亮度信号与色度信号混合在同
一个复合信号里所致。减小此种串扰有两个办法,一种是将亮度
倍号带宽限制到大约3MHz(该方法比较经济,直到几年前一直在
普遍使用);再就是利用流状滤波器将色度信号从亮度信号中滤出,
但又会使垂直分辨率降低。
⑷串亮
串亮是由于色度信号漏入亮度通道所致,特别是在黑白电视
接收机中,屏幕上由密布点组成矩阵状干扰。串亮可采取与抗串
色相同的方法来消除。
⑸ 时域混叠
这种“车轮向后转”的视觉效应是由30帧/秒的取样率造成的。
传统电视系统的缺陷小结:
为了使闪烁减少到可接受的水平,又要保持带宽不变,采用隔
行扫描是最好的折中。采用这样的技术不可能没有损失,如行间闪
烁、快速运动时垂直边缘模糊等。
为减轻这些缺陷的影响,尤其是要避免看到行结构,观众应该
在6倍图像高度距离处观看。但是在这个距离上,观看者不会有融进
节目的感觉,相反是感觉它像“一只盒子中的图”。
为了使彩色电视和黑白电视兼容采用了频率分割复用技术,使
得色差信号和亮度信号在频谱上的交借,这是很大的进步,但又免
不了会有串亮和串色。这也是在新一代电视系统中要解决的问题。
6.6.2 人眼视觉和电视标准
1.视角和临场感
当一幅清楚的图像呈现在宽阔的视觉场时,人眼将不能区分被
显示的图像空间和观看者所处的空间,这将使观看者几乎忘记了这
是由显示产生的图像,而获得逼真的立体视觉。因此,扩展屏幕宽
度对产生临场感是极为有效的技术手段。
实验证明,只有当视场角至少超过20°时才能开始获得具有“
临场感”表现的心理效果。随着观看者的视场角增加,这种心理效
果也增加,当达到80°~ 120°时趋于饱和。目前的电视系统,位于
最佳距离观看时,水平视角大约只有10°左右,而未来的电视系统
的水平视角则希望达到20°~ 30°。视觉场大小和观看距离有关,普
通电视在距图像高度的7倍处观看,HDTV在距图像高度3倍的距离
处观看已获得较大的视角。为了满足近处观看,HDTV的图像就必
须有相应的图像细节和清晰的轮廓。
图6-22
2.垂直细节和观看距离
要提高电视系统的垂直清晰度,就必须提高扫描行数。为此有必
要来确定在满足人眼视觉对图像质量要求的前提下,新的高清晰度
电视系统的扫描行数至少应为多少行才合适。研究的结果表明,高
清晰度电视要求的扫描行数决定于人眼视觉系统的频率响应特性,
并且是人眼观看图像距离的函数。
白顺序排列的条纹。对应这
些不同频率的条纹图案,视
觉的敏感度不同。由于人眼
的视力有个极限值,即眼睛
的分辨能力有限,当空间频
率超过—定值后,就感觉不
出有明暗条纹的变化,而成
了融合在一起的连续亮光。
因此,空间频率特性的截止
频率就相当于眼睛的分辨能
力。
图6-23
在单位空间里将明暗条纹按正弦分布规律变化,人眼将看到黑
图6-23
横坐标r为空间频率,单位为cpd(周/度),表示每度视角包含的黑自
条纹数;纵坐标为为相对视觉响应值;r 1为相对响应值下降6dB时的
空间频率,称为高端截止频率,一般r 1=;若定义归一化空间
频率x = r / r 1,则当x = x0= r0 / r 1=时,r0称为空间频率上限,x0
为极限空间频率的系数;常数k < 1,其值反映了对比度阀的变化。
由图可见,视觉的空间频率响应类似于低频端下跌的带通滤波器的
响应,即当空间频率r过低或过高时,视觉的相对响应值下降。
n V=2 r0θV=2 x0 r1θV
式中,θV为垂直视角:n V是眼睛能
够分辨的黑白线条数的上限。
另一方面,图像垂直分解力DV和
系统扫描行数N之间的关系式为
DV = K KiηV N
式中,K为Kell系数,K = ;Ki是
隔行扫描系数其值为~;ηV
为垂直扫描有效率(正程系数)。
在上限空间频率r0的情况下,眼睛能分辨出屏幕上的黑白线条总数
在图像垂直方向可表示为
若对高清晰度电视的图像垂直分解力的要求不超过人的眼睛能
够分辨的空间频率的上限 DV = n V,即扫描线数为
令视距与图像高度之比为d, 及 ,则扫描线数
由此可见,扫描行数直接与观察距离有关。观察距离越近,要
求的扫描行数越多,这样才能使相邻扫描线不产生间隔断开的感觉。
人观看电视图像的最佳距离应该是在看不清扫描线结构的情况下,
能看清电视图像的所有细节,就是说要看清图像最高分辨力的线数。
3.水平细节、图像宽度和视频带宽
由于人眼中锥状细胞是接近圆形的,其垂直分辨力和水平分辨力
是接近相同的高清晰度电视水平分辨力的要求应等于垂直分辨力。
普通电视的宽高比是(4:3),图像的最佳观看距离为6~7倍的
屏幕高度,水平/垂直视场角只有10°左右,没有临场感。高清晰度
电视采用了与宽银幕电影相同的图像宽高比16:9 ( ),在3倍屏
幕高度的观看距离上,水平/垂直视场角达19°/ 33°左右,具有较强
的临场感。它也是在图像质量和HDTV信道限制之间的一个折中,因
为在其它条件相同的情况下,视频基带的带宽和宽高比成正比。
人眼的视觉特性包括物理特性和心理特性两个方面。心理因素
涉及到的对高清晰度电视质量的影响,是通过大量实验数据得到的,
是综合性的。它和扫描行数、观看距离、图像宽高比、屏幕尺寸大
小、空间视角场、扫描制式以及屏幕亮度等都有密切相连的关系。
以清晰度为例,在一定的观看距离下,若观看者感觉到高清晰度电
视图像的清晰度远高于普通电视,那么随着显示图像的尺寸变小,或
图像尺寸不变而视距拉远,二者之间的差别就会变得不再能察觉出来。
所以,高清晰度电视是与大屏幕紧密联系在一起的。如果这个图像在
小屏幕上接收,它的高清晰度优势的吸引力就不存在了。
下面以 N = 1125、fF =30Hz为例,估算HDTV视频信号的带宽。
在此标准下的扫描行频fHDTV H为fHDTV H =1125×30=,
正程系数ηV取与NTSC相同,即取
ηV =
在DV = K KiηV N 中的隔行系数取Ki= K= ),则隔行扫
描的HDTV视频信号带宽 f b 约为 (DV ≈471/507线)。
6.6.3电视信号的空间表示
由摄像机所获取的图像是空间和时间取样的结果。行结构代表
了垂直方向上的取样,利用数字信号处理技术,通过模数转换将行方
向的模拟信号转换成数字信号,由此产生图像水平方向上的取样。这
样,垂直和水平取样过程提供了空间分析,场和帧的重复提供了
图像的时间取样。如果图像用f ( x, y )二维表
示,扫描线可表示成 。用扫描线对图
像进行取样,在时间域上是f ( x, y )与 的
乘积,在频域上是F (μ,ν )和 的卷
积(μ和ν分别是x和y方向的空间频率)。即
空间位置 空间频率
图6-24
图像扫描取样后的频谱如图6-24所示,其中图(a)是扫描线和
图像 f ( x, y );图(b)是图像的谱F (μ,ν );图(c)是扫描线的谱;
图(d )是经过扫描的图像的谱。由图可见,不发生混叠的条件是必
须保证图像在ν 轴方向上的最高频率满足 。
数字电视不仅在垂直方向上用扫描线取样,在行的方向上也须
取样,如图6-25(a)所示。取样点呈格子状,称之为正交取样,它可
以表示成二维冲击函数
图(b)表示图像的二维谱,图(c)是取样以后的图像信号的二维谱。
如取样后的信号为fg ( x, y ),则
图6-25
式中 是x、y方向的取
样频率。不发生混叠的条件是
限制图像在x方向和y方向上的
最高频率ωx、ωy,即
在前述的正交取样时,不发生混最的条件是取样频率要大于最
高频率的两倍,如果不满足这个条件,肯定会发生混叠。但是在交
错取样(offset sampling)(或称偏置取样)的情况下,即使在垂直
方向和水平方向上取样频率各降仅了近一半,仍然不发生混叠,采
用交错点取样使频谱面积的利用更充分了。
图6-26
我们将要介绍
的日本已实用化的
MUSE制HDTV就
是采用了的点交错
(偏置)的取样方法。
6.6.4 MUSE系统
首先需要指出,日本的MUSE系统(同时包括欧洲曾经开发过
的HD-MAC系统)不是全数字式HDTV,已经成为过时被淘汰的技
术。然而,MUSE毕竟 是世界上最早投入实用并正式播出的高清晰
度电视系统,而HD-MAC早在巴塞罗那奥运会期间进行过试播,同
时它们受采用的一些技术具有一定的先进性和可借鉴性(如采用多重
亚取样和运动补偿技术),所以这里对MUSE系统作简单的介绍。
1.概述
日本于1964年开始进行了高清晰度电视的研究.历经20余年。终
于在 1984年正式提出了 MUSE(Multiple Sub-Nyquist Sampling
Encoding),即多重亚奈奎斯特取样编码系统,用单频道作HDTV卫
星广播。 MUSE系统的技术参数如下:
⑴ 采用场频为60Hz的隔行扫描,扫描行数为1125行。这是为兼
顾到NTSC的525行和PAL和SECAM制的625行,因为1125行对于525行为
15:7,而对625行则为9:5。
⑵ 采用多重亚取样和运动补偿技术。重建的信号频带宽度:静
止情况下亮度信号为,色度信号为;运动情况下
亮度信号为.色度信号为。
⑶ 传输形式是取样数据的模拟传输,信号的取样频率为
。
⑷ 压缩后视频信号带宽为,采用调频调制。
目前MUSE系统在日本巳投入使用,用直播广播卫星(DBS)在
12GHz频道带宽为27MHz/24MHz,效果良好,但与现有电视制
式不兼容。
2.MUSE信号的形成
⑴ 亚取样技术
原始的模数变换的取样
频率是,也就是信
号的上限频率是。
经过压缩的信号的视频带宽
的上限是。这里所 图6-27
说的压缩方法就是用亚取样的方法,也可以称为点交错的取样方
法。对于静止图像,两帧(4场)呈一个周期,在一个周期内各场的
取样是互相交错的,也就是由4场组成一幅图。这里利用了人眼对
静止(包括慢运动)图像的空间分辨力要求高,而对时间分辨力要
求低的视觉特性 。
⑵ 时间压缩技术
在MUSE系统中,亮度信号和色度信号不是采用频谱交错方式
而是用时分复用方式。它是将亮度信号和色度信号分别在时间上压
缩,并且将压缩以后的亮度信号和色度信号安排在一行中不同的时
间段。亮度信号的压缩比是12:11,色度信号压缩得更多,和亮度
信号的时间压缩比是4:1。色度信号CR和CB还是轮流传送。亮度信
号之所以要进行12:11的压缩,是为了在将亮度信号压缩到亮度信
号的1/4之后,亮度信号和色度信号所占时间不超过行扫描全程时
间(μs)。亮度信号的上限频率是
(
色度信号的上限频率是
()×(1/3)=。
图6-31
实现时间压缩(TCI:Time Compressed Integration) 和扩展的方
框图如图6-31所示。
⑶ 运动检测和运动补偿
MUSE系统是一个运动补偿亚取样系统。对于图像的静止区
域,解码器是用时间内插,即用4场的信号的取样值采重建HDTV
图像。对于图像的运动区域,解码器是用空间内插,即用当前场
的信号的内插。如果将时间内插用于运动部分,多行混叠会使图
像质量下降。利用空间内插的区域带宽窄,这意味着图像运动部
分的分解力会下降,但这个问题影响不大,因人的视觉对图像运
动部分的边缘的模糊不敏感。
由于摄像机拍摄全景时如摇动镜头和倾斜拍摄造成的运动和
图像中物体的运动给人眼的感觉不同,如果按物体运动那样来处
理,它会使整个图画面都模糊。为此,就需要运动补偿。在编码
器端,对每一场作检测,要找出一个代表景物运动的矢量。在解
码器端,将前一场的图像元素取样值按运动矢量作位移。利用这
样的运动补偿方法,使时间内插能够应用于播镜头和倾斜拍摄的
场合,而不会有模糊,改善了运动图像的分解力。
由上所述,在MUSE系统中运动补偿仅用于摇镜头和倾斜拍
摄的情况,并不用在物体运动的情况。
为了要从一场中检测出一个单一的运动矢量,必须使用全画面
的信息,即使用全部像素来检测。这在理论上是可行的,但计算量
太大。实际上不使用那么多的点,也能确保足够的精度。如图6-32
所示,在每个32×8的小块中选出代表点,对这些代表点进行运算。
图6-32 图6-33
运动检测的方法很多,MUSE系统中是用的匹配法。如图6-33
所示,将前一幅图像中的代表点相当前图像各点之间进行相关计算,
求出其中相关值最高的运动矢量ZZ 。这里要注意的是,这里的相关
计算并不是两幅都用代表点进行计算,仅仅是前一幅用代表点。
6. 6. 5 全数字电视系统
1. 全数字电视系统信号的的基本特征
Ⅰ. 视频和音频信号全部数字化。
Ⅱ. 采用MPEG-2标准对数字化视频信号进行压缩编码,目标
是降低数字信号的传输码率。(信源编码)
Ⅲ. 压缩编码后的数字视频信号在调制前,为了保证在传输工
程中尽可能减少差错,通常还要加入用于纠错的RS码和卷积码,
同时还要作交织处理使可能产生的差错均匀分布,以利于纠错目低
是提高数字信号的传输的可靠性。 (信道编码)
Ⅳ. 采用MPEG-2、AC-3或AAC等标准(将来可能还会有新的
标准)将数字化音频信号进行压缩编码,提供声道的数字伴音
信号。
Ⅴ. 采用高效率的数字调制技术,完成数字电视信号的发送传
输任务。不同的数字电视系统所采用的调制方式不同,同时,相同
的数字电视系统,传输媒体中所采用的调制方式也不相同。
2. 现行的数字电视(含数字高清晰度电视)系统
Ⅰ. 美国的ATSC (地面广播:8 –VSB调制)
( ATSC :Advanced Television Systems Committee )
Ⅱ. 欧洲的DVB (地面广播:DVB-T 采用COFDM调制)
( DVB :Digital Video Broadcast 数字视频广播; COFDM
:Coded Orthogonal Frequency Division Multiplexing:编码正
交频分复用 )
Ⅲ. 日本的ISDB (地面广播: ISDB -T 采用COFDM调制)
( ISDB :Integrated Services Digital Broadcasting 综合业务
数字广播 ; ISDB-T:Terrestrial Integrated Services Digital
Broadcasting)
这些数字电视系统的共同特点是采用MPEG-2作为图像信号
的压缩标准,而在伴音信号的处理以及传输调制方法等方面各不
相同,均有各自的独到之处。
3. MPEG的基本理论(图像信源编码)
MPEG(Moving Picture Expert Group)是“活动图像专家组
”的英文简称,1988年成立以来已经制定了MPEG-1~MPEG-7等
多个数字视频/数字音频压缩编码标准。
MPEG-1的压缩比高达200:1,用于最高码率可达
动图像和相应音频信号的压缩编码,图像质量与VHS相当。
MPEG-2的压缩比可达50:1, 压缩后的数字活动图像信号和相应
音频信号码率可达几Mb/s,是DVD和数字高清度电视所采用的压缩
编码标准。
MPEG-4的最初目标是低码率图像通信(64Kb/s以下),后来
发展成为应用更加广泛的多媒体编码标准。 MPEG-4是一个开放的
系统,它即支持传统标准又不排斥性标准,码率成功地涵盖了从
100Kb/s~10Mb/s的广阔范围,互联网上的一些号称达到DVD画质
的影像很多是采用MPEG-4的。
MPEG-7能对各种不同类型的多媒体信息进行标准化的描述,
并将该描述与所描述的内容相联系,以实现快速有效的搜索。它的
应用很广,既可应用于存储,也可用于流式应用(如广播),还可以
在实时或非实时环境下应用,如:数字图书馆、多媒体名录服务(如
黄页) 、广播媒体选择、多媒体编辑等,应用潜力很大。
⑴ MPEG的视频数据流结构
为了便于对图像序列的随机访问和编辑,MPEG对视频数据流
规定了分层的结构(六个层次):
Ⅰ 图像序列层(Video Sequence layer)
Ⅱ 图像组层(Group of Picture)
Ⅲ 图像层(Picture)
Ⅳ 宏块条/片层 (Slice)
Ⅴ 宏块层(Macro block)
Ⅵ 块层(Block layer)
①图像序列:图像
序列就是一个被处理的连
续图像,是由图像组构成
的,它包含序列头、若干
个图像组层的数据以及序
列终止符。
②图像组(GOP) :图像组是为方便随机存取而加的,其结构
和长度均为可变的,MPEG2对此没有硬性规定。图像组是随机存
取视频单位,它由定义的一组或多组帧内编码帧(I帧)或非帧内
编码帧(P帧或B帧)图像构成。每组包括组头,图像层数据,还
有时间信息。 GOP有两个参数,即长度(N)和帧重复频率(M)。
③图像:图像是独立的显示单位,也是基本编码单位,由图
像头和宏块条层数据组成。在MPEG-2中,图像可以是逐行的,也
可以是隔行的,MPEG-1总是逐行的。
④宏块条:宏块条包含若干个连续的宏块,是重新同步单位。
宏块条的设置目的是防止误码的扩散,当一个宏块条出现误码时,
不影响后续的宏块条解码。
⑤宏块:宏块层由宏块头加块层数据组成,图像以亮度数据
矩阵为基准分为16×16像素的宏块,宏块是进行运动补偿的基本单
位。一个宏块包含4个8 × 8的亮度块,依据类的不同,一个宏块
还包含㈠ 两个8 × 8色度块(R-Y和B-Y各一个,4:2:0取样时)、㈡
四个8 × 8色度块( R-Y和B-Y各两个,4:2:2取样)或㈢ 八个8×8色
度块 ( R-Y和B-Y各四个, 4:4:4 取样时) 。
⑥块:块是MPEG码流的最底层,每个块是一个8 × 8 像素的
数据矩阵。每个块中只含有一种信号元素,即它或是亮度数据矩
阵,或是某中色度数据矩阵。块是进行DCT运算的单位,宏块在
进行DCT运算之前要被分成若干个块。
⑵ MPEG中的三种图像类型即码流组成
①三种图像类型
MPEG是基于DCT、运动补偿和Huffman编码算法的,在压
缩中使用了帧内压缩和帧间压缩两种方式。为了在编码中实现最大
的压缩比, MPEG使用三种类型的图像,即I帧、P帧和B帧。
I帧(Intra-Frame)是帧内压缩,不使用运动补偿,提供中等
的压缩比。由于I帧不依赖于其他帧,所以是随机存取的入点,同
时是解码中的基准帧。 一个图像组总是以I帧开头的,I帧压缩可以
得到6:1的压缩比而不产生任何可觉察的模糊现象。
P帧(Predicated-Frame)根据前面的I帧或P帧进行预测(向前预
测),使用运动补偿算法进行压缩,因而压缩比要比I帧高,数据量
平均达到I帧的1/3左右。P帧是对前后的B帧和后继的P帧进行解码
的基准帧。P帧本身是有误差的,如果P帧的前一个基准帧也是P帧,
就会造成误差传播。
B帧(Bidirectinal-Frame)是基于内插重建的帧,它基于前后的
两个I、P帧或P、P帧,它使用双向预测,数据量平均可以达到I帧
的1/9左右。B帧本身不作为基准,因此可以在提供更高的压缩比的
情况下不传播误差。
② 码流组成
一个GOP由一串I、B、P帧组成,起始为I帧。GOP的长度
是一个I帧到下一个I 帧的间隔,这个长度是可变的,长GOP可以
提供高的压缩比,但是会造成随机存取的延迟(必须等到下一个I
帧)和误差的积累(P帧的误差传播)。一般是一秒内有两个I帧,
用来作为随机存取的入口。
在MPEG-2中没有规定GOP的结构,帧重复方式可以是I、P
,I、B,I、B、P,I、B、B、P,甚至全部是I帧。一种典型图像
帧序为:IBBPBBPBBPBBIBBPBBPBBPBBI…。B帧和P帧要求
计算机有更强的功能。有些压缩器不能产生B帧或者连P帧也不能
产生,则图像的压缩结果将有很明显的间断。
在MPEG-1中,每个I帧图像含有152Kb,P帧图像含有80Kb
, B帧图像含有23Kb,一个典型GOP由1个I帧、 3个P帧、 8个B
帧组成,所以,一个GOP的数据量为152+80×3+23×8=576Kb,平
均每帧为48Kb,帧频为25Hz时,其视频码率为48×25=
4. 信道编码
提高数据传输效率,降低误码率是信道编码的任务。信道编码
的本质是增加通信的可靠性。
数字信号在传输中往往由于各种原因,使得在传送的数据流中
产生误码,从而使接收端产生图象跳跃、不连续、出现马赛克等
现象。所以通过信道编码这一环节,对数码流进行相应的处理,
使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传
送中误码的发生。误码的处理技术有纠错、交织、线性内插等。
A、纠错
在信道编码过程中将附加数据(如奇偶校验位)加于数据流之
中,在接收端通过奇偶校验位来发现有错误的数据字,并给予纠
正,纠错的方法有保持前面的字和线性内插等。数字电视系统一
般采用RS等外编码方式进行纠错处理。
B、 交织
交织是一种极复杂的过程,是对纠错过程的补充,交织的基本
原理是在编码时将数码流按已定义的规则“搅乱”,在接受端再
将那些“搅乱”的数据字按相反的规则重新排列,使之恢复出原
始次序。在DVB中是采用了卷积交织的纠错技术。
⑴ 数字电视中常用的纠错编码
① RS码
RS码即里德-所罗门码,是Reed和Solomon与1960年提出来
的,是在伽罗华域(Galois Field,GF)中运算的,是BCH(Bose-
Chaudhuri-Hocquenghem)码的一种。 BCH码是能够纠正多个
错误的的纠错码,纠错能力强,构造方便,易于实现。
②卷积码
卷积码非常适用于纠正随机错误,但是,解码算法本身的特
性却是:如果在解码过程中发生错误,解码器可能会导致突发性
错误。在卷积码的上部采用RS码块, RS码适用于检测和校正那
些由解码器产生的突发性错误,其功能强大。
③ Turbo码
1993 年诞生的Turbo 码,对于当时欧洲的DVB 来讲太新了,
对ATSC 更是如此。虽然如此,VLSI 的法国子公司ComAtlas 开
发了单片Turbo 码编/解码器,它的运行速率达40Mb/s。该芯片
集成了一个32×32 交织器,据报道其性能至少和传统的RS 外码和
卷积内码的级联一样好。
⑵交织
在实际应用中,比特差错经常成串发生,这是由于持续时间
较长的衰落谷点会影响到几个连续的比特,而信道编码仅在检测
和校正单个差错和不太长的差错串时才最有效。为了纠正这些成
串发生的比特差错及一些突发错误,可以运用交织技术来分散这
些误差。实现交织和解交织可以使用卷积方式。
6.6.6 美国的HDTV( ATSC )
1 .概述
美国HDTV研究的指导思想据称首先是考虑美国电视接收机所
有者和电视广播业者的利益以及美国的国情。在美国,地面电视广
播迄今仍占其电视业务的一半以上,全国各地的地区电视台组成全
国性的地面电视广播网。各个地方台服务于特定的城乡,只有国家
级的节目才用卫星等远距离手段来传送。因此,美国在发展高清晰
度电视时首先考虑的是如何通过地面广播网(6MHz带宽)进行传输。
1988年9月,FCC(Federal Communications Commission:美国
联邦通信委员会)作出决定:美国的新一代电视必须与现有NTSC接
收机的收看性能相兼容,它的播出不能打乱现有电视频道的划分。
这从根本上否定了美国采用MUSE方案的可能性。1990年3月FCC修
改了HDTV的条件:取消了与NTSC接收机兼容的要求,但仍然坚
持节目兼容和保持现有频道的划分。由于突破了“接收机兼容”的
框框,可以充分利用数字图像压缩编码、数字伴音压缩编码、数字
多路复用和数字调制等先进技术,美国通用仪器(GI)公司于1990年5
月首先提出数字HDTV系统Digicipher之后、美国又有三套数字
HDTV方案相继问世,它们是DSC - HDTV、AD - HDTV、CCDC。
上述四套方案的图像压缩编码方法各有特色,但其基本工作原
理与CCITT (国际电报电话咨询委员会,International Telegraph
and Telephone Consultative Committee的缩写,源出于法文
Comité Consultatif International Télégraphique et Téléphonique )
的建议相同。四套方案的传输系统有共同之处,也有各自持
色。如调制方式有的用QAM(Quadrature Amplitude Modulation
— 正交调幅),有的用VSB。
这么多方案究竟那个是好的,需要有个标准。FCC下属的先
进电视业务顾问委员会(ACATS)提出了一个HDTV系统的十项判据。
这十项判据是基于发展HDTV的同播(Simulcast)模式。所谓同播
模式即每个电视台为了广播一个HDTV信号被分配第二个信道,
在这同时原来指定的信道仍继续用NTSC信号广播同一节目。FCC
预定在选定HDTV标准的15年后用HDTV全部代替NTSC制式。所
以同播模式是FCC设计的过渡方法。
十项判据是FCC对HDTV系统进行分析、比较和评估的标准,
以确定最佳的HDTV系统。它们可分为三个方面:
⑴ 频谱利用方面的准则
由于采用同播模式,现有的电视台要在原有的分配给广播频段
中找到第二个信道播送HDTV信号,这就要使用UHF频段中的禁用
频道。所谓“禁用频道”是指为了避免邻近电视台相互干扰而指定
禁止使用的频道。如图6-35(a)所示,在d=270公里范围内,不能再
有
图6-35
使用和0#相同频道
的电视台,这个频
道就是禁用频道。
但由于全数字的
HDTV信号的平均
发射功率约为
NTSC信号发射功
率的10%,故而在
d=140公里处可设
置一个相同频道的
HDTV电视台。
⑵ 经济方面准则(三个判据)
① 消费者的费用。
② 广播者的费用。
③ 其它传播媒质,如电缆系统传播HDTV信号的费用。
⑶ 技术方面的准则
① 音频/视频质量。
② 传输的坚韧性(Transmission Robustness)
这是指存在同频干扰、邻频干扰、禁用频道干扰和离散频率干
扰的情况下,发送系统保持图像、声音和数据仍然有用的能力。不
仅是干扰,还有噪声、多径等对地面广播的损伤,二阶和三阶失真、
相位失真等对电缆发送的损伤存在时,发送系统仍能维持图像、声
音和数据一定的质量。
③ 服务范围和性能。
④ 可扩展性(Extensibility)。
⑤ 互操作性(Interoperability Consideration)。
互操作性考虑包括通过其它媒质,如电缆、卫星、VCR和分组
网络传播的能力,以及与计算机、交互系统协同工作等。
有了标准,还要有个专门的测试机构,这个机构在美国叫先进
电视测试中心(ATTC:Advanced Television Test Center),是个民间
机构。ATTC对以上四个方案以及另一个叫Narrow-Muse的方案作
了野外和室内试验,测试了各项性能指标。测试结果,除了Narrow
-Muse (它仍是模拟方法传输)明显地劣于其它方案,另外四个方案
是各有千秋,但都不能全面符合标准的要求。FCC的顾问委员会要
求这四个方案于1993年5月起作新一轮试验。正当试验开始前,研制
这四个系统的七个公司和组织表示愿意联合起来,共同研制一个单
一的新的HDTV系统。FCC顾问委员会主席Richard Wiley称这个将
产生的新系统为“大联盟”(Grand Alliance)方案、简称GA。方案
的制订者认为这个方案若被FCC接受的话,将使美国处于高清晰度
视频技术的最前列;并认为,一种全数字(all-digital)标准如果能
够促进广播、电缆(电视)、计算机及电信等技术之间的相互可操作
性(interoperability),将具有世界性意义。
⑷ 大联盟(GA)方案的目标
① 高质量的HDTV图像和声音。
② 有效的同播系统,即提供HDTV广阔的地面广播服务区、要
避免对现在的NTSC广播服务产生不可接受的干扰。
③ 对消费者、生产者和所有的用户在引入和使用HDTV期间其
开支是合理的。
④ 对其它的媒体(如电缆、卫星、计算机等)和应用都具有相互
可操作性。
⑤ 有可能成为世界标准。
这五点都是很重要的,其中第四点将 相互可操作性作为重要目
标提出来是为了适应当前时代的需要。事实上今天对高清晰度电视
的研究已不能局限于它是继黑白和彩色电视之后第三代电视,它必
须融合于倍息高速公路和多媒体的大趋势中,高清晰度电视接收机
将是一个多媒体接收显示终端。日本的MUSE系统所以没有前途,
重要原因之一就是它和计算机之间没有相互可操作性。
上面的五个目标之间是有不少矛盾存在的。比如在HDTV图像
质量、HDTV的服务区域和对NTSC服务的干扰方面三者存在着相
互矛盾的要求。为了获得优秀的图像质量、就希望有高的数据率,
在一个大的服务区里达到高的数据率就要大的发射功率,这就会对
NTSC的服务产生太大的干扰。如果因此而减小HDTV的服务区当
然不可取,因为这意味着减少观众,当然经济上不合算。幸好,在
这方面经适当的平衡和折衷,将视频压缩技术和数字发送技术结合
起来,足以产生HDTV的同播(Simulcast)服务。
另一个矛盾的例子就是相互可操作性的问题。HDTV的节目制
作标准可能是方形像素、帧频30Hz,而NTSC的相互操作性要求非
方形像素、场频,电影的相互操作性要求24Hz、但计算机
相互操作性要求方形像素,逐行扫描,帧频高至70Hz。这些相互
操作性的要求是相互排斥的,可是这些节目源对HDTV传送标准来
说又都是重要的。解决的办法当然是转换,但在设计HDTV系统时
必须考虑转换的技术难度和经济性。
1995年4月至7月,ATTC对GA系统进行了测试,1995年9月公
布了测试报告。据说测试专家一致认为数字HDTV大联盟方案明显
超过过去的任何系统,包括静止图像、运动序列、计算机图形和电
影。虽然他们也观察到一些缺陷,但仅出现于最困难的图像,和过
去的一些系统相比,已大大减小了。
另外一个值得重视的动向是,95年9月ACATS向FCC提交了最
终的技术报告,在这个报告中对扫描格式有了新的规定,增加了
SDTV 的格式,即480×704和480×640二种扫描格式。
所谓SDTV (Standard Definition Television)可译作普通清晰度
电视。它也是数字电视系统,其质量等效于NTSC,它是将符合ITU
—R提出的601建议的4:2:2级的图像源压缩后得到的等效质量。所以
也可以称为普通数字电视,这反映了美国技术人员对ATV的一种新
认识。他们认为数字广播以及传送技术已经成熟到不仅可以在
6MHz信道内广播HDTV信号,也可以有另外的多用途组合,即全
数字HDTV技术可以发展为动态的和灵活的数字广播电视技术。
1995年11月28日,ACATS主席向FCC正式提出结论性意见:
① GA系统满足委员会提出的性能指标。并且比原来的四个系
统中的任一个都好。
② GA系统优于目前已知的任何其它系统。
③基 于 顾 问 委 员 会 所 设 计 的 指 标 和 GA系 统 制 订 的
ATSC(Advanced Television Systems Committee) 数字电视标准是满
足美国ATV广播标准的要求的。
为此先进电视业务顾问委员会向FCC建议采用ATSC数字电视
标准作为美国ATV广播标准
2.系统综述
GA系统能够在一个6MHz地面广播信道中可靠地传递19Mb/s的
流量,也可在一个6MHz有线电视信道中传递38Mb/s的流量,这意
味着对分辨率为普通电视5倍的视频信源编码需要的压缩比大于50。
根据国际电信联盟无线电通信部(ITU-R)第11/3任务组(数字地
面电视广播)的规定,数字电视系统可由三个子系统组成。
这三个子系统(也可以称为三个层次)是:
⑴ 信源编码和压缩
该系统用于对视频、音频和辅助数据作编码,减小比特率,所
以叫数据压缩。辅助数据包括控制数据,条件接收控制数据,以及
和视频、音频有联系的数据,如字幕等。GA系统中的视频编码用
MPEG-2,音频编码用Dolby(杜比)AC-3。
⑵ 业务复用和运输
它涉及的是将数字码流分割成“包”信息的方法、识别各个包
的方法、将视频码流包、音频码流包和辅助码流包复用成一个单一
码流的适当方法。在开发运输机理中主要考虑数字媒体之间的互操
作性,如地面广播、有线分配、卫星分配、记录媒体和计算机接口。
数字电视系统用MPEG-2运输码流语法来将视频、音频和数据信号
打包和复用形成复合广播系统。还要考虑和ATM(Asynchronous
Transfer Mode:异步传输模式)运输机理互操作性的问题。
⑶ 射频/发送
它涉及信道编码和调制。信道编码是在传送的码流中加上一些
附加的信息,这样接收机收到的即使是由于传送受到损伤的信号,
仍然可以靠这些附加信息的帮助恢复原来的数据。调制(或物理层)
是利用数字的码流来调制发送的信号。调制子系统在地面传送系统
中是用8-VSB(Trellis-Coded 8-Level Vestigial Side-Band:八电平
残留边带 )技术,在有线高码率传输中用16-VSB。
3.GA的扫描格式和分辨率
4.GA的视频压缩子系统
视频系统要将约1Gb/s的HDTV信号压缩到大约20Mb/s才能在
6MHz的电视信道中传送。压缩比大约为50 : 1以上。 压缩编码是采
用MPEG-2技术,帧内亮度和色度取样是按4:2: 0组成。
视频压缩系统由三个基本运算组成。第一步,视频信号被表示
成更加有效的图像形式使得压缩的过程度得容易。一个有效的图像
形式只需要小部分的数据被送去重建视频信号。第二个运算是量化,
实现视频信息的离散化。因为在一个数字信道中传送视频信号,视
频信息必须被量化成数目有限的若干级。第三个运算是分配码字,
即用来代表量化级的码流。
这三个运算都是利用视频信号源中的冗余度和人的视觉系统的
限制特点。视频信号源中存在的冗余信息或相关的信息就没有必要
重复传送,视频信号源中人眼看不到的信息也不必传送。这就是GA
视频压缩系统设计的指导思想,也同样是MPEG -2依据的原则。
4:2:0格式:色度信号(R-Y,B-Y)只做隔行采样
模拟视频以RGB的格式输入,用10比特的A/D变换器加以数字化。
为了补偿摄像机的非线性响应,对每个彩色分量加上γ校正,这样有
助于减小量化噪声的视觉效应,尤其是在图像中的暗区。
图6-37
经数字化和γ校正的RGB取样被一个线性矩阵变换转换到
SMPTE 240M YC1C2彩色空间。可编程的FIR滤波器用于调整各个
彩色分量的频率响应的形状。为了防止后续的取样由于降低频率出
现混叠,两个彩色分量使用带宽为一半的滤波器。降低的取样的因
子是2,水平和垂直都如此。
图6-38
5.GA的运输子系统
⑴ GA采用固定长度的小包
运输子系统(运输层)的基本任务是打包、复用。包上当然
要有标志,这样视频、音频、数据等不同的基本码流都可以从同一
个信道中送出去。在MPEG-2标准中有二个基本方法,一个是利用
固定长度的小包,另一个是小包的长度可变。前者称运输码流,后
者称节目码流。这两种不同的打包方法适于不同的应用。运输码流
适合于有噪声的信道、会发生误差和数据丢失的环境,节目码流则
适用于不易发生误差的介质,如CD-ROM。
从GA的运行环境来说,毫无疑问地选运输码流的方式,即固
定长度订包的方式。GA方案的提出者认为固定长度订包方法的优
点是:
① 动态地分配信道容量
利用固定长度的包可以在视频、音频和辅助数据服务之间动态
地分配信道容量。利用包的头部的包识别符作为码流的识别方法,
就可以很灵活地将视频、音频相辅助数据灵活地混合,不需要事先
作说明。
② 可分级
在信道的带宽拓宽时可以在复接器的输入端加进更多的基本码
流,也可以在第二级复接口上和原来的码流复接。这对于网络分配
是很重要的优点。
③ 可扩展
考虑到将来会有新的服务,所以运输层应该是开放的。运输层
可以处理新的基本的码流而不必改动硬件,只需要在发送端指定新
的包识别符,接收机滤出这些新的PID (包识别符),向下兼容也没
有问题。现在的解码器可以不理新的PID就行了。这种能力可以将
来被用于送“1000线逐行格式”和“三维HDTV”。
④ 坚韧性(Robustness)强
固定长度打包方法的另一个基本优点是对固定长度的包易于处
理误码。误码检测和纠正的处理(在接收子系统中这件事先于包的解
复接)是和包结构的协调,所以由于发送损伤丢失数据时解码器可以
按包的单元作处理。在检测误码后,可以先从第一个好的包恢复数
据码流。同步恢复也是靠运输包的头部信息的帮助来实现。如果没
有这种方法,就要完全依赖于各个基本码流的性质来恢复同步。
⑤ 接收机实现的成本效益高
一个基于运输系统的固定长度包能够使解码器的结构简化。解
码器并不需要详细知道复接方案或者是信源的比特率特性就可以在
解复用器处提取各种基本码流。所有的接收机需要知道的是包的识
别符,这个识别符是在码流中各个包的头部,其位置是固定的,事
先已知的。唯一重要的时间信息是基本码流和包的同步。
GA的运输格式是以MPEG-2的“系统”部分的指标为基础的,
但GA的解码器并不和MPEG-2“系统”统完全兼容。它不能适应任
意的MPEG-2“系统”的码流,但所有的MPEG-2解码器应该可以在
运输层这一级解出GA的码流。
⑵ 运输子系统的功能和地位
运输子系统处在编解码和发送子系统之间,它负责将编码的码
格式化(即打包),并将不同的节目复接在一起以便发送。在接收端,
负责恢复码流以便解码。此外,运输子系统还有提供识别不同性质
的基本码流和接收机同步的功能
图6-39
⑷ GA系统的有条件接入
① 对加扰系统的要求
为维护电视系统管理者和广大合法用户的权益,保护节目拥有
者的利益,防止非授权用户的收看,必须对GA系统中所传输的视频、
音频、辅助数据及其它控制数据进行加扰,实行有条件接入
(Conditional Access)。
设计一个加扰系统时,应考虑:
Ⅰ 隐匿性:在加扰系统中所加扰的图像或声音、数据要有充分
的保密性。
Ⅱ 质量还原性:解扰后的图像或声音,与没有被加扰的原图像
或声音相比应在允许范围之内。
Ⅲ 高安全性:他人不易用不正当手段将加扰信息还原。
Ⅳ 扩展性:在限定的条件控制系统中,要考虑将来功能的扩展。
Ⅴ 廉价性;接收机中应尽量多地采用通用元件,降低接收机的
成本。
② “有条件接入”功能
在数字电视加解扰系统中引入了“有条件接入”的功能,从而
提高加解扰系统的可靠性和灵活性。有条件按入的工作机理是将传
输数据随机化,以便未授权的解码器不能正确地解码信号,而授权
解码器则被授于一个关键字,该关键字可初始化反随机解码电路而
实现解扰。
⑸ MPEG-2与ATM的互操作性
在未来的信息高速公路上,HDTV不再是单一的广播形式,一
定是交互式的。所以设法解决MPEG-2的码流在网络中传输的问题
是值得重视的。视频、音频在网络中传输,虽然和数据文本一样都
表现为二进制的码流,但它们之间在性质上有显著的不同。首先,
视频、音频是连续、宽带、时间关系严格的码流,它们的输出速率
必须恒定。例如,视频图像每秒必须为25或30帧,不受用户提取信
息的能力影响,所以它是恒定速率的连续媒体。文本是速率可变的
连续媒体,它的时间性掌握在用户手中。视频、音频数据的间隔周
期必须是固定的,文本数据的间隔周期可以变化。其次,“时延性
”的要求不同。比如传一页文件,即便有几秒种的延时用户可以接
受,但视频、音频即使只有1/15秒的扰乱,就会使用户不满意。
6.数字电视系统常用的几种调制方式及其比较
数字电视系统常用基本调制方式有 QAM、 VSB、 QPSK等三
种。在具体应用中,根据不同的传输介质,采用了不同的调制参数。
QAM ( Quadrature Amplitude Modulation:正交调幅;16-QAM
: 16状态/电平正交调幅 )
VSB ( Vestigial Side-Band:残留边带;8 -VSB:Trellis-Coded
8-Level Vestigial Side-Band:8电平残留边带 )
QPSK (Quadrature Phase-Shift Keying :四相/正交移相键控,
与四状态QAM相同 )
COFDM (Coded Orthogonal Frequency Division Multiplexing
:编码正交频分复用 )
Ⅰ QAM:正交调幅 (M-QAM多电平正交幅度调制)
16-QAM星座图
对于16-QAM(4种调制电平,
16状态正交调幅),mI( t )和mQ( t )
的电平取值范围为:-3、-1、1、3,
调制后(合成)信号的幅度和相位可
组合成16种状态,可以代表4位2进制
数。
正交载波
Ⅱ QPSK:正交移相键控 (多进制相位调制的一种)
将e0( t )展开,得
表达式形式与QAM相近,特别是带有45°偏置的QPSK与 4 状态
QAM的星座图完全相同。
多进制相位调制
QPSK共有4种不
同的状态,可以
代表2位二进制
数。
Ⅲ VSB:残留边带 (多电平残留边带)
根据调制理论,在双边带(DSB)的调制的基础上,设计一个
输出滤波器,使其输出信号的一边带频谱成分全部保留,另一个边
带频谱成分只保留一小部分(低频部分),这样的调制输出称为残
留边带 调制(VSB)。实现VSB的方法主要有滤波法和相移法,它
们不在本课程的讨论范围内,这里主要介绍多电平残留边带调制的
特点。对于8-VSB,已调波在满功率调制范围内可以取8种不同的电
平状态,所以可以表示3位二进制数,显然调制效率高于4-VSB,更
是高于一般ASK 。
Ⅳ 正交频分复用OFDM
为了便于理解COFDM,我们介绍正交频分复用( OFDM )
。 在高速数字通信中,如果存在
多径干扰(地面传输和移动接收则
更为严重),当多径延时(也包括信
道的冲激响应)达到一定程度时,
误码率将会急剧增加,(若最大多径
延时为τm ,其相关带宽Δf =1/τm ,
高码率的信号带宽大于Δf 时,将会
出现严重的码间干扰)最终可能
造成无法接收,OFDM技术可以很好地解决这一问题。OFDM将高
速率串行数据转换成多个(N个)低速率的数据流调制到多个(N个)频
率不同的载频上并行传输, 用N个并行单元码取代通常的串行脉冲
序列,使用每个单元码所占的频带小于Δf 时,可以消除码间干扰。
概括地讲,OFDM就是利用频域变换技术将信号样值用N 个(可到
达数千个)载波分别进行传输,而称为COFDM是因为频域信号样值
是经信道纠错保护编码之后的编码样值。
为了说明 N 个载波正交的物理意义,先定义一组载波数为 N
的表达式:
其中
式中
TS为单元码持续时间, fC为发送频率。
满足正交条件:
的频谱是交叠的,
当有限个用复数表示的数字信号{Ci,k}对 调制时,调
D( t )即为OFDM信号。
制后的信号D( t )为:
OFDM信号的解调:
例:i = 0时的OFDM信号。
i = 0,则
所以OFDM信号为:
如果采用QPSK调制, {Ci,k}可为{1+ i , 1- i , -1+ i , -1- i }。
常规的频分复用频谱是不能交叠的,而OFDM不同载频的频
谱是交叠的,所以OFDM的频谱利用率高。然而, OFDM非常复
杂,如果全用硬件实现,需要大量的正弦波发生器,所以实际应
用中均利用了高速傅里叶变换和反变换技术来完成频域转换的。
欧洲系统中放置了大量的导
频信号,穿插于数据之中,并以高
于数据3dB的功率发送。这些导频
信号一举多得,完成系统同步、载
波恢复、时钟调整和信道估计。由
于导频信号数量多,且散布在数据
中,能够较为及时地发现和估计信
道特性的变化。为进一步降低多径
造成的码间干扰,欧洲系统又使用
了“保护间隔”的技术,即在每个
符号(块)前加入一定长度的该符
号后段重复数值,由此抵御多径的
影响。可以认为,大量导频信号插
入和保护间隔技术是欧洲系统的技
术核心,正是这两项技术使欧洲系
统能够在抗强多径和动态多径及移
动接收的实测性能方面优于美国
VSB系统。
7. GA –HDTV 的调制方式
GA的视频压缩层和运输层基本上是MPEC-2的标准,所以容
易统一,但在确定GA的发送方案时可有不同的选择。原来的4种
HDTV方案采取的调制技术有QAM(正交幅度调制)和VSB(残留边
带调制)二种,最终ATSC选定了VSB。VSB系统有两种模式:同播
的地面广播模式:8-VSB和高比特率的电缆模式(有线电视系统):
16-VSB。
8-VSB模式在6MHz带宽内可传输的信息,而16-VSB
模式在6MHz带宽内可传输38Mb/s(实际可达43Mbps)的信息,
两种模式的导频、符号速率、数据帧结构、交织、RS编码和同步
脉冲都是相同的。地面广播模式是追求最大的服务区,在一个
6MHz信道中支持一路ATV信号(即一路高清晰度电视信号)。高比
特率的电缆模式由于工作环境不象地面广播模式那么苛刻,所以可
用16-VSB来传输而不是像地面广播用的是8-VSB。
VSB的传送从本质上说只需要处理同相( I )信道的信号,以符
号速率取样,这样使接收机做起来会便宜。解码器只需要一个A/D
变换器和一个实数的(不是多个)均衡器,工作于兆符号/秒。
对VSB来说,是采用导频来恢复载波,采用训练序列来控制均
衡器。导频的加入虽然提高了载波恢复精度,但在一定程度上损失
了信号的能量。训练序列虽减少计算量,但在应变能力上却减弱了。
对于QAM来说,由于无导频,听以最大限度利用了信号的能量。虽
计算时间增加、算法复杂,但实时性强。从结构来看,VSB要比
QAM简单,硬件复杂度低,这也是选择VSB的重要理由。
6.6.7 欧洲的DVB系统
1 .概述
在美国的全数字HDTV系统的冲击下,欧洲不得不于1993年放
弃了曾在巴塞罗那奥运会上试用过的HD-MAC系统。日本虽然仍在
广播MUSE系统的节目,但是也已经承认MUSE系统已不适应今后
电视向数字化方向发展的趋势。在这样的背景下,欧洲和日本,提
出了具有各自特色的全数字化的TV/HDTV的规划和方案。
欧洲和日本在发展全数字化电视的战略思想上和美国还是有区
别的,他们有以下特点:
(1) 首先考虑的传输信道是卫星信道而不是地面广播信道。
(2) 欧洲强调可分组性,日本强调多种数字业务的集成,而不
是只传送HDTV一种信号。
(3) 地面电视广播采用OFDM(正交频分正交复用)调制方法
1995年,欧洲成立了DVB联盟。该机构的首要目标是在全球范
围内发展和推广共同的数字电视广播标准。DVB联盟共同制定了数
字电视的DVB(Digital Video Broadcast)标准。这是一套包含电
视广播系统大家庭诸多要素的统一标准,其中最引人瞩目的是DVB
数字卫星和有线电视传输系统的标准。这些标准事实上已作为世界
统一的标准被大多数国家接受,包括中国。它较其他标准的优点是
灵活可扩充和移动通信的优势。
DVB标准规定,数字电视系统使用统一的MPEG-2压缩方法
和MPEG-2传输流及复用方法。统一的服务信息系统提供广播节
目的细节信息、统一的RS纠错码、统一的加扰系统和条件接收公
共接口。允许不同的厂商选用不同的条件接收系统,对于不同的传
输媒体,可采用不同的调制方法及通道编码纠错方法。
2.DVB的标准系列
① DVB-S:用于卫星直播电视。
它采用QPSK调制,工作频率为11/12GHz。使用MPEG-2格式,
用户端达到CCIR601演播室质量的码率为9Mbps,达到PAL质量的
码率为5Mbps。一个54MHz转发器传送速率可达68Mbps,并可供
多套节目复用。在DVB-S标准公布之后,几乎所有的卫星直播数字
电视均采用该标准。
② DVB-C:用于有线电视系统。
它具有16 QAM、32 QAM、64QAM三种方式,采用64QAM
调制时,一个PAL通道的传送码率为,还可供多套节目
复用。DVB的音频压缩方法可有多种选择:立体声MUSICAM、多
声道MUSICAM及AC-3。最近,MPEG专家组又公布了一种新的
音频压缩方法供MPEG-4和MPEG-2使用。据称,其效果优于上述
几种方法,可能会被DVB选用。
DVB标准公布之后,几乎所有的卫星直播数字电视均采用DVB
-S标准,包括美国的Echostar等。我国各省的卫星电视台均选用
了DVB-S标准。
③DVB-T:用于地面开路数字电视系统。
DVB-T标准是1998年2月批准通过的。第一个正式的开路数
字电视系统于1998年初开始运营。MPEG-2数字视音频压缩编码
仍然是开路传输的核心。采用COFDM(Coded Orthogonal
Frequency Division Multiplexing:编码正交频分复用)调制方式,
8MHz带宽内能传送4套标准清晰度的电视节目,而且传输质量高。
数字地面电视(DVB-T)标准正在逐渐被世界各国所采用,目前已在
欧洲的15个国家和澳大利亚、新西兰得到应用。由于相对较低的基
础设施费用投入和各国相对简单的标准协调问题,数字卫星电视
(DVB-S)网、数字有线电视(DVB-C)网和数字开路电视(DVB-T)网
先走一步,发展很快。1997年以来,DVB标准为基础的数字电视已
经在全世界普及,拥有了几百万用户,给整个电视行业带来深刻的
影响。
④ DVB-SMATV(ETS 300 473)
数字SMATV(卫星共用天线电视)广播系统标准。该标准是
在DVB-S和DVB-C基础上制定的。
⑤ DVB-MS(ETS 300 748)
高于10GHz的数字广播MMDS分配系统标准。MMDS是采用调
幅微波向多点传送,分配多频道电视节目的系统。该标准基于DVB
-S,使携带大量节目的微波信号直接入户。用DVB-S接收机配上一
个MMDS频率变换器就可接收DVB-MS信号。
⑥ DVB-MC(ETS 300 749)
低于10GHz的数字广播MMDS分配系统标准。该标准基于DVB
-C,使携带大量节目的微波信号直接入户。用DVB-C接收机配上
一个MMDS频率变换器就可接收DVB-MC信号。
与美国的ATV不同,欧盟认为,由于HDTV节目源稀少,制作
困难,难以形成市场,所以DVB的发展重点是SDTV(标准清晰度
数字电视)。实际上,对传输系统而言,SDVB与HDTV是没有区
别的,因为传输系统所面临的传输对象都是二元比特流,仅仅是数
据流量不同。
6.6.8 日本的ISDB-T系统
ISDB-T (Terrestrial Integrated Services Digital Broadcasting)
是数字电视地面广播系统的标准,ISDB-T 利用COFDM 信道编码
技术 (DVB 采用的技术 ),是一种适用于窄带和宽带的数字广播和
电视的技术,于1998年9月由日本的DiBEG(Digital Broadcasting
Experts Group 数字广播专家组)制订,ISDB-T与欧洲的DVB-T
非常类似,可以说是经修改的欧洲方案。DiBEG成立于1997年9月,
致力于综合业务数字广播ISDB(Integrated Services Digital
Broadcasting)标准的制定和发展。ISDB利用一种已经标准化的复
用方案在一个普通的传输信道上发送各种不同种类的信号,同时已
经复用的信号也可以通过各种不同的传输信道发送出去。ISDB具
有柔软性、扩展性、共通性等特点,可以灵活地集成和发送多节目
的电视和其它数据业务。
ISDB(综合业务数字广播)是新型的多媒体广播业务,它系
统地综合了各项数字内容,每一项内容可以包括从LDTV到HDTV
的多节目视频、多节目音频、图形、文本等。如今大部分的数字内
容均被编码到MPEG-2传输流格式并被广泛传输。由于ISDB包含了
不同的业务,其传输系统必然要涵盖各种业务不同的需求,例如
HDTV需要一个大的传输容量,而数据业务需要极高的业务可靠性,
诸如条件接入的键控传输,软件下载等。为了集成这些业务需求不
同的信号,要求传输系统提供一系列可供选择的调制和误码保护方
案,并且能够灵活组合以满足所集成业务的每一需求,特别是工作
在11~12GHz卫星广播业务(BSS)频段、又处于高雨衰区国家的卫星
ISDB系统的需求。
从1998年起,日本在其本土和海外进行多次试验,据说结果令
人满意。ISDB-T服务预期在日本2005-2007年开展,但迄今为止,
好像还没有其他国家着眼于 ISDB 技术,原来有意于ISDB-T的新加
坡经过深透的评估 ,最后还是放弃了ISDB -T。
6.6.9 三种数字地面广播系统的比较
1.DVB与ATSC的比较
欧洲“DVB标准”和美国“ATSC数字电视标准”的主要区别如
下:
(1)方形像素:在ATSC标准中采纳了“方形像素”(Square
Picture Eelements),因为它们更加适合于计算机;而DVB标准最初
没有采纳,最近也采纳了。此外,范围广泛的视频图像格式也被
DVB采纳,而ATSC对此则不作强制性规定。
(2)系统层和视频编码:DVB和ATSC标准都采纳MPEG-2标
准的系统层和视频编码,但是,由于MPEG-2标准并未对视频算法
作详细规定,因而实施方案可以不同,与两个标准都无关。
(3)音频编码:DVB标准采纳了MPEG-2的音频压缩算法;而
ATSC标准则采纳了AC-3的音频压缩算法。
(4)信道编码:两者的扰码器(Radomizers)采用不同的多项
式;两者的里德- 所罗门前向纠错(FEC)编码采用不同的冗余度,
DVB标 准 用 16B, 而 ATSC标 准 用 20B; 两 者 的 交 织 过 程
(Interleaving)不同;在DVB标准中网格编码(Trellix coding)有
可选的不同速率,而在ATSC标准中地面广播采用固定的2/3速率的
网格编码,有线电视则不需采用网格编码。
(5)调制技术:卫星广播系统中DVB标准采用QPSK,而ATSC
标准不涉及卫星广播。有线电视系统中DVB标准采用任选的16/32/64
QAM,而ATSC标准采用16VSB,两者完全不同。地面广播系统中
DVB标准采用具有QPSK、16QAM或64QAM的COFDM(2K个或
8K个载波);而ATSC标准采用8VSB。
2.DVB、ATSC和ISDB成员近况
据最新网络资信,DVB成员已经达到265个(来自35个国家和
地区),主要集中在欧洲并遍及世界各地,我国的广播科学研究院
和TCL电子集团也在其中。ATSC成员30个,其中有美国国内成员
20个、来自阿根廷、法国、韩国等7个国家的成员10个,我国的广
播科学研究院也参加了ATSC组织。ISDB筹划指导委员会委员17个,
其他成员23个,其成员都是日本国内的电子公司和广播机构。
由三个数字电视标准的成员数量及分布情况,可以看出DVB
标准的发展最快,普及范围最大。
已经采纳或决定采纳美国ATSC标准的国家和地区主要有:美
国、加拿大、韩国、阿根廷和我国台湾省(但业者要求改用DVB-T
,卫星电视和有线电视已分别采用了DVB-S和DVB-C);已经采纳
或决定采纳DVB-T地面广播标准的国家和地区主要有:英国、新西
兰、澳大利亚、新加坡、印度和中国香港特别行政区。我国的卫星
电视和数字有线电视也分别采用了DVB-S和DVB-C。
综上所述,DTV(SDTV和HDTV)经过二十余年的探索,目
前各国在视频编码方案上已统一于MPEG-2标准,分歧主要集中于
传输系统上(音频编码方案也有差异)。根据所采用的传输系统方案,
以美国GA系统和欧洲DVB系统为代表,形成了两大流派。从目前
的对比结果来看,这两种系统在技术上难分优劣,并已发展成为各
自国家或地区的数字电视及HDTV的标准。可以说,未来DTV的体
制是统一成一种世界标准,还是象现行模拟电视一样多种体制并存,
主要就取决于这两种流派在传输系统方案上能否融合成一种系统。
由于这一原因,使得传输系统成为当今世界DVB及ATSC领域分歧
最大,争论最多,也是最热门的研究课题。中国不仅已成为欧洲
DVB标准和美国ATSC标准争夺的重点,还很有可能自行制定出第
四种DTV标准,以便获得独立的知识产权。
需要指出的是,数字电视标准之争主要集中在地面传输方式上,
而卫星电视和有线电视的传输方式已分别采用了DVB-S和DVB-C作
为国际标准。
6.6.10 HDTV的音频编码方案
1.综述
自从1996年日本广播协会研制出第一台数字磁带录音机起,数
字音频技术在几十年内得到了迅速的发展。与传统的模拟技术相比,
数字技术具有无法比拟的优点,例如传输质量高;易于采用纠错编
码技术提高抗干扰能力,易于大规模集成等,所以一出现便得到了
迅速发展,从窄带电话,会议电视,普通电视广播到高清晰度电视
广播都在由模拟向数字发展。
但是模拟信号数字化后占用的带宽很宽,给传输和记录带来不
便。例如,CD、DAT等高保真数字音频信号,取样率为、
16bit线性量化,两通道立体声时,数字信号的传输率为
(数字信号传输率=取样频率×量化比特×通道数),在传输这个
数字音频信号时,需要占用的带宽,这相当于模拟信号
20KHz带宽(两通道占用40KHz)的35倍。在限定的频带内传输,
只能减少传输路数;或只能用硬盘(HDD)或磁光盘(MO)等大
容量媒体记录,且难于做到小型化,导致记录成本增高。因此,必
须对模拟信号数字化后的数据进行压缩,从而避开带宽的限制,发
展更高领域的数字音频技术。
2.宽带音频编码的国际标准
鉴于数字化音频技术的优点,各国、各大公司竞相开发数字音
频信号的压缩编码技术。目前,音频压缩编码已成为标准的是
MPEG-1(ISO/IEC11172-3)、MPEG-2(ISO/IEC13818-3)和美
国大联盟推荐的AC-3。这些编码技术普遍利用了人耳的掩蔽效应和
临界频带等听觉特性来进行子带编码或者变换编码。
3.MPEG 声频标准简介
⑴ MPEG-1声频标准
MPEG专家组在制定音频压缩标准时,征求了14种方案,先保
留了4种,最后确定了2种:
① MUSICAM(Masking Pattern Adapted Universal Subband
Integrated Coding And Multiplexing)-掩蔽型通用子频带集成编
码与频分复用。
② ASPEC(Adaptive Spectral Perceptual Entroy Coding)-自
适应频谱感知熵编码。
以上两种算法确定了三种层次(子系统)。层次1为简化的
MUSICAM,层次2等同MUSICAM ,层次3是ASPEC算法结合
MUSICAM算法,并对层次1、层次2向下兼容的一类算法。
层次 1 最适合于消费者应用,例如数字化小型盒带或磁光盘
等家庭记录设备。也就是说,用于那些不强调很低码率的应用。
层次2通过比例系数消除冗余度和不相干性而作进一步的压缩。
等级2(除了帧头外)与MUSICAM 方案完全相同。在消费和专业音频
中有着大量的应用。例如地面的数字音频广播(DAB)、Video-CD等。
层次3采用了均匀量化、自适应分段、量化值的熵编码等技术,
编码效率高,但编码器和解码器都比较复杂。层次3 在电信中最为
有用,特别是窄带ISDN、卫星线路,以及强制要求在低码率有最好
质量的所有情况。
⑵ MPEG-2声频标准
94年,音频压缩编码由双声道扩展到多声道,仍然保持三层次,
声道数扩展到(或3/2/),即左、中、右三个主声道,加左环和
右环两个环绕声道和一个重低音声道,此即是MPEG-2标准。
MPEG-2基本的帧格式与MPEG-1码流完全相同。附加的通道,
例如中、左环、右环在MPEG-1的附属数据区中传送。利用这些附
加通道,能够支持多语言解说声音。
MPEG-2的另一项扩展是增加了使用较低采样频率(即低于
32kHz)的方式,这些方式可在码率预算很有限的情况下应用于解
说和电视会议系统(语音)。
⑶ MUSICAM编码器
MUSICAM信源编码方式充分利用了人类听觉的心理声学现象
和声音信号统计的内在联系,把声音信号的频谱分割为32个子频段,
利用声音信号中的冗余和不相关,实现有效的数据压缩,可以把数
据率降低到CD的七分之一左右,而声音的主观质量仍然可以与CD
相比。因而被广泛的应用于数字音频广播,数字电视伴音,演播室
之间节目交换和存储等方面。
如何尽量降低声音信号中包含冗余和不相关(人耳不能感觉到
的部分),是MUSICAM编码的理论基础。对人类听觉的掩蔽效应,
编码中使用了心理声学模型进行模拟,对人耳能感觉到的信号进行
编码和传输。
根据声音信号在各频率范围中的分析和综合方法的不同,
MUSICAM 编码分为变换编码和子频段编码。进行变换编码时,输
入时域信号,应用快速算法将其转换为频域信号,所产生的频谱值
和相位值经过心理声学模型进行处理之后,以最少的量化进行编码、
传输,最后在解码器中扩展,变换为时域信号;子频带编码时,使
用多相滤波器组将宽带的声音信号分割成32个子频段,对各个子频
段的采样值分别进行数据率降低的编码。另外,对于比特差错的影
响,在宽带系统中将延伸至整个频率范围,而在上述编码中只限制
在窄的频段内,干扰作用大为减弱。
4.杜比AC-3简介
AC-3由杜比实验室开发,目标是为高清晰度电视(HDTV)提
供高质量的声音。美国联邦通信委员会FCC的高级电视咨询委员会
ACATS于1987年开始美国HDTV制式的研究。最初的HDTV系统方
案是模拟图象和数字声音传输,其中声音编码采用Dolby AC-1数字
编码器。AC-1通过4-2-4多声道矩阵方式把声道数减半,然后采用
增量调制( 调制)技术进行数字编码。1989年,随着声音编码技
术和数字信号处理器DSP的进步,AC-1发展为基于变换技术的AC-
2系统,压缩率加倍,但多声道矩阵处理技术仍然保留着。为最大
限度地发挥矩阵方式的特点,必须把编码的信号再编码,而且要边
监听边加以确认;对于电视现场节目而言,有时一次解码不能确认
其效果,这就限制了矩阵方式在HDTV中的应用。由此,人们提出
用两声道的码率提供多声道编码性能,而又没有4 -2 - 4矩阵方式的
局限。AC-3就是为满足此要求而研究的。AC-3使用声道,码率
为320kb/s。
AC-3系统首先在电影业得到实现。1992年,Dolby 正式推出了
AC-3系统的商业产品,并用于电影中。
世界电信联盟ITU-R 在1991年接受基本5声道格式的概念,1992
年修改了相应的建议草案而接受低频效果声道。1993年10月,美
国HDTV大联盟建议采用AC-3;1993年11月,高级电视咨询委员会
ACATS正式批准HDTV系统采用AC-3声音方案。
5.MUSICAM和AC-3的比较
AC-3是美国HDTV的声音制式,MUSICAM是欧洲尤里卡147
计划中的一个联合研究组共同开发的,作为ISO/IEC MPEG的声音
标准。出于政治和经济的需要,MUSICAM 和AC-3在HDTV 和数
字声音广播(DAB)方面的竞争是非常激烈的。下面仅从技术角度
和实际测试结果两个方面对两个系统作一扼要比较。
⑴ 滤波器组的实现
MUSICAM 和AC-3 均需通过滤波器组把时域信号变为频域信
号AC-3根据输入信号的特性动态地改变滤波器组的长度,以达到最
佳的时间和频率分辨率。而MUSICAM采用了固定长度的滤波器组,
实现比较容易,但有时与输入信号特性不能最佳匹配。
⑵ 自适应比特分配
MUSICAM 采用前向自适应比特分配方案,而AC-3采用混合前
向/后向自适应比特分配方案。前向自适应比特分配的特点是只在编
码器中使用听觉模型,因此可以随时修改模型而对解码器没有影响,
但也有实际使用上的限制,它要占用一部分有效的比特率传送明确
的比特分配信息给解码器。后向自适应方案没有从编码器得到明确
的比特分配信息;这种方法的优点是没有占用有效的码率来给解码
器传送比特分配信息,从而具有更高的传输效率和更好的时间及频
率分辨率。其缺点是解码器从接收到的数据中计算比特分配,因此,
计算不能太复杂;同时,一旦编码器中比特分配的算法固定,解码
器投入使用后,听觉模型就不能再更新了。
⑶ 硬件实现
由于MUSICAM 采用前向自适应比特分配,编码器把解码器必
不可少的比特分配信息全部提供给了解码器,因此,解码器实现起
来非常简单。现在已有许多专用集成电路(ASIC)芯片商品化。
6.AAC音频编码标准简介
AAC音频标准是日本高清晰度电视系统ISDB中的音频编码标
准。AAC是高级音频编码( Advanced Audio Coding )的缩写,有时
也被称为NBC,即后向不兼容编码(Non-Backward Compatible),
按这种编码标准做的音频编码同样具有CD音质,而且占用的存储空
间更小,它即是MPEG-2的一部分,也是MPEG-4规范的核心 。
AAC是一种高压缩比的音频压缩算法,它的压缩比远远超过了
较老的音频压缩算法,如AC-3、MP3等。AAC和AC-3都是变换编
码算法,但AAC使用了分辨率更高的滤波器组,因此它可以达到更
高的压缩比。另外AAC还使用了临时噪声重整、后向自适应线性预
测、联合立体声技术和量化哈夫曼编码等最新技术,这些新技术的
使用都使压缩比得到进一步的提高。而且,AAC比AC-3更灵活,它
支持更多种采样率和比特率、支持1个到48个音轨、支持多达15个低
频音轨、具有多种语言的兼容能力、还有多达15个内嵌数据流。现
在已经有了使用AAC算法编码和解码的样本软件,样本解码器软件
的 功 能 比 较 齐 全 , 它 可 以 解 码 全 部 三 种 AAC格 式 : 主 要
Main(Main)、低复杂性LC (Low Complexity)和可变取样率
SSR(Scaleable Sampling Rate)的AAC文件。
MPEG-2的AAC音频编码标准已经被国际标准化组织(ISO)讨
论通过,如果你感兴趣,可以查看ISO的正式文件:《MP3和AAC
的编/解码器的听音比较》,还可以得到ISO给出的供参考用的源程
序代码(Ansi C,2700K),并可以将它修改并编译成你自己的
AAC编/解码程序。
7.其它音频编码标准简介
⑴ 杜比定向逻辑环绕声
杜比定向逻辑环绕声(Dolby Pro Logic)是美国杜比公司开发的
环绕声系统。它是把四声道立体声在录制时通过特定的编码手段合
成为两声道,即将原来的左声道(L)、右声道(R)、中置声道
(C)、环绕声道(S)的4个信号,经编码后合成为LT、BT复合双
声道信号,重放时通过解码器将已编码的双声道复合信号LT和BT
还原为编码的左、右、中、环绕四个互不干犹的独立信号,经放大
后分别输入左音箱、右音箱、中置音箱和环绕音箱。即所谓的4 – 2
– 4编解码方式,但编解码方式是模拟式的,所以声道分隔度不高。
DTS原本是为电影领域开发的一种声音系统,
由德利贝乐格在1993年1月开创的美国数字影院系
统(DTS)公司研制开发出来的一种环绕声技术,
自1996年由美国EAD公司首次推出DTS解码器以
来,DTS数字环绕声系统越来越多地出现在家庭影院中,经过近几年
的发展,其独特的性能和特点越来越受到人们的青睐。DTS系统可以
对4~6声道信号进行编码。DTS进入中国市场较晚,了解和真正应用
了DTS技术的中国厂家还不多。DTS在中国的应用还没有达到普及程
度,中国大部分消费者不了解什么是DTS技术,什么是DTS环绕声效
果,有部分消费者只是大概地知道DTS和杜比AC-3一样,是目前影
音界最先进最流行的技术,买贴有DTS和AC-3标识的产品就好。除
此之外,进一步的有关DTS到底好在哪儿就不知道了。这给部分投机
商造成了可乘之机,带来的一个严重后果是市场上充满了假DTS、假
杜比。另外,值得注意的是目前在中国市场上,带DTS的碟片还很少,
影响了DTS技术的进一步推广。
6.6 .11中国数字电视地面广播的发展现状
我国数字电视的有线广播和卫星广播的标准已目前已分别采用了
欧洲的DVB-C和DVB-S,地面广播标准还在加紧制定中。我国在数
字电视广播标准制式方面虽然起步比较晚,但所取得的进步是非常
引人注目的,进入了世界的先进行列,在这方面的杰出代表有:广
研院杜百川院长、上海交大张文军博士、清华大学的杨林和王兴军
博士等。
数字电视地面广播的传输环境恶劣,频谱资源有限,应用需求
分散,其标准在各国仍有极大的争议,特别是在提高固定接收的稳
定性以及移动接收的性能等方面有很大的改进潜力。目前全球共有
三套已成为国际标准的地面传输系统,分别由美国(95年)、欧洲
(97年)和日本(99年)研制开发而成。从技术上而言,限于当时
的设计方向、使用环境、技术水平和硬件支持能力,这些系统没有
发挥出系统应有的潜力,都存在一些固有缺陷,这也为我们国家制
定自己的数字电视地面广播系统标准留下了宝贵的空间。
我国拥有巨大的数字电视潜在市场,不同于那些本国市场狭小的
出口型国家,关于这一点,就连国外公司的专家也承认:中国的市
场规模足以支撑形成一个新的数字电视标准。我国的第三代移动通
信标准也正是依靠了市场规模的支持。若简单选用国外某一标准,
不仅会扼杀代表未来高技术竞争力的相关关键技术研究的源动力,
而且会迫使我国过早启动市场,帮助西方国家培育国内市场,肢解
我国现有彩电工业体系,使得企业的主要利润都用于支付国外的专
利费和授权费,遗患无穷。
当然,自主制订标准不等于从头全面制订,制订标准不等于保
护落后,不等于不选用先进技术。制订标准的根本目的恰恰在于认
真比较分析各项先进技术能否为我所用,能否得到进一步改进。而
直接选用标准等于“一叶障目”,等于对先进技术改进的否定。在
技术飞速发展的今天,制订标准可更有利于欧美等发达国家向我开
放技术,相反,一旦选用某一国家的标准,将失去其它国家对我们
技术上的支持,丧失技术引进谈判权,甚至会导致未被采用的国外
一方由于市场利益损失所引发的政治上的麻烦。另外,由于数字技
术具备加密、隐密等特点,直接选用标准所可能造成的盲目引进甚
至会危及国家信息安全。在这一点上,日本人是很聪明的。
⑴ 我国现有的数字电视地面广播的试验方案
我国数字电视地面广播的试验方案主要有四种:
① 广播研究院标准化所的中国8VSB,这是参照了美国方案。
② 广研院杜百川院长的CQAM是一种美国8VSB和日本的ISDB
的结合。它主要是把8MHz分成6MHz的VSB传图像和2MHz传数据。
③ 上海交大张文军博士的中国OFDM,说白了是改变了某些参
数的DVB-T传输方案。
④ 清华大学为主的DMB-T传输方案。
前三种方案分别在中央电视台、深圳传输中心进行了试播,表
现出一定的优点,但也存在一些缺陷。
前两种方案解决移动接收方面还有一些问题,第三种方案虽然
可以解决移动接收的问题,也有一定的自主知识产权,但是高清电
视的解码器昂贵。
⑵ 清华DMB-T传输方案
① 方案简介
DMB-T(Terrestrial Digital Multimedia/Television Broadcasting)
基于TDS-OFDM(Time Domain Synchronous-Orthogonal
Frequency Division Multiplexing)调制技术,与8VSB调制不同,
而与DVB-T COFDM和ISDB-T BST OFDM一样都属于多载波技术。
DMB-T传输标准的主要出发点也是基本于多媒体和双向移动接收,
纠错深度比日本的ISDB还要深,采用了最先进的Turbo纠错编码,
在时域中插入同步信号,同步头采用沃尔什编码的伪随机序列,这
样可以做到同步可靠,比噪声低20分贝均可以测到同步信号,所以
能做到快速同步,一般传输方案同步时间为100毫秒以上,而其可
以做到5毫秒以内,并可以准确进行寻址定位,精度在10米以内,
所以可以扩展成蜂窝网。
② 与其它DTV标准的比较
从上述比较表中可以看出清华大学的传输方案具有很多优越
性。特别是对于数据通信,支持“移动的性能”;技术创新上有
所突破,也拥有自主的知识产权;另外一个是其观众的易接纳性,
其解码芯片已经投产并且低于50美金,大众容易接受,这是最符
合中国国情的。
然而,清华DMB-T方案还没有做过真正意义上的地面传输试
验。
③ 尚需完善之处
由于为了增大传输码率,而至使保护间隔最大为80μs ,也就是
说要使接收的信号得到建设性地叠加,发射台的距离不超过24公里,
这对于蜂窝网来说是足够的,但对于现行大功率无线发射覆盖网来
说要实现单频网还是不够的;还有就是信源编码是MPEG-2,与其
它的制式一样,无法降低信源解码的成本;另外,要是扩展成蜂窝
网时,其接收天线能否做得很小可内置于机顶盒与接收机内,如果
不行意义并非十分巨大,行则是前途无可限量。
当然,每一种方案都有它的可行性,也都必须长时间的实验和
测试,清华大学的传输方案优点很多,有很好的前景。但其没有真
正经过开路的广播(2000年深圳高交会期间,在场馆里进行过很小
功率的开路广播),所以,清华大学的传输方案应该早日进行开路
的试播,真真正正经过实践的检验,在实践中不断地修正和完善,
使之更符合我国的国情,从而使其能成为中国的数字电视地面广播
制式,使我国的数字电视地面广播制式在世界上占有一席之地,并
取得领先的地位。
附录:2001年4月《电子工程专辑》网站一项调查结果
问题:
您认为中国应采用何种地面数字广播电视制式 ?
结果:
结果分析:
在投票数中,超过半数的人认为中国的地面数字广播电视制式
应采用自己的标准。撇开技术的考虑,专利费和授权费问题已让许
多人对外来标准望而却步。加上欧美标准存在或多或少的缺陷,这
给中国制订自己的标准提供了技术跨越的机会。中国正在用8-VSB、
DVB-T COFDM系统及自己的几套系统进行比较试验。
量化误差分析模型
当输入信号的满度值为Vm时,
量化间隔ΔV为:
在均匀量化条件下,量化的均方
误差为:
式中:
T为采样周期。信噪比:
返回
关于MPEG-1的压缩比
认为MPEG-1的压缩比可达200:1其实是一种误解,MPEG-1
是不能够直接提供这样高压缩比的。为了将数字电视信的码率从
166 Mb/s降低到 Mb/s左右,人们首先将NTSC和PAL数字电视
转换成公用中分辨率格式CIF(Common Intermediate Format)的数
字电视,这种格式相当于VHS(Video Home System)的质量,于是
彩色数字电视的数据传输率就减小到
352×240×30×8× ≈ 30 Mb/s (NTSC)
352×288×25×8× ≈ 30 Mb/s (PAL)。
把这种彩色电视信号存储到CD盘上所需要的压缩比为:
30/ ≈ 26:1,
这就是MPEG-1技术所能获得的压缩比。
4:2:0的采样格式
Video-CD数据传输率可达到 Mb/s,用它来存储数字电视
信号时,分配给电视信号的数据传输率为 Mb/s(VCD)
返回
电视图像数据率的估算
根据当前成熟的压缩技术,电视图像的数据率压缩成平均为
Mb/s ~ Mb/s时,非专家难于区分电视图像在压缩前后的
之间差别。如果使用DVD-Video存储器来存储数字电视,它的数
据传输率虽然可以达到 Mb/s,但一张 GB的单面单层
DVD盘要存放133分钟的电视节目,按照数字电视信号的平均数
据传输率为 Mb/s来计算,压缩比要达到:166/ ≈ 40:1。
如果电视图像的子采样使用4:2:0格式,每个样本的精度为8
比特,数字电视信号的数据传输率就减小到124 Mb/s,即
720×480×30×8× ≈ 124 Mb/s (NTSC)
720×576×25×8× ≈ 124 Mb/s (PAL)
使用DVD-Video来存储720×480×30或者720×576×25的数字
电视图像所需要的压缩比为:124/ ≈ 30:1。
返回
多媒体技术基础与应用
清华大学计算机科学与技术系智能技术与系统国家
重点实验室
返回
返回
返回
返回