您的位置:KC网络电话 >> 媒体报道>> 语音信息数字化技术的应用

语音信息数字化技术的应用

来源:网上转载  发布时间:2014-11-27 12:13:39

传统电话机产生的信号主要是模拟信号,这些模拟信号需要经过数字化的处理之后,才能在IP网络上进行传输。因此,IP语音通信系统必须要采用合适的信号转换技术才能够实现,将模拟信号转换成数字信号,首先需要对模拟信号进行采样,得到一连串的、离散的信号之后,在对这些离散的信号按照一定规则进行量化,并且将量化的数据进行编码、分组和打包,这些打包之后的数据才可以在IP网络中进行传输。当这些打包的数字化信息到达目的端时,还要将这些打包的数据转化成模拟信号,最终通过电话设备转化成声音。下面介绍一些这个过程中的一些关键技术。

 

语音信息数字化-采样

由于模拟信号是一个连续的信号,在对这个连续的模拟信号进行数字化处理时,首先要根据某个频率来对这个信号进行采样,目前应用较为广泛的做法是通过等间隔采样。如果这个间隔时间越短,采样的频率越高,所转化的数字信号保真度也就越高,数字化语音的质量也就更加的接近于原始的声音,但是所转化的数据量也会更大。

根据著名的香农定理可以得知:如果某个连续信号的最高平率为f,那么使用频率为2f的等间隔采样时,转化的数字化信息可以无损的恢复成原始连续信号。而大部分的语音信息频率都低于4KHz,因此,在IP语音通信中,一般采用8KHz的频率来对模拟语音信号进行采样。

在IP语音中还有个比较重要的概念就是声道,声道的数量表示对模拟信号进行采样的波形的个数,其中单声道表示对语音模拟信号的一个波形进行采样,而双声道表示对语音模拟信号的两个波形进行采样,采用双声道的声音比采用单声道的声音更加逼真,但是存储、传输的数据量是单声道的两倍。

 

语音信息数字化-量化

数字信号的量化,就是将采集的信号进行离散化的过程。连续模拟信号经过采集之后变成了离散的随着信号幅度变化的一系列的采样值,这种连续变化的采样值同样不适合在IP数字通道中进行传输。因此,在IP语音通信系统中,需要将这些采样值进行离散化,转化成一系列离散的电平值。在量化过程中,根据量化的电平值之间间隔是否相等,可以将量化分成均匀量化以及非均匀量化两不中。

其中均匀量化的电平值之间的间隔是均匀的,由于在量化过程中使用了等量化,因此,导致了量化后的小信号信噪比较小,而大信号的信噪比较大。为了解决这个问题,提高小信号的信噪比,提出了非均匀量化的方法,例如,我国和欧洲所采用的A率以及美国所处采用的u率都是这种非均匀化量化的方法。在非均匀化量化过程中,首先就必须将信号进行压扩,压扩的目的在于缩小大信号,放大小信号,然后再进行均匀化的量化,从而大大提高小信号的信噪比。

语音信息量化的精度一般是将样点量化后的数值所占的空间大小来衡量「川,例语音如4位的采样就是将语音信息的采样幅度划分成2“等份。很显然,位数越多,说明语音量化的精度也越大,这样采样的信息也越接近于原始的波形,但是所对存储、传输的要求也就越大。另外,在信号量化过程中波形的动态范围是指波形上限与波形下限之间的单位数。

将模拟信号进行量化之后,所得到的数据量通常会特别大,一般而言,声音量化后的数据量=采样的频率*每个采样的位数*声道数/8(bytes/s)。

 

语音信息数字化-编码

由于将语音信息量化后的数据量较大,在网络上传输较为不便,因此,在进行数据传输之前,通常会对这些量化后的信息进行编码,来降低量化后语音信息的数据量。其中IP语音通信系统中的语音编码器主要就是将用户语音的脉冲编码调制样值编码成较少的帧,使得语音数据在传输过程中占用较小的带宽,从而提高了整个线路的利用率。当数据抵达目的端后,在目的端将语音帧家码成脉冲编码调制,然后形成最终的语音波形传给用户。

目前,国内外常用的语音编码方法有以下几种:

1.脉冲编码调制:脉冲编码调制首先对语音信号进行采样,然后将采样后的数据进行量化。例如ITU-T中的64kpbs语音编码标准就爱用了脉冲编码调制的方式,其中采样的速率固定为8khz,每个样值使用8位的A律进行编码,因此,总的熟虑为64kbps。

2.自适应差分脉冲编码调制:自适应差分脉冲编码调制首先经过特定的算法对输入数据进行预测,然后在实际编码过程中,再根据预测的误差进行编码量化,例如ITU-T中速率为32kbps的6.721就是采用了自适应差分脉冲编码调制,采样的速率同样为8khz,但是每个语音样值只需要使用4位来进行编码。

3.线性预测编码:线性预测编码是一种基本的低速率语音编码方法,线性预测编码的基础是产生语音的模型,在这个语音产生模型中,语音通过一个自适应滤波器通过激励后所产生的。通过线性预测方法,及通过历史样值数据来预测当前所提取的样值。

4.码激励线性预测编码:码激励线性预测编码可以说是目前最为成功的语音编码算法之一,码激励线性预测编码利用线性的方法从声道中提取参数,然后从一个包含了许多非常典型的激励矢量的集合中寻找激励参数,每次编码都会通过原始信息的一些特征从激励矢量集合中寻找最匹配的激励矢量,而通过传输这个激励矢量的序号来进行数据的传输,到目的地之后根据这个序号寻找相应的激励矢量来进行信号的复原。

以上介绍的四种语音编码方法各有其优缺点,表2-2就对这四种编码方法的性能进行了详细的比较。

 

语音信息数字化技术的应用

 

上一条:企业IP电话DOS攻击防范
下一条:什么是H.323协议