第七章:改善和维护语音质量

思科出版社

  • 确定IP网络提出的影响语音的问题,并描述用于解决这些问题的QoS机制。

  • 使用Cisco的AutoQoS特性,在基于Cisco ios的Catalyst交换机和路由器上设置基本的QoS配置。

  • 利用CAC工具和机制实现网络上的呼叫控制。

当人的语音被转换成模拟电信号,然后进行数字化和压缩时,一些定性成分就会丢失。本章探讨必须维护的语音质量的组成部分,可以用来衡量语音质量的方法,以及可以在网络中实现以提高语音质量的服务质量(QoS)工具。

优化语音质量

由于语音和数据融合IP网络的固有特性,管理员在正确发送语音流量方面面临着一定的挑战。本节描述了这些挑战,并提供了在设计VoIP网络以获得最佳语音质量时避免和克服这些挑战的解决方案。

影响语音质量的因素

由于IP网络的性质,通过IP发送的语音包会遇到某些传输问题。网络中存在的条件可能会带来诸如回声、抖动或延迟等问题。这些问题必须通过QoS机制来解决。

音频信号的清晰度或清洁度是至关重要的。听者必须能够识别说话者的身份,感知说话者的情绪。这些因素会影响清晰度:

  • 忠诚——程度一个系统或系统的一部分,准确地再现了,在它的输出,让其输入信号的基本特征或规定操作的结果让其输入信号(从电信行业解决方案联盟定义[ATIS航站])。传输介质的带宽几乎总是限制语音的总带宽。人类语言通常需要100到10000赫兹的带宽,尽管90%的语音智能包含在100到3000赫兹之间。

  • 回声-传输路径中电阻抗不匹配的结果。回声总是存在的,即使在传统的电话网络中,但其水平无法被人的耳朵检测到。影响回声的两个因素是振幅(即回声的响度)和延迟(即说话的声音和回声之间的时间)。可以使用回波抑制器或回波消除器控制回波。

  • 抖动-编码语音包到达VoIP网络远端时的变化。数据包到达时间的变化会导致语音信号的再现和回放出现间隙。这些间隙是不受欢迎的,并且会使听者感到厌烦。在网络中,延迟是由单个数据包的路由变化、争用或拥塞引起的。通常可以通过使用dejitter缓冲区来解析可变延迟。

  • 包滴-语音包丢弃。一般来说,当一个VoIP数据包从网络中丢失时,20毫秒的音频就会丢失。

  • 延迟-从说话的声音到电子传送的声音到达远端之间的时间。延迟是由多个因素引起的,包括距离(即传播延迟)、编码、压缩、序列化和缓冲。

  • 侧音-有目的的电话设计,使扬声器可以听到在耳机的语音。如果没有旁音,听筒就会给人留下电话仪器不工作的印象。

  • 背景噪音-从远端连接听到的低音量音频。某些节省带宽的技术可以完全消除背景噪声,如语音活动检测(VAD)。当该技术实现时,讲话者的音频路径对听话者是开放的,而听话者的音频路径对讲话者是封闭的。VAD的效果通常是,说话者认为连接中断了,因为他们从另一端什么也听不到。

尽管上述因素都会影响音频清晰度,但给VoIP网络带来最大挑战的因素包括抖动、延迟和丢包。缺乏网络带宽通常是导致这些问题的根本原因,这些问题将在下面几节中讨论。

抖动

抖动定义为接收包延迟的变化,如图7 - 1。在发送端,数据包以连续的流发送,数据包间隔均匀。由于网络拥塞、不恰当的排队或配置错误,这个稳定的流可能变得不均匀,因为每个包之间的延迟是变化的,而不是保持不变的。

当路由器接收到VoIP音频流时,它必须补偿所遇到的抖动。处理这个函数的机制是播出延迟缓冲区,dejitter缓冲区。播放延迟缓冲器必须缓冲这些数据包,然后将它们以稳定的流播放给数字信号处理器(dsp),再将其转换回模拟音频流。然而,播放延迟缓冲器影响整体绝对延迟。

当谈话受到干扰时,结果可以清楚地听到。如果谈话者说:“华生,到这儿来。”我想要你,”侦听器可能会听到“窟年代……在……来这里,我……哇……nt……y……你。”数据包在接收端可变的到达导致语音被延迟和乱码。

图7.1

图7 - 1

IP网络中的抖动

延迟

总体延迟和绝对延迟都会影响VoIP。你可能在和另一个大陆的人通电话时遇到过拖延。这种延迟会导致对话中整个词都被打断,因此会非常令人沮丧。

在设计通过分组、帧或小区基础设施传输语音的网络时,理解并考虑网络中可预测的延迟组件是很重要的。您还必须正确地考虑所有潜在的延迟,以确保总体网络性能是可接受的。整体语音质量是许多因素的函数,包括压缩算法、错误和帧丢失、回声消除和延迟。

图7 - 2)显示各种来源和延迟类型。请注意,有两种不同类型的延迟:

  • 固定延迟组件是可预测的,并直接增加了连接的总体延迟。固定延迟组件包括:

  • - - - - - -编码-将音频信号转换为数字信号的时间

    - - - - - -分包-将数字语音信息放入包中并从包中取出信息所花费的时间

    - - - - - -序列化-将位插入到链路上

    - - - - - -传播-数据包遍历链路的时间

  • 变量延迟由位于连接到广域网的串行端口上的出口中继缓冲区中的排队延迟引起。这些缓冲区在网络上创建可变延迟(即抖动)。

图7.2

图7 - 2)

延迟的来源

可接受的延迟

国际电联在建议G.114中规定了语音应用的网络延迟。本建议定义了三种单向时延,如表7-1所示。

表7 - 1组件和服务

范围以毫秒为单位

描述

0到150

可接受的大多数用户应用程序。

150年到400年

可接受,前提是管理员知道传输时间及其对用户应用程序传输质量的影响。

超过400

不能用于总体网络规划;但是,人们认识到,在某些例外情况下,将会超过这一限度。


注意:此建议适用于回声得到充分控制的连接,这意味着使用回声消除器。当单向延迟超过25ms时,需要回声消除器(G.131)。


这个G.114建议是针对国家电信管理局的,因此比通常适用于专用语音网络的建议更严格。当网络设计人员知道终端用户的位置和业务需求时,更多的延迟可能是可以接受的。对于私有网络,200毫秒延迟是一个合理的目标,250毫秒延迟是一个限制。这个目标是思科提出的合理的,只要过度的抖动不影响语音质量。然而,所有的网络都必须被设计成最大的语音连接延迟是已知的并且最小化的。

114建议只考虑单程延误,不考虑往返延误。网络设计工程师在设计时必须同时考虑可变延迟和固定延迟。可变延迟包括排队和网络延迟,而固定延迟包括编码、分组、序列化和dejitter缓冲区延迟。延迟预算的计算示例如表7-2所示。

表7 - 2样品推迟预算

延迟类型

固定(女士)

变量(女士)

编码器延迟

18

N/A

分组延迟

30.

N/A

排队和缓冲

N/A

8

序列化(64 kbps)

5

N/A

网络延迟(通过公网)

40

25

Dejitter缓冲

45

N/A

总数

138

33

包丢失

丢失的数据包,如图7如果端点可以请求重传,则可恢复。但是,丢失的语音包是可恢复,因为音频必须实时播放,不能重传。

图7.3

图7

包丢失

语音包在以下情况下可能会被丢弃:

  • 网络不稳定(链路抖动)。

  • 网络拥塞。

  • 网络中存在太多的可变延迟。

丢包会导致语音剪切和跳过。因此,听者会听到对话中的空白。思科dsp中使用的行业标准编解码器(CODEC)算法通过使用丢包隐藏(PLC)算法纠正20-50毫秒的语音丢失。PLC智能分析漏包,生成合理的替换包,提高语音质量。思科VoIP技术默认使用每VoIP包20毫秒的语音有效载荷样本。有效的编解码器校正算法要求在任何给定时间只能丢失一个包。如果丢失的数据包更多,侦听器就会出现缺口。

如果一段对话出现丢包,就会立即听到其影响。如果谈话者说:“华生,到这儿来。”我想要你,”听众可能会听到“Wat....。,过来,......你。”

质量指标

为了便于管理,质量必须是可测量的。三个质量度量指标包括平均意见评分(MOS)、感知语音质量度量(PSQM)和感知语音质量评价(PESQ)。

金属氧化物半导体

MOS是一种语音质量评分系统。当听者评估预先录制的句子时,就会产生MOS分数,这些句子受到不同的条件(如压缩算法)的影响。然后听者根据从1到5的范围给句子赋值,1代表最差,5代表最好。英语MOS测试用的句子是:“Nowadays, a chicken leg is a rare dish.”(如今,鸡腿是一道罕见的菜。)这个句子之所以被使用,是因为它包含了人类语言中广泛的声音,如长元音、短元音、硬音和软音。

然后测试分数被平均为综合分数。测试结果是主观的,因为它们是基于听众的意见。这些测试也是相对的,因为一个测试的3.8分不能直接与另一个测试的3.8分进行比较。因此,对于所有的测试,如G.711,都需要建立一个基线,以便将分数标准化并直接进行比较。

PSQM

PSQM是一种自动测量“服务中”语音质量的方法。PSQM软件通常驻留在IP呼叫管理系统中,这些系统有时被集成到简单网络管理协议(SNMP)系统中。

可以通过第三方供应商获得测量PSQM的设备和软件,但在思科设备中没有实现。PSQM测量是通过比较原始传输语音和传输信道远端产生的语音进行的。PSQM系统作为在役组件部署。PSQM测量是在网络上的真实会话中进行的。与MOS等主观听力测试相比,这种自动测试算法的准确率超过90%。评分标准是0 - 6.5,0代表最好,6.5代表最差。因为PSQM最初是为电路交换语音而设计的,所以它没有考虑包交换语音系统中遇到的抖动或延迟问题。

PESQ

目前的VoIP网络不推荐使用MOS和PSQM。两者最初是在VoIP技术出现之前设计的,并没有测量典型的VoIP问题,如抖动和延迟。例如,在VoIP网络中,当单向延迟超过500毫秒时,MOS评分可能达到3.8,因为MOS评估器没有双向对话的概念,只听音频质量。不计算单向延迟。

相关:
123.456 第1页
第1页,共6页
2021年IT薪资调查:结果在