发烧论坛

注册

 

发新话题 回复该主题

维基百科全书上关于”音频系统测量“的定义,供大家参考 [复制链接]

1#

  • 本帖是多国对“高保真定义”的补充贴,详细可以点击链接看帖子。
  • 音频的重播,可以被衡量,被测试吗?
  • 哪些是属于可客观测试?

音频系统测量
用于量化音频系统性能。
这些测量有多种目的。设计师通过测量来指定设备的性能。维护工程师进行这些测试是为了确保设备仍按规格工作,或确保音频路径的累积缺陷在可接受的范围内。音频系统测量通常采用心理声学原理,以与人类听觉相关的方式测量系统.

主观性和频率加权
1970 年代,主观有效的方法在英国和欧洲的消费类音频中开始受到重视,当时紧凑型盒式磁带、dbx杜比降噪技术的引入揭示了许多基本工程测量的不令人满意的性质。加权 CCIR-468 准峰值噪声加权准峰值 wow 和 flutter的规范得到特别广泛的应用,并试图寻找更有效的失真测量方法。

基于心理声学的测量(例如噪声测量)通常使用加权滤波器。众所周知,人类听觉对某些频率比其他频率更敏感,如等响度等值线所示,但这些等值线因声音类型而异,这一点并未得到很好的理解。例如,纯音的测量曲线与随机噪声的测量曲线不同。与连续声音相比,耳朵对低于 100 到 200 毫秒的短脉冲的反应也较差[1],因此,当噪声包含咔嗒声或脉冲串时,准峰值检测器可以给出最具代表性的结果,数字系统中的噪声通常就是这种情况。[2]由于这些原因,已经设计了一套主观有效的测量技术,并将其纳入 BSIECEBUITU 标准。这些音频质量测量方法被世界大部分地区的广播工程师以及一些音频专业人员使用,尽管其他人仍然普遍使用用于连续音调的旧 A 加权标准。[3]

没有单一的测量可以评估音频质量。相反,工程师使用一系列测量来分析可能降低保真度的各种类型的退化。因此,在测试模拟磁带机时,有必要测试较长时间内的哇叫声、颤振和磁带速度变化,以及失真和噪声。在测试数字系统时,由于数字电路中 clocks 的精度,通常认为没有必要测试速度变化,但测试混叠和时序抖动通常是可取的,因为这些在许多系统中会导致声音降级。[来源请求]

一旦主观有效的方法被证明与各种条件下的听力测试具有良好的相关性,那么这些方法通常被首选采用。在同类比较中,标准工程方法并不总是足够的。例如,当使用 RMS 方法甚至 A 加权 RMS 方法测量时,一个 CD 播放机的测量噪声可能比另一个 CD 播放机高,但在使用 468 加权时,听起来更安静,测量结果更低。这可能是因为它在高频甚至超过 20 kHz 的频率下具有更多的噪声,这两者都不太重要,因为人耳对它们不太敏感。(请参阅噪声整形。此效果是杜比 B 的工作原理以及引入它的原因。盒式磁带噪声主要是高频,考虑到录制轨道的小尺寸和速度,这是不可避免的,因此在主观上可以变得不那么重要。噪声听起来小了 10 dB,但除非使用 468 加权而不是 A 加权,否则无法更好地测量。


一楼补充音响中,“可衡量的性能”

 
分享 转发
TOP
2#

可衡量的客观音频性能
模拟电气
频率响应 (FR)

此测量值告诉您音频组件的输出电平在哪个频率范围内将保持合理恒定(在指定的分贝范围内,或者不超过 1 kHz 时振幅的一定 dB 数)。某些音频组件(如音调控制)旨在调整特定频率下信号内容的响度,例如,低音控制允许衰减或强调低频信号内容,在这种情况下,规范可以指定频率响应采用音调控制“平坦”或禁用。前置放大器还可能包含均衡器、滤波器,例如用于播放需要 RIAA 频率响应校正的 LP,在这种情况下,规范可以描述响应与标准的匹配程度。另一方面,频率范围是扬声器和其他传感器有时使用的术语,用于表示可用的频率,通常不指定分贝范围。功率带宽也与频率响应有关——表示高功率下可用的频率范围(因为频率响应测量通常在低信号电平下进行,此时转换速率限制或变压器饱和不会成为问题。
具有“平坦”频率响应的元件不会改变指定频率范围内信号内容的权重(即强度)。音频组件的频率范围通常在 20 Hz 到 20 kHz 之间,这大致反映了人类的听觉范围(大多数人的最高可听频率小于 20 kHz,16 kHz 更典型[4])。具有“平坦”频率响应的元件通常被描述为线性元件。大多数音频组件在其整个工作范围内设计为线性的。设计良好的固态放大器和 CD 播放器在 20 Hz 到 20 kHz 之间的频率响应可能仅变化 0.2 dB。[5]扬声器的平坦频率响应往往比这小得多。


总谐波失真 (THD)
音乐素材包含不同的音调,某些类型的失真涉及频率是这些音调频率的两倍或三倍的杂音。这种与谐波相关的失真称为谐波失真。对于高保真度,电子设备通常预计< 1%;扬声器等机械元件通常具有不可避免的更高电平。在使用负反馈的电子产品中,低失真相对容易实现,但以这种方式使用高电平反馈一直是发烧友中备受争议的话题。[来源请求]基本上,所有扬声器都比电子设备产生更多的失真,在中等响度的聆听水平下,1-5% 的失真并非闻所未闻。人耳对低频失真不太敏感,在大声播放时,音量通常低于 10%。仅为正弦波输入产生偶数次谐波的失真有时被认为比奇数次失真更麻烦。


输出功率
理想情况下,放大器的输出功率可以测量并引用为在特定负载下指定失真水平下每个通道的最大均方根 (RMS) 功率输出,根据惯例和**法规,这被认为是音乐信号上可用的功率最有意义的衡量标准,尽管真实的非削波音乐具有很高的峰均比,并且通常平均值远低于可能的最大值。通常给出的 PMPO(峰值音乐功率输出)的测量方法在很大程度上没有意义,并且经常用于营销文献中;在 1960 年代后期,关于这一点存在很多争议,美国** (FTA) 要求所有高保真设备都必须引用 RMS 数据。近年来,音乐力量一直在卷土重来。另请参阅 音频功率。
功率规格要求指定负载阻抗,在某些情况下会给出两个数字(例如,扬声器功率放大器的输出功率通常在 4 和 8 欧姆处测量)。为了向负载提供最大功率,驱动器的阻抗应该是负载阻抗的复共轭。在纯阻性负载的情况下,驱动器的电阻应等于负载的电阻,以实现最大输出功率。这称为阻抗匹配.


互调失真 (IMD)
与被放大的信号没有谐波关系的失真是互调失真。它是衡量不同频率输入信号的不必要组合所产生的杂散信号电平的量度。这种效果是由系统中的非线性引起的。足够高水平的负反馈可以减少放大器中的这种影响。许多人认为,最好以最小化反馈水平的方式设计电子设备,尽管这在满足其他高精度要求的同时很难实现。与谐波失真一样,扬声器驱动器中的互调几乎总是比大多数电子设备中的互调大。IMD 随着锥体偏移而增加。减少驱动程序的带宽会直接降低 IMD。这是通过将所需的频率范围分成单独的频段,为每个频段使用单独的驱动器,并通过分频滤波器网络馈送它们来实现的。陡峭斜率分频滤波器在降低 IMD 方面最有效,但使用大电流组件实现成本可能太高,并且可能会引入振铃失真。[6]使用有源分频器可以大大降低多驱动器扬声器中的互调失真,尽管它大大增加了系统成本和复杂性。
噪声
由系统本身或添加到信号中的外部源的干扰产生的不需要的噪声的级别。嗡嗡声通常仅指电源线频率下的噪声(与宽带白噪声相反),它是通过将电源线信号感应到增益级的输入端、调节不当的电源或组件接地不良而引入的。
串音
由接地电流、杂散电感或元件或线路之间的电容引起的噪声(来自另一个信号通道)的引入。串扰有时会显著减少声道之间的分离(例如,在立体声系统中)。串扰测量会产生一个以 dB 为单位的数字,相对于接收干扰的路径中的标称信号电平。串扰通常只是在同一机箱中处理多个音频通道的设备中的问题。
共模抑制比 (CMRR)
在平衡音频系统中,输入中存在相等和相反的信号(差模),施加在两条导联上的任何干扰都将被减去,从而抵消该干扰(即共模)。CMRR 是衡量系统忽略此类干扰的能力,尤其是其输入端的嗡嗡声的能力的指标。通常,只有当输入上的长线路或存在某些类型的接地回路问题时,它才有意义。不平衡输入没有共模电阻;其输入端的感应噪声直接显示为 Noise 或 Hum。
动态范围和信噪比 (SNR)
组件可以容纳的最大级别与它产生的噪声级别之间的差值。输入噪声不计入此测量。它以 dB 为单位。
动态范围是指给定信号源(例如,音乐或节目素材)中最大响度与最小响度的比率,此测量值还量化了音频系统可以承载的最大动态范围。这是无信号设备的本底噪声与可在指定(低)失真水平下输出的最大信号(通常为正弦波)之间的比率(通常以 dB 表示)。
自 1990 年代初以来,包括音频工程学会在内的多个权威机构建议在存在音频信号的情况下测量动态范围。这避免了基于使用空白介质或屏蔽电路的可疑测量。
然而,信噪比 (SNR) 是本底噪声与任意参考电平或对齐电平之间的比率。在“专业”录音设备中,此参考电平通常为 +4 dBu (IEC 60268-17),但有时为 0 dBu(英国和欧洲 – EBU 标准校准电平)。“测试级别”、“测量级别”和“阵容级别”的含义不同,通常会导致混淆。在“消费类”设备中,不存在标准,但 −10 dBV 和 −6 dBu 很常见。
不同的介质通常表现出不同数量的噪声和动态余量。尽管不同单位的值差异很大,但典型的模拟磁带可能提供 60 dB,CD 可能提供接近 100 dB。大多数现代质量放大器的动态范围为 >110 dB,[7] 接近人耳的动态范围,通常约为 130 dB。请参阅计划级别。


相位失真, 群延迟和相位延迟
完美的音频组件将在整个频率范围内保持信号的相位相干性。相位失真可能极难减少或消除。人耳在很大程度上对相位失真不敏感,尽管它对听到的声音中的相对相位关系非常敏感。我们对相位误差的敏感性很复杂,再加上缺乏提供易于理解的质量评级的便捷测试,这就是它不是传统音频规范的一部分的原因。[来源请求]多驱动器扬声器系统可能具有复杂的相位失真,这些失真是由分频器、驱动器放置和特定驱动器的相位行为引起或纠正的。
瞬态响应
对于稳态信号,系统可能具有低失真,但在突然的瞬态信号上则不然。在放大器中,这个问题可以追溯到在某些情况下的电源、高频性能不足或负反馈过多。相关测量包括 slew rate 和 rise time。瞬态响应的失真可能很难测量。按照现代标准,许多其他优秀的功率放大器设计被发现具有不足的转换速率。在扬声器中,瞬态响应性能受驱动器和外壳的质量和谐振以及分频滤波或扬声器驱动器时间对齐不足引起的群延迟和相位延迟的影响。大多数扬声器会产生大量的瞬态失真,尽管有些设计不太容易产生这种失真(例如静电扬声器、等离子弧高音扬声器、带状高音扬声器和具有多个入口点的号角外壳)).
阻尼系数
通常认为数字越高越好。这是衡量功率放大器控制扬声器驱动器意外运动的能力的指标。放大器必须能够抑制由扬声器锥体的机械运动(例如惯性)引起的共振,尤其是质量较大的低频驱动器。对于传统的扬声器驱动器,这主要涉及确保放大器的输出阻抗接近于零,并且扬声器线足够短且直径足够大。阻尼因数是放大器和连接电缆的输出阻抗与音圈直流电阻之比,这意味着长而高电阻的扬声器线会降低阻尼因数。对于现场扩声系统,20 或更高的阻尼系数被认为已经足够了,因为与惯性相关的驱动器运动的 SPL 比信号电平低 26 dB,并且不会被听到。[8]放大器中的负反馈会降低其有效输出阻抗,从而增加其阻尼系数。
TOP
3#

可测量的客观音频性能,下,机械部分。与数字部分。

机械
哇和颤动
这些测量与组件中的物理运动有关,主要是模拟媒体(如黑胶唱片和磁带)的驱动机制。“哇”是由驱动电机速度的长期漂移引起的慢速(几赫兹)变化,而“颤振”是较快的速度(几十赫兹)变化,通常是由机械缺陷引起的,例如磁带传输机构的绞盘不圆。测量值以 % 为单位,数字越小越好。
隆隆
模拟播放系统的转盘贡献的低频(数十 Hz)噪声的度量。它是由轴承不完美、电机绕组不均匀、某些转盘中驱动带的振动、转盘安装传递的房间振动(例如,来自交通)以及唱机唱头引起的。数字越小越好。

数字
请注意,数字系统在信号级别上不会受到许多这些影响,尽管相同的过程发生在电路中,因为正在处理的数据是符号的。只要符号在组件之间的传输中幸存下来,并且可以完美地重新生成(例如,通过脉冲整形技术),数据本身就会得到完美的维护。数据通常缓冲在内存中,并由非常精确的晶体振荡器计时。数据在经过许多阶段时通常不会退化,因为每个阶段都会重新生成新的符号进行传输。

数字系统有其自身的问题。数字化会增加噪声,这是可测量的,并且取决于系统的音频位深度,而与其他质量问题无关。采样时钟中的时序误差 (jitter) 导致信号的非线性失真 (FM 调制)。数字系统的一个质量衡量标准(误码率)与传输或接收中出错的概率有关。有关系统质量的其他指标由采样率和位深度定义。一般来说,数字系统比模拟系统更不容易出错;然而,几乎所有的数字系统都有模拟输入和/或输出,当然所有与模拟世界交互的系统都有模拟输入和/或输出。数字系统的这些模拟组件可能会受到模拟影响,并可能损害设计良好的数字系统的完整性。

抖动
测量测量的 clock timing 与理想 clock之间的 period (periodic jitter) 和绝对 timing (random jitter) 变化。通常,较少的抖动通常更适合采样系统。
采样率
模拟信号测量速率的规范。这是以每秒采样数或赫兹为单位的。更高的采样率允许更大的总带宽或通带频率响应,并允许在阻带中使用不太陡峭的抗混叠/抗成像滤波器,这反过来可以改善通带中的整体相位线性度。
位深度
在 Pulse-code modulation 音频中,位深度是每个样本中信息的位数。量化是数字音频采样中使用的一种过程,它会在重建的信号中产生错误。Signal-to-quantization-noise ratio 是位深度的倍数。
音频 CD 使用 16 位的位深度,而 DVD 视频和蓝光光盘可以使用 24 位音频。16 位系统的最大动态范围约为 96 dB[10]而 24 位系统的最大动态范围约为 144 dB。
Dither 可用于音频母带处理来随机化量化误差,而一些 Dither 系统使用 Noise shaping 来对量化本底噪声的频谱形状进行采样。使用成形抖动可以将 16 位音频的有效动态范围增加到 120 dB 左右。[11]
要计算数字系统的最大理论动态范围(信噪比 (SQNR)),请对位深度 Q 使用以下算法:

示例:一个 16 位系统有 216 种不同的可能性,从 0 到 65,535。没有抖动的最小信号是 1,因此不同级别的数量少 1,即 216 − 1。
因此,对于 16 位数字系统,动态范围为 20·log(216 − 1) ≈ 96 dB。
样品准确度/同步
与其说是规范,不如说是一种能力。由于独立的数字音频设备都由各自的晶体振荡器运行,并且没有两个晶体是完全相同的,因此采样率会略有不同。这将导致设备随着时间的推移而漂移。其影响可能会有所不同。如果一个数字设备用于监控另一个数字设备,这将导致音频丢失或失真,因为一个设备在单位时间内产生的数据将比另一个设备多或少。如果两个独立的设备同时录制,则随着时间的推移,一个设备将越来越滞后于另一个设备。这种影响可以通过 word clock synchronization 来规避。它也可以在数字域中使用漂移校正算法进行校正。这种算法比较两个或多个设备的相对速率,并从任何偏离主设备的设备的流中丢弃或添加样本。采样率也会随时间略有变化,因为晶体会随着温度等的变化而变化。参见 clock recovery
线性
微分非线性和积分非线性是模数转换器精度的两种衡量标准。基本上,它们测量每个 bit 的 threshold 电平与理论等距电平的接近程度。
TOP
4#

自动序列测试
序列测试使用自动生成和测量频率响应、噪声、失真等特定测试信号序列,以对设备或信号路径进行完整的质量检查。1985 年,EBU 对单个 32 秒序列进行了标准化,包括 13 个音调(−12 dB 时为 40 Hz–15 kHz)用于频率响应测量,两个音调用于失真(+9 dB 时为 1024 Hz/60 Hz)以及串扰和压缩扩展器测试。该序列以 110 波特的 FSK 信号开始,用于同步目的,也于 33 年成为 CCITT 标准 O.1985。[12]

Lindos Electronics 扩展了这一概念,保留了 FSK 概念,并发明了分段序列测试,将每个测试分成一个“段”,以 110 波特 FSK 传输的识别字符开始,以便这些字符可以被视为适合特定情况的完整测试的“构建块”。无论选择哪种混合,FSK 都会为每个分段提供识别和同步,因此通过网络甚至卫星链路发送的序列测试都会由测量设备自动响应。因此,TUND 表示一个由四个段落组成的序列,这些段落在不到一分钟的时间内测试对齐电平、频率响应、噪声和失真,还有许多其他测试,例如 Wow 和 Flutter、Headroom 和 Crosstalk 也可以作为段落以及整体使用。

无法量化?

本节缺少有关旨在匹配主观声音质量的新型客观指标的信息,包括 PEAQ (1998) 和 ViSQOL (Google, 2015)。 请展开该部分以包含此信息。更多细节可能在讨论页上存在。(2023 年 8 月)
许多音频组件使用客观和可量化的测量结果(例如 THD、动态范围和频率响应)进行性能测试。有些人认为客观测量是有用的,并且通常与主观表现(即听众体验到的音质)密切相关。[13]Floyd Toole 在声学工程研究中对扬声器进行了广泛的评估。[14][15]在一份同行评审的科学期刊上,Toole 提出了研究结果,即受试者具有一系列区分好扬声器和坏扬声器的能力,并且盲听测试比视力测试更可靠。他发现,在单声道播放过程中,受试者可以通过单个扬声器更准确地感知扬声器质量的差异,而对立体声的主观感知则更多地受到房间效应的影响。[16]Toole 的一篇论文表明,扬声器性能的客观测量与听力测试中的主观评价相匹配。[17]

一些人认为,由于人类的听觉和感知没有得到完全理解,听众的体验应该高于一切。这在家庭音频出版物中经常遇到。[18]盲听测试和常见的客观表现测量(例如 THD)的有用性受到质疑。[19]例如,给定 THD 的交越失真比相同 THD 下的削波失真更容易听到,因为产生的谐波处于更高的频率。这并不意味着缺陷在某种程度上是不可量化或不可衡量的;只是单个 THD 数字不足以指定它,必须小心解释。在不同的输出电平下进行 THD 测量将暴露失真是削波(随电平增加)还是交叉(随电平减小)。

无论哪种观点,一些测量方法历来都受到青睐。例如,THD 是等权重的谐波数量的平均值,尽管研究 [需要引证] 确定与高阶谐波相比,低阶谐波在同一电平上更难听到。此外,据说偶数次谐波通常比奇数次谐波更难听到。已经发布了许多试图将 THD 与实际可听性相关联的公式,但是,没有一个获得主流使用。[来源请求]

大众市场消费者杂志 Stereophile 宣传家庭音频爱好者更喜欢视力测试而不是盲测的说法。[20][21]

完毕。
TOP
发新话题 回复该主题