8
涵盖模块
20+
具体设置
6
真实案例
iZotope RX 是电影、电视、广告和在线视频制作中对话清理的主流工具。没有其他软件能将频谱编辑、机器学习降噪和针对性修复模块整合在一个应用程序中。本指南涵盖了与对话清理相关的每个模块,包括具体的初始设置、诚实的局限性说明以及来自越南制作工作的真实案例。这里的设置适用于 RX 10 或 RX 11——这些版本之间的模块界面保持一致。
1. Voice De-noise
自适应与手动降噪
Voice De-noise 可消除对话录音中的宽带噪声(嘶嘶声、空调声、风扇噪声、环境房间噪声)。它提供两种模式:Learn 和 Adaptive。
Learn 模式:选择一段纯噪声部分(没有对话——只有背景声),点击 Learn。RX 会捕获一个噪声配置文件——噪声底噪的频谱快照。然后处理整个片段。该模块从音频中减去噪声配置文件,只留下对话。这是最可靠的方法,因为您可以精确控制被移除的内容。
Adaptive 模式:该模块持续分析音频并实时分离噪声和对话。不需要噪声配置文件。Adaptive 更快但精度较低——它可能将安静的对话误判为噪声并予以移除。只有在没有干净的纯噪声段可供学习时才使用 Adaptive。
常见场景设置:
轻度空调噪声(酒店会议室、办公室):
- 模式:Learn(在对话语句之间捕捉 2-3 秒的纯空调声)
- 降噪量:6-10 dB
- 噪声配置文件:捕捉低频轰鸣(60-200 Hz)加上宽带嘶嘶声
- 学习时间:至少 2-3 秒
- 结果:对话听起来自然,空调声变得几乎听不到。在这些级别下没有伪影。
中等空调 + 风扇噪声(越南咖啡馆、餐厅厨房区域):
- 模式:Learn
- 降噪量:10-16 dB
- 噪声配置文件捕捉低频分量和中频风扇嗡嗡声(800-2000 Hz)
- 潜在伪影:超过 10 dB 降噪量时对话会轻微变薄。在 De-noise 之后用轻微的高频搁架提升(8 kHz 处 1-2 dB)来补偿。
重度背景噪声(街道录音、河内/胡志明市的摩托车交通):
- 模式:Adaptive(交通噪声不断变化——静态噪声配置文件无法捕捉变化)
- 降噪量:12-18 dB
- Adaptive 速度:中等(更快的速度追踪噪声变化但有将对话一起拉走的风险)
- 结果:显著降噪但仍会残留一些噪声。严重的交通噪声无法在不产生伪影的情况下完全消除。预期 60-80% 的改善,而非 100%。
诚实局限性:超过 18-20 dB 的降噪量,Voice De-noise 会引入可听到的伪影——对话出现水声、相位失真的非自然质感。这适用于所有降噪算法,不仅仅是 RX。如果需要超过 18 dB 的降噪量,说明录音噪声太大,应尽可能重新录制(ADR)。
Voice De-noise 最佳实践
- 始终从录音中最安静的部分学习噪声配置文件——而不是最响的噪声。最安静的部分包含一致的噪声底噪,没有瞬态干扰。
- 多次轻度处理优于一次重度处理。两次 6-8 dB 的处理比一次 14 dB 的处理效果更好。较轻的处理使伪影累积得更少。
- 聆听 Difference 信号(在模块面板中切换)——它播放 RX 正在移除的内容。如果在 Difference 信号中听到对话,说明您移除得太多了。减少降噪量。
- 使用频率范围控制将 De-noise 限制在特定频段。如果噪声仅在 500 Hz 以下,将高频限制设为 500 Hz。这保护了 500 Hz 以上的对话清晰度免受不必要的处理。
- 在 De-hum 之前应用 De-noise。De-noise 可能会部分降低嗡嗡声作为宽带噪声,使 De-hum 模块的工作更容易,并降低激进 De-hum 设置产生音乐噪声伪影的风险。
2. De-hum:越南 50Hz 电网
消除 50Hz 电气嗡嗡声
越南的电网以 50Hz 运行(与欧洲和亚洲大部分地区相同,不同于美国、加拿大和南美部分地区使用的 60Hz)。来自接地问题、廉价电源和附近电气设备的电气嗡嗡声会引入 50Hz 基频以及 100、150、200、250、300 Hz 及更高频率的谐波。
越南 De-hum 模块设置:
- 基频:50 Hz
- 滤波器类型:Notch(默认且推荐)
- 谐波数量:10(捕获高达 500 Hz 的谐波系列)
- 滤波器 Q 值:10-20(窄带陷波——移除嗡嗡声频率而不影响周围音频)
- 降噪量:从 6 dB 开始,如果嗡嗡声仍可听到则增加到 12 dB
接地环路嗡嗡声(持续存在,贯穿整个录音):
- 这是最容易移除的嗡嗡声,因为它是一致的。
- 降噪量:8-12 dB 通常可完全消除。
- Q 值:15-20 用于精确移除。
- 结果:嗡嗡声消除,这些设置下没有可听到的副作用。
间歇性嗡嗡声(设备开关循环、冰箱压缩机):
- Learn 模式:在较响的部分捕获嗡嗡声配置文件。
- Adaptive 模式:使模块能够追踪嗡嗡声振幅变化。
- 降噪量:6-10 dB(保守设置,因为嗡嗡声不是持续的,激进设置在安静期间会移除过多)。
- 结果:嗡嗡声减少但在突然增强时可能无法完全消除。最严重的部分可能需要后续手动频谱修复(Spectral Repair 模块)。
诚实局限性:De-hum 无法修复饱和录音中的接地环路。如果嗡嗡声大到使音频波形失真(在波形显示中可见削波),损害是永久性的。De-hum 移除嗡嗡声频率但无法重建被嗡嗡声失真的对话。
De-hum 故障排除:当嗡嗡声持续存在时
如果 De-hum 没有完全移除嗡嗡声,请检查以下内容: 1. 基频是否真的是 50Hz?某些设备会在略微偏移的频率(49.8 Hz、50.3 Hz)引入嗡嗡声。将基频控制设置为精确匹配。使用 Spectrum Analyzer(Window > Spectrum Analyzer)识别精确的峰值频率。 2. 500 Hz 以上的谐波是否有影响?将谐波数量增加到 15 或 20 以捕获更高的谐波成分。 3. 嗡嗡声是窄带的还是有宽带噪声底噪?如果录音还有显著的宽带噪声(嘶嘶声、风扇声),仅 De-hum 无法解决问题。先运行 Voice De-noise 降低噪声底噪,然后 De-hum。 4. 录音是 24 位还是 16 位?16 位录音的噪声底噪更高(-96 dB vs 24 位的 -144 dB)。嗡嗡声在 16 位录音中相对于噪声底噪更明显,可能需要更激进的 De-hum 设置。
3. De-reverb
减少房间回声和混响
De-reverb 可减少对话录音中的反射和房间混响尾音。它无法完全消除混响,但可以减少 4-10 dB,使对话听起来更近、更清晰。
De-reverb 效果好的情况:来自硬表面(瓷砖地板、混凝土墙壁、玻璃窗)的中等混响。这是越南室内最常见的混响问题——现代公寓、酒店大堂、餐厅和办公室通常铺有瓷砖或大理石地板,软装家具很少。
瓷砖/大理石房间回声设置(在越南很常见):
- 降噪量:6-8 dB
- 混响配置文件:Auto(RX 自动分析混响尾音)
- Enhancement:0-2 dB(为被混响软化的对话增加临场感)
- 结果:对话明显更近、更直接。回声减少但未消除。这是一个好结果——请接受它。
教堂/大厅混响设置(高天花板、长混响尾音):
- 降噪量:4-6 dB
- 混响配置文件:Auto
- Enhancement:2-3 dB
- 结果:中等改善。长混响尾音在数学上与直接对话交织在一起。对长混响使用激进的 De-reverb 会产生空洞、金属质感的对话。
De-reverb 失败的情况:尾音极短的混响(200ms 以下)——没有足够的混响尾音供算法分析。极长的混响(3 秒以上)——混响能量超过直接声能量,算法无法将它们分离。
诚实局限性:De-reverb 在任何超过 10 dB 降噪量的设置下都会产生空洞、相位失真的对话伪影。声音开始听起来像是通过金属管道录制的。这是当前机器学习 De-reverb 技术的硬性限制。如果您的对话需要超过 10 dB 的混响降噪,ADR 是更好的解决方案。
4. Mouth De-click
消除嘴唇咔嗒声和嘴部噪音
Mouth De-click 可消除对话录音中的嘴唇咔嗒声、舌头咔嗒声和湿润嘴部噪音。这些声音由唾液产生,在近距离麦克风录音(领夹式麦克风)和口干说话者中尤其成问题。
设置:
- Sensitivity(灵敏度):6(默认起始值)。范围 1-10。更高的灵敏度检测更多咔嗒声,但可能将合法辅音(T、K、D)标记为咔嗒声并将其柔化。
- Click Widening:1.0ms(默认)。控制每个检测到的咔嗒声周围处理多少音频。对于响亮、宽广的嘴部咔嗒声,增加到 2.0ms。对于细微的咔嗒声,减少到 0.5ms。
- Frequency Skew:0(中性)。正值优先处理高频咔嗒声,负值优先处理低频嘴唇声。
工作流程:以 Sensitivity 6 对整个对话轨道运行 Mouth De-click。聆听结果。如果嘴部咔嗒声仍然存在,增加到 7 并在特定部分重新运行。如果合法辅音听起来被柔化了,减少到 5。
专业提示:Mouth De-click 在 Voice De-noise 之后效果最好。宽带噪声干扰咔嗒声检测——当噪声底噪较高时,算法无法区分噪声瞬态和嘴部咔嗒声瞬态。
5. Spectral Repair
针对孤立噪声的手动频谱修复
Spectral Repair 是一个手动工具,用于移除对于自动模块来说太短或太特定的孤立噪声。它在频谱图视图中工作——您选择干扰频率范围和时间范围,RX 插值周围音频来填补空白。
常见用途:
- 对话期间的门砰声
- 背景中的电话铃声或通知声
- 麦克风外某人的单次咳嗽或打喷嚏
- 室外拍摄期间的鸟鸣或虫鸣
- 设备蜂鸣声或警报声
使用方法:
1. 打开频谱图视图(Tab > Spectrogram)。
2. 放大到干扰声音。调整频率缩放以清楚看到噪声。
3. 使用 Time-Frequency Selection 工具(I 键)选择噪声。只选择噪声——不要选周围的对话。
4. 打开 Spectral Repair 模块。
5. 模式:Replace(用来自周围时间/频率数据的插值音频填充选区)或 Pattern(用来自相邻区域的匹配图案替换)。
6. 点击 Render。
设置:
- Replace 模式配合默认插值设置可处理 90% 的频谱修复需求。
- Pattern 模式对持续音调(电话铃声、警报声)效果更好,因为 Replace 模式可能在持续频率中产生间隙。
- Band Limiting:设置频率范围以匹配噪声。门砰声占据 0-500 Hz。电话铃声占据 800-2000 Hz。将修复限制在这些频率内可保护频谱的其余部分。
诚实局限性:Spectral Repair 无法修复在同一频率范围和时间内与对话重叠的噪声。如果有人在对话的同一频率范围内砰门(通常如此——低频),移除门砰声也会移除那部分对话。在这些情况下,Spectral Repair 可以减少噪声但无法在不损害对话的情况下完全消除它。
6. De-wind
消除室外对话中的风噪
De-wind 可消除对话录音中的低频风声轰鸣。风吹击麦克风振膜产生宽带低频噪声(0-300 Hz),其振幅随阵风变化而变化。这是越南室外拍摄中的常见问题,特别是在季风季节(7-9 月)和沿海地点(岘港海滩、会安海滨)。
设置:
- Strength(强度):3-6(默认起始值)。范围 1-10。更高的强度移除更多风噪但可能使对话基频变薄。
- Cutoff Frequency(截止频率):200 Hz(默认)。风噪主要在 200 Hz 以下。如果风声轰鸣延伸更高则增加到 300 Hz。
- Adaptation(自适应):中等。控制模块追踪阵风振幅变化的速度。
沿海风(岘港海滩,稳定微风伴阵风):
- 强度:4-6
- 截止:200 Hz
- 结果:风声轰鸣显著减少。对话更清晰。可能丢失一些低频厚度——在 De-wind 之后用轻微低频搁架提升(80 Hz 处 1-2 dB)补偿。
季风风(强劲、阵发性、伴有降雨):
- 强度:7-9
- 截止:300 Hz
- 结果:风噪减少但对话在 300 Hz 以下听起来变薄。这是一个困难的场景——季风风强劲且不可预测。考虑对最严重的部分使用 ADR。
诚实局限性:De-wind 无法修复已削波的风噪录音。如果阵风使麦克风前置放大器过载(在波形中可见为平顶峰值),损害是永久性的。在所有室外麦克风上使用防风毛套(deadcat)从源头预防此问题。
7. 越南制作的真实案例
案例 1:酒店采访中的空调和 50Hz 嗡嗡声
问题:在岘港一家酒店会议室录制的采访。空调产生持续的低频轰鸣。电气接地问题引入 -35 dBFS 的 50Hz 嗡嗡声。瓷砖地板在受试者声音上产生中等混响。领夹式麦克风捕捉到嘴部咔嗒声。
处理链:
1. Voice De-noise:从语句间 2 秒静默处学习。降噪量:10 dB。消除空调宽带噪声。
2. De-hum:基频 50Hz,10 个谐波,Q=15,降噪量:8 dB。完全消除电气嗡嗡声。
3. De-reverb:降噪量:6 dB,Enhancement:1 dB。将瓷砖地板回声降低到可接受水平。
4. Mouth De-click:灵敏度:6。消除 90% 的嘴部咔嗒声。
结果:对话干净、清晰、自然。残留的房间底噪几乎听不到。总处理时间:每分钟音频 2 分钟。
案例 2:街头 Vlog 中的摩托车交通噪音
问题:主持人在岘港街头直接对着镜头说话。摩托车每 3-5 秒经过一次,在 200-4000 Hz 范围内产生宽带噪声。单独的摩托车经过声无法被移除——它们在频率和时间上与对话重叠。持续的低水平交通噪声。
处理链:
1. Voice De-noise:Adaptive 模式。降噪量:14 dB。显著降低持续的交通背景噪声。
2. Spectral Repair:手动移除两个发生在词语之间的孤立喇叭声(在频谱图中选择,用插值替换)。
3. De-hum:基频 50Hz,降噪量:6 dB。移除附近电气变压器的嗡嗡声。
结果:主持人的声音明显更清晰。摩托车经过声减少但仍可听到——无法在不破坏对话的情况下完全移除。建议在录音棚重新录制旁白并同步到画面以获得干净的最终结果。这是嘈杂街道录音的诚实答案。
案例 3:海滩婚礼中的沿海风噪
问题:在岘港美溪海滩举行的婚礼仪式。稳定的沿海风在主持人的领夹式麦克风上产生低频轰鸣。阵风在 3 个时刻造成瞬间过载。安静段落期间的宾客背景嘈杂声。
处理链:
1. De-wind:强度:5,截止:200 Hz。有效减少稳定的风声轰鸣。
2. Voice De-noise:从安静段落学习。降噪量:8 dB。降低宾客嘈杂声的背景噪声。
3. Spectral Repair:手动修复 3 个削波阵风时刻——选择并用插值替换。这 3 个时刻中不可避免会有一些对话损失。
4. De-reverb:降噪量:4 dB。海滩的混响出奇地少(沙子吸收声音),但露天环境增加了轻微的扩散质感。
结果:仪式音频可用。3 个削波时刻有轻微质量损失但词语仍然可辨。风噪降低到几乎听不到的背景声。对于精彩影片,这是可接受的。对于纪录片,请以 ADR 重新录制主持人的关键誓言。
8. 处理顺序和工作流程
推荐的模块处理顺序
应用 RX 模块的顺序很重要。如果以错误的顺序应用,前面的模块可能会干扰后面的模块。
推荐的处理链:
1. Spectral Repair——首先修复孤立问题(门砰声、电话铃声、设备咔嗒声),以免干扰自动模块。
2. De-wind——移除影响 De-noise 噪声底噪的低频风声轰鸣。
3. De-hum——移除电气嗡嗡声。窄带、特定频率。最好在宽带降噪之前完成。
4. Voice De-noise——降低宽带噪声底噪。现在嗡嗡声和风噪已经处理完毕,De-noise 可以专注于剩余噪声。
5. De-reverb——减少房间回声。De-reverb 在干净对话上比嘈杂对话上效果更好。
6. Mouth De-click——最后移除嘴部咔嗒声,此时噪声底噪最低,咔嗒声检测最准确。
此顺序是起点。根据录音中的具体问题进行调整。如果录音没有风噪,跳过 De-wind。如果录音没有电气嗡嗡声,跳过 De-hum。永远不要应用模块来修复不存在的问题——每个处理步骤都会引入微小的质量损耗。
RX 工作流程最佳实践
- 每次只处理短片段(10-30 秒),而不是整个文件。这使您可以 A/B 比较前后效果并针对每个部分调整设置。
- 始终保留原始文件。RX 默认就地修改音频。使用 File > Save As 创建新文件,保持原始文件不变。
- 使用 History 面板(Window > History)撤销任何处理步骤。RX 保留完整的撤销历史记录,您可以恢复到处理链中的任何点。
- 每个模块处理后渲染并聆听。不要堆叠 4 个模块一次性渲染——如果出现伪影,您无法确定是哪个模块导致的问题。
- 频繁与原始文件比较。经过 3-4 个模块处理后,听觉疲劳会逐渐产生,您会失去判断力。休息 5 分钟,然后将处理后的音频与原始文件比较。
- 导出 Difference 轨道。处理后,导出被移除的噪声(Module > Output: Difference)。聆听它。如果在差异轨道中听到对话,说明您移除了太多。
iZotope RX 对话清理常见问题
iZotope RX 中多少降噪量是过多的?
Voice De-noise 中超过 18-20 dB 的降噪量会出现可听到的伪影——对话出现水声、相位失真质感。保持在 12 dB 以下可获得干净结果。如果需要超过 18 dB 的降噪量,说明录音噪声太大,应考虑 ADR。多次轻度处理(每次 6-8 dB)比一次重度处理效果更好。
如何消除在越南录制的音频中的 50Hz 嗡嗡声?
使用 De-hum 模块。将基频设置为 50Hz(越南使用 50Hz 电网)。启用 10 个谐波。将 Q 值设为 10-20 进行窄带陷波滤波。从 6 dB 降噪开始,如果需要增加到 12 dB。如果嗡嗡声持续存在,使用 Spectrum Analyzer 检查实际频率是否偏离精确的 50Hz。
De-reverb 能否完全消除对话中的房间回声?
不能。De-reverb 可以减少 4-10 dB 的房间回声,使对话更近、更清晰。以当前技术无法完全消除。超过 10 dB 降噪量时,对话开始听起来空洞和金属质感。对于严重的混响问题,ADR 是实际的解决方案。
RX 模块的正确处理顺序是什么?
推荐顺序:Spectral Repair(首先修复孤立问题)、De-wind(移除风声轰鸣)、De-hum(移除电气嗡嗡声)、Voice De-noise(降低宽带噪声)、De-reverb(减少房间回声)、Mouth De-click(在噪声底噪最低时最后移除嘴部咔嗒声)。根据录音中的具体问题进行调整。
iZotope RX 能否修复削波或失真的音频?
De-clip 模块可以通过插值缺失的波形峰值来修复轻度削波(几个连续的平顶采样)。它无法修复大部分波形被削平的严重削波。对于中等削波,将 Threshold 设置为刚好高于削波水平,De-clip 将重建峰值。效果因情况而异——请在您的具体音频上测试。
如何在 Pro Tools 中使用 RX?
在 Pro Tools 的音频轨道上使用 RX Connect 插件。点击插件将音频发送到 RX 编辑器,处理后点击 Send Back 返回处理后的音频。这是无损的。或者从 Pro Tools 导出片段,在独立版 RX 中处理,然后重新导入。对于大多数工作流程,插件方法更快。
需要专业对话清理?
我们的音频工程师清理在越南具有挑战性的环境中录制的对话——空调轰鸣、摩托车交通噪音、季风雨风噪、瓷砖房间回声。我们使用 iZotope RX、Pro Tools 以及 15 年的现场录音经验。发送 30 秒样本即可获得免费评估。
获取免费音频评估