【科学基础】声音的物理本质与能量的基本数学表达式
› VFX大学 › Logic,Ableton Live电影音乐制作社区 › 【科学基础】声音的物理本质与能量的基本数学表达式
- 作者帖子
- 2025-04-21 - 09:20 #128324
追光参与者声音是“机械纵波(Mechanical Longitudinal Wave),是一种在介质(如空气、水、固体)中传播的纵波,其本质是:粒子在原位的振动引起邻近粒子的连锁反应。声音是能量的一种传播方式,通过介质中的粒子振动实现,它既受物理法则支配,又在音乐中成为情绪与表达的载体。
它本质上是粒子之间的振动传递:
一物体振动 → 推动周围的空气分子 → 这些分子的运动(压缩和稀疏)形成了声波 → 传播到耳朵。声音 ≈ 粒子震动 → 能量流动 → 谐波结构 → 空间传播 → 人类感知
一、声波的构成参数:
1.振幅(Amplitude) → 决定响度(能量大小)
基本波动表达式:声波在一维介质中传播的标准形式为:\(s(x,t) = A \sin(kx – \omega t + \phi)\)
A:振幅(Amplitude),f:频率,x:空间位置,t:时间,\(k = \frac{2\pi}{\lambda}:波数 单位为 \text{rad/m},\omega = 2\pi f:角频率,单位为 \text{rad/s},\phi:初相位,\lambda:波长\)
2.频率(Frequency) → 决定音高(1 Hz = 每秒振动一次)
3.波长(Wavelength) → 与频率成反比,影响穿透能力
4.周期(Period) → 一个完整波所需时间
\(T = \frac{1}{f}\)T:周期(秒);f:频率(赫兹)
5.传播速度(v) → 决定声波在介质中传输效率(空气中约 343 m/s)
\(v = f \lambda\)
v:波速(例如在空气中约 343 m/s);f:频率;\(\lambda:波长\)
二、声音与能量的直接关系
声音不仅是运动——它携带能量,声音中的能量表现为:压缩区和稀疏区的气压差;能量 = 功率 × 时间;在声音中,单位面积上的声能密度,决定了其声压级(SPL)
波动方程(声压或位移的描述):这是声学基础物理模型的核心,描述声音如何随时间与空间传播。
\(\frac{\partial^2 s}{\partial x^2} = \frac{1}{v^2} \frac{\partial^2 s}{\partial t^2}\)
声波的能量密度表达式
\(E = \frac{1}{2} \rho v^2 s^2\)
E:单位体积声能(能量密度);s:位移振幅;\(\rho:介质密度(如空气)\)
三、声音传递能量的表现:
1.振膜运动:
麦克风的振膜就是通过接收到声音的机械能而产生振动。2.音量越大,能量越高:
声波的振幅(amplitude)越大,表示压缩/稀疏越强烈,也就是单位时间内传递的能量越多。
所以大音量声音会推动耳膜(甚至窗户)产生更大的物理反应。3.频率与能量关系:
高频声音虽然振幅可以小,但由于单位时间内振动次数多,也会携带较高的平均功率。
高频更容易衰减(空气吸收能量快),这也是为什么你在远处听不到细节高频。声音能量单位:声压级(SPL)与分贝(dB)
SPL(Sound Pressure Level) 是声能强度的一个度量方式,单位是 分贝(dB SPL)。声音每增加 6 dB,能量就翻倍;而每减少 3 dB,能量减半。
四、频谱结构与共振,所有声音都是复合波
任何乐器/人声的声音 = 基频 + 若干谐波(整数倍频率)频谱(Spectrum):
声音在频率域的表现 → 使用 FFT(快速傅立叶变换)分析
听觉上,“音色”的差别来自频谱结构的不同五、共鸣(Resonance):
介质或腔体对特定频率放大(比如:吉他共鸣箱、胸腔、录音棚)
这是声学设计的核心理念之一(低频陷阱、扩散板)6、声音的空间属性与衰减
声音的能量随距离衰减:
自由场中:每增加一倍距离,能量下降 6 dB
空气吸收高频更强烈 → 远处声音失去细节\(I = \frac{p^2}{\rho c}\)
七、声音反射与混响:
反射 + 折射 + 吸收 = 混响(Reverb)
混响是“声音能量在空间内多次反弹”的体现声音的心理物理属性(Psychoacoustics)
人耳对声音的感知 ≠ 物理现实
响度曲线(Fletcher–Munson Curve):人耳对中频最敏感,低频和高频需要更强能量才能被听到
掩蔽效应:强信号掩盖弱信号(混音里 EQ 常用这个原理)音调(Pitch) vs 频率(Frequency):
频率 = 物理
音调 = 感知两者线性相关,但受音色、音强等因素影响
- 2025-04-21 - 09:31 #128328
追光参与者EQ(Equalization,均衡器)本质上是一个频率选择性的增益函数:
频谱图(如 Ableton 的 Spectrum、FabFilter 的 Analyzer)实时显示 X(f);EQ 滤波器实际影响的是 H(f);混音时,我们观察频谱并视觉定位问题频段,然后手动绘制 H(f) 来进行补偿或增强。
EQ 不是“修音”,是“重塑频率能量分布”,本质是用数学曲线,对声音进行“能量雕刻”。
它作用于信号的频谱,在特定频率区域 放大(Boost) 或 削减(Cut) 能量。
在数学上:
一个 EQ 可以看作是一个 线性时不变系统(LTI),其效果可用卷积描述:
y(t) = x(t) * h(t)
其中:
x(t) 是输入信号
h(t) 是 EQ 的脉冲响应
* 表示卷积运算
y(t) 是处理后的输出信号频谱角度看 EQ
信号的频谱是通过 傅立叶变换(Fourier Transform) 获得的:
X(f) = ∫ x(t) * e^(-j2πft) dt
应用 EQ 实际上就是将一个频谱 X(f) 乘以一个频率响应 H(f):
Y(f) = X(f) × H(f)
换句话说:EQ 就是在频域上进行的乘法滤波,每个 EQ 滤波器类型对应一个特定形状的频率响应 H(f)。
- 2025-05-06 - 09:49 #128561
追光参与者音频压缩器的工作原理算法
可以从动态范围压缩(dynamic range compression)的数学角度来描述,它的核心是在音频信号达到某个阈值(threshold)后,对超出的部分进行缩减,按照一定的压缩比(ratio)计算。
音频压缩器数学算法图解(由NewVFX结合AI制作)
1. 基本压缩表达式
设:
x(t):输入信号的幅度(通常是 dBFS)
T:压缩器的阈值(threshold,单位为 dB)
R:压缩比(ratio,例如 4:1 则 R = 4)
y(t):输出信号的幅度(单位为 dB)压缩器的工作逻辑可以表达为:
\(
y(t) =
\begin{cases}
x(t), & \text{if } x(t) \leq T \
T + \frac{x(t) – T}{R}, & \text{if } x(t) > T
\end{cases}
\)解释:
当信号小于等于阈值时,保持原样;
当信号超过阈值时,超出部分被按比例压缩。2、增益变化(Gain Reduction)
计算增益衰减值:
\(
G(t) = x(t) – y(t) =
\begin{cases}
0, & x(t) \leq T \
\left(1 – \frac{1}{R} \right)(x(t) – T), & x(t) > T
\end{cases}
\)3. 包络检测(Envelope Detection)
为了避免点击声和非线性突变,压缩器会对信号包络进行平滑处理(Attack/Release 时间),用指数平滑滤波器:
\(
E(t) = \alpha \cdot |x(t)| + (1 – \alpha) \cdot E(t – 1)
\)其中:
\(\alpha = 1 – e^{-\frac{1}{\tau f_s}};\tau 是时间常数(Attack 或 Release);f_s 是采样率\)压缩算法归纳:
压缩器是一种非线性动态处理器,其核心算法涉及:
条件判断(大于阈值即压缩)线性缩放(压缩比率)
时间平滑(包络追踪)它既有数学公式上的逻辑推导,也有声音行为上的艺术性。
- 2025-05-08 - 16:20 #128623
追光参与者Oversampling(过采样)在数字信号处理中常用的数学表达式
Oversampling(过采样)的数学原理及其在音频处理中的应用,包括插零、低通滤波和降采样的完整表达式。掌握高保真音频插件如何通过过采样减少失真与折叠噪声,提升声音质量。Oversampling(过采样)在数字信号处理中有明确的数学定义和实现过程。
以下是核心原理和常用的数学表达式:
1. 过采样因子定义
数学表达式设:
- \(x[n]\):原始离散时间信号(采样率为 \(f_s\))
- \(L\):过采样因子(如 2x, 4x)
则 Oversampled 信号 \(x_L[n]\) 的生成可表达为:
\(
x_L[n] =
\begin{cases}
x\left[\frac{n}{L}\right], & n \equiv 0 \pmod{L} \\
0, & \text{otherwise}
\end{cases}
\)意思是:在原始采样点之间插入 \(L – 1\) 个零(零插值)。
2. 插值滤波(Interpolation Filtering)
为了平滑插值后的信号,需要一个低通滤波器 \(h[n]\):
\(x_{int}[n] = x_L[n] * h[n]\)
其中 \(*\) 表示卷积,滤波器截止频率为:
\(f_c = \frac{f_s}{2}\)
3. 降采样(后期处理)
在 Oversampling 处理完毕后,进行降采样操作:
\(y[n] = x_{int}[nL]\)
总结流程
- 插零:
\(x_L[n] = x[n/L], \text{(插零)}\)
- 滤波:
\(x_{int}[n] = x_L[n] * h[n]\)
- 降采样:
\(y[n] = x_{int}[nL]\)
- 2025-05-28 - 14:45 #129133
追光参与者混响的物理与数学原理详解
🎵 混响是声音在空间内多次反射并衰减的现象,是营造音频空间感和自然感的重要元素。
物理本质
- 声音在封闭或半封闭空间传播,遇到墙壁、地面、天花板等表面产生反射。
- 初级反射(Early Reflections):最先到达耳朵的几次较强反射,帮助感知空间大小。
- 混响尾声(Reverberation Tail):大量次级反射叠加形成的持续衰减声音,赋予空间“丰满感”。
数学模型描述
🔍 混响可看作线性时不变系统(LTI),空间对声音的作用由脉冲响应(Impulse Response,IR)描述。
- 输入声音信号为 \( x(t) \)
- 空间脉冲响应为 \( h(t) \)
- 输出声音为两者的卷积:\( y(t) = x(t) * h(t) = \int_{-\infty}^{\infty} x(\tau) \cdot h(t-\tau) \, d\tau \)
脉冲响应特点
- 直接声对应脉冲响应中第一个冲击。
- 初级反射表现为几个较大幅度的离散峰值。
- 混响尾声由大量微弱反射组成,幅度随时间指数衰减。
- 数学表达:\( h(t) = \sum_{i=1}^N a_i \cdot \delta(t – \tau_i), \quad a_i \to 0 \text{ 随 } \tau_i \to \infty \)
混响衰减模型
⏳ 混响尾声衰减通常用指数函数描述:
\( a(t) = a_0 e^{-t / \tau} \)
- \( a_0 \) 是初始幅度
- \( \tau \) 是衰减时间常数,反映空间吸收特性
- 混响时间 RT60 是声音衰减 60 dB 所需时间,衡量空间混响强弱
数字音频工作站(DAW)中的混响实现
- 卷积混响(Convolution Reverb):利用真实空间的脉冲响应进行卷积,实现高度真实的空间效果,计算量大。
- 算法混响(Algorithmic Reverb):使用反馈延迟网络、多级滤波器等数学模型模拟混响,灵活且计算效率高。
算法混响示例
🔄 简单反馈延迟模型:
\( y[n] = x[n] + g \cdot y[n – D] \)
- \( D \):延迟样本数,决定反射时间
- \( g \):反馈增益,控制衰减速度
- 通过组合多个此类单元形成复杂混响尾声
- 作者帖子
- 在下方一键注册,登录后就可以回复啦。