音视频开发2 音频基础

发布于:2024-05-08 ⋅ 阅读:(27) ⋅ 点赞:(0)

基本概念

三巨头:采样率、采样格式,声道数与声道布局、

PCM、音质、音频编码格式、音频封装格式

采样率: 每秒采集的样本数量

我们知道声音是连续的一段波,

模拟信号的波形是无限光滑的,可以看成由无数个点组成,由于存储空间是相对有限的,数字编码过程中,必须要对波形的点进行采样。采样(Sampling):每隔一段时间采集一次模拟信号的样本,是一个在时间上将模拟信号离散化(把连续信号转换成离散信号)的过程。

每秒采集的样本数量,称为采样率(采样频率,采样速率,Sampling Rate)。比如,采样率44.1kHz表示1秒钟采集44100个样本。

采样格式 也叫 位深度: 

每秒采集 44100个,那么采集的这个点的数据用多大的位数表示呢?

例如用 8 bit 的表示  000-111

或者用16 bit 的表示 0000 - 1111

位深度(采样精度,采样大小,Bit Depth):使用多少个二进制位来存储一个采样点的样本值。位深度越高,表示的振幅越精确。常见的CD采用16bit的位深度,能表示65536(216)个不同的值。DVD使用24bit的位深度,大多数电话设备使用8bit的位深度。

声道数与声道布局、

单声道产生一组声波数据,双声道(立体声)产生两组声波数据。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数 * 时间
  • 44100 * 16 * 2 * 60  = 84,672,000 bit
  • 84,672,000 / 8 = 10,584,000 byte
  • 10,584,000 / 1024 = 10,335.9375KB
  • 10,335 /1024 = 10.09368896484375MB

也就是说,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

------------------------------------------

比特率(Bit Rate),指单位时间内传输或处理的比特数量,

单位是:比特每秒(bit/s或bps),还有:千比特每秒(Kbit/s或Kbps)、兆比特每秒(Mbit/s或Mbps)、吉比特每秒(Gbit/s或Gbps)、太比特每秒(Tbit/s或Tbps)。

采样率44.1kHZ、位深度16bit的立体声PCM数据的比特率是多少?

  • 采样率 * 位深度 * 声道数
  • 44100 * 16 * 2 = 1411.2Kbps

通常,采样率、位深度越高,数字化音频的质量就越好。从比特率的计算公式可以看得出来:比特率越高,数字化音频的质量就越好。

PCM

将音频数字化的常见技术方案是脉冲编码调制PCM,Pulse Code Modulation),主要过程是:采样 → 量化(实际上就是采样格式) → 编码。

音频编码格式、

前面看到,在一分钟之内,光是音频就有10M,因此一定要通过基础进行处理。

处理的技术就是将原始的 录制 到的PCM 信息转化成 .mp3,.mp4, .aac等格式。

总结:

对于音频,一定要知道 采样率,采样格式,声道数

采样率: Sampling Rate 44100.

采样格式:16 bit, 32 bit,

声道数: 1为单声道,2 为立体声

播放pcm时,必须得设置采样率(-ar)、采样格式(-f)、 声道数(-ac