对WAV文件格式的实例分析_徐济仁
- 格式:pdf
- 大小:192.58 KB
- 文档页数:2
大连理工大学语音信号A律编码解码报告课程名称:通信原理学院(系):电信专业:通信工程班级:1101学号:201181227 201181145学生姓名:殷青张非凡2014年 4 月17 日一.实验原理1.1总体框图1.2 低通滤波器信道中所用的音频信号频率范围为300~3400hz,因此,我们需要对获得的音频信号滤波,使用低通滤波器。
1.3 8k重采样信道中的带宽为8khz,因此,我们需要对获得的音频信号进行重采样,以获得8khz的信号。
1.4抽样信号的非均匀量化编码(13折线)为了改善小信号时的信号量噪比,采用非均匀量化,量化间隔随信号采样值的不同而变化,信号抽样值小时,量化间隔也小;信号抽样值大时,量化间隔也大,实际用13折线法近似逼近A律压缩来进行非均匀量化。
如下图所示:语音信号中通常采用8位的PCM编码就能保证满意的通信质量。
8bits的安排:极性码:第一位;段落码:第二至四位,代表13折线中的8个段落;段内码:第五至八位,代表每一段落内的16个均匀划分的量化间隔。
段落码和段内码的编码规则如下表所示:二.实验内容2.1语音信号的获取。
我们用电脑上的录音机录了一段“早上好,我是***”的录音。
并用软件“格式工厂”将其转成wav格式。
原始信号波形图如下。
代码:figure;[x0,fs0,bits0]=wavread('DSP2.wav');plot(x0);xlabel('t'),ylabel('幅值');title('原始信号波形');2.2信号处理——低通滤波器&8k重采样2.2.1低通滤波:设计思想:利用窗函数FIR函数,将语音信号的高频成分滤除,即达到低通滤波的目的。
低通滤波器的频响特性曲线如下图:2.2.2重采样:设计思想:wav文件的抽样频率已经是44khz,要用8khz重采样,而从44k到8k,由于44不能被8整点采样,造成可能的语音信号的缺失,因此,我们先用插0法将44khz的信号扩展成88khz的信号,再对88khz信号每11点抽一个值,这样,8k重采样基本完成。
wav音频文件的内部结构wav音频文件是一种无损的音频文件,相对于MP3来说音质较好,当然文件大小也很大。
A WAVE file is often just a RIFF file with a single “WAVE” chunk which consists of two sub-chunks –a “fmt ” chunk specifying the data format and a “data” chunk containing the actual sample data. Call this form the “Canonical form”其文件的内部格式如下:用表格统计各个部分的含义如下:一个简单的示例如下所示:chunk 结构typedef struct waveChunk {unsigned int chunkID; //RIFFunsigned int chunksize; //存储整个文件的文字数unsigned int WaveID; //WAVE}WAVE;typedef struct tWAVEFORMATEX {short wFormatTag; // format typeshort nChannels; // number of channels (i.e. mono, stereo...) unsigned int nSamplesPerSec; // sample rateunsigned int nAvgBytesPerSec; // for buffer estimationshort nBlockAlign; // block size of datashort wBitsPerSample; // number of bits per sample of mono datashort cbSize; // the count in bytes of the size of/* extra information (after cbSize) */} WAVEFORMATEX, *PWAVEFORMATEX;typedef struct dataChunk {unsigned int Subchunk2ID; //dataunsigned int Subchunk2size; //data sizeunsigned char *data; //data}WAVE;Q&A8bit/16 bit 样值的二进制编码表示一样吗?现有的wav支持哪几种音频编码方法?data format在数据域中除了单声道-量化位数为8音频数据之外PCM存储格式按照补码的形式存放。
Wave文件是用于多媒体文件存储的Microsoft RIFF(Resource Interchange File Format 资源交换档案标准)规范的子集之一。
一个RIFF文件以一个文件头(File Header)开始,接着是一系列数据块(data chunk)。
一个Wave文件常常是一个带有一个单“WAVE”块的RIFF文件。
该“WAVE”chunk由两个子快组成,一个“fmt”chunk用于详细说明数据格式,一个“data”chunk包含实际的样本数据。
这种形式我们称为规范形式。
下面我们看一个具体的例子,声音文件如下:
52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00
22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00
24 17 1e f3 3c 13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 ce 1a 0d
上图所示例子,该WAVE文件采用PCM编码。
该音频具有双声道,每个样点进行16位量化编码,双声道的一个样点占4字节,存储顺序是每个样点的左右声道交替存储。
对于Data块,根据声道数和采样率的不同情况,布局如下(每列代表8bits):1、8 Bit 单声道:
2、8 Bit 双声道
3、16 Bit 单声道:
4、16 Bit 双声道。
wav文件格式分析详解<转> (2008-12-18 22:02:51)标签:wav 音频 it 分类:研发杂物箱一、综述W A VE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。
RIFF是英文Resource Interchange File Format的缩写,每个W A VE文件的头四个字节便是“RIFF”。
W A VE文件是由若干个Chunk组成的。
按照在文件中的出现位置包括:RIFF W A VE Chunk, Format Chunk, Fact Chunk(可选), Data Chunk。
具体见下图:------------------------------------------------| RIFF W A VE Chunk || ID = 'RIFF' || RiffType = 'W A VE' |------------------------------------------------| Format Chunk || ID = 'fmt ' |------------------------------------------------| Fact Chunk(optional) || ID = 'fact' |------------------------------------------------| Data Chunk || ID = 'data' |------------------------------------------------图1 Wav格式包含Chunk示例其中除了Fact Chunk外,其他三个Chunk是必须的。
每个Chunk有各自的ID,位于Chunk最开始位置,作为标示,而且均为4个字节。
并且紧跟在ID后面的是Chunk大小(去除ID和Size所占的字节数后剩下的其他字节数目),4个字节表示,低字节表示数值低位,高字节表示数值高位。
WAV 文件的结构剖析王 颀 赵世刚 张春寿 计算机多媒体技术的发展使视听处理技术产生了巨大进步。
用计算机“剪”、“拼”、“接”的视频、音频节目比比皆是。
这些视、音频文件在计算机内的存储结构和组织结构对使用者是透明的,这给技术人员带来困惑和诸多不便(例如:受病毒攻击或误操作需恢复文件时)。
如果掌握了这类文件结构,就可用一些简单的维护软件,以“特征字符”为引导,将各簇挂接,恢复文件。
下面以非压缩的基本WAV 文件(扩展名为wav )为例,介绍音频文件的储存与组织结构,以期达到抛砖引玉的目的。
WAV 音频文件是存储数字音频(波形)数据的文件。
它支持多种分辨采样频率和多声道音频,在IBM 平台上非常流行。
广泛应用在专业数字音频波形节目制作上,这种格式采用微软电子技术交换文件介绍的方式以块存储数据。
11数据的组织所有数据以字节(8位二进制)方式存储,多字节数据值按低位优先顺序存储,如图1所示。
21文件结构WAV 文件是不同类型块的集合。
其中,所必需的格式块内含描述波形的重要参数(诸如采样频率等);数据块内含音频波形数据,两者关系见图2。
31样本点和样本帧样本点是某时间点上所采到的一个语音样本幅值(简称采样值)。
单字节采样值以无符号数0—255表示;采样值超过8位二进制值92 济南教育学院学报2000年第3期 时,则以2的补码形式表示。
例如:16位二进制数(0111111111111111)B十六进制的(7FFF )H 表示(32767)D (最大值),(8000)H 表示(32768)D (最小值)。
采样值在9—16位时用二字节描述;采样值在17—24位时用三字节描述;采样值在25—32位时用四字节描述。
采样值的数据位应遵循左对齐及余位补“O ”规则。
例如,采样值为12位,用4—15位存储该值,0—3位填“0”。
具体讲,采样值为二进制101000010111,数据描述如图3所示。
需要特别指出的是:机内存储要求低字节优先,波形数据要求最高位优先。