wav音频文件格式分析与数据获取
- 格式:pdf
- 大小:848.15 KB
- 文档页数:3
中职最新课标《信息技术》教学设计教案(电子工业出版社)第6章数字媒体技术应用任务1获取数字媒体素材任务2加工数字媒体任务3制作简单数字媒体作品任务4初识虚拟现实与增强现实技术信息技术(电子工业出版社)“信息技术”是中等职业教育公共基础课程。
中等职业学校公共基础课程2020年《中等职业学校信息技术课程标准》为了满足人才培养的适应性,教育部在2020年组织职教专家开发了《中等职业学校信息技术课程标准》。
本课程紧密围绕该标准,设置了8个基础教学模块。
这八个模块分别是信息技术应用基础、网络应用、图文编辑、数据处理、程序设计、数字媒体技术应用、信息安全和人工智能。
每模块设计多个任务,共31个任务99个知识点,每知识点配套教学指南、教学视频、主题讨论,每任务配套在线作业,每模块配套在线测试,内容全面、实用、先进、职业特征显著。
第6章数字媒体技术应用教案任务1获取数字媒体素材教案1.教学设计方案教学单元名称任务1获取数字媒体素材课时4学时所属章节第6章数字媒体技术应用任务1获取数字媒体素材任务描述除夕夜看中央电视台春节联欢晚会已成为中国人过年的新民俗。
2021年除夕夜,小华和全家人早早地吃完团圆饭后,坐在电视机前等待春节联欢晚会。
春节联欢晚会年年看,舞台岁岁新!2021年的春节联欢晚会从形式到内容都焕发出蓬勃的生命力,为观众带来众多惊喜。
尤其是武术节目《天地英雄》、舞蹈节目《牛起来》,创新视觉技术和各类表演为小华带来一次又一次的惊喜,更让他难以辨别是虚拟效果,还是真实存在。
同时,小华对春节联欢晚会使用的技术产生了浓厚的兴趣。
通过查阅资料,小华明白自己感受到的视觉盛宴是利用数字媒体技术制作而成。
我能学着做吗?任务分析小华非常明白,自己对数字媒体的感觉是从观看数字媒体技术作品和查阅文字资料开始的,但要学会制作完整的数字媒体技术作品,还有很长的路要走。
不是一朝一夕就能制作出美轮美奂的艺术作品,但他不会气馁。
小华决定,先从了解数字媒体技术开始,全面了解相关技术,然后认识数字媒体文件格式,帮助自己学会选择适用的文件格式,最后尝试获取音视频素材,若获取的素材不能满足需要,再进行必要的格式转换。
音频资源获取的常用方法1.直接录制音频资源在制作音频素材的时候,有时会需要录制一些原始的音频素材,这样就需要播音人员利用麦克风进行录制,如果希望在录制过程中获得比较好的录音效果,就需要在录音棚里面进行录制。
组建一间教学用的录音棚需要监听设备和功放、调音台和录音话筒、MIDI输入设备、计算机等设备。
如果经济条件允许的话,还可以增加采样机、多功能的子卡、转换卡、音乐工作站(看起来就像一台高档的合成器)、编曲机、MIDI接口、效果器、话筒防风罩、前置放大器等设备。
当然各设备之间的连接线和传唤头也是不能忽略的一个重要环节,这将直接影响音频资源的制作效果,一个基本的录音棚,如图4-4所示。
目前常用的数字录音技术是通过计算机中的数字音频接口,将(话筒或其他)音频信号输入到计算机,录制成波形文件进行存储,再通过多轨录音软件根据需要进行编辑(包括复制、剪切、粘贴),组合成完整文件再输出录制成CD或其他音频格式。
数字录音中有采样、量化和编码三个步骤。
⑴采样数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始模拟声音的,实现这个步骤使用的设备是模/数转换器(A/D),它以每秒上万次的速率对声波进行采样,音频采样可以分为采样的位数和采样的频率,其中采样位数可以理解为采集卡处理声音的解析度。
数字录音中的采样频率(一秒钟内对声音信号的采样次数),是衡量其质量的一个重要指标,可以理解为采集卡处理声音的解析度,采样频率越高,解析度就越高,录制和回放的还原声音就越真实自然。
⑵量化模拟信号采样后需解决采样点信号幅度的读出问题。
把连续变化的信号振幅按一定的级差精度读出采样点信号振幅的数据称为“量化”。
量化值通常用二进制表示。
表达量化值的二进制位数称为采样数据的比特数,也就是采样精度。
采样数据的比特数越多,声音的质量越高,所需的存储空间就越多;反之则声音的质量越低,所需的存储空间也越少。
⑶编码数字化音频在存储和传输的过程中必须进行压缩,根据所需获得质量的要求,这就需要选择相应的编码方式进行编码。
1.请你谈谈对媒体和数字媒体概念的认识。
媒体是指传播信息的媒介。
它是指人借助用来传递信息与获取信息的工具、渠道、载体、中介物或技术手段。
也可以把媒体看作为实现信息从信息源传递到受信者的一切技术手段。
媒体有两层含义,一是承载信息的物体,二是指储存、呈现、处理、传递信息的实体。
数字媒体属于工学学科门类,是指以二进制数的形式记录、处理、传播、获取过程的信息载体。
这些载体包括数字化的文字、图形、图像、声音、视频影像和动画等感觉媒体,和表示这些感觉媒体的表示媒体等,通称为逻辑媒体,以及存储、传输、显示逻辑媒体的实物媒体。
数字媒体的发展不再是互联网和IT行业的事情,数字媒体的发展通过影响消费者行为深刻地影响着各个领域的发展。
数字媒体的增强现实技术通过科学技术模拟仿真后,再叠加到现实世界被人类感官所感知,从而达到超越现实的感官体验的技术。
数字媒体分工更加细致明确,和个人生活更加紧密。
媒体是指信息在传输过程中,从信息源到受信者之间承载、传输、控制信息的载体或工具。
常常把媒介和媒质统称为媒体,因为任何一种形式单方面存在时没有意义的。
通常称通过计算机存储、处理和传播的信息媒体为数字媒体。
数字媒体是数字化的内容作品以现代网络为主要传播载体,通过完善的服务体系,分发到终端和用户进行消费的全过程。
2.以下问题为思考题,不是必做题,不要求上交。
1、二进制和十进制间的转换机制是什么?2、为何二进制的数可以形成千变万化的视听信息?3、简述数字媒体信息的类型划分。
4、以当前的市场技术主流,配置一台个人计算机,并列举自己参考的各部件主要性能指标和价格分析。
5、简述数字媒体处理系统的组成与各自功能。
1.十进制是满十进一,二进制是满二进一;十进制转二进制就是除以2所得余数,倒叙排列;2.可以将二进制数字进行编码,进而表示不同的内容信息。
3.(1)数字视觉信息:文本信息(数字文字、数值)、图信息(数字图形、数字图像)、动态信息(视频、动画)。
wav音频文件格式分析与数据获取作者:罗海涛来源:《电脑知识与技术》2016年第27期摘要:音频文件是把语音信号离散化的数字文件,wav格式的音频文件是常用的二进制音频格式,广泛应用于语音信号处理、语音识别、语音合成等领域;本文详细分析了wav音频文件格式,并用C语言编程,实现对该格式文件的访问,获取音频信息和数据。
关键字:wav;音频文件;音频信息;音频数据中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)27-0211-031 概述语言是人们之间进行通讯和交流必不可少的手段。
语音由人的发音器官发出,语音信号是连续的模拟信号,在用计算机来处理时,需要进行数字化,包括采样、量化等过程,转换成离散的数字信号,保存在音频文件中。
现在很多领域要求对语音信号中的音频数据进行进一步的加工和处理。
例如,利用读出的音频信号数据,进行语音信号时域和频域分析、语音压缩、语音编码、解码、语音合成、语音识别、语音增强等,并通过波形观察比较不同编码效果。
另外,利用多媒体语音系统我们还可以用语音数据和波形方便地进行噪声模拟分析,语音特征提取研究,以及语音识别和训练等应用方面的实验。
又如:在人工智能领域,通过设计软件和硬件电路,用声音去控制计算机工作,还有机器人通过语音与人进行简单的对话交流等等。
这些都要求我们对数字语音信号进行一些必要的加工处理。
wav文件格式是一种重要的数字音频文件格式,是目前应用很广泛的一种音频格式。
相比于其他格式如MP3、MP4、RAM等压缩效率更高的音频文件格式,wav文件没有采用压缩技术,因而其文件要大很多,一般都在几兆字节,甚至更大。
但也正因为没有采用压缩技术,wav文件中声音的采样数据很容易被读出来,便于做其他处理。
例如:画出声音的信号波形、作出频谱,进行时域、频域分析,提取语音信号的特征参数用于语音识别等。
现在的应用程序几乎都支持wav文件格式,也有专门软件可以完成从wav文件格式向其他文件格式的转换,或者把其他格式文件转换为wav格式,例如,微软公司的Adobe Audition。
C#使⽤NAudio合并mp3、wav⾳频⽂件1.什么是wav格式WAV为(Microsoft)开发的⼀种声⾳⽂件格式,它符合RIFF(Resource Interchange File Format)⽂件规范,⽤于保存Windows平台的信息资源。
通常使⽤三个参数来表⽰声⾳,量化位数,取样频率和振幅。
量化位数分为8位,16位,24位三种,声道有单声道和之分,单声道振幅数据为n*1矩阵点,⽴体声为n*2矩阵点,取样频率⼀般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三种。
标准格式化的WAV⽂件和CD格式⼀样,也是44.1K的取样频率,16位量化数字,因此在声⾳⽂件质量和CD相差⽆⼏。
2. WAV⽂件的组成偏移地址⼤⼩字节数据块类型内容00H~03H44字符资源交换⽂件标志(RIFF)04H~07H4长整数从下个地址开始到⽂件尾的总字节数08H~0BH44字符WAV⽂件标志(WAVE)0CH~0FH44字符波形格式标志(fmt ),最后⼀位空格。
10H~13H4整数过滤字节(⼀般为00000010H),若为00000012H则说明数据头携带附加信息(见“附加信息”)。
14H~15H2整数格式种类(值为1时,表⽰数据为线性PCM编码)16H~17H2整数通道数,单声道为1,双声道为218H~1BH4长整数采样频率1CH~1FH4长整数波形数据传输速率(每秒平均字节数)20H~21H2整数DATA数据块长度,字节。
22H~23H2整数PCM位宽随后2字节2整数附加信息(可选,由上⽅过滤字节确定)......................以上为对wav格式的基本了解,最近碰到⼀个需要合并⾳频⽂件的需求,奈何对此⽂件了解过少,最后借助于git地址:,结合⽂件流进⾏处理。
3.话不多说上代码。
⾸先是安装Naudio的包。
3.1.上传⾳频⽂件并调⽤合并⽅法【伪代码】public void UploadOrCombineAudioFile(){HttpFileCollection files = HttpContext.Current.Request.Files;if (files == null || files.Count < 1)return;string upfileType = HttpContext.Current.Request.Form["upfileType"];//⽂件格式类型/*...省略符...*/int maxSize = 1024 * 1024 * 100;//单⽂件上传最⼤限制List<string> dirDic = new List<string> { ".mp3", ".mp4", ".pcm", ".wav" };//⽂件格式限制string uploadPath = HttpContext.Current.Server.MapPath("~/AudioFile/TempFile/");//临时路径if (!Directory.Exists(uploadPath))Directory.CreateDirectory(uploadPath);string fileType = string.Empty;for (var i = 0; i < files.Count; i++){var postedfile = files[i];var inputStream = postedfile.InputStream;if (inputStream.Length > 0){string thisfileName = files[i].FileName;fileType = Path.GetExtension(thisfileName);if (postedfile.InputStream == null || postedfile.InputStream.Length > maxSize || !dirDic.Contains(fileType.ToLower()))return;/*...我是省略符...*/int ReadLen = 0;string uploadFileName = uploadPath + thisfileName;byte[] bytes = new byte[10240];using (FileStream stream = new FileStream(uploadFileName, FileMode.OpenOrCreate))//保存⽂件到指定待合并⽂件路径下{while ((ReadLen = inputStream.Read(bytes, 0, bytes.Length)) > 0){stream.Write(bytes, 0, ReadLen);}}}}List<string> filepaths = new List<string>(Directory.GetFiles(uploadPath));//获取待合并⽂件路径//⽂件合并后路径string savePath = HttpContext.Current.Server.MapPath("~/AudioFile/ComBineFile/" + DateTime.Now.ToString("yyyyMMdd") + "/"); if (!Directory.Exists(savePath))Directory.CreateDirectory(savePath);/*...我是省略符...*/byte[] buffer = new byte[10240];string savefullName = savePath + DateTime.Now.ToString("yyyyMMddHHmmssff") + upfileType;if (upfileType.ToLower().Equals(".mp3"))CombineMp3(filepaths, savefullName);//mp3合并else if ((upfileType.ToLower().Equals(".wav")))CombineWav(filepaths, savefullName);//wav合并/*...我是省略符...*/return;}3.2 .mp3格式合并//命名空间using System.IO;using NAudio;using NAudio.Wave;///<summary>/// Mp3格式合并///</summary>///<param name="inputFiles">待合并⽂件路径</param>///<param name="outputfullName">输出⽂件名</param>private void CombineMp3(List<string> inputFiles, string outputfullName){using (FileStream outputStream = new FileStream(outputfullName, FileMode.OpenOrCreate)){foreach (string file in inputFiles){Mp3FileReader reader = new Mp3FileReader(file);if ((outputStream.Position == 0) && (reader.Id3v2Tag != null)){outputStream.Write(reader.Id3v2Tag.RawData, 0, reader.Id3v2Tag.RawData.Length);}Mp3Frame frame;while ((frame = reader.ReadNextFrame()) != null){outputStream.Write(frame.RawData, 0, frame.RawData.Length);}}}}3.3.wav格式合并///<summary>/// wav格式合并///</summary>///<param name="inputFiles">待合并⽂件</param>///<param name="outputfullName">输出⽂件名</param>private void CombineWav(List<string> inputFiles, string outputfullName){WaveStream waveStream = WaveFormatConversionStream.CreatePcmStream(new WaveFileReader(inputFiles[0])); using (WaveFileWriter waveFileWriter = new WaveFileWriter(outputfullName, waveStream.WaveFormat)){foreach (string file in inputFiles){waveStream = WaveFormatConversionStream.CreatePcmStream(new WaveFileReader(file));byte[] bytes = new byte[waveStream.Length];waveStream.Position = 0;waveStream.Read(bytes, 0, (int)waveStream.Length); waveFileWriter.Write(bytes, 0, bytes.Length);}}}未完待续....。
样题一、填空(20分)1.色彩可用色调、亮度和饱和度三个特征来表示。
2.在制作网页图像时时,如果是连续调的图像,应存储为psd 格式。
3.视频特技是指视频片段内部的串编的效果,要想使视频特技效果随时间变化应在视频上建立。
4.在Premiere中组接视频时,想输出时间线窗所有素材组成的整个电影但却只输出了时间线窗中间一部分区域,修正的方法是。
二、单项选择题(10分)1.在数字音频信息获取与处理过程中下述顺序哪个是正确的?( c )(A)A/D变换、采样、压缩、存储、解压缩、D/A变换(B)采样、压缩、A/D变换、存储、解压缩、D/A变换(C)采样、A/D变换、压缩、存储、解压缩、D/A变换(D)采样、D/A变换、压缩、存储、解压缩、A/D变换2.以下对Web图像格式的叙述哪个是错误的( a ):(A)GIF是基于索引色表的图像格式,它可以支持上千种颜色(B)JPEG适合于诸如照片之类的具有丰富色彩的图像(C)JPEG和GIF都是压缩文件格式(D)GIF支持动画,而JPEG不支持3.在路径曲线线段上,方向线和方向点的位置决定了曲线段的( c)?(A)角度(B)形状(C)方向(D)像素三、多项选择题(20分)1.下面对图层蒙板的描述哪些是正确的?(ABC)(A)图层上的蒙板相当于一个8位灰阶的Alpha通道(B)当按住Shift键同时单击图层选项栏中的蒙板图标就可关闭蒙板,使之不在图像中显示(C)在图层调板的某个图层中设定了蒙板后,会发现在通道调板中有一个临时Alpha 通道(D)在图层调板上可对包括背景在内的所有图层建立蒙板2.下面对图层调板中背景的描述哪些是正确的?(AD)(A)背景始终是在所有图层的最下面(B)可以将背景转化为普通的图层,但是名称不能改变(C)背景不可以转化为普通的图层(D)背景转化为普通的图层后,可以执行图层所能执行的所有操作3. 下面对通道的描述哪些是正确的?( BCD )(A)色彩通道的数量是由图象阶调,而不是因色彩模式的不同而不同(B)当新建文件时,颜色信息通道已经自动建立了(C)同一文件的所有通道都有相同数目的象素点和分辨率(D)在图象中除了内定的颜色通道外,还可生成新的Alpha通道4.下列关于Premiere中“转场特技”的叙述哪些是正确的?( ABC )(A)转场特技是实现视频片段间转换的转场效果的方法(B)转场特技是指两个视频轨道上的视频片段有重叠时,从一个片段平滑、连续地变化到另一段的过程(C)两视频片段间只能有一种转场特技(D)视频转场也是一个视频片段四、简答题(50分)第1章多媒体基础1. 多媒体技术处理的对象有哪些?各自具有什么特点?文本,图像,图形,视频,音频,动画文本分为非格式化文本文件和格式化文本文件。
C#实现WAV音频单声道提取作者:Joseph Pan (转载请注明出处/weizhoupan/archive/2011/03/20/1989718.html)喜欢买碟或者卡拉ok的朋友一定不会对声道这个术语陌生。
通常我们在音像店买回来的VCD或者DVD都是双声道的形式,唱片商在录制唱片时往往提供了两个或多个声道,以保存不同的音频内容,以形成立体声效。
左声道保存的大多为一些背景声效,如卡拉OK 的消音伴唱。
而右声道保存的往往是较为主要的声音,比如主唱的歌声。
利用多声道技术,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受。
有时候我们只需要音频里的单声道内容,比如喜欢用电脑录制卡拉ok的朋友就经常为了找歌曲的伴唱而流连于各大伴奏网站。
现在的网络翻唱非常流行,很多网络歌手就是先搜索喜欢的歌曲的伴奏,然后利用Adobe Audition(前身就是大名鼎鼎的CoolEdit)录制自己的演唱,然后加一些简单的降噪和压限处理,最后mix到伴奏的音轨里面。
尽管利用Audition 也可以完成单声道的提取工作,但是操作起来比较复杂。
其实对W A V的单声道提取并不困难。
关键在于对W A V文件格式的理解。
一、W A V的文件头W A V为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范。
所有的W A V都有一个文件头,这个文件头包含了音频流的编码参数。
偏移地址字节数类型内容00H~03H 4 字符资源交换文件标志(RIFF)04H~07H 4 长整数从下个地址开始到文件尾的总字节数08H~0BH 4 字符WA V文件标志(W A VE)0CH~0FH 4 字符波形格式标志(FMT)10H~13H 4 整数过滤字节(一般为00000010H)14H~15H 2 整数格式种类(值为1,表示数据PCMμ律编码的数据)16H~17H 2 整数通道数,单声道为1,双声道为218H~1BH 4 长整数采样频率1CH~1FH 4 长整数波形数据传输速率(每秒平均字节数)20H~21H 2 整数数据的调整数(按字节计算)22H~23H 2 整数样本数据位数表1W A V的文件头由表1我们可以得到以下几个重要的信息:116H~17H处记录通道数,当值为1时,表示文件为单声道;当值为2时,表示文件为双声道。