当前位置:文档之家› 从DVD光盘中将影片原声做成音频文件

从DVD光盘中将影片原声做成音频文件

从DVD光盘中将影片原声做成音频文件
从DVD光盘中将影片原声做成音频文件

从 DVD 光盘中将影片原声做成音频文件
乐迷通常也是影迷, 好的电影配乐令人回想戏中的情节, 或者音乐本身也已经是精品 (比如攻壳机动队的主题音乐) ,
使人不禁想把音乐留在身边可以随时欣赏。这个想法可以实现吗?
答案当然是可以。同样的道理也适用于 DVD 卡拉 ok 碟、音乐会的实况碟等,可以让你在电视上欣赏之余还能 将音乐带在身边随处可听。
要实现这个想法,我们首先要熟悉一下视频 DVD 上的音频。通常视频 DVD 上的音频都是与视频流混合在一起 的。一般使用 DTS 或者 Dolby Digital 方式编码。两者都是有损压缩,音质也差不多。对于视频 DVD ,我们需要 通过工具软件将混合在视频里面的音频分离出来,然后再转换为适合使用 PC 或便携播放器播放的格式。
目前有一些软件工具可以将视频 DVD 的音频提取出来,但由于多声道音频格式才刚刚起步,且多声道技术与便 携播放通常使用耳机这一两声道回放设备的矛盾仍未完全解决,因此提取后一般都是要将其转换为普通的双声道音频 才适合保存和播放。所以我们的提取视频 DVD 的音乐的方法也是围绕着将其提取并转换为立体声音乐来进行。



可以处理 DVD 上的内容的软件已经有很多了。其中相当一部份都是免费或者开放源码的软件。其中一个比较好 的软件是 Gordian Knot (简称 GK ) GK 是一个软件包, 。 里面包含了许多可以将 DVD 的内容提取出来制作成 AVI 文件的工具。由于我们只对音频部分感兴趣,所以就只关注音频方面的功能。 GK 在各大下载站均有提供,下载安装 后启动主程序,在第一次使用时会提示使用什么语言。由于许多 DVD 都是加密的,因此需要通过 GK 调用包含其 中的 DVD Decrypter ,将 DVD 上的内容解密后存放在硬盘上成为 VOB 文件。由于 DVD 的存储容量比较大,因 此你需要有足够的硬盘空间。然后,在 Gk 中启动 DXIndex 。它可以将 VOB 文件中的音频部分抓取出来成为一个 AC3 或者 DTS 文件,然后用 BeSweet 软件将 AC3 文件或 DTS 文件转换为最终需要的格式。


另一方面,需要付费的共享软件也有许多,比如 ACE DVD Audio Extractor 也是一个比较方便的工具。而且由于 此类软件不像刚才所说的 Gordian Knot 那样面向的是 DVD 音视频内容的同时提取,而是专注于 DVD 内容音频部 分的提取,因此在易用性方面要好很多。 但有一个现象,就是许多 DVD 音频提取的共享软件都存在着同质化的现象, 不仅功能相同,甚至连软件里面的选项设置也都是一样。估计应该是使用了某些相同的第三方组件的原因。所以,你
只需要其中一个就够了。

下面我们就以捕捉著名电影 《七宗罪》 结尾的音乐为例, 看看如何抓取。 首先出场的是 ACE DVD Audio Extractor 。 运行软件后选择 Open DVD ,选择 DVD 光盘上的 VIDEO_TS 文件夹(这里显得不够方便),便可列出 DVD 上 的章节(见截图左侧)并可从中选择需要捕捉的章节(最后一章是第 37 章)。截图右上的 Input 框用于选择捕捉那 个音轨。这张 DVD 是 D9 的,所以音轨非常多,从截图中可见共有 7 条。最前面两条是电影原声,一个是 AC3 格 式,另一个是 DTS 格式。最后一条是预混合的两声道 AC3 ,以兼容不支持解码的播放器。其他的都是加了评论或 者解说等等。 ACE DVD Audio Extractor 不支持对 DTS 音轨的解码, 如果选择该音轨会给出警告信息。 下面的 Output 框可选择输出格式、设置生成文件的标记以及选择输出位置,目前支持的格式分别为 WAV 、 MP3 及 WMA 三种。 选择格式后可以通过旁边的锤子按钮选择输出格式的压缩参数。右下方的框为预览框,在选择章节的时候可以通过这 个功能察看该章节的内容。一切设置好后按 Extract 按钮便可将选中章节的音轨以指定的压缩方式生成压缩文件。转 换的速度大约在 2 倍速左右(我的电脑 CPU 是 PIII 1.1GHz ),还可以接受。

如果改用 GK ,这个过程就稍微复杂一点,但由于 GK 里面捆绑的软件功能比较强大,因此可以对付一些比较 棘手的场合,例如使用了区码加密或只有 DTS 音轨等情况。一般的操作顺序是这样的:使用 GK 软件包中附带的 DVD Decrypter ,这个软件可以忽略 DVD 上的区码加密而提取音视频流。启动 DVD Decryper ,打开 DVD 后可以 在右上的 Input 框中选择需要提取的章节,在 Stream Processing 页中选择需要处理的播放流。我们只需要音频,因此 可以不选中有 Video 字样的流,这样 DVD Decrypter 就不会将视频流提取出来。其他的音频流就像之前介绍 ACE DVD Audio Extractor 那样进行选择。媒体流列表框下面可以选择对媒体流的处理方式,选择 Demux 以解除媒体流之 间的混合状态,分开为一个个独立的文件。选择好之后按界面上的那个 DVD 到硬盘的图形按钮便可开始提取。但此 时提取出来的只是 AC3 或者 DTS 文件,还不是我们想要的最终结果。此时便需要使用 BeSweet 。启动 BeSweet GUI ,最简单的操作是通过界面上方的 Input 和 Output 按钮选择输入输出的文件名,然后选择中间的 Use AC3 Decoder 、 Downconvert Sample Rate 、 Compress Dynamic Range 。,在 Lame 下拉框中选择 LAME ,最后按界面 右下方的 AC3 to MP3 按钮便可开始转换。有兴趣的朋友也可以尝试修改 BeSweet GUI 提供的各种参数选项以控制 压缩过程以获得更好的效果。

论声音与电影录音

论声音与电影录音 [摘要]本文主要谈论声音在电影电视影片中的重要性,以及我们在实际环境中是如何录制声音一些方法. [关键词] 影视声音电影录音 影视,英文是——movie and television,直接翻译是电影和电视的合称,而中文中的影视不但包括电影和电视剧还有动画等,通过拍摄绘画等手段制作出来的,带有故事片的影片。 电影是综合性的艺术,它包括的方面很广,音乐、美术、摄影、雕刻、绘画、语言、舞蹈等等。我们生活中的七十二行,行行都在其中,缺一不可。因为电影的内容是来源于生活,生活是架构电影故事的基础,有生活电影就丰富多彩,就有形有色、有滋有味。电影艺术家们把对生活的观察记录展现下来,呈现在银幕上,表现出来,就成为电影。 这里我先谈谈对电影声音的认识。 “音”是一种物理现象,它是由于物体振动,通过空气媒介,送到人们听觉器官,而形成感觉,这种感觉就是“音”。“音”又分为乐音和噪音,一种物体振动的规则和不规则之分,和谐的、悦耳的就是乐音,反之就是噪音。声音的存在无处不有。声音有高低之分,在一定时间内,振动的次数少,谓之低音,振动的次数多,谓之高音。人耳能在宇宙中,听到的声音频率的27hz到4100hz。 电影是一种形式,任何艺术形式的作品,都是对生活的提炼和升华,也就源于生活高于生活,要达到一种视和听的完美境界,让人们尽力的去接受去享受,我们在录音的制作过程中,要把握住理智的控制,心须严格的按照录音工艺和技术要求,把握住一当一录的情、意,不要放过每一个过程,每一个段落,每一个重点,细致地去做,利用各种手段方法,录好每一部影片。 我录音的第一部故事片《绿水》,它是一部同期数字电影,我们是完全按照电影格式拍摄,因为后期需要胶转磁,声画都是二十四格,。《绿水》是中国首部大型环保题材悬疑电影,是一部艺术水准很高的影片,商业价值很高,是广电总局及环保部很重视的一部片子。这部戏拍摄中,我每天除了把正戏拍完后,背着数字DAT录音机,随时录我需要的自然效果声和自然声,哪怕是几声。车声,街道的各种环境,旷野中鸟虫叫声,都录好带回去,作为同期声备用资料和实用资料,这样就会提高音响效果的真实感,只有亲身体验了,才能真正的想象,在想象的基础上才能进一步的发挥,由于自己有些后期经验,对每一个细节都不错过。在政审阶段,我们加环境及分轨都是在普通录音棚做的,包括音乐的位置,政审结束以后,该技术审查了,最后去了八一电影制片厂混录了三天,后来杜比公司做认证时,给予了很高的分数。 我当时在录《寻找美人痣》中一个镜头,车从左边哗的一声开到右边,当时就用AB制的方法,加一支话筒作定位,保持当时的声场环境方法录的,当然,有的录音师是用调音台上的PAN来做了,不过我还是认为我当时的那种尝试很好。《寻找美人痣》中还有几个镜头,车从画面左角开向纵深,或者从左边滑到右边,好多具体的镜头,我都用立体声拾音的方式把它录下来,我在和师傅学习的时候,对声场的变化都非常的感兴趣,非常希望通过我的手,营造出一个真实的声场氛围。 2011年《燃烧的石头》在同期录音中加用了三支话筒。采用了AB制式录同

声音和音频设备属性是灰色的 没有声音

声音和音频设备属性是灰色的没有声音 电脑没有声音任务栏没有小喇叭标志 一,没有安装驱动或者驱动不正确、不完整(XP下“控制面板”的“声音和音频设备”,[WIN98则是“控制面板”的“多媒体”]的“音频”选项否灰色不可用);建议重新安装驱动,特别是随主板送的光盘上的驱动(注意:对于AC7的板载声卡,随主板送的光盘上的驱动未必是正确的),如果知道声卡或者主芯片型号(具体方法一是看硬件芯片编号,二是用软件检测 https://www.doczj.com/doc/d810673100.html,/cgi-bin/bbs/show/content?groupid=103:10040&st=&sc=&messageid=639561& gpc=0&ggpc=0),也可以到驱动之家https://www.doczj.com/doc/d810673100.html,/去搜索最新的驱动。 二,XP下“控制面板”的“声音和音频设备”WIN98则是“控制面板”的“多媒体”]的“音频”选项否灰色不可用,如果是板载声卡的话检查BIOS里是否开启了板载声卡;如果是独立声卡的话也可以开机箱检查声卡是否接触不良(特别是老机子)。 三,XP下“控制面板”的“声音和音频设备”的“音频”选项否灰色不可用,但确认安装过正确的驱动,可以进“控制面板”的“管理工具”的“服务”里查看“Windows Audio”是否开启(“Windows Audio”服务,服务名AudioSrv,管理基于Windows 的程序的音频设备,默认是自动的,偶然也会出现手动的情况),将该服务启动并设置为“自动”。 如果你的XP下没有这个项目的话,你可以将下面蓝字部分保存为Audio.reg文件,然后双击运行,弹出的“是否确认要将?\Audio.reg中的信息添加进注册表?”窗口中点击“是”按钮。 Windows Registry Editor V ersion 5.00 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\AudioSrv] "DependOnService"=hex(7):50,00,6c,00,75,00,67,00,50,00,6c,00,61,00,79,00,00,00,\ 52,00,70,00,63,00,53,00,73,00,00,00,00,00 "Description"="管理基于Windows 的程序的音频设备。如果此服务被终止,音频设备及其音效将不能正常工作。如果此服务被禁用,任何依赖它的服务将无法启动。" "DisplayName"="Windows Audio" "ErrorControl"=dword:00000001 "Group"="AudioGroup" "ImagePath"=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,00,\ 74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,73,\

音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

音频与音效复习资料

音频与音效复习资料 题型: 名词解释4'*5 选择2'*10 判断2'*10 简答8'*3 思考12'*1 计算? 一.名词解释5道题从下面列出来的里面出,还没弄清楚的同学请尽快弄清楚。 ●鸡尾酒会效应 ●MIDI ●EDL ●混响 ●掩蔽 ●音色(音品) ●音频设备的动态范围 ●信噪比 ●耳间强度差 鸡尾酒会效应: 【老师说的】在有干扰存在的条件下,听者能听到他所关心的声音的现象。 【网上搜的】可用特瑞斯曼的注意衰减理论来解释。听觉注意现象。当人的听觉注意集中于某一事物时,意识将一些无关声音刺激排除在外,而无意识却监察外界的刺激,一旦一些特殊的刺激与己有关,就能立即引起注意的现象。因常见于酒会上而得名。如在各种声音嘈杂的鸡尾酒会上,有音乐声、谈话声、脚步声、酒杯餐具的碰撞声等,当某人的注意集中于欣赏音乐或别人的谈话,对周围的嘈杂声音充耳不闻时,若在另一处有人提到他的名字,他会立即有所反应,或者朝说话人望去,或者注意说话人下面说的话等。该效应实际上是听觉系统的一种适应能力。对熟悉事物的迅速再认被称为鸡尾酒会现象。也就是:我们站在一个挤满了人的屋子里,周围可能有十个,二十个人在说话,可我们却能挑选出我们想听的对话。换句话说,我们的大脑对其它对话都进行了某种程度的判断,然后决定堵住不听。 MIDI: 【网上搜的】MIDI是乐器数字化接口(Musical Instrument Digital Interface)的缩写。所以说MIDI并不是一个实在的东西,而是一个国际通用的标准接口。通过它,各种MIDI设备都可以准确传送MIDI信息。MIDI音乐的基本设备是三大法宝:音源,音序器,输入设备。 EDL: 【老师说的】剪辑决定表Edit decision list 【网上搜的】EDL(Editorial Determination List)编辑决策列表,是一个表格形式的列表,由时间码值形式的电影剪辑数据组成。EDL 是在编辑时由很多编辑系统自动生成的,并可保存到磁盘中。当在脱机/ 联机模式下工作时,编辑决策列表极为重要:脱机编辑下生成的EDL 被读入到联机系统中,作为最终剪辑的基础。此过程中固有的问题是,虽然EDL 包含后编辑所需的所有时间码值,但其并不包含关于特技效果、颜色校正、声音音量设置或类似项目的信息。因此,将包含EDL 的磁盘插入联机编辑控制中,通常并未提供联机编辑所需的全部信息,而是必须重新生成特技效果和画面校正。有各种各样的EDL 格式,例如Sony、

声音和音频设备成灰色了没有音频设备怎么解决

声音和音频设备成灰色了没有音频设备怎么解决声音和音频设备成灰色了没有音频设备怎么解决 问题补充 怎么办啊

今天碰到一台机器,在设备管理器里没有叹号,声卡也已安装官方驱动,但是在声音和音频设备中还是显示灰色,机器也没有声音。找来找去原来是windows audio服务丢失了。(判断是否为windows audio服务引起上述声卡不能用问题的方法是在控制面板-管理工具-服务中查找是否有windows audio服务并查看是否已自动启动?) 解决方法如下: 1、将下面的文件复制到文本文件中,保存后改名为Audio.reg Windows Registry Editor Version 5.00 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\AudioSrv] "DependOnService"=hex(7):50,00,6c,00,75,00,67,00,50,00,6c,00,61,00,79,00,00,00,\ 52,00,70,00,63,00,53,00,73,00,00,00,00,00 "Description"="管理基于 Windows 的程序的音频设备。如果此服务被终止,音频设备及其音效将不能正常工作。如果此服务被禁用,任何依赖它的服务将无法启动。" "DisplayName"="Windows Audio" "ErrorControl"=dword:00000001 "Group"="AudioGroup" "ImagePath"=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,00,\ 74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,73,\ 00,76,00,63,00,68,00,6f,00,73,00,74,00,2e,00,65,00,78,00,65,00,20,00,2d,00,\ 6b,00,20,00,6e,00,65,00,74,00,73,00,76,00,63,00,73,00,00,00 "ObjectName"="LocalSystem" "Start"=dword:00000002 "Type"=dword:00000020 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\AudioSrv\Parameters] "ServiceDll"=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,\ 00,74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,\ 61,00,75,00,64,00,69,00,6f,00,73,00,72,00,76,00,2e,00,64,00,6c,00,6c,00,00,\ 00 "ServiceDllUnloadOnStop"=dword:00000001 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\AudioSrv\Enum] "0"="Root\\LEGACY_AUDIOSRV\\0000" "Count"=dword:00000001 "NextInstance"=dword:00000001 2、双击刚刚创建并保存的audio.reg文件,并重启机器就OK了。

【Alsa】播放声音跟录音详细流程

【Alsa】播放声音跟录音详细流程 播放声音和录音详细流程 一,前言: linux中,无论是oss还是alsa体系,录音和放音的数据流必须分析清楚。先分析alsa驱动层,然后关联到alsa 库层和应用层。 二,链接分析: 1)链路一 usr/src/linux-source-3.0.0/sound/core/pcm_native.c文件中注册部分.mmap = snd_pcm_mmap调用 snd_pcm_mmap_data(substream, file, area); 该方法中进一步调用 substream->ops->mmap(substream, area); 根据./soc/pxa/pxa3xx-pcm.c文件中.mmap = pxa3xx_pcm_mmap,可知 dma_mmap_writecombine(, ,runtime->dma_addr,);函数被调用。 soc/pxa/pxa3xx-pcm.c文件中 pxa3xx_pcm_hw_params()函数会创建链表,根据dma_buff_phys = runtime->dma_addr; dma_desc->dsadr = dma_buff_phys;可知

runtime->dma_addr为dma内存端地址,且此地址由alsa 库层传递进来。又根据 dma_desc->dtadr = prtd->params->dev_addr 和soc/pxa/pxa3xx-ac97.c文件中 .dev_addr = __PREG(PCDR),可知dma外设端地址为ac97控制器中fifo读写寄存器PCDR。至此,第一条链路建立完毕:FIFO通过DMA和内存交互。2)链路二 ac97接口或者i2s(Inter—IC Sound)或者pcm接口可以将cpu和codec(wm9714/alc5620/alc5621)连接起来。 配置好格式:pcm接口必须配置采样率、采样位数、通道数和传送格式; i2s接口必须配置采样率、采样位数、通道数和对齐方式; ac97接口比较灵活,可以认为cpu这端不用配置,只需要在codec端配置就行了。当然,电源、时钟、IO任何数 字芯片都得配置。最后不能混淆数据接口和控制接口的慨念,i2s和pcm只能传输音频数据,访问codec的寄存器必须通过i2c等控制接口,ac97接口分时传输控制和数据。codec 中的adc/dac通过ac97等接口同cpu的fifo交互数据。第 二条链路建立完毕。 3)链路三alsa_lib源码中pcm.c文件中 snd_pcm_readi(,buffer,size)调用pcm_local.h文件中

关于声音与视频

关于声音与视频 1 何时须使用声音与视频 虽然声音和视频可以给观众在听觉和视觉方面带来更大的冲击力,但不是每个演示文稿中都要使用声音和视频,制作者应适宜地使用这些元素来为演示的主题服务。 ●对于自动循环播放的演示文稿,在没有演讲者的情况下,通过可以为幻灯片添加 演讲者旁白来代替演讲者的口述。 ●一些具有娱乐、轻松性质的演示文稿,可添加适当的背景音乐,调节现场的气氛。 ●在一些特殊的幻灯片中,有时须添加一些音效来配合幻灯片中的内容。 ●一些商务类演示文稿,有时须在开始时展示公司或组织的一个片头宣传动画,这 是视频应用的一种情况。 2 使用声音与视频时的注意事项 在确定了要使用声音或视频后,还须注意以下一些事项。 ●在幻灯片中使用的声音或视频文件须要放置在与演示文稿相同的文件夹中。 ●在演示文稿中并不能使用所有类型的多媒体文件,只能使用与PowerPoint相兼容 的文件类型。若确实要使用,用户须事先通过其他软件对其格式进行转换。 ●在PowerPoint的剪辑管理器和Microsoft Office Online网站中也提供了许多小而简 单的声音或视频文件,用户也可以在这里进行选择。 3 可供使用的声音与视频格式 ①声音格式 PowerPoint所能支持的声音格式包括如下一种。 ●WA V:这是Windows中最常见的声音文件格式之一,它是原始的声音音频,没有 经过优化压缩,因此声音质量非常好,但文件体积较大,一段一分钟左右的WA V 文件可能会达到50MB。即使如此,它仍然是非常受欢迎的声音格式。 ●MP3:这是目前使用最广泛的一种声音文件格式,它采用高质量的比特率进行压缩, 其质量类似于CD音质,但文件比W A V小很多,一分钟大概1MB。 ●WMA:它与MP3类似,却使用了更好的压缩算法,因此其音质与MP3相关无几, 但文件变得更小一些。 ●MIDI:MIDI的中文意义为乐器数字接口,这类文件不包含实际的音乐,而只包含

(完整版)音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 单元知识点考试要求试题类型 音频、视频采集与处理1.音频的数字化和存储容量的计算 b 选择题、填空题 必考+加试2.声音素材的采集 C 3.声音素材的制作 C 4.声音的格式转换 C 5.视频的数字化和存储容量的计算 b 6.视频素材的采集和处理 C 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

音频基本知识

1、人耳能听到的频率范围是20—20KHZ。 2、把声能转换成电能的设备是传声器。 3、把电能转换成声能的设备是扬声器。 4、声频系统出现声反馈啸叫,通常调节均衡器。 5、房间混响时间过长,会出现声音混浊。 6、房间混响时间过短,会出现声音发干。 7、唱歌感觉声音太干,当调节混响器。 8、讲话时出现声音混浊,可能原因是加了混响效果。 9、声音三要素是指音强、音高、音色。 10、音强对应的客观评价尺度是振幅。 11、音高对应的客观评价尺度是频率。 12、音色对应的客观评价尺度是频谱。 13、人耳感受到声剌激的响度与声振动的频率有关。 14、人耳对高声压级声音感觉的响度与频率的关系不大。 15、人耳对中频段的声音最为灵敏。 16、人耳对高频和低频段的声音感觉较迟钝。 17、人耳对低声压级声音感觉的响度与频率的关系很大。 18、等响曲线中每条曲线显示不同频率的声压级不相同,但人耳感觉的响度相同。 19、等响曲线中,每条曲线上标注的数字是表示响度级。 20、用分贝表示放大器的电压增益公式是20lg(输出电压/输入电压)。 21、响度级的单位为phon。 22、声级计测出的dB值,表示计权声压级。 23、音色是由所发声音的波形所确定的。 24、声音信号由稳态下降60dB所需的时间,称为混响时间。 25、乐音的基本要素是指旋律、节奏、和声。 26、声波的最大瞬时值称为振幅。 27、一秒内振动的次数称为频率。 28、如某一声音与已选定的1KHz纯音听起来同样响,这个1KHz纯音的声压级值就定义为待测声音的响度。 29、人耳对1~3KHZ的声音最为灵敏。 30、人耳对100Hz以下,8K以上的声音感觉较迟钝。 31、舞台两侧的早期反射声对原发声起加重和加厚作用,属有益反射声作用。 32、观众席后侧的反射声对原发声起回声作用,属有害反射作用。 33、声音在空气中传播速度约为340m/s。 34、要使体育场距离主音箱约34m的观众听不出两个声音,应当对观众附近的补声音箱加0.1s延时。 35、反射系数小的材料称为吸声材料。 36、透射系数小的材料称为隔声材料。 37、透射系数大的材料,称为透声材料。 38、全吸声材料是指吸声系数α=1。 39、全反射材料是指吸声系数α=0。 40、岩棉、玻璃棉等材料主要吸收高频和e中频。 41、聚氨酯吸声泡沫塑料主要吸收高频和中频。 42、薄板加空腔主要吸收低频。

完整版音频视频采集与处理知识点整理

---稽山中学信息技术学业水平考试复习资料音频与视频音频、视频采集与处理相关知识点 知识条目: 单元知识点考试要求试题类型 1.音频的数字化和存储容量的计算b 2.声音素材的采集 C 3.声音素材的制作C 选择题、音频、视频采集填空题 必考+加试与处理 4.C 声音的格式转换 5.视频的数字化和存储容量的计算b 6.C 视频素材的采集和处理 : 知识点整理音频数字化及存储量的计算1. 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 8时间(秒)、量化位数*声道数*存储量(字节)=采样频率*2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

音频与相位的关系

反相 在广播播出系统中,由于音频节目源日益多样化,节目制作很多由未经专业训练的编辑或制作人完成,甚至也有从网络下载的等等。节目质量参差不齐,时常有各种各样的音频节目存在缺相、反相、相移、左右声道电平不平衡等问题,影响播出质量。尤其是音频节目的相位关系正确与否,将直接影响着广播播出质量和播出安全。

反相的识别和判断 要避免左右声道反相的节目源播出,必须严格做好预听工作。节目预听中,当信号反相时,左右两组音箱发出的声音在声场中的振动方向正好相反,彼此之间声音能量在声场中相互抵消,出现声短路现象,导致重放声音的音量达不到应有的音量、声音的力度变差、低音浑浊等现象。此时调音台表头显示有输出,容易造成假象。要仔细观察左右声道电平显示,会发现相差很大。具体听觉感受是中音略感不足,声音明亮度欠佳。严重时听到的是吱吱声,甚至完全听不到播出声音。 由于左右声道声音存在180°的相位差,致使重放立体声音乐时的声音无法定位。这是因为立体声的声音定位在很大程度上是依靠左右声道之间的相位差来完成的。立体声理论告诉人们,当左右声道之间存在180°相位差时,听音者会感觉到立体声像跑到了两音箱的外侧,声源的位置飘忽不定、模糊且混乱、立体声所特有的临场感、空间感和包围感效果遭到破坏。听觉效果是立体声感丢失,声音发干。

节目反相的危害 播出中节目反相是非常可怕的,具体会发生两种情况: 一是播出系统自动切换,系统识别为信号中断,就是在左右声道互相中和,输出电平过低,使播出系统切换到备播信号源,造成播出节目停播; 二是播出质量下降,收听模糊且混乱,造成劣播。值班中电平监视显示正常,预听也有声音,由于问题来得突然,无法判断根源,切换节目源可恢复正常,一次节目反相造成长达几分钟停劣播,影响很坏。 节目反相的原因 节目制作时造成反相的原因有以下几种:

音频编辑就这么简单

音频编辑就这么简单 现在网上有很多介绍音频编辑的软件,但都是专业的录音软件的使用方法,我们有时按照上面介绍的方法来制作,但感觉一时半会无法掌握,专业的录音软件重点是在后期制作上,如果没有一定的经验,制作出来的歌曲还没有直接用普通录音机录出来的效果好。而微软自带的录音机可以完成一般的录制、截取、合成、等基本功能,关键是可随时使用,不用到处找音频处理软件,还担心是否能用和有病毒了。 一、声音的截取处理 在实际应用中,我们可能需要对某一段音频进行截取处理,即只需其中一部分,把多作的删掉掉。我们利用录音机打开要处理的音频文件,如下图所示: 该音频文件共长6.77秒,现在我们截取其中从2秒到5秒的音频数据,生成一个新的音频文件,可以先播放到2秒片暂停(或直接拖动滑块到2秒片),再选择“编辑”中的“删除当前位置以前的内容”,如下图所示。这样,就清除了该音频文件的前2秒。然后再拖动滑块到5秒钟的位置,再选择“编辑”中的“删除当前位置以后的内容”,这样就从该音频文件中截取了我们所需要的音频文件了。

二、声音的录音处理 1、声卡的四种录入源的选择(如下图所,双击右下角的音量图标-音量控制-选项-属性-录音控制,默认是以下四种方式,当然还有其它方式,但对普通用户不需要了。) A、CD音频。通过CD机播放录入声音了。但是前提是你电脑里的CD音频线已经插上。 B、麦克风。选择了它,通过麦克风就能把周围的声音录入了,这种适合录入比较干净的源声了。 C、线路。这种是录入外部音源了,比如录音机,音响等。但在此之前请确认把音响的输出线插入声卡相应的线入输入口(一般在声卡上有一个“LINE IN”字样)。 D、波形输出混音。它实际上完成了两部分声音的录入,一是就是把你电脑播放的所有声音录入,也就是内录。二是从麦克风传入的声音全部录入了。这项常常用来唱卡啦OK时录入声音。一边用电脑播放伴奏音乐,一边用麦克风歌。注意:不同的声卡这项的表示标识不一样,有的是“Stereo Mix”或者“混音”或者“立体声”,但他们的功能是相同的。 在实际运用中,我们可以根据需要来选择一种合适的录入方式。需要注意的是 1、录音时间的延长。默认情况下,“录音机”程序只能录入60秒的声音了,我们可以通过两种方式来延长录音时间。第一种是当在录完的那一时刻即60秒,迅速单击一下那个“录音”按钮(红色实心小圆圈),就又可以继续录入了。第二种是打开录音机后,点红色录音按键,再点“效果”中的“减速”(系统默认的时间只有60秒,点一次减速时间会增加目前所显示时间的一倍,根据实际录音的长短减速到合适的时间,如下图所示,就变为300秒了。),然后点黑色方块停止键,最后点向左双键头。这个时候再开始录音即可。 1、“麦克风”方式下虽然也可以录入电脑播放的声音,但效果远不如在“在波形输出混音”方式下录入了。我们可以从声音录入的波形的变化来看了(如下图所示),在“麦克风”方式下,如果是单纯录电脑的声音,它实际上是从麦克风传入,波形变化很小了。如果在“波形输出混音”方式下,它是通过内部录入了,波形变化很大了,而且不需要麦克风了。

采访录音技巧与后期音频处理

采访录音技巧与后期音频处理 谢倍伟 现在,广播记者在使用录音机进行录音采访过程中,经常出现录音失真,或者声音不集中等情况,使播出的录音报道不理想,整篇报道也就大打折扣。本文主要针对广东电台新闻中心记者在采制录音报道过程中普遍存在的问题进行技术指导,旨在提高广播记者的录音报道水平和质量。 一、常用采访机 1、PAW120数字采访机

关于这种采访机的基本功能使用,有说明书可以参考,网上也可以下载,这里就不在赘述了。只提醒大家几个使用中比较关键的问题。 1)、输入设备的选择 按蓝色的MENU键后,出现的第一个菜单就是输入设备选择菜单。DYN、IECM-1、COND、这几个设备输入接口是PAW120预置好的一些话筒型号匹配型,在使用外接话筒时都可以选择,只是录出来的效果有些不同。 其中DYN用于接动圈话筒,数字放大倍数较大,低频略有提升,要注意容易喷话筒;IECM-1为其选配电容话筒,有低频切除功能;COND为电容话筒,有低频切除功能;INT为内置话筒;LINEH为高电平线路输入,可作为从调音台或其他放音设备导出音频时使用;LINEL为低电平输入,可作为从调音台或其他放音设备导出音频时使用。 经过实际使用中的比较,发现当用我们记者常用的SONY电容话筒时,如果选择该机型推荐的COND选项的话,录音电平会偏小一些,反倒是用DYN选项电平比较适中。 SONY 907电容话筒

2)、压缩方式的选择 关于压缩方式的选择,对我们最终的录制质量有很大的影响。 HI QUALITY是没有压缩的PCM音频格式,音质最好,但文件量大;MUSIC 是MPEG的压缩格式,默认数据流量是256kbps,音质相当于CD,可文件量相当于上一种的1/5,立体声,尽管扩展名是.WAV,但实际上就相当于我台目前使用的S48文件,平时使用时,推荐使用这种方式;SPEECH,用于语言录音,单声道,中高频略有失真感;STENO采样率太低,达不到广播级的音质要求,不推荐使用。 3)、关于AGC的使用 AGC是AUTO GAIN CONTROL,自动增益控制功能,在这种PAW120上,有几种选择,比如-5dBfs,-11dBfs等,实际功能是一种电平动态压限器,它可以提高弱电平的录音音量,减小最大电平与最小电平之间的差别,但是,使用不当,往往会造成整段录音电平过大、失真、底噪提升。 这一功能的原本的设计目的是为了在录音音源音量很小,或距离很远时使用,但经过实际采录的比较,发现当使用了这一功能时,环境的本底噪音会同时被加大,而且有些高电平的地方有很明显的失真。请谨慎使用。 下面是两段录音的波形比较,一段用了AGC,一段没有,录音时,话筒距离音源约3—4米。

相关主题
文本预览
相关文档 最新文档