当前位置:文档之家› MP3知识之采样频率与比特率

MP3知识之采样频率与比特率

MP3知识之采样频率与比特率
MP3知识之采样频率与比特率

MP3知识之采样频率与比特率

最近不知道是不是耳朵刁了,已经觉得128K的MP3没法听了,声音发颤。至少要192K 的才能入耳,320K的听着才舒服。

数字音乐文件的品质主要参考采样频率和比特率这两项指标。声音是一种波,我们以极短的时间间隔把波形变成一系列的数字,也就是模拟信号到数字信号的转换,简称A/D转换,就是对声音进行采样,每秒钟采样的次数称为采样频率。常用的采样频率有11.025kHz、22.05kHz和44.1kHz。在采样时,采样点之间的时间间隔越小,即每秒钟采样的次数越多,采样频率越大,采样就越细腻逼真,所以理论上讲应该是采样频率越高音质越好。但由于人耳听觉分辨率毕竟有限,最大分辨率大约是20kHz左右,所以目前大部分MP3播放机所能够支持的44.1kHz的采样频率,基本上已经能够满足要求了。

比特率则表示记录音频数据每秒钟所需要的平均比特值,比特是计算机中最小的数据单位,指一个0或者1的数,通常我们使用Kbps(1024bps)作为单位。CD中的数字音乐比特率为1411.2Kbps,也就是记录1秒钟的CD音乐,需要1411.2×1024比特的数据,对于大部分人来说,192Kbps的MP3音质已经非常不错了,但是如果你的耳朵比较灵敏,自然要求也就相应提高。目前大部分MP3播放机所能够支持的256Kbps的比特率,基本上已经能够满足要求了,如果能够支持更高当然更好。

比特率这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。比特率与音频压缩的关系简单的说就是比特率越高音质就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。

VBR(Variable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;ABR(Average Bitrate)平均比特率是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用喽缘偷牧髁浚 咂岛痛蠖 硐质笔褂酶吡髁浚 梢宰鑫猇BR和CBR的一种折衷选择。

CBR(Constant Bitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR 来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高

影响声音的大小的物理要素是振幅,电脑上的声音必须也要能精确表示乐曲的轻响,所以一定要对声波的振幅有一个精确的描述,“比特”就是这样一个单位,x比特就是指把波形的振幅划为2的x次方个等级,根据模拟信号的轻响把它划分到某个等级中去,就可以用数字来表示了。比特率越高,越能细致地反映声音的轻响变化。

为了体现正常的声音信息,16bit为基本的需求,较好的cd使用的是20bit甚至24bit。CS 呢?顶多顶多算及格。而声道就别提了,连mp3都是2 Channel。

不知道大家能听的出128K和320K的区别吗,128K的细节不是被删减就是被衰减,薄得像纸。高音上不去,低音下不来。192K的和320K的耳朵不是很刁的话估计也听不出什么区别。所以那种耳朵不是很刁要求也不是很高的192K VBR的是最好的选择。

码流码率高清的区别

关键帧的周期,也就是两个IDR帧之间的距离,一个帧组的最大帧数,一般而言,每一秒视频至少需要使用1 个关键帧。增加关键帧个数可改善质量,但是同时增加带宽和网络负载。 需要说明的是,通过提高GOP值来提高图像质量是有限度的,在遇到场景切换的情况时,H.264编码器会自动强制插入一个I帧,此时实际的GOP值被缩短了。另一方面,在一个GOP中,P、B帧是由I帧预测得到的,当I帧的图像质量比较差时,会影响到一个GOP中后续P、B帧的图像质量,直到下一个GOP开始才有可能得以恢复,所以GOP值也不宜设置过大。 同时,由于P、B帧的复杂度大于I帧,所以过多的P、B帧会影响编码效率,使编码效率降低。另外,过长的GOP还会影响Seek操作的响应速度,由于P、B帧是由前面的I或P帧预测得到的,所以Seek操作需要直接定位,解码某一个P或B帧时,需要先解码得到本GOP内的I帧及之前的N个预测帧才可以,GOP值越长,需要解码的预测帧就越多,seek响应的时间也越长。 CABAC/CAVLC H.264/AVC标准中两种熵编码方法,CABAC叫自适应二进制算数编码,CAVLC叫前后自适应可变长度编码, CABAC:是一种无损编码方式,画质好,X264就会舍弃一些较小的DCT系数,码率降低,可以将码率再降低10-15%(特别是在高码率情况下),会降低编码和解码的速速。 CAVLC将占用更少的CPU资源,但会影响压缩性能。 帧:当采样视频信号时,如果是通过逐行扫描,那么得到的信号就是一帧图像,通常帧频为25帧每秒(PAL制)、30帧每秒(NTSC制); 场:当采样视频信号时,如果是通过隔行扫描(奇、偶数行),那么一帧图像就被分成了两场,通常场频为50Hz(PAL制)、60Hz(NTSC制); 帧频、场频的由来:最早由于抗干扰和滤波技术的限制,电视图像的场频通常与电网频率(交流电)相一致,于是根据各地交流电频率不同就有了欧洲和中国等PAL制的50Hz和北美等NTSC制的60Hz,但是现在并没有这样的限制了,帧频可以和场频一样,或者场频可以更高。 帧编码、场编码方式:逐行视频帧内邻近行空间相关性较强,因此当活动量非常小或者静止的图像比较适宜采用帧编码方式;而场内相邻行之间的时间相关性较强,对运动量较大的运动图像则适宜采用场编码方式。 Deblocking 开启会减少块效应。 FORCE_IDR 是否让每个I帧变成IDR帧,如果是IDR帧,支持随机访问。 frame,tff,bff

音视频文件码率与大小计算公式(更新版)

编码率/比特率直接与文件体积有关。 且编码率与编码格式配合是否合适,直接关系到视频文件是否清晰。 在视频编码领域,比特率常翻译为编码率,单位是Kbps,ps是每秒的意思,例如800Kbps其中,1K=1024 1M=1024Kb为比特(bit)这个就是电脑文件大小的计量单位,1KB=8Kb,区分大小写,B代表字节(Byte)s为秒(second)p 为每(per)以800kbps来编码表示经过编码后的数据每秒钟需要用800K比特来表示。 1MB=8Mb=1024KB=8192KbWindows系统文件大小经常用B(字节)为单位表示,但网络运营商则用b(比特),也就是为什么2Mb速度宽带在电脑上显示速度最快只有约256KB的原因,网络运营商宣传网速的时候省略了计量单位。 完整的视频文件是由音频流与视频流2个部分组成的,音频和视频分别使用的是不同的编码率,因此一个视频文件的最终技术大小的编码率是音频编码率+视频编码率。 例如一个音频编码率为128Kbps,视频编码率为800Kbps的文件,其总编码率为928Kbps,意思是经过编码后的数据每秒钟需要用928K比特来表示。 了解了编码率的含义以后,根据视频播放时间长度,就不难了解和计算出最终文件的大小。 编码率也高,视频播放时间越长,文件体积就越大。 不是分辨率越大文件就越大,只是一般情况下,为了保证清晰度,较高的分辨率需要较高的编码率配合,所以使人产生分辨率越大的视频文件体积越大的感觉。 所以: 计算输出文件大小公式: 文件大小=(音频码率÷8 +视频码率÷8)×影片总长度(秒为单位)即: 文件=码率÷8×时间码率=文件×8÷时间比如:

什么是码率

什么是码率? 码率是指每秒码流中经过的比特数。此处所指码流即MPEG文件。 一般情况下,MPEG的压缩率是通过指定码率实现的。码率越高,画质和音质越好,而压缩率则越低。 在同一码流中码率始终恒定时,称之为固定码率(CBR,Constant Bit Rate)。 一般情况,MPEG基本上是CBR,VBR技术被DVD等广泛支持。 PAL与NTSC制式的转换问题 1、PAL制式是每秒记录25幅画面; 2、NTSC制式是每秒记录30幅画面;(两种制式的画面的扫描线也不同); 3、DV格式既不属于PAL制式也不属于NTSC制式,但它确实分为25幅画面/秒和30幅画面/秒两种版本; 4、透过镜头,PAL制的TRV-900记录的是25幅画面/秒,而NTSC制的TRV-900记录的是30幅画面/秒 5、从数字端口(1394端口),TRV-900(其它数字摄像机也相同)既可记录25幅画面/秒信号,也可记录30幅画面/秒; 6、从模拟输入口,TRV-900只能记录与摄像机制式相同的模拟信号(PAL制式或NTSC制式); 7、如果你将一个PAL制式摄像机拍摄的DV带在一个NTSC制式的TRV-900中播放,它会输出一个非标准的、带有NTSC3.58彩色编码的25幅画面/秒信号。大多数电视机都可以很好地播放出来,但录像机无法记录。如果通过数字端口(1394口)输出,则它输出的将是标准的PAL版DV信号; 8、反之,如果你将一个采用NTSC制式记录的DV带,在一个PAL制式的TRV―900摄像机中播放,它将输出一个NTSC4.43或PAL制式彩色编码的非标准的30幅画面/秒信号(取决于摄像机的菜单设置)。大多数电视机都可以很好地播放出来,但录像机无法记录。如果通过数字端口(1394口)输出,则它输出的将是标准的NTSC版DV信号; 9、没有一种摄像机可以将帧数(即每秒画面数)或每幅画面的扫描线转换过来。这一点是理解问题的关键,即当摄像机遇见其它制式标准时,它需要不同的晶体振荡器去处理不同的制式信号(3.58(NTSC)或者4.43(PAL和NTSC4.43))。但摄像机只能有一种晶体振荡器。 10、TRV900将以其自有的格式从PC卡端口记录静像。即如果我在PAL制摄像机中放入一盘NTSC制式记录的DV带,并从一幅JEPG格式文件中加入数秒钟的录像,那么这几秒钟的录像将以PAL格式记录下来。 如果你通过IEEE-1394记录或回放,那么你只是在进行一个纯粹的数字文件传递。因而不存在格式转换问题。如果原来是PAL制的,拷贝后仍是PAL制。如果原来是NTSC制的,拷贝后仍是NTSC制。不管你是用什么制式的摄像机。 如果你有一种制式的模拟信号,想转换成另一种制式,你需要一个专门的影像转换盒才行。如果你有一种 制式的数字DV信号,想转换成另一种制式的DV信号,则可以采用软件进行转换。 什么是MPEG码流? MPEG-Video码流图像部分的码流。文件扩展名通常使用:m1v, m2v, mpv, vbs等。 MPEG-Audio码流声音部分的码流。文件扩展名通常使用:mp1, mp2, mp3, mpa等。 MPEG-System码流MPEG-Video码流和MPEG-Audio码流复合形成的独立码流。文件扩展名通常使用:mpg, m2p等。

音视频文件码率与大小计算公式(更新版)

编码率/比特率直接与文件体积有关。且编码率与编码格式配合是否合适,直接关系到视频文件是否清晰。 在视频编码领域,比特率常翻译为编码率,单位是Kbps,ps是每秒的意思,例如 800Kbps 其中,1K=1024 1M=1024K b 为比特(bit)这个就是电脑文件大小的计量单位,1KB=8Kb,区分大小写,B代表 字节(Byte) s 为秒(second) p 为每(per) 以800kbps来编码表示经过编码后的数据每秒钟需要用800K比特来表示。 1MB=8Mb=1024KB=8192Kb Windows系统文件大小经常用B(字节)为单位表示,但网络运营商则用b(比特),也就是为什么2Mb速度宽带在电脑上显示速度最快只有约256KB的原因,网络运营商宣传网速的时候省略了计量单位。 完整的视频文件是由音频流与视频流2个部分组成的,音频和视频分别使用的是不同的编 码率,因此一个视频文件的最终技术大小的编码率是音频编码率+视频编码率。例如一个 音频编码率为128Kbps,视频编码率为800Kbps的文件,其总编码率为928Kbps,意 思是经过编码后的数据每秒钟需要用928K比特来表示。 了解了编码率的含义以后,根据视频播放时间长度,就不难了解和计算出最终文件的大小。编码率也高,视频播放时间越长,文件体积就越大。不是分辨率越大文件就越大,只是一 般情况下,为了保证清晰度,较高的分辨率需要较高的编码率配合,所以使人产生分辨率 越大的视频文件体积越大的感觉。 所以: 计算输出文件大小公式: 文件大小 =(音频码率÷8 + 视频码率÷8)×影片总长度(秒为单位) 即: 文件= 码率÷8×时间 码率=文件×8÷时间 比如: 码率1M、时长1小时的视频,文件大小=1÷8×3600=450M。 文件450M、时长1小时的视频,码率大小=450×8÷3600=1M 这样以后大家就能精确的控制输出文件大小了。 例:有一个1.5小时(5400秒)的影片,希望转换后文件大小刚好为700M 计算方法如下: 700×8÷5400×1024≈1061Kbps 意思是只要音频编码率加上视频编码率之和为1061Kb,则1个半小时的影片转换后文件 体积大小刚好为700M。 至于音频编码率和视频编码率具体如何设置,就看选择的编码格式和个人喜好了,只要2 者之和为1061即可。如可以设置为视频编码格式H264,视频编码率900 Kbps,音频 编码格式AAC,编码率161 Kbps。 与文件体积大小有关的码率是指的平均码率,因此,不论是使用固定比特一次编码方式还 是使用二次(多次)动态编码方式,都是可以保证文件大小的。只有使用基于质量编码的 方式的时候,文件大小才不可控制。 编码格式有很多种,在技术不断进步的情况下,针对不同的用途,产生了各种编码格式。 不同编码格式的压缩率不一样,且有各自的特点,有些在低码率情况下能保持较高的画面

声音中的比特率

声音中的比特率 简介 比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。作为一种数字音乐压缩效率的参考性指标,比特率表示单位时间(1秒)内传送的比特数bps(bit per second,位/秒)的速度。通常使用kbps(通俗地讲就是每秒钟1000比特)作为单位。cd中的数字音乐比特率为1411.2kbps(也就是记录1秒钟的cd音乐,需要1411.2×1024比特的数据),音乐文件的BIT RATE高是意味着在单位时间(1秒)内需要处理的数据量(BIT)多,也就是音乐文件的音质好的意思。但是,BIT RA TE高时文件大小变大,会占据很多的内存容量,音乐文件最常用的bit rate是128kbps,MP3文件可以使用的一般是8~320kbps,但不同MP3机在这方面支持的范围不一样,大部分的是32-256Kbps,这个指数当然是越广越好了,不过320Kbps是暂时最高等级了。 比特率值与现实音频对照 16Kbps=电话音质24Kbps=增加电话音质、短波广播、长波广播、欧洲制式中波广播40Kbps=美国制式中波广播56Kbps=话音64Kbps=增加话音(手机铃声最佳比特率设定值、手机单声道MP3播放器最佳设定值)112Kbps=FM调频立体声广播128Kbps=磁带(手机立体声MP3播放器最佳设定值、低档MP3播放器最佳设定值)160Kbps=HIFI高保真(中高档MP3播放器最佳设定值)192Kbps=CD(高档MP3播放器最佳设定值)256Kbps=Studio音乐工作室(音乐发烧友适用)实际上随着技术的进步,比特率也越来越高,MP3的最高比特率为320Kbps,但一些格式可以达到更高的比特率和更高的音质。比如正逐渐兴起的APE音频格式,能够提供真正发烧级的无损音质和相对于WA V格式更小的体积,其比特率通常为550kbps-----950kbps。 常见编码模式 VBR(V ariable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;ABR(A verage Bitrate)平均比特率是VBR的一种插值参数。LAME针对CBR 不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。CBR(Constant Bitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。 实际价值 APE的比特率高低与音质的关系,有如下几种观点:1、APE的比特率越高,音质越好。 2、APE的比特率和音质没有关系。 3、APE的比特率由压缩比决定。首先,APE的比特率到底由什么决定?经过几次试验,发现APE的比特率是由原CD本身的特征和压制APE 时采取的参数两者共同决定的。原CD的特征是主要因素。同样的CD抓的W A V文件,用猴子压缩时采取不同的参数,会导致得出的APE的比特率有细小的差别(50KBPS左右),压缩比越高,比特率越低。而原CD的特征的差异就会导致压出的APE比特率有非常大的区别(能达到500K左右),这个特征包括母带录制时采样量值(BIT)、音乐本身的动态范围(不能简单认为交响乐就比人声清唱的动态范围大)。20BIT和16BIT灌制的CD压出来

视频质量、码率、带宽的关系

视频质量、码率、带宽的关系0点 视频质量、码率、带宽的关系 1、码率的单位是bps,这是一个表征通信速率的基本参数,属于通信范畴,和图像清晰度无关;码率和质量成正比,但是文件体积也和码率成正比。如果对方要看到你的视频码率很高,当然带宽越大,传输过去的数据就越快了,带宽小延迟马赛克等现象更可想而知。 2、分辨率的乘值就是像素,直接关系图像清晰度。分辨率越高=像素越高=图像越清晰。 CIF是常用的标准化图像格式(Common Intermediate Format)。在H.323协议簇中,规定了视频采集设备的标准采集分辨率。CIF = 352×288像素 CIF格式具有如下特性: (1) 电视图像的空间分辨率为家用录像系统(Video Home System,VHS)的分辨率,即352×288。 (2) 使用非隔行扫描(non-interlaced scan)。 (3) 使用NTSC帧速率,电视图像的最大帧速率为30 000/1001≈29.97幅/秒。 (4) 使用1/2的PAL水平分辨率,即288线。 (5) 对亮度和两个色差信号(Y、Cb和Cr)分量分别进行编码,它们的取值范围同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等于240,最小值等于16。 3.带宽又叫频宽是指在固定的的时间可传输的资料数量,亦即在传输管道中可以传递数据的能力。在数字设备中,频宽通常以bps 表示,即每秒可传输之位数。此理,分辨率越大,视频数据量就越大当然需求带宽就越大。 4.各大厂家都有自己出台的资料参数,这个只是书面的,很多大项目需要现场设备来测试才好说,很多内在设备音视频编解码和外在的因素在里边,同时也含有各大厂家的利弊,其实也是招标中你争我夺的利剑之

采样率和编码率

简单的说,音频的质量和体积取决于两方面:采样率和编码率。采样率:自然的声音是连续的信号,而计算机不能直接处理,要将其“离散化”。举个简单的例子:正弦曲线是连续的,就像声音一样,进入计算机后,计算机把连续的曲线按照1mm一个点把正弦曲线分成了若干个点,这样就可以处理了,这个过程叫采样。显然,分点分得密度越大,曲线就越 逼真,这个密度在音频中就是采样率。每一个点都要占用存储空间,因此采样率越高体积 越大。编码率:采样只是处理的第一步。采样之后,还要把采集的数据存储起来。存储是需要空间的,一秒钟的采样数据用多少空间来存储,这就是编码率。可见,在采样率相同的前提下,编码率越低,体积越小。但是,采样和编码两个步骤都会降低音质。采样降低质量是没办法的,想输入计算机就必须采样。编码实际上就是压缩,像mp3这样的算法都是有损压缩,扔掉了大部分人耳察觉不带的声波数据,因而体积很小。 音频处理软件大部分是以时间为横坐标计量单位,因此采样率就是没单位时间内可以容纳 的样品数量,采样率越大,证明同样的时间内样品数越多,音频也就越逼真 低频噪音与高频噪音不同,高频噪音是那种很尖利的声音,随着距离越远或遭遇障碍物, 能迅速衰减,如高频噪音的点声源泉每10米距离就能下降6分贝。而低频噪音声音分贝 不高,却递减得很慢,因此能够长距离直入人耳,比如变压器的电流声,大型冷柜机的声 音都属于低频噪音。高频率的声音日常生活中接触较多的有门铃、女人声音、鸟鸣声等,因此,如果对门铃声音反应比较迟钝,或在男女一起说话时,对频率较高的女声一起说话时,对频率较高的女声听不太清楚,以及对鸟叫声不敏感,都要怀疑自已是否出现了高 频听力受损。以前有数据说有听力损失的儿童和青年中大约90%的人存在4-8KHZ的高频听 力损失。

比特率与采样率

比特率】这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。比特率与音频压缩的关系简单的说就是比特率越高音质就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。 quote: -------------------------------------------------------------------------------- VBR(Variable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;ABR(Average Bitrate)平均比特率是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。 CBR(Constant Bitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR 来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。 -------------------------------------------------------------------------------- 【采样率】是指在数字录音时,单位时间内对音频信号进行采样的次数.它以赫兹(HZ)或千赫兹(KHZ)为单位.通常来说,采样率越高,单位时间内对声音采样的次数就越多,这样音质就越好.MP3音乐的采样率一般是44.1KHZ,即每秒要对声音进行44100次分析,记录下每次分析之间的差别.采样越高,获得的声音信息也就越完整.如果要对频率范围在20---20000HZ之间的声音信息进行正确采样,声音必须按不低于40000HZ的采样频率进行采样.降低声音文件的采样率,文件的体积会减小,但声音的失真现象也会越明显.因此,采样率涉及到如何协调声音文件的体积与声音的比例关系。 quote: -------------------------------------------------------------------------------- 几种音频的采样率 采样率质量级别用途 48KHZ 演播质量数字媒体上的声音或音乐 44.1KHZ CD质量高保真声音或音乐 32KHZ 接近CD质量数字摄像机音频

视频中的比特率

视频中的比特率 比特率是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,传送的数据越大。声音中的比特率是指将数字声音由模拟格式转化成数字格式的采样率,采样率越高,还原后的音质就越好。视频中的比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号的采样率。 目录计算机中的比特率声音中的比特率 简介 比特率值与现实音频对照 常见编码模式 视频中的比特率 码率计算公式 码率几点原则 实际价值计算机中的比特率声音中的比特率 简介 比特率值与现实音频对照 常见编码模式 视频中的比特率 码率计算公式 码率几点原则 实际价值 展开 编辑本段计算机中的比特率 比特率是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,传送的数据越大。 比特率比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好相反。 计算机中的信息都是二进制的0和1来表示,其中每一个0或1被称作一个位,用小写b表示,即bit(位);大写B表示byte,即字节,一个字节=八个位,即1B=8b;前面的大写K表示千的意思,即千个位(Kb)或千个字节(KB)。表示文件的大小单位,一般都使用字节(KB)来表示文件的大小。 Kbps:首先要了解的是,ps指的是/s,即每秒。Kbps指的是网络速度,也就是每秒钟传送多少个千位的信息(K表示千位,Kb表示的是多少千个位),为了在直观上显得网络的传输速度较快,一般公司都使用kb(千位)来表示,如果是KBps,则表示每秒传送多少千字节。1KBps=8Kbps。ADSL上网时的网速 比特率是512Kbps,如果转换成字节,就是512/8=64KBps(即64千字节每秒)。 在电信和计算中,比特率(有时书面bitrate)是位被传送通过收音机或导线的速度,有时也被利用以波特速率,不是一般相同。注意"速度"在这环境不提到distance/time但对"information"/time的数量,并且应该因而是卓越的从"传播速度"(取决于传输媒介和有通常物理意思)。 它通常被表达作为位每秒、省略的bit/s、b/s,或非正式地bps。B应该总是小写,避

音乐比特率计算方法

采样率就是44.1KHz这个值,越高反应音乐效果越好比特率就一般是128kbps,反映每秒所使用的空间大小(比方硬盘空间大小),同样是越高反应音乐效果越好。以下是更多的信息:简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。横坐标的采样率表示了每秒钟的采样次数。纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100*2*13=1146600,也就是说CD每秒的数据量大约是144KB,而一张CD的容量是74分等于4440秒,就是639360KB=640MB。我试过,,采样率44.1Khz,16bit,2声道,即,44100*2*16=1411200,winamp播放器显示1411kbps

音频常见指标介绍

THD(Total Harmonic Distortion,总谐波失真): 谐波失真是指音箱在工作过程中,由于会产生谐振现象而导致音箱重放声音时出现失真。尽管音箱或耳机中只有基频信号才是声音的原始信号,但由于不可避免地会出现谐振现象(在原始声波的基础上生成二次、三次甚至多次谐波),这样在声音信号中不再只有基频信号,而是还包括由谐波及其倍频成分,这些倍频信号将导致音箱放音时产生失真。对于普通音箱允许一定谐波信号成分存在,但必须是以对声音基频信号输出不产生大的影响为前提条件。 而总谐波失真是指用信号源输入时,输出信号(谐波及其倍频成分)比输入信号多出的额外谐波成分,通常用百分数来表示。一般说来,1000Hz频率处的总谐波失真最小,因此不少产品均以该频率的失真作为它的指标。所以测试总谐波失真时,是发出1000Hz的声音来检测,这一个值越小越好。 注:一些产品说明书的总谐波失真表示为THD<0.5%,1W,这样看来总谐波失真较小,但只是在输出功率为1W的总谐波失真,这与标准要求的测量条件下得到的总谐波失真是不同的。 SNR(Signal to Noise Ratio,信噪比): 指在规定输入电压下的输出信号电压与输入电压切断时,输出所残留之杂音电压之比,也可看成是最大不失真声音信号强度与同时发出的噪音强度之间的比率,通常以S/N表示。一般用分贝(dB)为单位,信噪比越高表示音频产品越好,常见产品都选择60dB以上。 Sample(采样): 这个字同时为动词与名词。做为名词之用时,表示一段录进来的声音(Audio);做为动词使用时,则表示录一段取样声音的录音动作。会用到"采样"这个字眼的场合,多半是针对采样过程,特别在不是录一整首歌曲,而只是录一段声音的状况。 Resolution(解析力、分辨率): 若是用在数字声音信号的领域当中,解析度是指一个取样值的位数,位数越大所能表现的数值范围就越广。解析力也叫还原度,顾名思义,是声音的还原能力。即声音的细节表现程度,以及复杂音场的处理能力 酒 阅茉角浚 缏方涌谏杓圃郊眩 乖 纫苍礁撸 诖 鞰P3等高压缩比音乐时,还原度会主变得相当重要,高还原度意味着音乐不会走样。解析力很差的机子,播放什么类型的音乐都会混乱不清,基本上不能再谈什么细节表现与层次感,亦无法把细微、复杂的东西都交代得一清二楚。然而,即使是最高级的MP3,解析力也远不如HIFI音响。 BIT RATE(比特率): 作为一种数字音乐压缩效率的参考性指标,比特率表示单位时间(1秒)内传送的比特数bps(bit per second,位/秒)的速度。通常我们使用kbps(通俗地讲就是每秒钟1000比特)作为单位。cd中的数字音乐比特率为1411.2kbps(也就是记录1秒钟的cd音乐,需要1411.2×1024比特的数据),音乐文件的BIT RATE高是意味着在单位时间(1秒)内需要处理的数据量(BIT)多,也就是音乐文件的音质好的意思。但是,BIT RATE高时文件大小变大,会占据很多的内存容量,音乐文件最常用的bit rate是128kbps,MP3文件可以使用的一般是8~320kbps,但不同MP3机在这方面支持的范围不一样,大部分的是32-256Kbps,这个指数当然是越广越好了,不过320Kbps是暂时最高等级了。 EQ均衡器: Equalization(均衡)将声音中的各频率的组成泛音等级加以修改的动作。例如,将频率为100 Hz的组成泛音推大,就会让声音中100 Hz左右的低频部份听起来明显一些。若觉

影片文件码率与大小计算

音视频文件码率与大小计算 编码率/比特率直接与文件体积有关。且编码率与编码格式配合是否合适,直接关系到视频文件是否清晰。 在视频编码领域,比特率常翻译为编码率,单位是Kbps,例如800Kbps 其中, 1K=1024 1M=1024K b 为比特(bit)这个就是电脑文件大小的计量单位,1KB=8Kb,区分大小写,B代表字节(Byte) s 为秒(second) p 为每(per)以800kbps来编码表示经过编码后的数据每秒钟需要用800K比特来表示。 1MB=8Mb=1024KB=8192Kb Windows系统文件大小经常用B(字节)为单位表示,但网络运营商则用b(比特),也就是为什么2Mb速度宽带在电脑上显示速度最快只有约256KB的原因,网络运营商宣传网速的时候省略了计量单位。 完整的视频文件是由音频流与视频流2个部分组成的,音频和视频分别使用的是不同的编码率,因此一个视频文件的最终技术大小的编码率是音频编码率+视频编码率。例如一个音频编码率为128Kbps,视频编码率为800Kbps的文件,其总编码率为928Kbps,意思是经过编码后的数据每秒钟需要用928K比特来表示。 了解了编码率的含义以后,根据视频播放时间长度,就不难了解和计算出最终文件的大小。编码率也高,视频播放时间越长,文

件体积就越大。不是分辨率越大文件就越大,只是一般情况下,为了保证清晰度,较高的分辨率需要较高的编码率配合,所以使人产生分辨率越大的视频文件体积越大的感觉。 计算输出文件大小公式: (音频编码率(Kbit为单位)/8 + 视频编码率(Kbit为单位)/8)× 影片总长度(秒为单位)= 文件大小(MB为单位) 这样以后大家就能精确的控制输出文件大小了。 例:有一个1.5小时(5400秒)的影片,希望转换后文件大小刚好为700M 计算方法如下: 700×8÷5400×1024≈1061Kbps 意思是只要音频编码率加上视频编码率之和为1061Kb,则1个半小时的影片转换后文件体积大小刚好为700M。 至于音频编码率和视频编码率具体如何设置,就看选择的编码格式和个人喜好了,只要2者之和为1061即可。如可以设置为视频编码格式H264,视频编码率900 Kbps,音频编码格式AAC,编码率161 Kbps。 与文件体积大小有关的码率是指的平均码率,因此,不论是使用固定比特一次编码方式还是使用二次(多次)动态编码方式,都是可以保证文件大小的。只有使用基于质量编码的方式的时候,文件大小才不可控制。

位速和采样率是什么意思

位速和采样率是什么意思 位速是指在一个数据流中每秒钟能通过的信息量。 采样率就是44.1KHz这个值,越高反应音乐效果越好 比特率就一般是128kbps,反映每秒所使用的空间大小(比方硬盘空间大小),同样是越高反应音乐效果越好。 简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。 横坐标的采样率表示了每秒钟的采样次数。 纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。 采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ 采样的声音,绝大部分人已经觉察不到其中的分别了。 而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。 当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100*2*13=1146600,也就是说CD每秒的数据量大约是144KB,而一张CD的容量是74分等于4440秒,就是639360KB=640MB。 音频文件的采样频率(khz)与位速/码率(kbps) 数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(A/D)它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串的样本连接起来,就可以描述一段声波了,把每一秒钟所采样的数目称为采样频率或采样率,单位为HZ(赫兹)。采样频率越高所能描述的声波频率就越高。采样率决定声音频率的范围(相当于音调),可以用数字波形表示。以波形表示的频率范围通常被称为带宽。要正确理解音频采样可以分为采样的位数和采样的频率。 1.采样的位数 采样位数可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。我们首先要知道:电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256,16位则代表2的16次方-- 64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位,造成了较大的信号损失,最终的采样效果自然是无法相提并论的。 如今市面上所有的主流产品都是16位的采集卡,而并非有些无知商家所鼓吹的64位

码流 码率 比特率 帧速率 分辨率 高清的区别

码流/ 码率/ 比特率/ 帧速率/ 分辨率/ 高清的区别 GOP/ 码流/码率/ 比特率/ 帧速率/ 分辨率 GOP(Group of picture) 关键帧的周期,也就是两个IDR帧之间的距离,一个帧组的最大帧数,一般而言,每一秒视频至少需要使用1 个关键帧。增加关键帧个数可改善质量,但是同时增加带宽和网络负载。 需要说明的是,通过提高GOP值来提高图像质量是有限度的,在遇到场景切换的情况时,H.264编码器会自动强制插入一个I帧,此时实际的GOP值被缩短了。另一方面,在一个GOP中,P、B帧是由I帧预测得到的,当I帧的图像质量比较差时,会影响到一个GOP中后续P、B帧的图像质量,直到下一个GOP开始才有可能得以恢复,所以GOP值也不宜设置过大。 同时,由于P、B帧的复杂度大于I帧,所以过多的P、B帧会影响编码效率,使编码效率降低。另外,过长的GOP还会影响Seek操作的响应速度,由于P、B帧是由前面的I或P帧预测得到的,所以Seek操作需要直接定位,解码某一个P或B帧时,需要先解码得到本GOP内的I帧及之前的N个预测帧才可以,GOP值越长,需要解码的预测帧就越多,seek响应的时间也越长。 CABAC/CAVLC H.264/AVC标准中两种熵编码方法,CABAC叫自适应二进制算数编码,CAVLC叫前后自适应可变长度编码, CABAC:是一种无损编码方式,画质好,X264就会舍弃一些较小的DCT系数,码率降低,可以将码率再降低10-15%(特别是在高码率情况下),会降低编码和解码的速速。 CAVLC将占用更少的CPU资源,但会影响压缩性能。 帧:当采样视频信号时,如果是通过逐行扫描,那么得到的信号就是一帧图像,通常帧频为25帧每秒(PAL制)、30帧每秒(NTSC制); 场:当采样视频信号时,如果是通过隔行扫描(奇、偶数行),那么一帧图像就被分成了两场,通常场频为50Hz(PAL制)、60Hz(NTSC制); 帧频、场频的由来:最早由于抗干扰和滤波技术的限制,电视图像的场频通常与电网频率(交流电)相一致,于是根据各地交流电频率不同就有了欧洲和中国等PAL制的50Hz和北美等NTSC制的60Hz,

音频基本知识

音频基本知识 第一部分 模拟声音-数字声音原理 第二部分 音频压缩编码 第三部分 和弦铃声格式 第四部分 单声道、立体声和环绕声 第五部分 3D环绕声技术 第六部分数字音频格式和数字音频接口 第一部分 模拟声音-数字声音原理 一、模拟声音数字化原理 声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。 图1 模拟声音数字化的过程

声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散化通过采样来实现。 声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(f s)是多少,②每个声音样本的位数(bit)应该是多少,也就是量化位数。 ?采样频率 奈奎斯特理论(采样定理)指出,采样频率不应低于声音信号最高频率的两倍,这样才能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 常见的音频录制时的采样率和量化位数: 镭射碟 声音录制格式 从数字音频接口输入输出 DVD 杜比数字 杜比数字位信号 线性PCM 线性PCM(48kHz采样/16bit或 48KHz采样/24bit等) CD 线性PCM 线性PCM(44.1kHz采样/16bit) VCD MPEG 线性PCM(44.1kHz采样/16bit) 表1 常见音频录制及传输格式 ?量化精度 光有频率信息是不够的,我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我们常见的CD位16bit的采样精度,即音量等级个数有2的16次方。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。 ?压缩编码 经过采样、量化得到的PCM数据就是数字音频信号了,可直接在计算机中传输和存储。但是这些数据的体积太庞大了!为了便于存储和传输,就需要进一步压缩,就出现了各种压缩算法,将PCM转换为MP3,AAC,WMA等格式。 二、问题 1、音频压缩技术有多重要? 我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比: PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps,这个参数也被称为数据带宽。再除以8将bit 换算成字节byte,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM 编码的音频信号,需要176.4KB的空间。 MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为128Kbps/8=16KB/s。如下表所示: 音频格式 比特率 存1秒音频数据所占空间 CD(线性PCM) 1411.2 Kbps 176.4KB MP3 128Kbps 16KB AAC 96Kbps 12KB mp3PRO 64Kbps 8KB WMA 64Kbps 8KB

视频码率详解

视频码率详解 经常转换视频的用户,在进行转换设置时,通常都会根据自身需求对视频的码率进行设定,有经验的用户一定都发现当视频拥有高码率后,即便放大播放也能表现出清晰的画面,而对于许多刚开始尝试自己转换视频的用户来说,码率的重要性并不是十分了解,对此今天我就对视频码率进行全面解析,帮助用户彻底了解高码率下的高画质。 视频码率全面解析: 一、视频码率简介: 码率就是数据传输时单位时间传送的数据位数,一般我们用的单

位是kbps即千位每秒。而视频码率由于计算机中的信息都是二进制的0和1来表示,其中每一个0或1被称作一个位,用小写b表示,即bit(位);大写B表示byte,即字节,一个字节=八个位,即1B =8b;前面的大写K表示千的意思,即千个位(Kb)或千个字节(KB)。表示文件的大小单位,一般都使用字节(KB)来表示文件的大小。 Kbps的ps指的是/s,即每秒。Kbps指的是网络速度,也就是每秒钟传送多少个千位的信息(K表示千位,Kb表示的是多少千个位),为了在直观上显得网络的传输速度较快,一般公司都使用kb(千位)来表示,如果是KBps,则表示每秒传送多少千字节。1KBps=8Kbps。ADSL上网时的网速是512Kbps,如果转换成字节,就是512/8=64KBps(即64千字节每秒)。 简单理解就是取样率,单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,但是文件体积与取样率是成正比的,所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真,围绕这个核心衍生出来的cbr(固定码率)与vbr(可变码率)。从音频方面来说,码率越高,被压缩的比例越小,音质损失越小,与音源的音质越接近,而码率超过一定数值,对图像的质量没有多大影响。 二、码率计算公式: 码率基本的算法是:文件体积=时间X码率/8 这里时间单位是秒,码率除以8,如视频文件为3.7G,视频长度100分钟(6000秒),计算结果:码率应为4900K。

高品质音乐文件基础知识(wav)

高品质音乐文件基础知识(wav) 序: 如果是播放器,最好是将DTS CD、DTS DVD Audio、DSD编码的SACD音乐等转换成PCM DVD Audio编码来播放,效果较佳。 1.常见编码音乐文件属性: 1.1.MP3文件枚举 编码:MPEG 1 Layer 3 声道[声音数]:立体声 频率[采样频率]:44100 Hz 比特[量化位数]:16 Bits 码率[比特率]:128 Kbps/320 Kbps 1.2.APE/.cue文件枚举 编码:Monkey's Audio 3.99 声道[声音数]:5.1声道 频率[采样频率]:44100 Hz 比特[量化位数]:16 Bits 码率[比特率]:728 Kbps/769 Kbps/789 Kbps/790 Kbps/826 Kbps 1.3.FLAC/.cue文件枚举 编码:FLAC Audio 声道[声音数]:立体声 频率[采样频率]:44100 Hz 比特[量化位数]:16 Bits 码率[比特率]:872 Kbps/920 Kbps/936 Kbps/1.01 Mbps 1.4.WAV文件枚举 编码:DVD DTS Audio 声道[声音数]:5.1声道 频率[采样频率]:44100 Hz 比特[量化位数]:16 Bits 码率[比特率]:1.41 Mbps 1.5.WAV/.cue文件枚举 编码:PCM Audio 声道[声音数]:立体声 频率[采样频率]:44100 Hz 比特[量化位数]:16 Bits 码率[比特率]:1.41 Mbps 比特率-量化位数*采样频率*声音数-16*44100*2-1411200 bps≈1411 kbps≈1.41 Mbps

相关主题
相关文档 最新文档