视音频编解码技术及应用
- 格式:doc
- 大小:316.00 KB
- 文档页数:5
计算机与网络李晓辉山东省临沂市广播电视台电子科技技术的稳定发展,为人们的日常生活带来了更多便捷,数字视音频信息处理技术作为家庭网络通信的重要技术,数字解码压缩与网络传输技术的应用,作为核心必须要得到重视。
本文主要围绕数字视音频编解码与电视传输网络技术的应用开展分析,并阐述了实际应用要点,仅供参考。
广播电视正在朝向数字化方向发展,而且通信越来越无线化。
网络越来越宽带化,储存的容量不断拓展,再加上近几年涌现出的数字压缩传输等新型科学技术,视音频压缩技术及数字传输技术应用越来越广泛。
技术越来越成熟,提高了数字音频节目压缩效率,能够实现数字化传输,为各项工作的应用提供了帮助。
数字视音频编解码技术数字视音频编解码技术涉及到的内容相对较多,再加上信源编码作为信息领域研究的重要组成具有一定的难度。
无论是哪种音频系统都需要遵循音频编码标准,这样可以通过激光视盘机、数字电视等多种电子产品进行优化,从而最大化发挥音视频编解码的效果。
实际应用过程中,为了确保图像质量得到保障,并具有较高的压缩率,需要合理地运用多种压缩技术,如比较常见的无失真压缩技术、有损压缩技术和频带压缩技术。
每一种压缩技术的应用都有一定的差异,所以为了能够最大化发挥各项压缩技术的优势,必须要事先对其有充足的了解,才能做好更全面的优化,最大化发挥技术应用的效果,使得数据传输率及传输质量得到不断提咼。
视讯技术在实际应用的过程中,需要根据实际情况将视频编码的图像数据进行压缩,为了能够全面保障图像编码质理的能力。
随着人工智能、大数据等技术的持续发展,结合视频技术的边缘计算将在网络边缘位置,为更多的垂直行业提供实时的智能化视频服务,扩展边缘视频的应用边界。
总的来说,不同场景案例的整体架构都符合“端边云”基本特征,面向视频领域的边缘计算的全面发展,也促进了边缘视频技术(边缘存储技术、边缘视频编解码技术、边缘视频智量,还应该注重对各项编辑过程中所产生的问题进行分析,为满足先进视频编码技术的各种需求组建联合视频工作组,在现有的基础上继续开发多种视频编码标准。
多媒体系统中的音视频编解码技术教程随着科技的迅猛发展,多媒体技术已经成为我们生活中不可或缺的一部分。
而音视频编解码技术作为多媒体系统的核心技术,发挥着至关重要的作用。
本文将介绍多媒体系统中的音视频编解码技术,包括其基本原理、常用的编解码算法及其应用场景和发展趋势。
一、音视频编解码技术的基本原理1、音视频编解码的定义音视频编解码是将音频和视频信号转换为数字形式并进行压缩的过程。
编码是指将原始的音频和视频信号转换为数字信号,而解码则是将压缩的数字信号转换为可播放的音频和视频信号。
2、音视频编解码的步骤音视频编解码一般包括以下几个步骤:采样、量化、编码、解码和重构。
采样是将连续的音频和视频信号转换为离散的数字信号,量化是将连续的信号转换为离散的幅度值,编码是将幅度值转换为数字编码,解码是将数字编码还原为幅度值,而重构则是将数字信号转换为可播放的音频和视频信号。
3、音视频编解码的基本原理音视频编解码的基本原理是通过去除信号中的冗余和不可察觉的部分信息,从而实现信号的压缩。
音频信号可以利用声音的听觉特性实现压缩,视频信号则可利用人眼的视觉特性实现压缩。
常用的音视频编解码算法包括MPEG-1、MPEG-2、MPEG-4和H.264等。
二、常用的音视频编解码算法及其应用场景1、MPEG-1MPEG-1是最早的音视频编解码标准之一,它适用于低码率的音视频压缩。
MPEG-1可以有效地压缩音频和视频信号,并在带宽有限的网络条件下进行传输和播放。
MPEG-1广泛应用于CD、VCD和网络视频等领域。
2、MPEG-2MPEG-2是一种高质量的音视频编解码标准,它适用于高清晰度的视频和多声道的音频压缩。
MPEG-2广泛应用于数字电视、DVD和蓝光光盘等领域,具有较好的兼容性和稳定性。
3、MPEG-4MPEG-4是一种面向互联网的音视频编解码标准,它能够实现更高的压缩比和更好的音视频质量。
MPEG-4在视频会议、流媒体和移动多媒体等领域得到广泛应用,具有较好的可扩展性和适应性。
网络通信中的音视频编码与解码技术随着互联网的普及和科技的进步,网络通信的需求也日益增加。
音视频通信作为其中重要的一部分,发挥着越来越重要的作用。
通过网络实现音视频通信需要依赖于音视频编码与解码技术,它们扮演着传输和呈现音视频数据的关键角色。
一、音视频编码技术音视频编码技术是将音频或视频信号转化为数字数据的过程,以便在网络中传输和存储。
在这个过程中,编码器将原始的音频或视频信号采样并进行压缩处理。
音频和视频的编码技术各自有不同的算法和标准。
1. 音频编码技术音频编码是将声音信号转换为数字数据的过程,使其能够以高效的方式进行存储和传输。
常见的音频编码技术包括MP3、AAC、Opus等。
其中,MP3是一种流行的音频编码格式,它通过减少声音的数据量来实现压缩。
AAC(Advanced Audio Coding)是MP3的升级版本,它提供了更高的音频质量和更低的比特率。
2. 视频编码技术视频编码是将视频信号转换为数字数据的过程,使其能够以高效的方式进行存储和传输。
常见的视频编码技术包括、、VP9等。
是目前被广泛应用的视频编码标准,它具有高效的压缩率和优秀的视频质量。
是的升级版本,相比于,它能够更好地处理高分辨率视频。
二、音视频解码技术音视频解码技术是将经过编码的音视频数据转换为原始的音视频信号的过程。
当音视频数据在接收端接收到后,解码器将数据进行解压缩和解码处理,以便将其转化为可播放的音视频信号。
1. 音频解码技术音频解码是将经过编码的音频数据还原为原始音频信号的过程。
解码器通过解析压缩的音频数据,并对其进行还原和重构,使得原始音频信号能够得以恢复。
常见的音频解码技术包括MP3解码器、AAC解码器等。
2. 视频解码技术视频解码是将经过编码的视频数据还原为原始视频信号的过程。
解码器会解析压缩的视频数据,并还原出原始的视频帧。
视频解码技术需要处理的计算量较大,因为视频数据通常具有较高的分辨率和帧率。
常见的视频解码技术包括解码器、解码器等。
视频会议的音视频编解码技术随着全球化的发展和工作场景的变迁,视频会议已经成为了我们日常工作和社交交流的必要方式。
而视频会议能够正常进行,离不开音视频编解码技术的支持。
本文将从编解码原理、编解码标准、编解码器选择、编解码效果等方面,探讨视频会议的音视频编解码技术。
一、编解码原理音视频编解码技术是通过压缩和解压缩实现的。
所谓压缩,是指通过算法等方式将音视频信号中的冗余内容去掉,从而降低信号的数据量,以达到传输、存储等目的;解压缩则是指将压缩后的音视频信号还原成原始信号。
在音视频编解码中,编码是通过将原始信号转换成数字信号,并将数字信号压缩来实现的。
解码则是对压缩后的信号进行还原,并将其转换为显示或播放所需的信号。
二、编解码标准编解码标准是指压缩和解压缩音视频信号所使用的数据格式、算法、参数等规范。
在视频会议中,常用的编解码标准包括H.264/AVC、H.265/HEVC、VP8、VP9等。
H.264/AVC是目前视频会议中最普及的编解码标准。
它采用了先进的压缩算法,可以在保证视频质量的前提下实现更小的数据传输量。
而H.265/HEVC则是H.264/AVC的升级版,它能够在不降低画质的情况下,实现更高的压缩比,进一步降低视频传输成本。
VP8和VP9则是由Google开发的开源编解码标准,在一些商业应用中得到一定应用。
它们的优势在于能够在低带宽情况下保证视频质量,同时在压缩比方面也有较高的表现。
三、编解码器的选择选择正确的编解码器对于视频会议的流畅程度和画质有着至关重要的影响。
目前,常见的编解码器包括x264、x265、ffmpeg 等。
x264是一款开源的H.264/AVC编码器,它的编码速度快,压缩比高,适合在较低带宽环境中进行视频会议。
x265则是x264的升级版,能够更高效地运用CPU的处理能力,同时在保证视频质量的前提下,实现更小的视频文件大小。
而ffmpeg则是一款集多种视频编解码器于一身的开源软件,能够对多种视频编码进行支持,能够应对各种视频会议场景。
音视频编解码和多媒体技术随着数字媒体技术的不断发展,人们对音视频编解码和多媒体技术的需求也随之不断增加。
这些技术不仅广泛应用于数字家庭、网络传媒、数字娱乐等领域,还在医疗、教育、安防等领域得到了很好的应用。
今天本文将为大家介绍一下音视频编解码和多媒体技术的相关内容。
一、音视频编解码技术音视频编解码技术是将数字信号编码成压缩格式,以便在有限的带宽下实现高清晰度、无损传输。
音视频编解码技术分为两个部分:音视频编码和音视频解码。
1. 音视频编码音频编码主要有两种:有损压缩和无损压缩。
有损压缩可以将原始音频信号压缩至更小的体积,但同时丢失一定的信息。
而无损压缩则能保留全部信息,但压缩比较低。
常见的音频编码格式包括 MP3、FLAC、AAC 等。
视频编码需要考虑像素值、帧率、码率、压缩比等因素。
目前应用比较广泛的视频编码格式包括 MPEG-2、H.264、H.265 等。
2. 音视频解码音视频解码是将编码后的音视频信号进行解码还原成原始的音视频信号。
解码器主要有硬解和软解两种方式。
硬件解码是利用集成电路中的芯片和处理器来实现,软件解码则是利用计算机的CPU 处理和实现。
二、多媒体技术多媒体技术是指将文字、图像、声音、动画等不同形式的信息进行结合,形成一个新的信息形式。
它包括图像处理、音频处理、动态图像处理和文字处理等多个领域。
1. 图像处理图像处理是利用计算机将数字图像进行转换,提高图像的清晰度和色彩度。
图像处理技术包括图像增强、压缩、去噪等操作,常用的图像处理软件有 Photoshop、GIMP 等。
2. 音频处理音频处理主要是对声音进行处理,让音频的音质和音量更加优化。
音频处理技术包括降噪、回声抵消、均衡器等操作,常用软件有 Audacity、Adobe Audition 等。
3. 动态图像处理动态图像处理是对动态的图像进行处理,常用的动态图像处理软件有 Adobe After Effects、Blender 等。
前端开发中的音视频处理技术介绍随着互联网的快速发展,音视频内容已经成为人们生活中不可或缺的一部分。
在前端开发中,处理音视频的技术也变得越来越重要。
本文将介绍几种常见的音视频处理技术,帮助读者更深入地了解前端领域中的相关技术和应用。
一、音视频编解码技术音视频编解码技术是处理音视频的基础。
它将音视频信号进行压缩和解压缩,使其能够在网络上流畅传输和播放。
在前端开发中,常用的音视频编解码技术有AAC、MP3、H.264等。
这些编码格式能够在保证音视频质量的同时,尽可能减小文件大小,提高传输效率。
随着移动设备的普及,对于低带宽环境的适应性也变得越来越重要。
因此,前端开发人员需要了解音视频编解码技术,选择适合不同场景的编码格式,以提供更好的用户体验。
二、音视频播放技术音视频播放技术是前端开发中的关键环节。
在Web开发中,常用的音视频播放技术有HTML5 Video和Flash。
HTML5 Video是HTML5标准中新增的视频播放标签,它能够直接在浏览器中播放视频,无需安装插件。
Flash则是较早期使用的一种音视频播放技术,它提供了更多的功能和兼容性。
在选择音视频播放技术时,前端开发人员需要根据实际需求和目标用户来进行权衡。
HTML5 Video在移动设备上具有更好的兼容性和性能,而Flash在一些老旧的浏览器上可能会更好地支持特定的功能。
三、音视频编辑技术音视频编辑技术是前端开发中的一项重要技能。
它可以将不同的音视频素材进行剪辑、合并、特效处理等操作,以生成符合需求的音视频内容。
在前端开发中,常用的音视频编辑技术有FFmpeg和WebRTC。
FFmpeg是一种强大的开源多媒体处理工具,它能够处理各种音视频格式,提供丰富的音视频编辑功能。
WebRTC是一种用于实时通信的Web技术,它提供了音视频传输和处理的API,方便前端开发人员实现实时音视频通话和会议功能。
四、音视频流媒体技术音视频流媒体技术是前端开发中的热门技术之一。
音视频编解码技术的原理与实践音视频编解码技术是现代多媒体技术的重要组成部分,广泛应用于各种场景,如电视、电影、音乐、视频通话等。
它的原理和实践涉及到信号处理、压缩算法、编解码器等方面的知识。
本文将从基础概念、原理分析和实践应用三个方面进行介绍。
一、基础概念1. 音视频编解码器音视频编解码器是音视频压缩与解压缩的软件或硬件实现。
它能够将原始的音视频信号转换成数字数据,并通过压缩算法对数据进行压缩,降低数据量。
在解码时,通过解码算法将压缩后的数据重新恢复成可播放的音视频信号。
2. 压缩算法压缩算法是音视频编解码的核心技术。
主要分为有损压缩和无损压缩两种。
有损压缩通过牺牲一定的数据精度来换取更高的压缩率,适用于一些对精度要求不高的场景。
而无损压缩则可以完全还原原始数据,但压缩率相对较低。
3. 编解码标准为了实现不同厂商、设备之间的互操作性,音视频编解码技术需要遵循相应的编解码标准。
目前,常用的音频编解码标准有MP3、AAC等,而视频编解码标准有H.264、H.265等。
二、原理分析1. 音频编解码原理音频编解码的过程主要分为采样、量化、编码和解码四个步骤。
首先,原始音频信号经过采样,将其连续的模拟信号转换成离散的数字信号。
然后,通过量化过程,将连续的样本值转换成有限的离散值集合。
接下来,利用编码算法将离散值集合转换成比特流。
最后,在解码端,根据编码标准将比特流解码成离散值集合,并通过逆量化和重构过程还原成原始的音频信号。
2. 视频编解码原理视频编解码的过程相较于音频更为复杂,主要涉及到时域压缩和空域压缩两个方面。
时域压缩是通过减少图像帧间的冗余信息来实现的,在编码过程中,将连续的帧图像进行差分编码,只编码图像帧之间的差异部分。
空域压缩则是利用图像的空间相关性,将图像分为块并进行变换压缩,例如将图像分成8x8大小的块,并通过离散余弦变换(DCT)将其转换成频域系数,再利用量化和编码技术对频域系数进行压缩。
电视机的音频解码技术电视机的音频解码技术在现代家庭中扮演着重要的角色。
随着科技的不断进步和媒体内容的多样化,对音频解码技术的需求也越来越高。
本文将探讨电视机音频解码技术的原理、发展以及对用户的影响。
一、音频解码的原理音频解码是将数字音频信号转换为模拟音频信号的过程。
当我们收看电视节目时,音频信号被编码压缩后传输,在电视机内部需要进行解码还原。
常见的音频解码技术有脉冲编码调制(PCM)、多声道编码(AC-3)、Dolby TrueHD等。
脉冲编码调制(PCM)是最基本的音频解码技术,它将音频信号量化为数字信号并进行编码。
PCM音频解码器通过解码将数字信号转换为模拟音频信号,以供扬声器播放。
这种解码技术是目前使用最广泛的音频解码技术之一。
多声道编码(AC-3)是一种用于压缩多声道音频的解码技术。
它采用了Dolby数字音频编码技术,能够实现5.1声道环绕音效,让观众获得更加逼真的听觉体验。
Dolby TrueHD是一种高保真音频解码技术,可以提供更高质量的音频输出。
它支持7.1声道环绕音效,通过对原始音频信号的精确还原,使用户能够享受到更加真实和清晰的声音效果。
二、音频解码技术的发展随着高清电视、蓝光光盘和在线流媒体的普及,对音频解码技术的要求越来越高。
人们对更高质量、更逼真的音效有着不断增长的需求。
过去,电视机的音频解码技术相对简单,主要以PCM为主。
然而,随着媒体内容的多样化,音频解码技术也在不断进步。
现在的电视机已经支持多种音频解码技术,如AC-3、Dolby TrueHD等,使得用户能够在家中享受到影院级的音效。
此外,随着人工智能技术的快速发展,电视机的音频解码技术也在不断创新。
一些电视机配备了智能音频解码芯片,能够实现自动识别音频内容并进行优化处理。
比如,当用户观看体育比赛时,电视机可以自动识别比赛画面,并根据比赛场景调整音效,使观众获得更加沉浸式的观影体验。
三、音频解码技术对用户的影响音频解码技术的进步对用户体验产生了深远的影响。
音视频解决方案一、介绍音视频解决方案是指通过技术手段,为用户提供高质量的音视频传输、存储、处理和播放的解决方案。
随着互联网的发展,音视频应用在各个领域得到广泛应用,包括在线教育、远程会议、直播、视频监控等。
本文将详细介绍音视频解决方案的相关技术、架构和应用场景。
二、技术概述1. 音视频编解码技术音视频编解码技术是音视频解决方案的核心技术之一。
常见的音视频编码标准包括H.264、H.265、AAC等。
编码技术可以将音视频信号转换为数字信号,并通过压缩算法减少数据量,提高传输效率。
解码技术则将压缩后的数据还原为原始的音视频信号。
2. 网络传输技术音视频解决方案需要通过网络进行传输。
常见的网络传输协议包括RTMP、HLS、WebRTC等。
RTMP适合于实时音视频传输,HLS适合于点播场景,WebRTC则是一种基于浏览器的实时通信技术。
3. 存储技术音视频解决方案需要对音视频数据进行存储,以便后续播放或者点播。
常见的存储技术包括本地存储、云存储等。
本地存储适合于小规模的音视频应用,云存储则适合于大规模的音视频应用,可以实现数据的高可靠性和可扩展性。
4. 数据处理技术音视频解决方案可能需要对音视频数据进行处理,包括音视频混流、分割、合成等。
常见的数据处理技术包括音视频编辑软件、图象处理算法等。
三、架构设计音视频解决方案的架构设计根据具体的应用场景和需求而定,普通包括以下几个模块:1. 采集模块采集模块负责从音视频源(如摄像头、麦克风)获取原始的音视频数据,并进行预处理,如降噪、增益等。
2. 编码模块编码模块将采集到的音视频数据进行编码压缩,减少数据量。
常见的编码标准包括H.264、H.265等。
3. 传输模块传输模块负责将编码后的音视频数据通过网络传输到目标设备或者服务器。
传输协议可以根据具体需求选择,如RTMP、HLS等。
4. 存储模块存储模块负责将音视频数据存储到本地或者云端,以便后续的播放或者点播。
视频编解码技术与性能分析随着互联网的普及和技术的不断提升,视频已经成为互联网中不可或缺的一部分。
而视频编解码技术是视频播放和传输中最核心的技术之一。
本文将介绍视频编解码技术的原理和影响性能的因素,并对常见的视频编解码标准进行比较和性能分析。
一、编解码技术原理及应用视频编解码技术是为了在网络传输或者存储时减小视频数据体积,提升视频传输效率和播放性能而存在的。
首先,我们需要了解编码和解码两个概念。
编码:把一个视频或者音频文件等数字信号转换成压缩后的数字数据或者码字流的过程。
解码:把一个压缩后的数字数据或码字流转换成原始的数字信号,以便展现或者传递的过程。
常用视频编解码技术:H.264/AVC、H.265/HEVC、VP9、AV1等。
H.264/AVC是目前市场上应用最为广泛的视频编码标准之一。
在同等视频质量下,H.264/AVC相对于H.263/MP4减少了50%左右的比特率,具有良好的广泛性、可扩展性和高效性等优点,被应用在多种视频传输场景中。
但是,H.264/AVC在一些场景下会出现码率过高、画面质量劣化和编解码延迟过大等问题。
H.265/HEVC是近几年出现的一种新型视频编码标准。
相较于H.264/AVC,H.265/HEVC在同等画质下,可以将视频压缩率提高到原来的一半左右,但是编解码和计算复杂度提高,需要更高的计算性能支持。
VP9是由Google推出的、开源、免费的视频编解码技术标准。
相比于H.264/AVC,VP9在压缩效率上有所提升,但是它的编解码复杂度较高,需要更高的计算能力来保证视频正常播放。
AV1是由AOM(Alliance for Open Media)制定的、基于VP10的下一代视频编解码技术标准。
它使用更为先进的压缩算法,同样可以在不影响画质的情况下将视频的比特率减少一半左右。
但是,相比VP9,AV1的编解码复杂度更高,需要更高的计算性能支持。
二、视频性能分析、方案对比在不同的视频播放场景下,选择合适的视频编解码标准和参数设置是至关重要的。
工科类信息工程学院本科论文题目:视音频编解码技术及应用别系:信息工程学院专业:信息工程届次: 2012届学号: 2012041183姓名:焦杰指导教师:杨宇老师2014年9月28日视音频编解码技术及应用(——视音频编解码技术及应用焦杰【摘要】首先分析了在各个不同的历史阶段为满足不同的需求而提出的各种音频编解码器,讨论了最常见编解码器的特征和性能。
然后考虑了它们对当前和未来移动通信需求的适应性,比较了各种音频编解码器的性能。
最后给出了一些音频编解码器在移动通信系统中的应用。
【关键词】音频编解码器;增强的高效高级音频编码;增强的自适应多码率宽带音频编码;可变速率多模式宽带音频编码;谱带恢复。
1 引言当今,各种各样的音频编解码器广泛应用于Et常生活中。
选择哪种编解码器通常取决于以下因素:音频素材的内容类型、可用通信速率和收听场合对音质的要求。
可能影响编解码器选择的其它因素,还包括标准化情形、专利费和市场品牌。
尽管MP3格式已获得了很大的成功,但它不适合于移动设备。
近来,效率较高的编解码器(如AAC和AMR)已被提出,并为适应移动的音频应用而不断改进。
笔者将通过揭示音频编码和解码的技术原理、标准化情形以及涉及可用技术和市场需求的编解码器的适应性来评估最常见的音频编解码器,同时也考虑到移动通信领域在硬件和软件上的发展状况,分析现有和将来的音频应用,以阐明对移动音频的需求和期待。
2 音频编解码器的历史背景音频编解码器的简短历史可追溯到20世纪80年代中期,德国Fraunhofer 研究所首先开始从事高质量、低码率的音频编码研究。
他们的项目作为面向市场的尤里卡(Eureka)研究计划(EU一147)的一个部分得到了欧盟的财政资助。
1989年,Fraunhofer在德国获得了MP3的专利权。
后来,MP3递交给了国际标准化组织(ISO),于1992年成为正式的MPEG一1标准的一部分。
1995年1月,Fraunhofer 在美国也申请了MP3专利,并于1996年l1月获批。
使用MP3格式压缩的个人计算机用户能将一张普通的音乐CD (激光唱碟)的内容压缩到它原来大小的1/10,而在音质上只有很小的损伤。
这样,12个d,n,t的音乐可存储在一张可录制的激光唱碟上,而且可用一台MP3格式的CD播放器或一台普通的个人计算机来播放。
现今,市场上提供的移动设备从笔记本电脑、掌上型电脑到手机应有尽有,而且高速无线网络正在日益发展。
与此同时,宽带语音和高保真音频压缩编码技术在商业应用驱动下得到了迅速的发展。
电话语音、宽带语音和宽带音频信号不仅在带宽和动态范围上有所不同,而且在收听者对所提供的音质期待上也不相同。
宽带的使用不仅改善了语音的可懂度和自然度,也增加了面对面直接交流的感觉,更容易识别说话人。
目前,移动通信领域不断推出新的业务,包括流媒体、多媒体短信、广播和下载等。
流媒体业务包括听新闻、听音乐、运动比赛的监听、商业广告、交互式游戏等。
广播业务类似于流业务,此外还包括因特网的网上广播。
与下载的音频文件不同,流式音频文件无需存储在用户的硬盘上,但通过用户的音频播放器可像传统的收音机那样进行广播。
多媒体短信业务也与流业务类似,但由于受文件大小的限制,只包括商业单位与个人以及个人与个人之间的短信发送和接收。
下载业务包括网络上的音乐、书籍和连环图画的下载。
上述应用对音频编解码器提出的要求主要包括:(1)处理通用内容的能力;(2)在最低码率下保证有足够好且始终如一的音质;(3)在最低码率下要获得最好的音质;(4)可变码率要求下的高质量操作。
对于低资源设备(具有低的存储和计算资源),必须对音频编解码器进行优化。
目前,开发和标准化编解码器的工作主要由3GPP (The 3rd Generation Part —nership Project,第三代移动通信伙伴项目)负责。
3 音频编解码器的发展趋势及比较移动通信平台的硬件正在经历迅速的发展,因此,在未来的移动设备中期待出现新的软件和应用。
随着中央处理单元(CPU)处理能力的不断增强以及存储器价格的下降,可以推断出在不久的将来移动设备将会是怎样的。
无线信道也处在不断的发展之中,连接移动设备的带宽正在不断的增加,是否还需要像HE—AAC 那样能提供有效压缩的编解码器。
3.1 新式移动电话的特征硬件研究的主要目标是移动电话,因为移动电话的数量远远超过个人数字助理(PDA)的数量。
移动电话也是一个很好的低端移动设备平台的代表,因为对移动电话的主要设计要求是其尺寸和重量。
3G移动电话操作系统的主要制造商Symbian公司最近推出的Symbian操作系统OS 8,已用于像Nokia 6630这样的基于60系列、SDK2.0平台的3G移动电话上,能支持AMR,AMR—WB,MP3,AAC 和RealAudio等音频编解码器口01。
如Nokia 7710这样较高档的手机甚至能支持立体声的音频编解码器。
因此,在中、高档移动电话手机中,对音频和多媒体应用的硬件瓶颈已被打破。
然而,在低档的移动电话手机中,主要由于考虑到低价格的要求,对于音频的应用目前仍然存在一些硬件限制,但在不久的将来,相信这些硬件限制将不会存在。
3.2 移动通信网络的特征目前用于移动电话系统的基本GPRS(GeneralPacket Radio Services,通用分组无线业务)网络支持的通信速率为30-50 Kb/s。
EDGE (Enhanced Datarates for GSM Evolution,增强数据速率的GSM演进方案)或EGPRS(Enhanced GPRS,增强型GPRS)技术将终端用户的速率增加到了120~150 Kb/s,甚至更高。
如果手机中使用了最新的音频编解码器,则EGPRS的速率对于流式音频应用是足够的。
EGPRS可应用于大部分的中档手机甚至一些低档手机,但目前只能在大城市和市郊可用。
UMTS(Universal Mobil Telecommu.nication System,通用移动通信系统)提供的数据速率为384 Kb/s(TDD 模式)-2 Mb/s(TDD 模式),但到目前为止,UM 只应用于高档手机且仅在市区可用⋯。
3.3 音频编解码器的比较比较音频流质量的方法有许多种,其中一个方法是让听众来判断质量。
通常将EBU(European Broad—casting Union,欧洲广播联盟) 采用的一种测试MI JSHR A MIJhi Stimulus test with Hidden Referenceand Anchors作为评判的参考_l21。
它是由EBU 项目组B/AIM 开发并提议的一种先进的测试方法,现已提交给ITU进行标准化。
MUSHRA是一种主观测试方法,参加测试的一组听众来自欧盟的不同国家,他们使用各种不同类型的音频信号作为编码器的输入,将解码器的输出与一个参考信号进行比较,并按100分制进行评分。
如果给出的平均分在8l~100之间,则认为是“优”,6l~80则认为是“好”,41~60则认为“一般”,21~40则认为“差”,0~20则认为“坏”。
不同类型的音乐,例如古典音乐、民间音乐、爵士乐和流行音乐都要测试。
演播室和直播环境中的男、女声广播节目也被测试。
EBU公布的测试结果是:在码率为48 Kb/s的立体声情况下,HE—AAC的性能最好,音质几乎接近立体声的CD音质,获得了80分的最高分,其它依次是MP3 Pro (76分),MPEG一4 AAC,Real Audio 8,Win—dows Media Audio 8和MP3。
测试证实了SBR增强编解码器MP3 Pro和HE—AAC的优越性能。
EBU还没有报告AMR—WB+编解码器的MUSHRA测试结果。
对于分组交换流(PSS)、多媒体短信业务(MMS),3GPP已候选了2种码率范围的编解码方案:(1)当码率低于24 Kb/s时,AMR—WB+,HE—AAC以及EAAC+将作为候选方案;(2)当码率高于24 Kb/s时,HE-AAC和EAAC+将作为候选方案。
3GPP对AMR—WB+编解码器在48 Kb/s码率下进行了MUSHRA测试,得到83分。
对于低于24 Kb/s码率的立体声,3GPP的MUSHRA 测试结果表明AMR—wB+的性能稍好于EAAC+。
3.4 移动电话对最新音频编解码器的支持目前,在中、高档的手机中都已使用了像AAC,AMR—WB这样的编解码器,但还不支持使用SBR技术的最新编解码器。
这意味着HE—AAC(aacPlus)、EAAC+和AMR—WB+还不能应用在移动系统中。
但随着3GPP标准的推出,支持这些最新编解码器的产品不久就会上市。
Nokia已于2004年7月签署了aacPlus授权协议书,这意味着aacPlus很快将用在其手机上。
Ogg Vorbis开放编解码器在移动电话商业市场上似乎不那么成功。
他们通常不能作为标准而被支持,但是对此感兴趣的用户可以安装编码器和播放器。
目前一个称为OggPlay的免费播放器能在具有SymbianOS7或较新版操作系统的60系列手机上支持ogg,mp3及acc格式文件Windows Media在移动电话市场中还没有获得成功,无法取得像在PC市场中那样的地位。
然而,RealMedia Player已在移动电话中被使用,从而在移动通信市场中占有一席之地。
3.5 音频编解码器在移动设备中的应用下载音乐内容到手机的应用已经存在,目前至少有2个商业的播放器(MP3go和UltraMP3)支持MP3格式音乐的播放。
这些播放器也支持播放列表的创建和使用。
目前,其主要缺点是:对于高音质的MP3音乐,每首歌需要3~5 MB 的存储容量。
如果使用HE—AAC或AMR—WB,则每首歌所需的存储容量可压缩到l MB以下。
这就使得低档的手机有可能存储更多的音乐;在EGPRS网络中一首歌的下载时间也会从5 min减到1 min。
英国移动电话公司MMO2在2004年11月开通了一项下载音乐到移动电话手机的业务[161。
它使用了称做O2数字音乐播放器。
音乐文件以MPEG4 aac—Plus的格式进行编码,其大小约为l MB。
在GPRS 网络中一首歌的下载时间约90 S。
版权保护技术由瑞士的SDC(Secure Digital Container)公司提供。
移动电话上的流式应用已存在,手机上可享受音乐和视频。
例如,芬兰广播公司YLE在GPRS网络上以20~50Kb/s的流发送新闻。
选择这种码率,在芬兰的任何地方都能接收新闻。
目前最常见的格式是Real —Media,但在不久的将来,其它的格式也必将可用。
目前存在的一个问题是:由于GPRS网络的带宽有限而无法保证媒体内容的质量。