一种改进的基于时间戳的空间音视频同步方法
- 格式:pdf
- 大小:283.41 KB
- 文档页数:4
基于改进的HMM地图匹配算法作者:张浩刘大明来源:《现代信息科技》2020年第21期摘要:針对路网拓扑结构的复杂和轨迹信息利用不充分问题,文章提出了一种改进的HMM,该方法考虑了真实路网的拓扑信息,轨迹的位置、方向和速度信息。
在计算发射概率时用二维正态分布将轨迹的位置信息和方向信息融合,转移概率计算时考虑到候选道路的限制速度和距离的非线性关联,并在实验中得到验证,改进后的匹配成功率比传统HMM提高了7%。
关键词:拓扑结构;HMM;观测概率;转移概率中图分类号:TP301.6 文献标识码:A 文章编号:2096-4706(2020)21-0084-04The Map Matching Algorithm Based on Improved HMMZHANG Hao,LIU Daming(School of Computer Science and Technology,Shanghai University of Electric Power,Shanghai 200090,China)Abstract:In view of the complexity of road network topology and inadequate utilization of track information,an improved HMM method is proposed in this paper,which considers the topology information,track position,direction and velocity information of the real road network. In the calculation of the emission probability,the location information and direction information of the trajectory are fused together with the two-dimensional normal distribution. In the calculation of the transition probability,the nonlinear relation between the limit speed and distance of the candidate road is taken into account,which is verified in the experiment. The improved matching success rate is 7% higher than the traditional HMM.Keywords:topology;HMM;observation probability;transition probability0 引言随着无线通信技术和定位技术的发展,轨迹数据可用于空间数据挖掘、智能交通[1-3]、城市规划[4,5]等领域。
一种基于双帧动态时间规整的语音识别新方法
张亚歌;张太镒
【期刊名称】《微电子学与计算机》
【年(卷),期】2010(0)11
【摘要】提出了一种基于双帧动态时间规整(Double Frame Dynamic Time Wrapping)的识别方法,通过缩小帧匹配距离矩阵(Frame Match Distance Matrix)的规模从而减少计算量,提高识别速度.实验表明,基于双帧动态时间规整的识别方法在识别率有所提高的条件下,缩短了识别时间,有很好的实用价值.
【总页数】4页(P17-19)
【关键词】语音识别;双帧动态时间规整;帧匹配距离矩阵
【作者】张亚歌;张太镒
【作者单位】西安交通大学电子与信息工程学院
【正文语种】中文
【中图分类】TP391.42
【相关文献】
1.改进的高效动态时间规整算法语音识别系统 [J], 王新胜;巩捷甫;喻明艳
2.飞机牵引车语音识别的动态时间规整优化算法 [J], 解本铭;韩明明;张攀;张威
3.一种时间规整算法在神经网络语音识别中的应用 [J], 史笑兴;顾明亮;王太君;何振亚
4.基于动态时间规整算法的语音识别技术研究 [J], 张慧敏
5.基于FFT与形态加权动态时间规整的电压暂降源辨识新方法 [J], 夏杰;张建文;王金川
因版权原因,仅展示原文概要,查看原文内容请购买。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109189999A(43)申请公布日 2019.01.11(21)申请号CN201810832873.7(22)申请日2018.07.26(71)申请人浙江省测绘科学技术研究院;北京吉威时代软件股份有限公司地址310000 浙江省杭州市西湖区保俶北路83号(72)发明人龚丽芳;周海鹏;王延朝;李晶云;黄桦;祝士杰;杜维;丁宜忠(74)专利代理机构北京纽乐康知识产权代理事务所(普通合伙)代理人白明珠(51)Int.CI权利要求说明书说明书幅图(54)发明名称一种基于时空数据模型的矢量动态更新方法(57)摘要本发明公开了一种基于时空数据模型的矢量动态更新方法,包括以下步骤:S1分析原始数据,创建时空数据模型并进行本底数据入库;S2对库内下发的数据进行更新编辑,通过对更新状态和更新时间的标记,得到增量更新包;S3将增量更新数据提交至临时库,通过匹配临时库与现势库中的要素来检查增量数据,若检查通过则执行增量数据的更新入库;S4根据更新前后数据的对比浏览提取指定时间、空间范围的增量更新数据,用于其他数据库的联动更新。
有益效果:能够提高数据更新效率,建立生产与管理的一体化机制,能达到时空数据的快速准确回溯以及要素时序信息的查看。
法律状态法律状态公告日法律状态信息法律状态2019-01-11公开公开2019-01-11公开公开2019-02-12实质审查的生效实质审查的生效权利要求说明书一种基于时空数据模型的矢量动态更新方法的权利要求说明书内容是....请下载后查看说明书一种基于时空数据模型的矢量动态更新方法的说明书内容是....请下载后查看。
一种改进的星载CAN 总线时间同步方法摘要:星载CAN 总线是一种广泛应用于卫星空间通信系统中的数据传输技术。
其中,时钟同步是保证多个节点在不同时间点上正确通信的重要环节。
传统的星载CAN 总线时间同步方法采用了简单的时钟协议来保证分布式节点的同步精度。
然而,这种方法的同步精度和网络系统吞吐量仍存在缺陷。
因此,为了提高星载CAN 总线时间同步的性能,本论文提出了一种改进的星载CAN 总线时间同步方法,通过引入TDoA 定位技术和精度高的众数算法,来提高同步精度和网络吞吐量。
实验结果表明,本文提出的改进方法具有良好的性能和可行性,可以为星载通信系统提供更加可靠和高效的通信体验。
关键词:星载CAN 总线、时钟同步、TDoA 定位技术、众数算法、网络吞吐量。
引言:星载通信系统是一种在航天领域广泛应用的通信技术。
星载CAN 总线作为一种重要的数据通信技术,已经在多个航天项目中被广泛应用。
然而,在星载CAN 总线应用中,同时需要面临诸多通信问题,其中时钟同步就是其中一个重要问题。
因为,多个分布式节点必须保持同步才能保证数据可靠地传输。
传统的星载CAN 总线时间同步方法采用简单的时钟同步协议来保证分布式节点的时间同步。
然而,由于其同步精度和网络吞吐量有限,已经无法满足越来越严格的空间通信需求。
本文提出了一种改进的星载CAN 总线时间同步方法,通过引入TDoA 定位技术和精度高的众数算法来提高同步精度和网络吞吐量。
本文首先介绍了星载CAN 总线相关技术和时钟同步的相关概念。
然后,提出了一种基于TDoA 定位技术的改进方法,并对众数算法进行了优化。
最后,通过实验结果,验证了本文提出的改进方法的可行性和优越性。
星载CAN 总线和时钟同步技术星载CAN 总线是一种高可靠、高效的数据通信技术。
它利用基于“总线控制器-节点”架构的方式来连接多个节点,实现节点之间的数据传输。
每个节点都会在频繁交换的CAN 帧中带有其数据信息,这样所有节点都可以感知网络中其他节点的状态。
基于LSTM-CBAM的音视频同步人脸视频生成基于LSTM-CBAM的音视频同步人脸视频生成随着人工智能技术的不断发展,音视频处理和人脸识别技术在各个领域都得到了广泛的应用。
一种重要的应用就是音视频同步人脸视频生成,即通过一个音频源和一个人脸图像,生成一个与音频内容同步的人脸视频。
在传统的音视频同步人脸视频生成方法中,通常需要进行较为复杂的手动标定和编辑,耗时耗力且效果有限。
而基于深度学习的方法在这一领域中取得了显著的成功。
其中,长短期记忆网络(LSTM)和注意力机制的压缩-激励注意力模块(CBAM)在音视频处理和人脸识别领域都表现出良好的效果。
因此,将LSTM和CBAM应用于音视频同步人脸视频生成中,具有潜在的概念创新和技术突破。
LSTM是一种递归神经网络(RNN),能够处理序列数据并捕捉序列中的长期依赖关系。
在音视频同步人脸视频生成中,LSTM可以用于建模音频的时间序列特征,从而捕捉到语音的音节和音调等信息。
通过学习音频和人脸图像之间的时间对齐关系,LSTM可以生成与音频内容同步的人脸运动序列。
CBAM是一种基于注意力机制的压缩-激励模块,可以自适应地选择输入特征图的重要区域并增强它们。
在音视频同步人脸视频生成中,CBAM可以用于提取人脸图像的重要特征,并根据音频内容调整人脸图像的运动状态。
通过加权人脸图像的不同时间步的特征,CBAM可以生成更加准确和连贯的人脸视频。
基于LSTM-CBAM的音视频同步人脸视频生成模型的具体实现步骤如下:1. 数据准备:收集音频源和人脸图像数据,并进行预处理,如音频转换为频谱图,人脸图像进行裁剪和对齐。
2. 特征提取:使用卷积神经网络(CNN)提取音频和人脸图像的特征。
对音频使用Fast Fourier Transform(FFT)将其转换为频谱图,对人脸图像使用预训练的人脸识别模型提取特征。
3. 特征对齐:将音频的时间序列特征与人脸图像的特征进行对齐,使用LSTM学习两者之间的时间对齐关系。
基于AVS的嵌入式音视频同步方法
陈健;赵岩;陈贺新
【期刊名称】《计算机工程》
【年(卷),期】2009(35)3
【摘要】音视频同步是数字电视广播和多媒体通信等应用的关键技术.该文提出一种基于AVS并结合嵌入技术的音视频同步方法.将压缩音频数据嵌入AVS视频编码系统,保证传输或存储、接收端解码与播放过程中的音视频始终同步.实验结果表明,该方法实现了音视频完全同步,能减小用于同步的开销.
【总页数】3页(P240-241,256)
【作者】陈健;赵岩;陈贺新
【作者单位】吉林大学通信工程学院通信新技术重点实验室,长春,130012;吉林大学通信工程学院通信新技术重点实验室,长春,130012;吉林大学通信工程学院通信新技术重点实验室,长春,130012
【正文语种】中文
【中图分类】TP912.3
【相关文献】
1.总结AVS经验加速推广应用——记AVS五周年产业成果展暨数字音视频产业投融资峰会 [J], 蔡国良
2.一种改进的基于时间戳的空间音视频同步方法 [J], 薛彬;徐京;王猛
3.一种适用于嵌入式媒体播放器的音视频同步方法 [J], 程文青;陈云鹤;徐晶
4.基于RTP/RTCP的音视频同步方法研究 [J], 王凤纯;鲁静
5.基于多媒体信息交互系统的音视频同步方法 [J], 陈伟;刘永红;高菡;
因版权原因,仅展示原文概要,查看原文内容请购买。
2024年软件资格考试多媒体应用制作技术员(基础知识、应用技术)合卷(初级)自测试题(答案在后面)一、基础知识(客观选择题,75题,每题1分,共75分)1、以下哪个操作系统被认为是第一代操作系统?()A、UNIXB、WindowsC、MS-DOSD、Linux2、在多媒体技术中,MPEG是一种常用的压缩编码标准,以下关于MPEG的描述不正确的是?()A、MPEG是一种视频和音频的压缩编码标准B、MPEG可以同时处理视频和音频数据C、MPEG标准包括了MPEG-1、MPEG-2和MPEG-4等多个版本D、MPEG不适用于流媒体传输3、题干:以下哪种技术不是多媒体技术的主要组成部分?A、音频技术B、视频技术C、动画技术D、数据库技术4、题干:在多媒体作品中,以下哪种格式不适合作为音频文件存储?A、WAV格式B、MP3格式C、WMA格式D、MP4格式5、在多媒体作品中,为了使画面更加生动和真实,常常会用到一些特殊的视觉效果处理技术。
下列哪一项不是一种常用的多媒体视频特效?A. 模糊B. 透明度调整C. 颜色校正D. 声音降噪6、以下关于多媒体文件格式的说法,哪一个是不正确的?A. JPEG是一种常用的图像压缩标准,特别适合于照片等复杂色彩的图片。
B. MP3是基于MPEG-1 Layer III音频编码的一种数字音频编码格式。
C. AVI是一种由微软开发的视频文件容器格式,可以包含使用不同编解码器编码的视频流和音频流。
D. GIF支持真彩色显示,非常适合存储高质量的照片。
7、以下关于多媒体技术的说法中,正确的是()A. 多媒体技术只包括文字、图像和声音B. 多媒体技术是指将多种媒体信息数字化后,在计算机上进行综合处理的技术C. 多媒体技术只能应用于计算机领域D. 多媒体技术主要应用于游戏开发8、在多媒体制作过程中,以下哪个不是常用的素材类型()A. 图像素材B. 声音素材C. 动画素材D. 视频素材9、多媒体数据压缩的基本原理是:A. 减少数据量以加快传输速度B. 提高编码效率来增加数据冗余度C. 将信号数字化以便于处理D. 利用数据间的相关性减少冗余 10、在多媒体系统中,最适合用来播放音乐的设备是:A. 显卡B. 声卡C. 网卡D. 扫描仪11、以下关于多媒体数据的数字表示方法,错误的是()A. Pulse Code Modulation(脉冲编码调制,PCM)B. Pulse Width Modulation(脉冲宽度调制,PWM)C. Frequency Modulation(频率调制,FM)D. Phase Modulation(相位调制,PM)12、下列关于MPEG-1标准中视频压缩技术的描述,不正确的是()A. MPEG-1标准采用H.261视频压缩标准B. MPEG-1标准适用于1.5Mbps的传输速率C. MPEG-1标准主要用于数字存储媒体D. MPEG-1标准在压缩过程中采用了运动补偿技术13、在多媒体作品的开发过程中,()阶段主要解决“做什么”和“怎样做”的问题。