智能语音芯片SYN6658开发资料-V1
- 格式:pdf
- 大小:753.51 KB
- 文档页数:5
/amwdnvfku/blog/item/4ada7807b6fb697d0308812c.html语音识别芯片资料产品介绍应用于消费类电子产品上的交互式语音集成芯片(RSC-100/164T,RSC-300/364,RSC4XX)是一种高性能、低成本的8位MCU,所有这类芯片内部集成有ADC、DAC、ROM(除了RSC-100/300)、RAM和麦克风的预放大电路,并拥有以下多种功能:与说话者无关/有关的语音识别、语音确认(PASSWORD)、语音和音乐合成,录音和回放、快速数字拨号(只有RSC-300/364)、持续监听。
产品线有两种通用目的的微处理器(RSC系列)1. RSC-100/164T—低成本的版本(只支持4.0版本技术)2. RSC-300/364(支持最新版本的6.0版本技术),它有更快的响应时间、先进和附加的技术(包括数字拨号,固定单词触发,同时产生数字记录和识别模板)3. RSC-164/364产品的特性a) 有64k内置ROM的8位微处理器;b) 集成有A/D和D/A转换器;c) DAC或PWM(Pulse Width Modulation);d) 可实现DTMF 拨号;e) 音源的AGC功能;f) 16个通用I/O端口;g) 片上有输出放大器;h) 省电模式-最小的功耗(小于5UA)。
RSC-300/364产品特性RSC-300/364是专门为消费类电子产品应用而设计的,拥有高度集成和高识别率的系统化芯片。
RSC-300/364有额外的SDAM和硬件加速器去支持SENSORY的最新技术(5.0以上)。
这种特别设计的8位微处理器在拥有灵活的编程时支持一系列语音技术:与说话者无关/有关的识别、语音和音乐的合成、语音确认、语音提示、持续监听、快速数字拨号、录音和回放。
RSC-300/364允许在片上存储最多6个与说话者有关的短句。
RSC-300与RSC-364的区别就是少一个64K的ROM,根据封装和版本的不同,RSC-300/364的价格在2.2~3.9美元之间。
基于SYN6288的超声波语音测距拐杖的设计陈培兴;张晓飞;杨娟【摘要】在介绍超声波测距原理的基础上,设计并实现了一种基于SYN6288语音合成芯片的超声波语音测距拐杖.系统以STC89C52单片机为核心,采用高性能的KS103超声波模块,具备温度补偿功能,可以对超声波的速度进行校正.并采用语音合成芯片SYN6288对实时采集的距离信息进行转换,该芯片采用TTS技术,无需预先录音,可以直接实现文字到语音的转换,通过外置扬声器进行语音提示,实现了测量结果的语音化.实验证明,该超声波语音测距拐杖具有较高的精度和使用方便的特点,可为盲人行走提供安全的保障.【期刊名称】《山西电子技术》【年(卷),期】2015(000)001【总页数】3页(P11-12,25)【关键词】SYN6288;超声波测距;语音功能;KS103;拐杖【作者】陈培兴;张晓飞;杨娟【作者单位】中北大学仪器科学与动态测试教育部重点实验室,山西太原030051;中北大学信息与通信工程学院,山西太原030051;电子测试技术重点实验室,山西太原030051;中北大学仪器科学与动态测试教育部重点实验室,山西太原030051;中北大学信息与通信工程学院,山西太原030051【正文语种】中文【中图分类】TP23我国听力语言残疾居视力残疾、肢残、智残等五大残疾之首,为2 057 万人,占中国人口总数的1.67%。
在发达国家,大多数盲人都有配备导盲犬,然而在中国,导盲犬数量严重不足,如何改善盲人的出行条件是一件很重要的工作。
为了方便盲人的安全出行,世界各国一直进行着导盲系统的研制[1]。
利用超声波检测距离,设计比较方便,计算处理也较简单,其测量精度也能达到使用要求。
目前国内生产的带语音功能的超声波导盲拐杖存在类似的问题:一方面是语音芯片使用前需预先录制,使用不便。
另一方面,因为录制者的不同而产生语音音质的差别容易导致误听,需要有统一的语音音质。
本文采用STC89C52R 单片机,结合超声波测距技术设计导盲杖,并通过语音合成芯片SYN6288 实现文本到语音的直接转换,无需预先录制,通过外置扬声器提醒盲人前方道路情况,实现语音导盲功能。
学号:10446234 常州大学毕业设计(论文)(2014届)题目一种智能语音抢答器的设计学生朱京学院信息科学与工程学院专业班级电子102校内指导教师段仲麒专业技术职务讲师校外指导老师专业技术职务二○一四年六月一种智能语音抢答器的设计摘要:由公交车的报站系统得到启发,将报站系统经过修改将其移植到抢答器之上。
设计一款智能语音抢答器,其可以代替主持人完成提示选手进入抢答环节、语音随机出题及报号、提示抢答环节结束的功能。
这样的抢答环节由机器发声,具有统一的音色、语调,避免主持人个人的因素对选手带来的不公平性。
这款智能语音抢答器由控制芯片、液晶显示器、中文语音合成芯片、4*4矩阵键盘以及扬声器组成。
其中控制芯片选用的是STM32系列的stm32f103rbt6,其具有128kb的闪存,最高工作频率达到72MHz。
负责整个抢答器系统的按键扫描、发送数据给液晶、给语音合成芯片。
液晶显示器选用的是TFTLCD,常见于智能手机上。
具有强大的功能,可以改变字体颜色、设置文字的显示区域等。
中文语音合成芯片选用的是SYN6658,由北京宇音天下有限公司推出的。
可以对任意中文文本进行语音合成,甚至可以识别多音字及中文姓氏等非常规的读法。
关键词:公交车报站系统;智能语音;STM32;Design of an intelligent voice responderAbstract:Inspired by the bus stop reporting system, the newspaper station system after modification of the responder. Design of an intelligent voice responder, which can replace the host to complete tip into responder link, random and reported speech, clew vies to answer first link end function. Such a machine voice answer link, with a unified tone, intonation, avoid the unfair factors of host individuals to the player's.The intelligent voice answering device by the control chip, liquid crystal display, Chinese speech synthesis chip, 4*4 matrix keyboard and speakers. The control chip is used is the STM32 series of stm32f103rbt6, which has 128KB of flash memory, the maximum operating frequency is up to 72MHz. Responsible for the entire responder system key scanning, sends data to the LCD, gave a speech synthesis chip. Liquid crystal display, select TFTLCD, common in intelligent mobile phone. With powerful function, can change the font color, set the text display area etc.. Chinese speech synthesis chip select SYN6658, launched by the Beijing Yu sound world Co. ltd.. Can be the voice synthesis of arbitrary Chinese text, can even identify polyphone and Chinese surname and other non conventional pronunciation.Keywords:Bus stop reporting system ;intelligent voice;STM32;目录摘要 (I)Abstract (Ⅱ)1 前言 (1)1.1本课题的设计背景与意义 (1)1.2 目前抢答器的发展现状及趋势 (1)1.3 本课题的设计任务与目标 (1)2 系统开发平台和方案论证与选择 (3)2.1 开发平台 (3)2.1.1 软件平台:keil (3)2.1.2硬件平台:STM32开发板 (3)2.2方案选择与论证 (3)2.2.1系统图设计 (3)2.2.2控制芯片的选择 (4)2.2.3语音合成芯片的选择 (5)2.2.4 发声模块的选择 (5)3 系统总体设计 (6)3.1系统总体设计图 (6)3.2 硬件模块的设计 (6)3.2.1 STM32F103RBT6主控制模块的设计 (6)3.2.2 SYN6658语音模块的设计 (10)3.2.3 显示器的设计 (13)3.2.4键盘模块的设计 (18)3.2.5发声模块的设计 (19)3.3系统软件程序设计 (19)3.3.1系统程序流程图 (19)3.3.2语音合成程序流程图 (20)3.3.3显示系统控制流程图 (21)3.4系统功能函数设计 (22)4 系统调试 (24)4.1 硬件调试-J-Link (24)4.2 软件调试-keil3程序调试器 (25)5 系统实物图和成果图 (29)5.1 系统三大功能模块实物图 (29)5.2 系统成果图 (29)6 总结与展望 (34)6.1 总结 (34)6.2 展望 (34)参考文献 (36)致谢 (38)附录 (39)1 前言1.1本课题的设计背景与意义抢答器是一种应用极其广泛的基础设备,在各种知识竞赛、抢答环节等文体活动中,它能客观、及时、快速地分辨出首先获得抢答权的选手。
US665蓝牙智能语音IoT芯片产品手册版本:V1.0US665US665芯片是一款蓝牙双模智能语音IoT芯片。
芯片集成32位CPU 处理器,包含UART、GPIO、SPI、SD卡、I2C、ADC、TouchSensor等外围接口;内置NPU、浮点运算单元。
依托于云知声在语音识别技术上的积累和算法的不断优化和创新,将本地识别算法与芯片架构深度融合,为客户提供Turnkey语音识别方案。
该芯片采用MCU加语音识别专用NPU架构内核,同时芯片内置SRAM和FLASH,只需少量外围器件即可形成完整解决方案。
该方案支持50条本地指令离线3-5米远场识别,支持RTOS轻量级系统,并提供简洁友好的客制化工具,可快速部署到不同的终端产品上。
适用于用于智能家电、智能家居、智能玩具、无线音视频、工业控制、医疗监护等广泛的物联网领域。
芯片主要特点:处理单元●集成32位处理器,工作频率240MHz,内置NPU、浮点运算单元●内置1MB Flash●4级中断优先级外围接口●集成3路全双工UART, UART0和UART1支持DMA模式●集成1个10比特ADC●集成1个高速SPI接口,支持主从模式●集成1个SD卡主模式控制器●集成1个I2C控制器,支持主从模式●集成GPIO控制器,最多支持9个GPIO●集成1路全速USB2.0 OTG 控制器●集成4路多功能16位定时器,支持capture和PWM模式●集成2路用于马达控制的PWM●集成Touch Sensor控制器Audio Codec●两路16位DAC,SNR>=95dB●一路16位ADC,SNR〉=90dB●采样率:8/11.025/16/22.05/24/32/44.1/48KHz●1路模拟MIC输入,内置MIC偏置电压输出蓝牙特性●支持V5.1+BR+EDR+BLE●支持Class1、2、3发送功率●支持GFSK、π/4 DQPSK包型●支持6dBm发射功率●接收灵敏度-90dBm●快速AGC支持增强型动态范围●支持 a2dp/avctp/avdtp/avrcp/hfp/spp/smp/att/gap/gatt/rfcomm/sdp/l2cap供电●单电源供电,VBAT 2.2V 到 5.5V●内置LDO用于芯片数字和模拟部分供电SDK●提供完整基于RTOS的SDK●提供搭载云知声语音算法完整解决方案●支持快速便捷的UART等控制协议开发芯片物理规格●封装: QSOP24●环境工作温度:-20℃到70℃芯片管脚描述Pin 管脚名 复用功能及描述 驱动能力(mA)IO类型1 USBDM UART1RXD/SPI2DOB/I2C_SDA_A 4 I/O2 USBDP UART1TXD/SPI2CLKB/I2C_SCL_A/ADC12 4 I/O3 PA1 AMUX0R/Touch1/ADC0/UART1RXC/PWMCH0L 24/8 I/O4 PA0 AMUX0L/Touch0/CLKOUT0/UART1TXC/PWMCH0H 24/8 I/O5 PC7 MIC_BIAS: Microphone Bias Output I/O6 MIC MIC: MIC Input Channel I7 VDDIO IO Power 3.3V P8 DACVSS DAC Ground P9 VCOMO DAC Reference Output10 DACL DAC Left Channel AO11 DACR DAC Right Channel AO12 TEST Not Used AI13 PB11 I/O14 PB10 AMUX2R/SD0CMB/SPI2DOA/ADC9/UART2RXC/PWMCH3L 24/8 I/O15 PB9 AMUX2L/SD0CLKB/SPI2CLKA/CAP0/UART2TXC/PWMCH3H 24/8 I/O16 PB8 AMUX1R/SD0DAT0B/SPI2DIA/ADC8/CLKOUT1 24/8 I/O17 PB5 PWM3/CAP1/UART0TXC/UART0RXC 8 I/O18 VBAT Power Supply P19 BT_AVDD BT Power P20 PB1 ADC5/TMR2/UART1RXA/Long Press Reset 24/8 I/O21 BT_RF BT Antenna22 VSSIO Ground P23 OSCI OSC Input AI24 OSCO OSC Output AO参数 标识 最小 典型 最大 单位 供电电压 VBAT 2.2 3.7 5.5 V IO输入低电平(VDDIO=3.3V) V IL-0.3 0.3*VDDIO V IO输入高电平(VDDIO=3.3V) V IH0.7*VDDIO VDDIO+0.3 V IO输出低电平(VDDIO=3.3V) V OL0.33 V IO输出高电平(VDDIO=3.3V) V OH 2.7 V 3.3V电源输出能力 I3.3150 mA 存储温度范围 T STR-65 150 ℃ 工作温度范围 T OPR-20 70 ℃内部上下拉电阻特性IO口 一般输出 高输出内部上拉电阻内部下拉电阻备注PA0、PA1、PB1、PB8~PB108mA 24mA 10K 10K 1、PB1默认上拉2、USBDM&USBDP默认下拉3、PB5外部可以上拉到5V4、内部电阻精度±20% PC7PB11输出0 8mA 24mA 10K 10K输出1 8mA 64mA 10K 10KPB5 8mA 8mA 10K 10KUSBDP 4mA 1.5K 15KUSBDM 4mA 180K 15K参数 最小 典型 最大 单位 测试条件频率响应 20 20K Hz 1KHz/0dB 10Kohm 负载,A-Weighted滤波 THD+N -75 dBS/N 95 dB串扰 -80 dB输出幅值 1 V rms动态范围 90 dB 1KHz/-60dB 10Kohm 负载,A-Weighted滤波输出能力 11 mW 32ohm负载ADC特性参数 最小 典型 最大 单位 测试条件THD+N -70 dB 1KHz/-60dBS/N 90 91 dB串扰 -80 dB动态范围 80 dB 1KHz/-60dB封装信息:QSOP24(Note: Dimensions are in millimeters.)。
语音芯片使用说明规格:SOP8/DIP8脚封装电压:1.8-5.5V静态电流:>2uA声音驱动方式:PWM直接驱动8欧0.5W喇叭(所有的都可以,只是声音大小差别)语音内容:使用说明:语音芯片可以通过单片机等其他控制设备,任意组合上面的数字,从而到达语音播报时间、星期、年、月、日、温度、湿度等。
例如:今天是2012年3月17日现在北京时间是21点28分30秒。
语音芯片是特定的固定标准模块,可以通过单片机最少一个IO口控制多达32段声音任意调用和组合的语音标准芯片。
通常最常用的控制方式是采用了模拟串行的控制方式(3个IO)。
如需要播放第几个地址的内容就发送几个脉冲,可以快速的控制多达32段地址的任意组合。
语音芯片管脚图:单片机控制语音芯片电路图:控制原理说明:此控制方式是采用了模拟串行的控制方式。
如需要播放第几个地址的内容就发送几个脉冲(大于0.2ms即可,建议采用1ms左右,下同)的原理,可以快速的控制多达32段地址的任意组合。
模拟串行工作时各IO的作用:BUSY:芯片工作时(播放声音),输出低电平,停止工作或者待机是,保持高电平;DATA:接受控制脉冲的脚位。
收到几个脉冲,就播放第几个地址的内容;RST:任何时候,收到高电平,都可以使芯片的播放指针归零(就是是DATA的脚位恢复到初始状态),同时即刻使芯片停止,进入待机状态;工作示例:例如现在需要播放第十段声音。
单片机控制原理是:先发送一个复位脉冲到RST脚,接着发送10个脉冲到DATA脚。
芯片即刻工作,播放第十段的声音;如果需要播放第五段的声音,则是:先发送一个复位脉冲到RST脚,接着发送5个脉冲到DATA脚。
芯片即刻工作,播放第5段的声音;例如需要连续播放第十段和第五段声音:先发送一个复位脉冲到RST脚,接着发送10个脉冲到DATA脚。
芯片即刻工作,播放第十段的声音,同时单片机判断语音芯片的BUSY 是否是高电平,如果不是则一直等待,如果是高电平,则发送一个复位脉冲到RST脚,接着发送5个脉冲到DATA脚。
广州唯创电子有限公司MP3录音模块WTN6系列语音芯片说明书V1.15Note:WAYTRONIC ELECTRONIC CO.,LTD.reserves the right to change this document without prior rmation provided by WAYTRONIC is believed to be accurate and reliable.However,WAYTRONIC makes no warranty for any errors which may appear in this document.Contact WAYTRONIC to obtain the latest version of device specifications before placing your orders.No responsibility is assumed by WAYTRONIC for any infringement of patent or other rights of third parties which may result from its use.In addition,WAYTRONIC products are not authorized for use as critical components in life support devices/systems or aviation devices/systems,where a malfunction or failure of the product may reasonably be expected to result in significant injury to the user,目录1.概述: (2)2.功能简述: (2)3.管脚描述: (2)3.1管脚分布图 (3)4.极限参数: (3)5.直流特性: (3)6.一线串口通讯: (4)6.1管脚分配: (4)6.2一线语音地址对应关系: (5)6.3一线语音及命令码对应表: (5)6.4一线串口时序图: (6)7.两线串口通讯: (7)7.1管脚分配: (7)7.2语音地址对应关系: (7)7.3语音及命令码对应表: (7)7.4两线串口时序图: (8)8.数脉冲控制方式: (9)8.1管脚分配: (9)8.2语音地址对应关系: (9)8.3数脉冲控制时序: (10)9、按键控制模式 (10)10.程序范例 (12)10.1一线串口控制程序 (12)10.2二线串口控制程序 (13)10.3数脉冲控制程序 (14)11.应用电路 (15)11.1一线串口应用电路 (15)11.2两线串口应用电路 (16)11.3数脉冲应用电路 (18)11.4按键应用电路 (19)12.封装管脚图 (21)1.概述:WTN6系列为多功能,低功耗,高性能的CMOS语音芯片。
SYN6288的产品功能概述SYN6288的产品功能概述 1 SYN6288语音合成芯片—相关材料: (1)SYN6288语音合成芯片--产品应用范围: (1)SYN6288语音合成芯片--功能特点: (2)SYN6288语音合成芯片—相关材料:SYN6288中文语音合成芯片是北京宇音天下科技有限公司于2010年初推出的一款性/价比更高,效果更自然的一款中高端语音合成芯片。
SYN6288通过异步串口(UART)通讯方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。
宇音天下于2002年最早研制出国内首款语音合成芯片OSYNO6188。
公司最新推出的SYN6288语音合成芯片,继承了OSYNO6188语音芯片的优秀特点:最小SSOP28L贴片封装、硬件接口简单、低功耗、音色清亮圆润、极高的性/价比;除此之外,SYN6288在识别文本/数字/字符串更智能、更准确,语音合成自然度更好、可懂度更高。
SYN6288语音合成效果和智能化程度均得到大幅度提高,是一款真正面向中高端行业应用领域的中文语音合成芯片。
SYN6288语音合成芯片的诞生,将推动TTS语音合成技术的行业应用走向更深入、更广泛!SYN6288语音合成芯片--产品应用范围:◆车载信息终端语音播报,车载调度,车载导航◆公交报站器,考勤机◆手机,固定电话◆排队叫号机,收银收费机◆自动售货机,信息机,POS机◆智能仪器仪表,气象预警机,智能变压器◆智能玩具,智能手表◆电动自行车,旋转广告灯箱◆语音电子书,彩屏故事书,语音电子词典,语音电子导游◆短消息播放,新闻播放◆电子地图SYN6288语音合成芯片--功能特点:●支持GB2312、GBK、BIG5和UNICODE内码格式的文本;●清晰、自然、准确的中文语音合成效果;可合成任意的中文文本,支持英文字母的合成;●具有智能的文本分析处理算法,可正确识别数值、号码、时间日期及常用的度量衡符号;●具备很强的多音字处理和中文姓氏处理能力;●支持多种文本控制标记,提升文本处理的正确率;●每次合成的文本量最多可达 200 字节;●支持多种控制命令,包括:合成、停止、暂停合成、继续合成、改变波特率等;●支持休眠功能,在休眠状态下可降低功耗;支持多种方式查询芯片工作状态;●支持串行数据通讯接口,支持三种通讯波特率:9600bps,19200bps、38400bps;●支持 16 级音量调整;播放文本的前景音量和播放背景音乐的背景音量可分开控制;●可通过发送控制标记调节词语语速,支持 6 级词语语速调整;●芯片内固化有多首和弦音乐、提示音效和针对某些行业领域的常见语音提示音;●内部集成19首声音提示音,23首和弦提示音,15首背景音乐;●最终产品提供SSOP贴片封装形式;体积业内最小;●芯片各项指标均满足室外严酷环境下的应用;附件:SYN6288语音合成芯片-数据手册V1.0了解本产品的详细情况请登陆:/SYN6288.aspx。