中国科学院大学自然语言处理 期末试题 宗成庆
- 格式:pdf
- 大小:407.21 KB
- 文档页数:2
人工智能自然语言技术练习(习题卷9)第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]如何理解NNLM这个模型,它是一个什么样的模型A)基于统计的语言模型B)基于神经网络的语言模型C)预训练模型D)编解码模型答案:C解析:2.[单选题]文本文件中存储的其实并不是我们在编辑器里看到的一个个的字符,而是字符的()。
A)内码B)外码C)反码D)补码答案:A解析:3.[单选题]数据可视化data visualization,导入_哪个包?A)A: sklearn.linear_modelB)B: sklearn.model_selectionC)C: matplotlib.pylabD)D: sklearn.metrics答案:D解析:4.[单选题]dropout作为常用的函数,它能起到什么作用A)没有激活函数功能B)一种正则化方式C)一种图像特征处理算法D)一种语音处理算法答案:B解析:5.[单选题]以下四个描述中,哪个选项正确的描述了XGBoost的基本核心思想A)训练出来一个一次函数图像去描述数据B)训练出来一个二次函数图像去描述数据C)不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。
D)不确定答案:C解析:C)LSTM 神经网络模型使用门结构实现了对序列数据中的遗忘与记忆D)使用大量的文本序列数据对 LSTM 模型训练后,可以捕捉到文本间的依赖关系,训练好的模型就可以根据指定的文本生成后序的内容答案:B解析:7.[单选题]relu函数的作用是可以将小于()的数输出为0A)-1B)0C)1D)x答案:B解析:8.[单选题]以下不是语料库的三点基本认识的是A)语料库中存放的是在语言的实际使用中真实出现出的语言材料。
B)语料库是以电子计算机为载体承载语言知识的基本资源,并不等于语言知识。
C)真实语料需要经过加工(分析和处理),才能成为有用的资源。
人工智能自然语言技术练习(习题卷4)第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]实际应用当中应该如何选激活函数A)根据数据和需求凭经验选择B)可以随意选择使用C)使用到激活函数的地方都选用ReluD)不确定答案:A解析:2.[单选题]下面哪个不是编辑距离里的编辑操作A)删除B)替换C)添加D)相乘答案:D解析:3.[单选题]超参数使我们模型道中必要的阐述,关于超参数范围中说法正确的是A)随机取值可以提升搜索效率B)随机取值就是随机均匀取值C)范围就是[0,1]D)随机取值对搜索无影响答案:A解析:4.[单选题]Beam Search(集束搜索)的作用A)增加在空间的消耗B)增加搜索的时间C)减少准确率D)减少搜索所占用的空间和时间答案:D解析:5.[单选题]以下哪种情况下树会容易发生了过拟合的现象A)加入L2正则B)加入L1正则C)设置树的最大深度D)没有设置树的最大深度答案:D解析:6.[单选题]自然语言处理的简称为()A)ScrumB)NLPC)AUP答案:B解析:7.[单选题]什么是自然语言处理(NLP)A)机器理解B)让计算机/机器在理解语言上像人类一样智能C)弥补人类交流和计算机理解之间的差距D)一门计算机科学、人工智能以及语言学的交叉学科答案:D解析:8.[单选题]贝叶斯作为常用的理论基础,它的定理实质上是对()的陈述。
A)联合概率B)边际概率C)条件概率D)后验概率答案:C解析:9.[单选题]向量空间也可以称为( ),它属于线性代数内容和范畴A)线性空间B)内积空间C)赋范空间D)希尔伯特空间答案:A解析:10.[单选题]概率图中的有向边表示的是什么A)表示单向的依赖B)表述互相依赖关系C)表示无依赖关系D)不确定答案:A解析:11.[单选题]tf.to_int32的作用是什么A)字符串转为数字B)转为64位浮点类型-float64C)转为32位整型-int32D)转为64位整型-int64答案:C解析:12.[单选题]ELMO是个预训练模型,使用了LSTM做特征提取,那么其中用了几层的LSTMA)单层B)双层C)三层D)不确定答案:B解析:13.[单选题]为了模拟神经细胞行为,与之对应的感知器基础概念被提出,下列与之无关的是()A)权量(突触)B)偏置(阀值)C)激活函数(细胞体)D)核仁答案:D解析:14.[单选题]EM算法,什么是EM,最大期望算法A)是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。
口语翻译中的问题、方法与应用可能性宗成庆中科院自动化所模式识别国家重点实验室北京100080E-mail: cqzong@摘要本文简要介绍了语音翻译技术的研究现状,分析了该项技术在10多年的发展过程中所取得的进展和存在的问题;然后侧重介绍和分析了目前语音翻译技术的基本方法,并对两种主要的实现技术-基于规则的分析翻译方法和基于统计模型的翻译方法的比较与结合问题进行了简要的讨论;最后本文介绍了在973项目“图象、语音、自然语言理解与知识挖掘”的支持下口语翻译关键技术研究的最新进展情况和取得的初步成果。
1 引言语音翻译(Speech-to-speech Translation)就是让计算机实现从一种语言的语音到另一种语言的语音翻译的过程。
其基本思想是,让计算机像人一样充当持不同语言的说话人之间翻译的角色。
由于说话人使用的语言一般都是日常生活中的口语,而人们也正希望计算机翻译系统能够接受并实现任意口语语句的翻译,并且,这种希望随着语音识别技术和口语解析技术的快速发展和提高,已经不再是渺茫的设想。
因此,现在的语音翻译又常被称作口语翻译(Spoken Language Translation, SLT)[Kitano, 1994;宗,1999]。
集多项技术于一体的语音翻译系统一般由语音识别(SR)、机器翻译(MT)和语音合成(TTS)等三个主要技术模块组成。
从目前情况来看,尽管语音合成技术已在很多应用系统中得到实际应用,但语音识别技术和机器翻译技术则更多地停留在实验室研究阶段。
因此,作为多技术集成的口语翻译系统仍然处于“艺术级的”(state-of-the-art)研究现状也就不足为怪了。
我们不回避在口语翻译研究中的实际困难,无论是语音识别,还是口语解析和机器翻译,都存在许多有待于深入研究的关键问题,但我们认为,一项新的技术和发明从实验室走向实用化是逐步完成的,是需要一个过程的,而不是等到这项新技术在理论上完全成熟后才寻找其实现可能和应用目标的。
人工智能自然语言技术练习(试卷编号171)1.[单选题]在处理文本是,关于NLP中句法结构分析的说法正确的是A)神经网络可以准确地确定句子的句法结构B)机器学习的KNN算法就可以获取到句子的句法结构C)机器学习的K-Means算法就可以获取到句子的句法结构D)不确定答案:A解析:2.[单选题]专家系统是以( )为基础,以推理为核心的系统。
A)专家B)软件C)知识D)解决问题答案:C解析:3.[单选题]sigmoid激活函数的曲线是什么样的A)直线B)A型曲线C)C型曲线D)S型曲线答案:D解析:4.[单选题]以下四个选项中,关于随机森林和GBDT说法正确的是A)都是由多棵树组成,最终的结果都是由多棵树一起决定。
B)RF和GBDT在使用CART树时,只能做回归不能做分类。
C)RF和GBDT在使用CART树时,只能做分类不能做回归。
D)不确定答案:A解析:5.[单选题]下列不属于一般的有指导的机器学习的步骤是()A)预处理B)人工标注C)训练和预测D)数据导出6.[单选题]并行地训练一系列各自独立的不同类模型,然后通过训练一个元模型(meta-model)来将各个模型输出结果进行结合,是什么思想A)BaggingB)BoostingC)StackingD)以上都正确答案:C解析:7.[单选题]小概率事件怎么理解?( )A)发生可能性不大的事件B)发生可能性大的事件C)发生可能性不去确定的事件D)以上都正确答案:A解析:8.[单选题]( )是指用NLP、文本挖掘和计算机语言学等方法对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。
A)关键词提取B)文本向量化C)文本情感分析D)智能问答答案:C解析:9.[单选题]在NLP中CRF的到广泛的应用,那么CRF是什么模型A)是生成式模型B)是判别式模型C)即是生成式模型又是判别式D)不确定答案:B解析:10.[单选题]早期的语料库语言学主要研究不包括A)语料库的建设B)语言习得C)音系研究D)方言学与语料库技术的结合11.[单选题]情感分析是一种特殊的文本分析,它侧重于确定个人的偏见或情绪。