概率逻辑型生成式人工神经网络
- 格式:pdf
- 大小:1022.02 KB
- 文档页数:24
人工智能导论复习资料(课程代码:07844)知识点汇总:1.人工智能是一门综合性的交叉学科和边缘学科。
2.人工智能的含义最早由一位科学家于1950年提出,并且同时提出一个机器智能的测试模型,请问这个科学家是图灵。
3.人工智能的远期目标是制造智能机器,近期目标是实现机器智能。
4.要想让机器具有智能,必须让机器具有知识。
因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫机器学习。
5.编译原理不属于人工智能的研究的一个领域。
6.AI的英文缩写是Artifical intelligence。
7.“图灵实验”是为了判断一台机器是否具备智能的实验,实验由三个封闭的房间组成,分别放置主持人、参与人和机器。
8.语义网络表达知识时,有向弧AKO 链、ISA 链是用来表达节点知识的继承性。
9.(A->B)∧A => B是假言推理10.命题是可以判断真假的陈述句11.问题归约法是指已知初始问题的描述,通过一系列变换把此问题最终变为一个子问题集合,这些子问题的解可以直接得到,从而解决了初始问题。
12.仅个体变元被量化的谓词称为一阶谓词13.MGU是最一般合一14.关系不在人工智能系统的知识包含的4个要素中15.当前归结式是空子句时,则定理得证。
16.或图通常称为状态图17.不属于人工智能的学派是机会主义18.所谓不确定性推理就是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程。
( )19.用户不是专家系统的组成部分20.产生式系统的推理不包括简单推理21.C(B|A) 表示在规则A->B中,证据A为真的作用下结论B为真的信度22.在图搜索中,选择最有希望的节点作为下一个要扩展的节点,这种方法叫做有序搜索23.人工神经网络属于反馈网络的是BP网络24.使用一组槽来描述事件的发生序列,这种知识表示法叫做剧本表示法25.产生式系统的推理不包括简单推理26.从已知事实出发,通过规则库求得结论的产生式系统的推理方式是正向推理。
● 1.1.3 脑智能和群智能●脑(主要指人脑)的宏观心理层次的智能表现称为脑智能(Brain Intelligence, BI)。
●由群体行为所表现出的智能称为群智能(Swarm Intelligence, SI)。
●脑智能和群智能是属于不同层次的智能:●脑智能是一种个体智能(Individual Intelligence, II);群智能是一种社会智能(Social Intelligence, SI),或者说系统智能(System Intelligence, SI)。
1.1.4 符号智能和计算智能1. 符号智能符号智能就是符号人工智能,它是模拟脑智能的人工智能,也就是所说的传统人工智能或经典人工智能。
符号智能以符号形式的知识和信息为基础,主要通过逻辑推理,运用知识进行问题求解。
符号智能的主要内容包括知识获取(knowledge acquisition)、知识表示(knowledge representation)、知识组织与管理和知识运用等技术(这些构成了所谓的知识工程(Knowledge Engineering, KE))以及基于知识的智能系统等。
幻灯片52. 计算智能计算智能就是计算人工智能,它是模拟群智能的人工智能。
计算智能以数值数据为基础,主要通过数值计算,运用算法进行问题求解。
计算智能的主要内容包括:神经计算(Neural Computation, NC)、进化计算(亦称演化计算,Evolutionary Computation,EC,包括遗传算法(Genetic Algorithm,GA)、进化规划(Evolutionary Planning,EP)、进化策略(Evolutionary Strategies,ES)等)、免疫计算(immune computation)、粒群计算(Particle Swarm Algorithm,PSA)、蚁群算法(Ant Colony Algorithm,ACA)、自然计算(Natural Computation,NC)以及人工生命(Artificial Life,AL)等。
人工智能基础(习题卷1)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]声明1:可以通过将所有权重初始化为0来训练网络。
声明2:可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的?A、1对2错A)1错2对B)1和2都对C)1和2都错答案:B解析:2.[单选题]下列哪个函数可以组合估计器?A)RepeatedKFoldB)KFoldC)LeaveOneOutD)make_pipeline答案:D解析:3.[单选题]输入图像已被转换为大小为28×28的矩阵和大小为7×7的步幅为1的核心/滤波器。
卷积矩阵的大小是多少?A)22X22B)21X21C)28X28D)7X7答案:A解析:4.[单选题]人工神经网络的相关研究最早可以追溯到上世纪40年代,由心理学家麦卡洛克和数学逻辑学家皮茨提出的( )。
A)M-P神经元模型B)B-P神经元模型C)M-N神经元模型D)N-P神经元模型答案:A解析:5.[单选题]要在某一台机器上为某种语言构造一个编译程序,必须掌握哪些内容()A)汇编语言、高级语言、编译方法B)程序设计方法、测试方法、编译方法C)源语言、目标语言、编译方法D)高级语言、程序设计方法、机器语言答案:C解析:C)奇异点阈值D)点云分辨率答案:A解析:7.[单选题]Hadoop生态系统中,HBase是一种()。
A)分布式文件系统B)数据仓库C)实时分布式数据库D)分布式计算系统答案:C解析:HBase是一个面向列的实时分布式数据库。
8.[单选题]人工神经元网络与深度学习的关系是A)人工神经元网络是深度学习的前身B)深度学习是人工神经元网络的一个分支C)深度学习是人工神经元网络的一个发展D)深度学习与人工神经元网络无关答案:C解析:深度学习是实现机器学习的一种技术,现在所说的深度学习大部分都是指神经网络9.[单选题]在编制自动化需求时,实践证明采用()时最有效的方式A)流程图B)视频说明C)电子表格D)流程图加视频说明答案:D解析:10.[单选题]关于用4V来表示大数据的主要特征,描述错误的是A)大数据的时间分布往往不均匀,近几年生成数据的占比最高B)“如何从海量数据中洞见(洞察)出有价值的数据”是数据科学的重要课题之一C)数据类型的多样性往往导致数据的异构性,进而加大数据处理的复杂性,对数据处理能力提出了更高要求D)数据价值与数据量之间存在线性关系答案:D解析:11.[单选题]常用的的灰度内插法不包括()。
一、多选(共计25分,每题2.5分,每题答案完全一样得满分,少选、多选、错选均不得分。
)错误:【A;B;C】错误:【A;D】错误:【A;B;C;D】错误:【B;C】错误:【A;B;C;D】错误:【A;B】7、遗传算法借鉴了生物进化中的什么规律?()。
错误:【A;B;C;D】错误:【A;D】错误:【A;D】10、遗传算法中常用的编码方式有()。
A. 二进制编码B. Gray编码错误:【A;B;C】二、判断(共计25分,每题2.5分)错误:【B】12、在极大极小分析法中,对于或节点,选其子节点中一个最小的得分作为父节点的得分。
错误:【B】13、智能是知识与智力的总和,其中知识是一切智能行为的基础,而智力是获取知识并应错误:【A】14、从初始证据出发,按某种策略不断运用知识库中的已知知识,逐步推出结论的过程称错误:【A】错误:【A】错误:【A】17、与/或树中与节点的子节点中只要有一个是可解节点,就可以判断该与节点是可解的。
错误:【B】18、当传入的神经冲动使细胞膜电位下降低于阈值时,细胞进入兴奋状态,产生神经冲动错误:【B】错误:【A】20、命题逻辑可以把所描述的事物的结构及其逻辑特征反映出来,也能把不同事物间的共错误:【B】三、单选(共计50分,每题2.5分)21、已知CF1(H)=-0.5,CF2(H)=-0.3,请问结论H不确定性的合成CF1,,2(H)=?()。
A. -0.5B. -0.8错误:【C】错误:【D】错误:【A】错误:【A】错误:【B】26、在遗传算法中,将所有妨碍适应度值高的个体产生,从而影响遗传算法正常工作的问错误:【D】27、如果八数码问题的启发式函数定义为当前格局与目标格局位置不符的数码数目,请问以下当前状态的启发式函数值()A. 3B. 4错误:【C】错误:【A】29、遗传算法、模拟退火算法、免疫算法、粒子群优化算法、蚁群算法、人工蜂群算法以错误:【D】30、李明的父亲是教师,用谓词逻辑可以表示为Teacher(father(Liming))这里father (Liming)是()。
机器学习的常见模型机器学习任务中常见的⽅法有:决策树学习,关联规则学习,⼈⼯神经⽹络,深度学习,归纳逻辑设计,⽀持向量机,聚类,贝叶斯⽹络,强化学习,表⽰学习,相似度和度量学习,稀疏字典学习,遗传算法等。
⼀、决策树学习决策树学习就是根据数据的属性采⽤树状结构建⽴的⼀种决策模型,可以⽤此模型解决分类和回归问题。
常见的算法包括CART,ID3,C4.5等。
可以根据数据集来构建⼀颗决策树,他的重要任务就是根据数据中所蕴含的知识信息并提取出⼀系列的规则,这些规则就是树结构的创建过程。
决策树算法主要是指决策树进⾏创建中进⾏树分裂(划分数据集)的时候选取最优特征的算法,他的主要⽬的就是要选取⼀个特征能够将分开的数据集尽量的规整,也就是尽可能的纯。
最⼤的原则就是:将⽆序的数据变得更加有序。
常⽤的三个⽅法:信息增益增益⽐率基尼不纯度1、信息增益这⾥涉及到了信息论的⼀些概念:某个时间的信息量,信息熵,信息增益等。
a、某事件的信息量:这个事件发⽣的概率的负对数b、信息熵就是平均⽽⾔,⼀个事件发⽣得到的信息量⼤⼩,也就是信息量的期望值c、信息增益将⼀组数据集进⾏划分后,数据的信息熵会发⽣变化,我们可以通过使⽤信息熵的计算公式分别计算被划分的⼦数据集的信息熵并计算他们的平均值(期望值)来作为分割后的数据集的信息熵。
新的信息熵相⽐未划分数据的信息熵的减⼩值就是信息增益了。
假设我们将数据集D划分成k份D1,D2,...,Dk,则划分后的信息熵为:信息增益就是就两个信息熵的差值2、增益⽐率增益⽐率是信息增益⽅法的⼀种扩展,是为了克服信息增益带来的弱泛化的缺陷。
因为按照信息增益的选择,总是会倾向于选择分⽀多的属性,这样会使得每个⼦集的信息熵最⼩。
例如给每个数据添加独⼀⽆⼆的ID值特征,则按照这个ID值进⾏分类是获得信息增益最⼤的,这样每个⾃⼰中的信息熵都是0,但是这样的分类没有任何意义,没有任何泛化能⼒,类似于过拟合。
因此可以引⼊⼀个分裂信息找到⼀个更合适的衡量数据划分的标准,即增益⽐率。
SIGMOD 函数1. 介绍SIGMOD 函数是指一种常用的数学函数,用于计算数值的Sigmoid(S型)曲线。
SIGMOD 是 Sigmoid(S型)函数的一个常用缩写。
SIGMOD 函数在数据科学、机器学习等领域中广泛应用,尤其在逻辑回归和人工神经网络中常被使用。
SIGMOD 函数的定义如下:f(x)=11+e−x其中,e是自然对数的底数。
2. 特点SIGMOD 函数具有以下几个特点:1.S型曲线:SIGMOD 函数的图像呈现出典型的S形曲线,该曲线在x=0附近快速增长,并在两侧趋于饱和。
2.取值范围:SIGMOD 函数的取值范围介于0和1之间。
当x趋于负无穷时,f(x)趋近于0;当x趋于正无穷时,f(x)趋近于1。
3.连续可导:SIGMOD 函数是连续可导的,这对于梯度下降等优化算法很重要。
4.非线性:SIGMOD 函数是一种非线性函数,它可以将输入映射到非线性空间中。
5.可压缩:SIGMOD 函数具有可压缩的性质,即通过调整参数可以在一定范围内控制函数的斜率。
3. 应用SIGMOD 函数在各个领域都有广泛的应用。
以下是 SIGMOD 函数在机器学习和数据科学中的常见应用场景:3.1 逻辑回归在逻辑回归中,SIGMOD 函数常用于将输入的线性组合转化为概率值。
逻辑回归通过将线性回归的结果输入到 SIGMOD 函数中,将连续的预测值转化为0和1之间的概率值,从而进行二分类问题的预测。
3.2 人工神经网络SIGMOD 函数在人工神经网络(Artificial Neural Network, ANN)中也扮演着重要的角色。
在神经网络中,SIGMOD 函数通常被用作激活函数,用于在神经元中引入非线性。
SIGMOD 激活函数能够将输入的加权和映射到0和1之间的非线性范围内,从而模拟人脑神经元的激活过程。
3.3 数据预处理SIGMOD 函数还常被用于数据预处理中,用于将连续的特征值映射到0和1之间的范围内。
人工智能应用技术模拟题+参考答案一、单选题(共28题,每题1分,共28分)1.批量梯度下降,小批量梯度下降,随机梯度下降最重要的区别在哪里?A、梯度方向B、使用样本数C、梯度大小D、学习率正确答案:B2.机械学习是最简单的机器学习方法,机械学习就是A、记忆B、计算和推理C、规划D、以上都不对48正确答案:A3.下面哪个不属于数据的属性类型A、序数B、区间C、标称D、相异正确答案:D4.在人脸检测算法中,不属于该算法难点的是A、出现人脸遮挡B、需要检测不同性别的人脸C、需要检测分辨率很小的人脸D、人脸角度变化大正确答案:B5.下面对误差反向传播(errorbackpropagation,BP)描述不正确的是A、BP算法是一种将输出层误差反向传播给隐藏层进行参数更新的方法B、BP算法将误差从后向前传递,获得各层单元所产生误差,进而依据这个误差来让各层单元修正各单元参数C、对前馈神经网络而言,BP算法可调整相邻层神经元之间的连接权重大小D、在 BP算法中,每个神经元单元可包含不可偏导的映射函数正确答案:D6.以下说法正确的是()A、一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的B、如果增加模型复杂度,那么模型的测试错误率总是会降低C、不可以使用聚类“类别id”作为一个新的特征项,用监督学习进行学习D、ABC全错正确答案:D7.AI芯片也被称为 AI加速器,是专门用于处理人工智能应用中的大量计算任务的功能模块。
A、TRUEB、FALSE正确答案:A8.可以在自然语言处理中用于语义关系提取的神经网络技术是以下哪种?A、循环神经网络B、残差神经网络7C、递归神经网络D、卷积神经网络正确答案:A9.下面哪个/些超参数的增加可能会造成随机森林数据过拟合?1树的数量 2树的深度 3学习速率A、有 1、2B、都正确C、只有 1D、只有 3正确答案:A10.HUAWEIHiAI平台中的人脸检测是属于哪个模块?A、HiAIEngineB、HiAIFramework37C、HiAIFoundationD、HiAIService正确答案:A11.数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是()A、单个模型之间有高相关性B、单个模型之间有低相关性C、在集成学习中使用“平均权重”而不是“投票”会比较好D、单个模型都是用的一个算法正确答案:B12.下列哪项属于集成学习A、决策树模型B、kNN分类C、AdaboostD、k-means正确答案:C13.下列哪个函数不可以做激活函数?A、y=2xB、y=tanh(x)C、y=max(x,0)D、y=sin(x)正确答案:A14.随着句子的长度越来越多,神经翻译机器将句意表征为固定维度向量的过程将愈加困难,为了解决这类问题,下面哪项是我们可以采用的?A、使用递归单元代替循环单元B、使用注意力机制(attentionmechanism)C、使用字符级别翻译(characterleveltranslation)D、所有选项均不对正确答案:B15.在以下模型中,训练集不需要标注信息的是()A、k-means24B、线性回归C、决策树D、神经网络正确答案:A16.假设我们已经在 ImageNet数据集(物体识别)上训练好了一个卷积神经网络。
⼈⼯智能、机器学习及深度学习的起源和发展发展时间线第⼀阶段:⼈⼯智能起步期1956—1980s1956达特茅斯会议标志AI诞⽣1957神经⽹络Perceptron被罗森布拉特发明1970受限于计算能⼒,进⼊第⼀个寒冬第⼆阶段:专家系统推⼴1980s—1990s1980 XCON专家系统出现,每年节约4000万美元1986 BP ,Geoffrey Hinton提出了前馈算法,⼀个通过对输⼊数据按照重要进⾏排序的精准神经⽹络。1989 卷积,Yann LeCun写了另外⼀篇旷世之作,描述了卷积神经⽹络。这些发现突破了计算机难以解决的问题,譬如从⼀张照⽚中找到⼀只猫。1990——1991 ⼈⼯智能计算机DARPA没能实现,政府投⼊缩减,进⼊第⼆次低⾕1997 IBM的DeepBlue战胜国际象棋冠军1997 Schmidhuber发明了长短期记忆⽹络(LSTM)第三阶段:深度学习2000s—⾄今2006 Hinton提出“深度学习”的神经⽹络2011 苹果的Siri问世,技术上不断创新2012Google⽆⼈驾驶汽车上路(2009年宣布)2012年,计算机视觉界顶级⽐赛ILSVRC中,多伦多⼤学Hinton团队所提出的深度卷积神经⽹络结构AlexNet⼀鸣惊⼈,同时也拉开了深度卷积神经⽹络在计算机视觉领域⼴泛应⽤的序幕。成功原因⼤量数据,Deep Learning领域应该感谢李飞飞团队搞出来如此⼤的标注数据集合ImageNet;GPU,这种⾼度并⾏的计算神器确实助了洪荒之⼒,没有神器在⼿,Alex估计不敢搞太复杂的模型;算法的改进,包括⽹络变深、数据增强、ReLU、Dropout等。2013 深度学习算法在语⾳和视觉识别上有重⼤突破,识别率超过99%和95%2014GoogleNet VGGNet ,Google公司的GoogleNet和⽜津⼤学视觉⼏何组的VGGNet在当年的ILSVRC中再⼀次各⾃使⽤深度卷积神经⽹络取得了优异的成绩,并在分类错误率上优于AlexNet数个百分点,再⼀次将深度卷积神经⽹络推上了新的巅峰。GAN Ian Goodfellow因提出了⽣成对抗⽹络(GANs)⽽闻名,他被誉为“GANs之⽗”,甚⾄被推举为⼈⼯智能领域的顶级专家。2015 ResNet 微软亚洲研究院何恺明等发明ResNet,ResNet的核⼼思想是引⼊所谓的“⾝份近路连接(identity shortcutconnection)”,可以跳过⼀层或多层,从⽽解决梯度下降问题。残差⽹络有这样⼏个特点:1. ⽹络较瘦,控制了参数数量;2. 存在明显层级,特征图个数逐层递进,保证输出特征表达能⼒;3. 使⽤了较少的池化层,⼤量使⽤下采样,提⾼传播效率;4. 没有使⽤Dropout,利⽤BN和全局平均池化进⾏正则化,加快了训练速度;5. 层数较⾼时减少了3x3卷积个数,并⽤1x1卷积控制了3x3卷积的输⼊输出特征图数量,称这种结构为“瓶颈”(bottleneck)。2016 Deepmind团队的AlphaGo运⽤深度学习算法战胜围棋冠军概念⼈⼯智能、机器学习和深度学习的关系严格意义上来讲,⼈⼯智能和机器学习没有直接关系⼈⼯智能(AI)是⽬标机器学习是实现⼿段深度学习源于机器学习的⼀个技术⽅向:ANN(Artificial Neural Networks,⼈⼯神经⽹络)⼈⼯智能⼈⼯智能是计算机科学的⼀个分⽀,它企图了解智能的实质,并⽣产出⼀种新的能以⼈类智能相似的⽅式做出反应的智能机器,该领域的研究包括语⾳识别、图像识别、机器⼈、⾃然语⾔处理、智能搜索和专家系统等。学派符号主义功能模拟⽅法从定理机器证明、归结⽅法到⾮单调推理理论等⼀系列成就符号主义学派认为⼈⼯智能源于数学逻辑。数学逻辑从19世纪末起就获得迅速发展,到20世纪30年代开始⽤于描述智能⾏为。计算机出现后,⼜在计算机上实现了逻辑演绎系统。该学派认为⼈类认知和思维的基本单元是符号,⽽认知过程就是在符号表⽰上的⼀种运算。符号主义致⼒于⽤计算机的符号操作来模拟⼈的认知过程其,实质就是模拟⼈的左脑抽象逻辑思维,通过研究⼈类认知系统的功能机理,⽤某种符号来描述⼈类的认知过程,并把这种符号输⼊到能处理符号的计算机中,从⽽模拟⼈类的认知过程,实现⼈⼯智能。连接主义结构模拟⽅法归纳学习连接主义(Connectionism)⼜称为仿⽣学派(Bionicsism)或⽣理学派(Physiologism)。是⼀种基于神经⽹络及⽹络间的连接机制与学习算法的智能模拟⽅法。其原理主要为神经⽹络和神经⽹络间的连接机制和学习算法。这⼀学派认为⼈⼯智能源于仿⽣学,特别是⼈脑模型的研究。联结主义学派从神经⽣理学和认知科学的研究成果出发,把⼈的智能归结为⼈脑的⾼层活动的结果,强调智能活动是由⼤量简单的单元通过复杂的相互连接后并⾏运⾏的结果。其中⼈⼯神经⽹络就是其典型代表性技术。 ⾏为主义⾏为模拟⽅法反馈控制模式及⼴义遗传算法智能控制和智能机器⼈系统。认为智能是系统与环境的交互⾏为,是对外界复杂环境的⼀种适应。这些理论与范式在实践之中都形成了⾃⼰特有的问题解决⽅法体系,并在不同时期都有成功的实践范例。⾏为主义最早来源于20世纪初的⼀个⼼理学流派,认为⾏为是有机体⽤以适应环境变化的各种⾝体反应的组合,它的理论⽬标在于预见和控制⾏为。实现⽅法⼈⼯智能在计算机上实现时有2种不同的⽅式。⼀种是采⽤传统的编程技术,使系统呈现智能的效果,⽽不考虑所⽤⽅法是否与⼈或动物机体所⽤的⽅法相同。这种⽅法叫⼯程学⽅法(ENGINEERING APPROACH),它已在⼀些领域内作出了成果,如⽂字识别、电脑下棋等。采⽤这种⽅法,需要⼈⼯详细规定程序逻辑,如果游戏简单,还是⽅便的。如果游戏复杂,⾓⾊数量和活动空间增加,相应的逻辑就会很复杂(按指数式增长),⼈⼯编程就⾮常繁琐,容易出错。⽽⼀旦出错,就必须修改原程序,重新编译、调试,最后为⽤户提供⼀个新的版本或提供⼀个新补丁,⾮常⿇烦。⼀种是模拟法(MODELING APPROACH),它不仅要看效果,还要求实现⽅法也和⼈类或⽣物机体所⽤的⽅法相同或相类似。遗传算法(GENERIC ALGORITHM,简称GA)和⼈⼯神经⽹络(ARTIFICIAL NEURAL NETWORK,简称ANN)均属后⼀类型。遗传算法模拟⼈类或⽣物的遗传-进化机制,⼈⼯神经⽹络则是模拟⼈类或动物⼤脑中神经细胞的活动⽅式。为了得到相同智能效果,两种⽅式通常都可使⽤。采⽤这种⽅法时,编程者要为每⼀⾓⾊设计⼀个智能系统(⼀个模块)来进⾏控制,这个智能系统(模块)开始什么也不懂,就像初⽣婴⼉那样,但它能够学习,能渐渐地适应环境,应付各种复杂情况。这种系统开始也常犯错误,但它能吸取教训,下⼀次运⾏时就可能改正,⾄少不会永远错下去,⽤不到发布新版本或打补丁。利⽤这种⽅法来实现⼈⼯智能,要求编程者具有⽣物学的思考⽅法,⼊门难度⼤⼀点。但⼀旦⼊了门,就可得到⼴泛应⽤。由于这种⽅法编程时⽆须对⾓⾊的活动规律做详细规定,应⽤于复杂问题,通常会⽐前⼀种⽅法更省⼒。机器学习概念机器学习(Machine Learning)是指⽤某些算法指导计算机利⽤已知数据得出适当的模型,并利⽤此模型对新的情境给出判断的过程。传统机器学习的研究⽅向主要包括决策树、随机森林、⼈⼯神经⽹络、贝叶斯学习等⽅⾯的研究。机器学习的思想并不复杂,它仅仅是对⼈类⽣活中学习过程的⼀个模拟。⽽在这整个过程中,最关键的是数据。基于学习⽅式的分类(1) 监督学习(有导师学习):输⼊数据中有导师信号,以概率函数、代数函数或⼈⼯神经⽹络为基函数模型,采⽤迭代计算⽅法,学习结果为函数。[(2) ⽆监督学习(⽆导师学习):输⼊数据中⽆导师信号,采⽤聚类⽅法,学习结果为类别。典型的⽆导师学习有发现学习、聚类、竞争学习等。[2](3) 强化学习(增强学习):以环境反惯(奖/惩信号)作为输⼈,以统计和动态规划技术为指导的⼀种学习⽅法。[2]基于学习⽬标的分类(1) 概念学习:学习的⽬标和结果为概念,或者说是为了获得概念的学习。典型的概念学习主要有⽰例学习。(2) 规则学习:学习的⽬标和结果为规则,或者为了获得规则的学习。典型规则学习主要有决策树学习。(3) 函数学习:学习的⽬标和结果为函数,或者说是为了获得函数的学习。典型函数学习主要有神经⽹络学习。[2](4) 类别学习:学习的⽬标和结果为对象类,或者说是为了获得类别的学习。典型类别学习主要有聚类分析。(5) 贝叶斯⽹络学习:学习的⽬标和结果是贝叶斯⽹络,或者说是为了获得贝叶斯⽹络的⼀种学习。其⼜可分为结构学习和多数学习。[2]基于学习策略的分类(1) 模拟⼈脑的机器学习符号学习:模拟⼈脑的宏现⼼理级学习过程,以认知⼼理学原理为基础,以符号数据为输⼊,以符号运算为⽅法,⽤推理过程在图或状态空间中搜索,学习的⽬标为概念或规则等。符号学习的典型⽅法有记忆学习、⽰例学习、演绎学习.类⽐学习、解释学习等。神经⽹络学习(或连接学习):模拟⼈脑的微观⽣理级学习过程,以脑和神经科学原理为基础,以⼈⼯神经⽹络为函数结构模型,以数值数据为输⼈,以数值运算为⽅法,⽤迭代过程在系数向量空间中搜索,学习的⽬标为函数。典型的连接学习有权值修正学习、拓扑结构学习。(2) 直接采⽤数学⽅法的机器学习主要有统计机器学习。[2]统计机器学习是基于对数据的初步认识以及学习⽬的的分析,选择合适的数学模型,拟定超参数,并输⼊样本数据,依据⼀定的策略,运⽤合适的学习算法对模型进⾏训练,最后运⽤训练好的模型对数据进⾏分析预测。统计机器学习三个要素:模型(model):模型在未进⾏训练前,其可能的参数是多个甚⾄⽆穷的,故可能的模型也是多个甚⾄⽆穷的,这些模型构成的集合就是假设空间。策略(strategy):即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差(损失函数)越⼩,模型就越好。那么策略就是误差最⼩。算法(algorithm):即从假设空间中挑选模型的⽅法(等同于求解最佳的模型参数)。机器学习的参数求解通常都会转化为最优化问题,故学习算法通常是最优化算法,例如最速梯度下降法、⽜顿法以及拟⽜顿法等。任何通过数据训练的学习算法的相关研究都属于机器学习,包括很多已经发展多年的技术,⽐如
人工智能模拟题(含参考答案)一、单选题(共103题,每题1分,共103分)1.可以对Pytorch框架进行网络结构等数据可视化的工具是A、VisdomB、FlaskC、VueD、以上选项均不正确正确答案:A2.下列关于线性回归分析中的残差(Residuals)说法正确的是A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大于零D、以上说法都不对正确答案:A3.Boosting是一可将弱学习器提升为强学习器的算法,最著名的代表是A、BaggingB、随机森林C、AdaBoostD、决策树正确答案:C4.在数据科学项目的活动流程中,()主要回答的是“我们用什么方式记录和展现数据结果”。
A、模式/模型的验证和优化B、结果的可视化与文档化C、数据的获得与管理D、模式/模型的应用及维护正确答案:B5.a=np.arange(2),b=np.arange(3,5),print(np.lexsort([a,b]))的输出结果是()。
A、[0,1,3, 4]B、[0, 1, 2, 3]C、[a, b]D、[0,1]正确答案:D6.语言模型的参数估计经常使用MLE(最大似然估计)。
面临的一个问题是没有出现的项概率为0,这样会导致语言模型的效果不好。
为了解决这个问题,需要使用()A、平滑B、去噪C、随机插值D、增加白噪音正确答案:A7.FPN中根据ROI的()来分配所属层级?A、分类分数B、面积C、最大边长度D、nan正确答案:B8.华为昇腾 AI 芯片是 NPU (神经网络处理器)的典型代表之一。
A、TRUEB、FALSE正确答案:A9.一个完整机器学习项目需要以下哪些流程?①抽象成数学问题②获取数据③特征预处理与特征选择④训练模型与调优⑤模型诊断与融合⑥上线运行A、①②③④⑤B、①②③④⑤⑥C、②③④⑤⑥D、①②④⑤⑥正确答案:B10.ROIAlign在哪个模型被采用()A、fastRCNNB、fasterRCNNC、maskRCNND、YOLOv3正确答案:C11.下面哪个命令不是用来查看网络故障的?A、netstatB、pingC、initD、telnet正确答案:C12.以下激活函数中,不具有“正向无边界”特征的是?A、SigmoidB、softplusC、ReLUD、Mish正确答案:A13.在线性回归算法中,我们认为误差项是符合什么分布的()A、高斯分布B、均匀分布C、二项分布D、泊松分布正确答案:A14.反向传播算法一开始计算什么内容的梯度,之后将其反向传播?A、各个输入样本的平方差之和B、都不对C、各个网络权重的平方差之和D、预测结果与样本标签之间的误差正确答案:D15.设a=2,b=5,在python中,表达式a>b And b>3的值是()A、FalseB、TRUEC、-1D、$1正确答案:A16.图像灰度的方差表示图像的哪种属性A、图像整体亮度&B、&图像对比度&C、&图像细节D、&图像饱和度&正确答案:B17.在神经网络学习中,每个神经元会完成若干功能,下面哪个功能不是神经元所能够完成的功能A、对前序相邻神经元所传递信息进行加权累加B、向前序相邻神经元反馈加权累加信息C、对加权累加信息进行非线性变化(通过激活函数)D、将加权累加信息向后续相邻神经元传递正确答案:B18.一般来讲,下列语言属于人工智能语言的是。
机器学习任务中常见的方法有:决策树学习,关联规则学习,人工神经网络,深度学习,归纳逻辑设计,支持向量机,聚类,贝叶斯网络,强化学习,表示学习,相似度和度量学习,稀疏字典学习,遗传算法等。
一、决策树学习决策树学习就是根据数据的属性采用树状结构建立的一种决策模型,可以用此模型解决分类和回归问题。
常见的算法包括CART,ID3,C4.5等。
可以根据数据集来构建一颗决策树,他的重要任务就是根据数据中所蕴含的知识信息并提取出一系列的规则,这些规则就是树结构的创建过程。
决策树算法主要是指决策树进行创建中进行树分裂(划分数据集)的时候选取最优特征的算法,他的主要目的就是要选取一个特征能够将分开的数据集尽量的规整,也就是尽可能的纯。
最大的原则就是:将无序的数据变得更加有序。
常用的三个方法:信息增益增益比率基尼不纯度1、信息增益这里涉及到了信息论的一些概念:某个时间的信息量,信息熵,信息增益等。
a、某事件的信息量:这个事件发生的概率的负对数b、信息熵就是平均而言,一个事件发生得到的信息量大小,也就是信息量的期望值c、信息增益将一组数据集进行划分后,数据的信息熵会发生变化,我们可以通过使用信息熵的计算公式分别计算被划分的子数据集的信息熵并计算他们的平均值(期望值)来作为分割后的数据集的信息熵。
新的信息熵相比未划分数据的信息熵的减小值就是信息增益了。
假设我们将数据集D划分成k份D1,D2,...,Dk,则划分后的信息熵为:信息增益就是就两个信息熵的差值2、增益比率增益比率是信息增益方法的一种扩展,是为了克服信息增益带来的弱泛化的缺陷。
因为按照信息增益的选择,总是会倾向于选择分支多的属性,这样会使得每个子集的信息熵最小。
例如给每个数据添加独一无二的ID值特征,则按照这个ID值进行分类是获得信息增益最大的,这样每个自己中的信息熵都是0,但是这样的分类没有任何意义,没有任何泛化能力,类似于过拟合。
因此可以引入一个分裂信息找到一个更合适的衡量数据划分的标准,即增益比率。
分类问题的求解过程如下图:2.⽤pytorch的逻辑回归实现图像分类#导⼊包#损失函数和优化器import torch.nn.functional as Fimport torch.optim as optimlearning_rate=0.001loss = nn.CrossEntropyLoss()#定义交叉熵损失函数, 这个⽅法集成了softmax计算optimizer = torch.optim.SGD(linearnet.parameters(),lr=learning_rate)#SGD优化器#测试集数据评估def evaluate_accuracy(data_iter, net):acc_sum, n =0.0, 0for data in data_iter:X, y=dataX, y=X.to(device),y.to(device)acc_sum +=(net(X).argmax(dim=1)== y).float().sum().item()n += y.shape[0]return acc_sum / n#定义训练过程epochs =200def train_model(optimizer):for epoch in range(epochs):train_loss_sum, train_acc_sum, n =0.0, 0.0, 0for data in trainloader:inputs, y=datainputs, y=inputs.to(device),y.to(device)#print(inputs)y_hat = linearnet(inputs)cost = loss(y_hat, y).sum()optimizer.zero_grad()cost.backward()optimizer.step()train_loss_sum += cost.item()train_acc_sum +=(torch.argmax(y_hat, dim=1)== y).float().sum().item()n += y.shape[0]test_acc = evaluate_accuracy(testloader, linearnet)print('epoch %d, loss %.4f, train acc %.4f, test acc %.4f' % (epoch + 1, train_loss_sum / n, train_acc_sum / n, test_acc)) #调⽤函数训练数据train_model(optimizer)#结果可视化#准确度绘制import matplotlib.pyplot as plt# 绘制训练%验证的精度Trainacc=[]#请输⼊上述训练过程中保存的数据Testacc=[]##请输⼊上述训练过程中保存的数据plt.plot(Trainacc)plt.plot(Testacc)plt.title('qijiajing-Residual Block Model accuracy')plt.xlabel('Epoch')plt.ylabel('Accuracy')plt.legend(['Train acc', 'Test acc'], loc='upper left')plt.show()#loss绘制import matplotlib.pyplot as pltloss=[]plt.plot(loss)plt.xlabel('Epoch')plt.ylabel('Loss')plt.title('qijiajing-Model accuracy')我们进⾏了250次迭代,最终训练集精度稳定在43.5%左右,测试集精度稳定在41%左右,是随机猜测10%的四倍。
人工智能专题一、单选题1.人工智能虽然对经济社会发展有巨大促进作用,但同时也带来了就业替代的隐忧。
A.对B.错正确答案: A2.强人工智能观点认为有可能制造出真正推理和解决问题的智能机器。
A.对B.错正确答案: A3.首次通过图灵测试的人工智能软件是聊天程序尤金·古斯特曼”(Eugene Goostman)。
A.对B.错正确答案: A4.1965年,美国MIT人工智能实验室的Roberts编制了多面体识别程序,开创了计算机视觉的新领域。
A.对B.错正确答案: A5.图灵测试一词来源于艾伦·图灵发表于1956年的一篇论文《计算机器与智能》。
A.对B.错正确答案: B6.下图表示的是前向状态空间搜索。
A.对B.错正确答案: A7.P(A∣B)代表事件A发生的条件下事件B发生的概率。
A.对B.错正确答案: B8.人们需要把分类器学习的样本的特点进行量化,这些量化后的数据,如鸢尾花的高度、花瓣的长度、花瓣的宽度等就是鸢尾花的特征。
这些特征都是有效的,可以提供给分类器进行训练。
A.对B.错正确答案: B9.贝叶斯定理是为了解决频率概率问题提出来的。
A.对B.错正确答案: B10现实世界中的规划问题需要先调度,后规划。
A.对B.错正确答案: B11.人工智能利用遗传算法在求解优化问题时,会把问题的解用“0”和“1”表示。
0,1就是就是“遗传基因”,01组成的字符串,称为一个染色体或个体。
A.对B.错正确答案: A12.启发式规划的两种方法是减少更多的边或者状态抽象。
A.对B.错正确答案: B13.谓词逻辑是应用于计算机的逻辑形式,其逻辑规则、符号系统与命题逻辑是一样的。
A.对B.错正确答案: B14.分层规划中包含基本动作和高层动作。
A.对B.错正确答案: A15.语义网络的表示方法只能表示有关某一事物的知识,无法表示一系列动作、一个事件等的知识。
A.对B.错正确答案: B16.第三代防火墙利用大数据和机器智能技术对业务逻辑进行分析。