第6章_近邻法
- 格式:ppt
- 大小:382.50 KB
- 文档页数:29
第一章测试1.样本是连续型数据且有标签,我们采用()进行机器学习。
A:嵌入算法B:聚类算法C:分类算法D:回归算法答案:D2.在机器学习中,样本常被分成()。
A:训练集B:其它选项都有C:测试集D:评估集答案:B3.机器学习算法需要显示编程,具备归纳、总结等自学习能力。
()A:错B:对答案:A4.机器学习和人工智能、深度学习是一个概念,都是指机器模仿人类推理、学习能力。
()A:错B:对答案:A5.特征工程非常重要,在采用机器学习算法前,首先需要利用特征工程确定样本属性。
()A:错B:对答案:B第二章测试1.K近邻算法认为距离越近的相似度越高。
()A:对B:错答案:A2.K近邻算法中数据可以不做归一化,因为是否归一化对结果影响不大。
()A:错B:对答案:A3.K近邻算法中采用不同的距离公式对于结果没有影响。
()A:错答案:A4.在上面图中,K=5,绿色样本的类别是()。
A:红色三角形B:蓝色正方形C:不能确定D:绿色圆形答案:B5.在K近邻算法中,K的选择是()?A:越大越好B:与样本有关C:其它都不正确D:越小越好答案:B第三章测试1.下列()中两个变量之间的关系是线性的。
A:猫的皮毛颜色和体重B:人的工作环境和健康状况C:重力和质量D:女儿的身高和父亲的体重答案:C2.下列说法不正确的是()。
A:线性回归模型也可以解决线性不可分的情况B:回归用于预测输入变量和输出变量之间的关系C:回归就是数据拟合D:回归分析就是研究两个事物的相关性答案:C3.从某大学随机选择8名女大学生,其身高x(cm)和体重y(kg)的回归方程是y=0.849x-85.712,则身高172cm的女大学生,预测体重为()。
A:60.316kgB:大于60.316kgC:小于60.316kgD:其它都不正确答案:Asso中采用的是L2正则化。
()A:错B:对答案:A5.线性回归中加入正则化可以降低过拟合。
()A:错答案:B第四章测试1.以下说法正确的是()。
模式识别(山东联盟)智慧树知到课后章节答案2023年下青岛大学青岛大学第一章测试1.关于监督模式识别与非监督模式识别的描述正确的是答案:非监督模式识别对样本的分类结果是唯一的2.基于数据的方法适用于特征和类别关系不明确的情况答案:对3.下列关于模式识别的说法中,正确的是答案:模式可以看作对象的组成成分或影响因素间存在的规律性关系4.在模式识别中,样本的特征构成特征空间,特征数量越多越有利于分类答案:错5.在监督模式识别中,分类器的形式越复杂,对未知样本的分类精度就越高答案:错第二章测试1.下列关于最小风险的贝叶斯决策的说法中正确的有答案:条件风险反映了对于一个样本x采用某种决策时所带来的损失;最小风险的贝叶斯决策考虑到了不同的错误率所造成的不同损失;最小错误率的贝叶斯决策是最小风险的贝叶斯决策的特例2.我们在对某一模式x进行分类判别决策时,只需要算出它属于各类的条件风险就可以进行决策了。
答案:对3.下面关于贝叶斯分类器的说法中错误的是答案:贝叶斯分类器中的判别函数的形式是唯一的4.当各类的协方差矩阵相等时,分类面为超平面,并且与两类的中心连线垂直。
答案:错5.当各类的协方差矩阵不等时,决策面是超二次曲面。
答案:对第三章测试1.概率密度函数的估计的本质是根据训练数据来估计概率密度函数的形式和参数。
答案:对2.参数估计是已知概率密度的形式,而参数未知。
答案:对3.概率密度函数的参数估计需要一定数量的训练样本,样本越多,参数估计的结果越准确。
答案:对4.下面关于最大似然估计的说法中正确的是答案:在最大似然函数估计中,要估计的参数是一个确定的量。
;在最大似然估计中要求各个样本必须是独立抽取的。
;最大似然估计是在已知概率密度函数的形式,但是参数未知的情况下,利用训练样本来估计未知参数。
5.贝叶斯估计中是将未知的参数本身也看作一个随机变量,要做的是根据观测数据对参数的分布进行估计。
答案:对第四章测试1.多类问题的贝叶斯分类器中判别函数的数量与类别数量是有直接关系的。
第一章机器学习概述1.机器学习研究什么问题,构建一个完整的机器学习算法需要哪些要素?机器学习主要研究如何选择统计学习模型,从大量已有数据中学习特定经验。
构建一个完整的机器学习算法需要三个方面的要素,分别是数据,模型,性能度量准则。
2.可以生成新数据的模型是什么,请举出几个例子可以生成新数据的模型是生成模型,典型的生成模型有朴素贝叶斯分类器、高斯混合模型、隐马尔可夫模型、生成对抗网络等。
3.监督学习、半监督学习和无监督学习是什么,降维和聚类属于哪一种?监督学习是指样本集合中包含标签的机器学习,无监督学习是无标签的机器学习,而半监督学习介于二者之间。
降维和聚类是无监督学习。
4.过拟合和欠拟合会导致什么后果,应该怎样避免?过拟合导致模型泛化能力弱,发生明显的预测错误,往往是由于数据量太少或模型太复杂导致,通过增加训练数据量,对模型进行裁剪,正则化的方式来缓解。
而欠拟合则会导致模型不能对数据进行很好地拟合,通常是由于模型本身不能对训练集进行拟合或者训练迭代次数太少,解决方法是对模型进行改进,设计新的模型重新训练,增加训练过程的迭代次数。
5.什么是正则化,L1正则化与L2正则化有什么区别?正则化是一种抑制模型复杂度的方法。
L1正则化能够以较大概率获得稀疏解,起到特征选择的作用,并且可能得到不止一个最优解。
L2正则化相比前者获得稀疏解的概率小的多,但得到的解更加平滑。
第二章逻辑回归与最大熵模型1.逻辑回归模型解决(B )A.回归问题B.分类问题C.聚类问题D.推理问题2.逻辑回归属于(B )回归A.概率性线性B.概率性非线性C.非概率性线性D.非概率性非线性3.逻辑回归不能实现(D )A.二分类B.多分类C.分类预测D.非线性回归4.下列关于最大熵模型的表述错误的是(B )A.最大熵模型是基于熵值越大模型越稳定的假设B.最大熵模型使用最大熵原理中一般意义上的熵建模以此缩小模型假设空间C.通过定义最大熵模型的参数可以实现与多分类逻辑回归相同的作用D.最大熵模型是一种分类算法5.下列关于模型评价指标的表述错误的是(C )A.准确率、精确率、召回率以及AUC均是建立在混淆矩阵的基础上B.在样本不平衡的条件下准确率并不能作为很好的指标来衡量结果C.准确率表示所有被预测为正的样本中实际为正的样本的概率D.一般来说,置信度阈值越高,召回率越低,而精确率越高6.简述逻辑回归的原理。
《数据科学导论》复习资料本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March《数据科学》课程期末复习资料《数据科学》课程讲稿章节目录:第一章导论第一节了解数据科学的基本概念第二节了解数据科学的应用第三节了解数据科学的过程第四节掌握数据科学的方法第二章数据获取及预处理第一节了解获取数据的途径和方法第二节掌握数据质量检验的方法第三节掌握数据清洗第四节掌握数据集成第五节掌握数据规约第六节掌握数据变换第三章数据分析第一节了解探索性数据分析的概念第二节掌握单变量分析方法第三节掌握多变量分析方法第四节掌握样本相似性与相异性分析的方法第四章特征工程第一节了解特征的介绍和创建过程第二节了解降维的基本概念第三节掌握主成分分析-PCA第四节掌握奇异值分解-SVD第五节了解特征选择的基本概念第六节掌握过滤式方法第七节了解产生特征子集的搜索策略第八节了解封装式方法第九节了解嵌入式方法第五章关联规则算法第一节了解关联规则的基本概念第二节掌握频繁项集的产生过程第三节掌握Apriori算法第六章分类算法第一节了解分类问题基本概念第二节掌握k近邻算法第三节了解贝叶斯定理第四节掌握朴素贝叶斯第五节了解决策树的基本概念第六节了解决策树-特征选择第七节了解决策树-剪枝算法第七章线性回归算法第一节了解线性回归的基本概念第二节掌握一元线性回归第三节掌握多元线性回归第八章人工神经网络第一节了解神经网络的基本概念第二节掌握感知机的学习算法第三节掌握多层感知机-反向传播算法第九章聚类算法第一节了解聚类问题的介绍第二节掌握层次聚类第三节掌握K-means聚类第四节了解BFR聚类一、客观部分:(单项选择、判断)(一)、选择部分1、通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的(C)A.简单函数变换B.规范化C.属性构造D.连续属性离散化★考核知识点: 数据变换参见讲稿章节:2-6附(考核知识点解释):数据变换是对数据进行规范化处理,将数据转换成“适当的”形式,更适用于任务及算法需要。
美食行业外卖配送路线优化方案第1章研究背景与现状分析 (3)1.1 美食外卖市场概述 (3)1.2 配送路线优化的重要性 (3)1.3 国内外外卖配送路线优化研究现状 (3)第2章配送路线优化理论基础 (4)2.1 贪心算法 (4)2.1.1 贪心策略 (4)2.1.2 贪心算法的应用 (4)2.2 动态规划 (4)2.2.1 动态规划原理 (4)2.2.2 动态规划在配送路线优化的应用 (5)2.3 遗传算法 (5)2.3.1 遗传算法原理 (5)2.3.2 遗传算法在配送路线优化的应用 (5)2.4 蚁群算法 (6)2.4.1 蚁群算法原理 (6)2.4.2 蚁群算法在配送路线优化的应用 (6)第3章配送网络构建 (6)3.1 配送区域划分 (6)3.2 网格化配送网络 (6)3.3 配送节点选择 (7)第4章配送路径规划算法 (7)4.1 经典最短路径算法 (7)4.1.1 Dijkstra算法 (7)4.1.2 Floyd算法 (7)4.1.3 A算法 (8)4.2 多目标优化算法 (8)4.2.1 遗传算法 (8)4.2.2 粒子群优化算法 (8)4.2.3 多目标蚁群算法 (8)4.3 启发式算法 (8)4.3.1 近邻法 (8)4.3.2 交换法 (8)4.3.3 重构法 (9)4.3.4 蚁群算法 (9)第5章考虑实际因素的配送路径优化 (9)5.1 交通状况影响分析 (9)5.1.1 路段拥堵程度 (9)5.1.2 道路类型 (9)5.1.3 交叉口管理 (9)5.2 餐品属性对配送的影响 (10)5.2.2 餐品包装 (10)5.3 骑手工作强度与效率 (10)5.3.1 配送距离 (10)5.3.2 配送时间 (10)5.3.3 骑手休息与轮换 (10)第6章大数据分析与预测 (11)6.1 数据收集与处理 (11)6.1.1 数据来源 (11)6.1.2 数据收集方法 (11)6.1.3 数据预处理 (11)6.2 用户下单行为分析 (11)6.2.1 用户下单时间分布 (12)6.2.2 用户下单地点分布 (12)6.2.3 用户消费偏好 (12)6.3 预测模型构建 (12)6.3.1 配送时间预测模型 (12)6.3.2 用户满意度预测模型 (12)6.3.3 配送成本预测模型 (12)第7章智能配送系统设计与实现 (12)7.1 系统架构设计 (12)7.2 配送路径推荐模块 (12)7.2.1 路径规划算法 (12)7.2.2 数据处理 (13)7.2.3 配送路径推荐 (13)7.3 配送过程监控模块 (13)7.3.1 实时监控 (13)7.3.2 异常处理 (13)7.3.3 配送质量评估 (13)7.3.4 数据分析与优化 (13)第8章配送效率与效果评估 (13)8.1 评估指标体系构建 (13)8.1.1 配送时间指标 (13)8.1.2 配送成本指标 (14)8.1.3 配送服务质量指标 (14)8.2 配送效率分析 (14)8.2.1 配送时间分析 (14)8.2.2 配送成本分析 (14)8.3 配送效果分析 (14)8.3.1 服务质量分析 (14)8.3.2 综合效益分析 (15)第9章案例分析与优化实践 (15)9.1 典型城市外卖配送案例分析 (15)9.2 配送路线优化实践 (15)第10章未来发展趋势与展望 (16)10.1 新技术在外卖配送中的应用 (16)10.2 配送模式创新 (16)10.3 绿色配送与可持续发展 (16)10.4 政策法规对行业的影响与机遇 (16)第1章研究背景与现状分析1.1 美食外卖市场概述互联网技术的迅速发展和移动终端设备的普及,我国美食外卖市场近年来呈现出爆发式增长。