湘潭大学-人工智能课件-机器学习
- 格式:ppt
- 大小:4.02 MB
- 文档页数:76
《机器学习》ppt课件完整版•引言•机器学习基础知识•监督学习算法目录•无监督学习算法•深度学习基础•强化学习与迁移学习•机器学习实践与应用引言机器学习的定义与目标定义目标机器学习的目标是让计算机系统能够自动地学习和改进,而无需进行明确的编程。
这包括识别模式、预测趋势以及做出决策等任务。
早期符号学习01统计学习阶段02深度学习崛起0301020304计算机视觉自然语言处理推荐系统金融风控机器学习基础知识包括结构化数据(如表格数据)和非结构化数据(如文本、图像、音频等)。
数据类型特征工程特征选择方法特征提取技术包括特征选择、特征提取和特征构造等,旨在从原始数据中提取出有意义的信息,提高模型的性能。
包括过滤式、包装式和嵌入式等,用于选择对模型训练最有帮助的特征。
如主成分分析(PCA )、线性判别分析(LDA )等,用于降低数据维度,减少计算复杂度。
数据类型与特征工程损失函数与优化算法损失函数优化算法梯度下降变种学习率调整策略模型评估与选择评估指标评估方法模型选择超参数调优过拟合模型在训练集上表现很好,但在测试集上表现较差,泛化能力不足。
欠拟合模型在训练集和测试集上表现都不佳,未能充分学习数据特征。
防止过拟合的方法包括增加数据量、使用正则化项、降低模型复杂度等。
解决欠拟合的方法包括增加特征数量、使用更复杂的模型、调整超参数等。
机器学习中的过拟合与欠拟合监督学习算法线性回归与逻辑回归线性回归逻辑回归正则化二分类问题核技巧软间隔与正则化030201支持向量机(SVM )决策树与随机森林剪枝决策树特征重要性随机森林一种集成学习方法,通过构建多棵决策树并结合它们的输出来提高模型的泛化性能。
Bagging通过自助采样法(bootstrap sampling)生成多个数据集,然后对每个数据集训练一个基学习器,最后将所有基学习器的输出结合起来。
Boosting一种迭代式的集成学习方法,每一轮训练都更加关注前一轮被错误分类的样本,通过加权调整样本权重来训练新的基学习器。