第十讲 Modeler分类预测:判别分析资料
- 格式:ppt
- 大小:437.00 KB
- 文档页数:29
IBM SPSS Modeler 说明数据挖掘和建模数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。
数据挖掘解决了一个常见的问题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。
金矿无法开采,通常是由于缺乏人力、时间或专业技术。
数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有用且有价值的信息,这正是您所需要的“商务智能”。
尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。
如果您可以使用这些过去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目标 - 模型,它包含一组从源数据中抽取的规则、公式或方程式,并允许您通过它们生成预测结果。
这正是预测分析的核心。
关于预测分析预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事件的可靠结论,帮助制定有效的行动措施。
它是以下方面的组合:•高级分析•决策优化高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。
决策优化确定您的哪些措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。
有关预测分析如何工作的深入信息,请访问公司网站/predictive_analytics/work.htm。
建模技术建模技术基于对算法的使用,算法是解决特定问题的指令序列。
您可以使用特定算法创建相应类型的模型。
有三种主要的建模技术类别,IBM® SPSS® Modeler 为每种类别提供了一些示例:•Classification•关联•细分(有时称为“聚类”)分类模型使用一个或多个输入字段的值来预测一个或多个输出(或目标)字段的值。
这些技术的部分示例为:决策树(C&R 树、QUEST、CHAID 和 C5.0 算法)、回归(线性、logistic、广义线性和Cox 回归算法)、神经网络、Support Vector Machine (SVM) 和贝叶斯网络。
目录定义和应用判别分析和分类分析介绍两群体Fisher线性判别分析多群体Fisher线性判别分析判别分析:分类规则两群体Fisher分类两群体贝叶斯分类多群体分类分类分析:分类结果分类分析判别分析旨在寻找一种分类规则,而分类分析更进一步:将新的观察对象分到一个合适的类别——即在分析过程中进行的预测回想前面贷款的例子,银行需要决定是否同意申请者的贷款,最终目标是判断新申请者是属于“按时还款组”还是“倾向违约组”假设:分类思想:两个群体 和 有相同的协方差矩阵 ,并且基于Fisher判别函数 ,比较新个体转化后所得 与均值转化后 和 的距离,如果那么 和 更近,应被归为 ,反之,应被归为 .定理:如果那么将新观察对象 分为类别如果那么将 分为类别真实数据中,任何分类法则通常都不能完全正确地分类。
我们可以用如下表格表示总错分率(Total probability of misclassification, TPM)例:“今天”和“昨天”的湿度差( )和温度差( )是用来预测“明天”是否会下雨的两个很重要的因素雨天组别晴天组别绘制数据散点图:用Fisher‘s LDA分类:因此,判别函数为我们可以用模型回测现有样本计算总错分率(TPM)从箱线图可以看出Fisher‘s LDA分类效果很好如果我们得知今天的数据是 ,如何预测明天的天气?按照Fisher's LDA模型的结果,明天应该是雨天从数学角度来看,很容易发现Fisher分配法则在做的事情,实际上是在比较新观测对象 与 、 间的马氏距离。
即如果相较于 , 与 更近,那么把 分到 :反之,分到由于我们没有对分布作假设,因此 Fisher 法则是一种非参数方法,但是当样本是正态分布或者有线性趋势,LDA能表现的更好。
如下非线性分类问题中,Fisher判别分析就失效了。
目录定义和应用判别分析和分类分析介绍两群体Fisher线性判别分析多群体Fisher线性判别分析判别分析:分类规则两群体Fisher分类两群体贝叶斯分类多群体分类分类分析:分类结果贝叶斯分类动机•通常,一家公司陷入财务困境并最终破产的(先验)概率很小,所以我们应该首先默认一家随机选择的公司不会破产,除非数据压倒性地支持公司将会破产这一事件。
判别分析模型研究及应用判别分析模型是一种统计分析方法,用于解决分类问题。
其主要目标是通过对已知分类的样本进行学习,得出一个分类函数,然后通过应用这个分类函数对未知样本进行分类。
判别分析模型在许多领域中都得到广泛的应用,例如医学诊断、金融风险评估、文本分类等。
判别分析模型主要包括线性判别分析(Linear Discriminant Analysis,简称LDA)和二次判别分析(Quadratic Discriminant Analysis,简称QDA)两种。
LDA 假设样本的特征在每个类别中的分布服从正态分布,且各个类别的协方差矩阵相同。
LDA通过计算每个类别的均值向量和协方差矩阵,然后基于贝叶斯决策理论计算后验概率,从而得到分类函数。
QDA则放松了协方差矩阵相同的假设,允许每个类别有不同的协方差矩阵。
判别分析模型的研究主要围绕以下几个方面展开。
首先,模型的建立和求解是研究的重点之一。
在模型建立过程中,需要根据实际问题选择适当的判别准则和优化方法,以提高模型的分类性能。
其次,特征选择和降维也是研究的热点。
由于判别分析模型的性能受样本维度的影响,因此特征选择和降维可以提高模型的准确性和效率。
另外,与其他机器学习方法的集成也是一个重要的研究方向。
判别分析模型与支持向量机、神经网络等机器学习方法相结合,可以提高分类性能,拓展模型的应用范围。
判别分析模型在实际应用中具有广泛的应用价值。
一方面,它可以用于医学诊断,帮助医生识别疾病并制定治疗方案。
例如,通过对病人的病历、症状和检测结果进行分析,可以建立一个判别分析模型,用于区分正常人和疾病人群。
另一方面,判别分析模型也可以用于金融风险评估。
通过对客户的个人信息、信用记录和财务状况进行分析,可以建立一个判别分析模型,用于预测客户是否有违约的风险。
此外,判别分析模型还可以用于文本分类。
通过对文本的词频、词义和句法等进行分析,可以建立一个判别分析模型,用于将文本分类到不同的主题或类别。
分类、回归、聚类、降维、模型选择、数据预处理六大模块1.引言1.1 概述概述部分旨在介绍本文的主题和内容,为读者提供一个整体的了解。
本文主要围绕分类、回归、聚类、降维、模型选择和数据预处理这六个模块展开讨论。
这六个模块是机器学习领域中常见且重要的技术和方法,它们在数据分析和模式识别任务中起着关键作用。
首先,分类是一种对数据进行分组的技术,根据给定的特征将数据划分为不同的类别。
分类算法通过从已知的样本中学习规则和模式,从而对新的未知数据进行分类。
在实际应用中,分类算法被广泛应用于垃圾邮件过滤、图像识别、文本分类等领域。
其次,回归是一种用于预测连续变量的方法。
回归算法通过建立输入特征和输出变量之间的数学模型,来预测未知的连续变量值。
回归技术在金融市场预测、房价预测、销量预测等场景中表现出了很好的效果。
聚类是将相似的样本组合在一起的过程,旨在发现数据中的隐含模式和结构。
聚类算法通过计算样本之间的相似性或距离,将其分配到不同的簇中。
聚类技术在市场细分、社交网络分析、图像分割等方面具有广泛的应用。
降维是将高维数据映射到低维空间的过程,目的是减少数据的维度并保留有效的信息。
降维算法可以帮助我们在可视化、特征选择和数据压缩等方面处理复杂的数据。
模型选择是指在机器学习中选择最适合数据集的模型或算法。
不同的模型有不同的优缺点,模型选择方法可以通过评估和比较不同模型的性能来选择最佳模型。
数据预处理是指在数据分析之前对原始数据进行清洗、转换和归一化等预处理操作。
数据预处理方法可以帮助我们处理缺失值、异常值,提高数据的质量和可靠性。
通过对分类、回归、聚类、降维、模型选择和数据预处理这六个模块的研究和理解,我们可以更好地应对实际问题,从海量的数据中挖掘出有价值的信息,为决策和预测提供有力的支持。
在接下来的章节中,我们将详细介绍每个模块的定义、概念和常用算法,希望能为读者提供全面而深入的学习和理解。
1.2文章结构文章结构部分的内容可以从以下角度进行撰写:文章结构是指整篇文章的组织框架和布局,它直接关系到读者对文章内容的理解和逻辑的推演。
常用预测模型1、分类模型在某些方面,分类模型是我们将要介绍的几种类型的预测分析模型中最简单的一种。
它根据从历史数据中学到的信息将数据分类。
分类模型最好回答是或否的问题,提供广泛的分析,有助于指导果断的行动。
这些模型可以回答以下问题:对于零售商来说,“这个顾客会流失吗?”对于贷款提供者,“这笔贷款会被批准吗?”或“此申请人是否有可能违约?”对于在线银行提供商而言,“这是欺诈交易吗?”分类模型具有广泛的可能性,以及通过新数据对其进行再培训的简便性,意味着它可以应用于许多不同的行业。
2、聚类模型聚类模型基于相似的属性将数据分类到单独的嵌套智能组中。
如果一家电子商务鞋类公司希望为其客户实施有针对性的营销活动,那么他们可以遍历数十万条记录来为每个人创建量身定制的策略。
但这是最有效的时间利用方式吗?可能不是。
使用聚类模型,他们可以根据共同特征将客户快速分为相似的组,并针对每个组设计更大的策略。
这种预测性建模技术的其他用例可能包括基于贷款属性将贷款申请人分组为“智能桶”,在犯罪率高的城市中识别区域,以及将SaaS客户数据分组以确定全局使用模式。
3、预测模型预测模型是使用最广泛的预测分析模型之一,用于处理度量值预测,对历史数据的学习估计新数据的数值。
这个模型可以应用于任何有历史数值数据的地方。
场景包括: SaaS公司可以估计他们在给定一周内可能转换的客户数量。
呼叫中心可以预测每小时将收到多少个电话。
鞋店可以计算出他们应该保留多少库存以满足特定销售期间的需求。
预测模型还考虑了多个输入参数。
如果餐厅老板希望预测下周可能会接待的顾客数量,则该模型将考虑可能影响这一点的因素,例如:附近是否有活动?天气预报怎么样?有一种疾病在流行吗?4、离群值模型离群值模型围绕数据集中的异常数据条目进行定位。
它可以自行识别异常数字,也可以与其他数字和类别一起识别异常数字。
记录支持电话的高峰时间,这可能表明产品故障可能导致召回查找交易或保险索赔中的异常数据以识别欺诈在NetOps日志中查找异常信息,并注意到即将发生计划外停机的迹象离群模型对于零售和金融中的预测分析特别有用。
简述注意模型的分类注意模型的分类简述:在机器学习领域,模型是指一种用于预测或分类的算法。
不同的模型适用于不同的数据类型和目标。
因此,在选择模型时,需要考虑多种因素,例如数据类型、目标、算法复杂度等。
本文将详细介绍机器学习中常用的模型分类及其特点。
1.监督学习监督学习是一种基于有标签数据进行训练的学习方法,其中每个样本都有一个已知的输出值。
监督学习通常用于分类和回归问题。
1.1 分类模型分类模型是一种监督学习方法,它将输入数据分为不同的类别。
常见的分类算法包括决策树、支持向量机(SVM)、逻辑回归等。
1.2 回归模型回归模型是一种监督学习方法,它使用输入变量来预测输出变量。
常见的回归算法包括线性回归、岭回归、Lasso回归等。
2.无监督学习无监督学习是一种基于无标签数据进行训练的学习方法,其中没有预先定义好的输出值。
无监督学习通常用于聚类和降维问题。
2.1 聚类模型聚类模型是一种无监督学习方法,它将输入数据分为不同的组。
常见的聚类算法包括K均值、层次聚类等。
2.2 降维模型降维模型是一种无监督学习方法,它通过减少输入数据的维度来提高计算效率和可视化效果。
常见的降维算法包括主成分分析(PCA)、线性判别分析(LDA)等。
3.半监督学习半监督学习是介于监督学习和无监督学习之间的一种方法,它使用有标签和无标签数据进行训练。
半监督学习通常用于数据量较大但标签数量较少的情况下。
4.强化学习强化学习是一种基于试错过程进行训练的机器学习方法,其中智能体通过与环境交互来获得奖励。
强化学习通常用于游戏、自动驾驶等领域。
总结:在选择机器学习模型时,需要考虑多个因素,例如数据类型、目标、算法复杂度等。
了解不同类型的模型及其特点可以帮助我们更好地选择适合自己的模型。
常见的模型分类包括监督学习、无监督学习、半监督学习和强化学习。
其中,监督学习适用于有标签数据进行训练的情况,无监督学习适用于无标签数据进行训练的情况,半监督学习适用于数据量较大但标签数量较少的情况下,强化学习适用于试错过程进行训练的情况。
分类模型归纳总结在机器学习和数据挖掘领域,分类是一种常见的任务,它旨在根据给定的特征将数据点分为不同的类别。
分类模型是用于解决分类问题的数学模型。
本文将对一些常见的分类模型进行归纳总结,包括逻辑回归、决策树、支持向量机和随机森林等。
一、逻辑回归(Logistic Regression)逻辑回归是一种广泛应用于分类问题的线性模型。
它通过将输入特征与权重相乘,并通过一个激活函数(如sigmoid函数)将结果映射到[0, 1]的范围内,从而预测样本属于某个类别的概率。
逻辑回归具有简单、高效的特点,适用于二分类问题。
二、决策树(Decision Tree)决策树是一种基于树结构的分类模型。
它通过将特征空间划分为多个矩形区域,每个区域对应一个类别,从而实现对样本进行分类。
决策树具有易解释、易理解的特点,可处理离散和连续特征,并且具备较好的鲁棒性。
三、支持向量机(Support Vector Machine)支持向量机是一种经典的分类模型,通过在特征空间中构造最优超平面,将不同类别的样本分开。
支持向量机可处理线性可分和线性不可分的问题,在高维空间中表现出色,并具有一定的抗噪能力。
四、随机森林(Random Forest)随机森林是一种集成学习方法,由多个决策树组成。
它通过对训练集随机采样,并对每个采样子集构建一个决策树,最终通过投票或平均等方式得到分类结果。
随机森林具有较高的准确性和较好的泛化能力,对于处理高维数据和大规模数据集具有一定优势。
五、朴素贝叶斯分类器(Naive Bayes Classifier)朴素贝叶斯分类器是一种基于贝叶斯定理的概率分类模型。
它假设各个特征之间相互独立,并根据训练数据计算类别的先验概率和特征的条件概率,从而进行分类预测。
朴素贝叶斯分类器简单、高效,并在处理文本分类等领域表现突出。
六、神经网络(Neural Networks)神经网络是一类模拟人脑结构和功能的机器学习模型。
它包含输入层、隐藏层和输出层,通过不同层之间的连接权重进行信息传递和特征提取,最终实现分类任务。
第三章判别分析范文判别分析,也称为判别函数分析,是一种统计分析方法,旨在通过建立判别函数来确定样本的类别归属。
判别分析被广泛应用于各个领域,包括医学、经济学、社会科学等。
本章将介绍判别分析的基本原理、应用以及一些相关的方法和技巧。
3.1判别分析的基本原理判别分析的基本原理是通过在高维空间中找到一个判别函数,将样本划分为不同的组别。
这个判别函数的设计目标是使得同一组别内的样本尽可能相似,而不同组别之间的样本尽可能不同。
判别函数可以是线性或非线性的,具体的形式取决于具体的问题。
对于线性判别分析而言,判别函数可以表示为:D(x)=w'x+w0其中,x是样本的特征向量,w是权重向量,w0是一个常数。
为了找到最佳的权重向量 w,我们需要定义一个目标函数,常用的目标函数包括 Fisher 判别准则和最小误分类准则。
3.2判别分析的应用场景判别分析可以应用于多个场景,以下是一些常见的应用场景:1.医学诊断判别分析在医学领域中被广泛用于疾病的诊断和预测。
通过对患者的生理指标进行测量,可以建立一个判别函数,将患者分为患病组和健康组。
例如,在癌症诊断中,医生可以通过对患者的肿瘤大小、形状和血液指标等进行测量,来建立一个判别函数,判断患者是否患有癌症。
2.金融风险评估判别分析在金融领域中被广泛应用于风险评估。
通过对客户的个人信息、信用评级等进行分析,可以建立一个判别函数,将客户分为高风险组和低风险组。
这可以帮助银行机构评估客户的信用风险,并做出相应的贷款决策。
3.社会科学研究判别分析在社会科学研究中也有着广泛的应用。
例如,在心理学研究中,可以通过对被试者的个人特征、心理问卷得分等进行分析,来建立一个判别函数,将被试者分为不同的心理类型。
这有助于研究人员理解人类行为和心理特征之间的关系。
3.3判别分析的相关方法和技巧在进行判别分析时,有一些方法和技巧可以提高分析的准确性和可解释性。
1.特征选择在建立判别函数时,选择合适的特征是非常重要的。
分类预测的评估指标常见的分类预测的评估指标包括准确度、精确度、召回率、F1分数和混淆矩阵等。
1. 准确度(Accuracy):准确度是分类预测中最基本、最直观的度量,表示模型正确分类的样本占总样本数的比例。
计算公式为:准确度=(TP+TN)/(TP+TN+FP+FN)。
优点:简单、直观,易于理解。
缺点:对于样本不平衡的情况,准确度不能反映模型的性能。
2. 精确度(Precision):精确度是衡量模型预测出的正类别中有多少样本真正为正类别的指标。
计算公式为:精确度=TP/(TP+FP)。
优点:对于样本不平衡的情况,精确度能够提供更准确的评估结果。
缺点:不能完全衡量模型的性能,需要结合召回率进行综合评估。
3. 召回率(Recall):召回率是衡量模型能够正确预测出多少正类别样本的指标。
计算公式为:召回率=TP/(TP+FN)。
优点:对于样本不平衡的情况,召回率能够提供更准确的评估结果。
缺点:不能完全衡量模型的性能,需要结合精确度进行综合评估。
4. F1分数(F1 Score):F1分数是精确度和召回率的调和平均数,综合了精确度和召回率的指标。
计算公式为:F1分数=2*(精确度*召回率)/(精确度+召回率)。
优点:综合了精确度和召回率的指标,对于评估模型的性能更具全面性。
缺点:对于样本不平衡的情况,F1分数也不能完全反映模型的性能。
5. 混淆矩阵(Confusion Matrix):混淆矩阵是一个2x2的矩阵,用于可视化分类模型的预测结果。
矩阵的横轴表示真实值,纵轴表示预测值,矩阵的每个元素表示分类结果的数量。
混淆矩阵可以进一步计算其他评估指标,包括TP(真正例)、TN(真负例)、FP(假正例)和FN(假负例)等。
除了上述常见的评估指标,还有一些其他的指标也可以用于分类预测的评估,比如AUC-ROC曲线、类别加权准确度、Kappa系数等。
评估指标的选择应根据具体的问题和模型需求进行,需要综合考虑模型的准确性、可解释性和可应用性等因素。
分类模型的判别标准通常包括以下几个方面:
准确性(Accuracy):准确性是评估分类模型的最基本指标,它衡量了模型在所有样本上预测正确的比例。
准确性越高,表示模型的预测结果与实际标签的匹配程度越高。
精确率(Precision):精确率衡量了模型预测为正例的样本中,真正为正例的比例。
它关注的是模型在预测为正例的样本中的准确性。
高精确率意味着模型对正例的预测更可靠。
召回率(Recall):召回率衡量了模型正确预测为正例的样本占所有真正正例样本的比例。
它关注的是模型对正例样本的识别能力。
高召回率意味着模型能够较好地捕捉到真正的正例。
F1 值(F1 Score):F1 值是精确率和召回率的综合指标,综合考虑了模型的准确性和识别能力。
它是精确率和召回率的调和平均值,当精确率和召回率都较高时,F1 值也会较高。
ROC 曲线和AUC(Area Under Curve):ROC 曲线是根据不同的分类阈值绘制的真正例率(True Positive Rate)和假正例率(False Positive Rate)之间的曲线。
AUC 衡量了ROC 曲线下的面积,它反映了分类模型在不同阈值下的整体性能,AUC 值越大,模型性能越好。
除了以上指标,还可以根据具体任务的需求来选择其他适合的评估指标,如多分类问题中的混淆矩阵、类别间的F1 值等。
此外,还可以考虑模型的训练时间、内存占用等方面的指标,根据具体场景和需求进行综合评估和选择。
预测模型分类及优缺点分析灰色(系统)预测模型神经网络预测模型趋势平均预测法1 微分方程模型当我们描述实际对象的某些特性随时间(或空间)而演变的过程、分析它的变化规律、预测它的未来性态、研究它的控制手段时,通常要建立对象的动态微分方程模型。
微分方程大多是物理或几何方面的典型.问题,假设条件已经给出,只需用数学符号将已知规律表示出来,即可列出方程,求解的结果就是问题的答案,答案是唯一的,但是有些问题是非物理领域的实际问题,要分析具体情况或进行类比才能给出假设条件。
作出不同的假设,就得到不同的方程。
比较典型的有:传染病的预测模型、经济增长预测模型、正规战与游击战的预测模型、药物在体内的分布与排除预测模型、人口的预测模型、烟雾的扩散与消失预测模型以及相应的同类型的预测模型。
其基本规律随着时间的增长趋势是指数的形式,根据变量的个数建立初等微分模型。
微分方程模型的建立基于相关原理的因果预测法。
该法的优点:短、中、长期的预测都适合,而.既能反映内部规律,反映事物的内在关系,也能分析两个因素的相关关系,精度相应的比较高,另外对初等模型的改进也比较容易理解和实现。
该法的缺点:虽然反映的是内部规律,但是由于方程的建立是以局部规律:的独立性假定为基础,故做中长期预测时,偏差有点大,而且微分方程的解比较难以得到。
2 时间序列法将预测对象按照时问顺序排列起来,构成一个所谓的时间序列,从所构成的这一组时间序列过去的变化规律,推断今后变化的可能性及变化趋势、变化规律,就是时间序列预测法。
时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。
考虑一组给定的随时间变化的观察值,t=1,2,3,?,n},如何选取合适模型预报,t=n+1,n+3,n+k}的值。
上面的模型统称ARMA模型,是时间序列建模中最重要和最常用的预测手段。
事实上,对实际中发生的平稳时间序列做恰当的描述,往往能够得到自回归、滑动平均或混合的模型,其阶数通常不超过2。
判别类模型方法是机器学习领域中的一种重要方法,它通过对训练数据进行学习,从而能够对未知数据进行分类或预测。
在数据挖掘、自然语言处理、计算机视觉等多个领域都得到了广泛的应用。
随着人工智能技术的不断发展,判别类模型方法也在不断完善和改进。
本文将从判别类模型方法的定义和基本原理入手,介绍其在各个领域的应用及研究进展,探讨其优势和局限性,并展望其未来发展方向。
首先,判别类模型方法是一种监督学习方法,其基本思想是通过学习输入与输出之间的映射关系,从而对输入数据进行分类或预测。
与生成类模型方法不同的是,判别类模型直接对条件概率进行建模,而生成类模型则同时对先验概率和条件概率进行建模。
在实际应用中,判别类模型由于其简单、直接的特点,更适用于大规模数据的处理和复杂模式的识别。
常见的判别类模型包括支持向量机、逻辑回归、决策树、神经网络等。
在数据挖掘领域,判别类模型方法被广泛应用于分类、聚类、异常检测等任务。
例如,在电商平台中,可以利用判别类模型方法对用户购买行为进行分类,从而实现个性化推荐;在金融领域,可以利用判别类模型方法对信用卡交易进行异常检测,从而保障交易安全。
此外,判别类模型方法还可以用于文本分类、情感分析、图像识别等任务,为人们的生活带来了诸多便利。
在自然语言处理领域,判别类模型方法被广泛应用于文本分类、命名实体识别、机器翻译等任务。
例如,在机器翻译中,可以利用判别类模型方法对输入句子进行翻译,并生成输出句子。
判别类模型方法在处理自然语言时,通常需要考虑词义、语法、语境等多个因素,因此需要充分挖掘数据之间的关联性,以提高模型的准确性和泛化能力。
在计算机视觉领域,判别类模型方法被广泛应用于目标检测、图像分割、人脸识别等任务。
例如,在人脸识别中,可以利用判别类模型方法对不同人脸特征进行学习,并实现对输入图片中人脸的识别和分类。
判别类模型方法在处理图像时,通常需要考虑图像的像素值、颜色、纹理等特征,以提高模型的灵敏度和鲁棒性。