6-无量纲化方法
- 格式:ppt
- 大小:583.00 KB
- 文档页数:54
指标无量纲化处理是一种数据预处理方法,用于消除不同指标之间的量纲影响,使得不同指标之间可以进行比较和分析。
具体来说,无量纲化处理通过将原始指标值转化为一个相对大小,从而消除不同量纲之间的差异。
这样可以使得不同指标之间的数据可以进行加总、比较和分析。
常见的无量纲化处理方法包括:
1. 标准化:将原始数据减去均值,再除以标准差,得到标准化的数据。
这样可以使得数据的均值为0,标
准差为1,从而消除量纲和量级的影响。
2. 归一化:将原始数据除以最大值,得到归一化的数据。
这样可以使得数据的最大值为1,最小值为0,
从而使得不同量纲之间的差异被消除。
3. 比重化:将原始数据除以该指标的总和,得到比重化的数据。
这样可以使得数据的总和为1,从而使得
不同量纲之间的差异被消除。
4. 对数化:将原始数据的自然对数转换为对数值,这样可以使得数据的分布更加接近正态分布,从而消
除量级和偏态的影响。
总之,无量纲化处理是一种重要的数据预处理方法,可以消除不同指标之间的量纲影响,使得不同指标之间可以进行比较和分析。
具体使用哪种无量纲化处理方法需要根据实际情况和数据特征进行选择。
数据无量纲化处理
1 什么是无量纲化
无量纲化是一种统计学转换方法,是将不同量纲的数据转换为统一的量纲,使之在比较或分析中更加容易,从而达到可比较性和降低模糊性的目的。
2 无量纲化的作用
① 无量纲化可以让不同规模量纲的数据进行比较。
传统的统计分析和比较都是基于变量值大小的,而无量纲化后的数据可以使不同量纲数据公平地被比较和比较。
② 无量纲化可以使数据处理更为准确。
无量纲化可以改善结果的准确性,因为当处理运算时,数据在量纲之间的转换和相乘等运算的扰动会被抹除,从而避免数据被不同量纲影响所带来的偏差。
③ 无量纲化可以使变量具有更加独立的特性储存,使得不同变量之间容易进行表示和比较。
3 常用的无量纲化方法
① 最大最小值法:将某一变量由原来的变量值范围缩放到一定的范围(如0-1)
② 尺度变换法:对原始数据进行伸缩变换,从而达到量纲统一的效果
③ 小数定标法:把原始数据除以一个常数,使其量纲为给定数字的N次方
④ 几何平均标准化:将原始数据减去算术平均数,再除以其标准差
4 无量纲化的应用
无量纲化的应用十分广泛,例如它被广泛应用于医疗方面,更多的是统一个人不同病症的测量量纲,方便比较和关联,帮助医生判断病情。
同时在数据挖掘方面,运用无量纲化的数据也能更好地发挥作用,使结论更加准确。
此外无量纲化的应用还包括人工智能、机器学习及信号处理等。
总之,无量纲化能够有效地帮助我们统一不同量纲的数据,让它们在比较、表示和探索中更加准确客观,而且它在多个领域有着广泛的应用,已经发挥出了不可忽视的作用。
数据的无量纲化处理数据的无量纲化处理是指将具有不同量纲和取值范围的数据转化为统一的标准格式,以便于不同特征之间的比较和分析。
在数据挖掘、机器学习和统计分析等领域中,无量纲化处理是非常重要的预处理步骤之一。
无量纲化处理的方法有多种,常见的包括标准化、区间缩放和正则化等。
下面将详细介绍这些方法及其应用。
1. 标准化(Standardization)标准化是将数据转化为均值为0,标准差为1的分布。
标准化的计算公式如下:```x' = (x - mean) / std```其中,x'是标准化后的数据,x是原始数据,mean是原始数据的均值,std是原始数据的标准差。
标准化的优点是能够保留原始数据的分布形态,适合于大多数机器学习算法,特殊是基于距离的算法,如K-means聚类和支持向量机(SVM)等。
2. 区间缩放(Min-Max Scaling)区间缩放是将数据转化为指定的区间范围内。
常见的区间范围是[0, 1]或者[-1, 1]。
区间缩放的计算公式如下:```x' = (x - min) / (max - min)```其中,x'是区间缩放后的数据,x是原始数据,min是原始数据的最小值,max是原始数据的最大值。
区间缩放的优点是能够保留原始数据的分布形态,适合于大多数机器学习算法,特殊是对离群值敏感的算法,如神经网络和决策树等。
3. 正则化(Normalization)正则化是将数据转化为单位长度的向量。
正则化的计算公式如下:```x' = x / sqrt(sum(x^2))```其中,x'是正则化后的数据,x是原始数据。
正则化的优点是能够将数据转化为单位向量,适合于基于向量空间模型的算法,如文本分类和推荐系统等。
以上是常见的无量纲化处理方法,根据不同的数据类型和应用场景,选择合适的方法进行处理。
在实际应用中,可以通过编程语言如Python或者R中的库函数来实现这些方法。
数据的无量纲化处理数据的无量纲化处理是指将不同量纲的数据转化为统一的标准,以便于数据分析和建模。
在实际应用中,由于不同变量的单位和量级不同,直接使用原始数据进行分析会导致结果的不准确性。
因此,无量纲化处理是数据预处理的重要环节之一。
常用的无量纲化处理方法包括标准化、区间缩放和归一化等。
下面将逐一介绍这些方法的原理和具体步骤。
1. 标准化标准化是将数据转化为均值为0,标准差为1的标准正态分布。
这种方法适用于数据符合正态分布的情况。
标准化的计算公式如下:X' = (X - mean) / std其中,X'为标准化后的数据,X为原始数据,mean为原始数据的均值,std为原始数据的标准差。
2. 区间缩放区间缩放是将数据限定在一个特定的区间内,常见的区间为[0, 1]或[-1, 1]。
这种方法适用于数据不符合正态分布的情况。
区间缩放的计算公式如下: X' = (X - min) / (max - min)其中,X'为区间缩放后的数据,X为原始数据,min为原始数据的最小值,max为原始数据的最大值。
3. 归一化归一化是将数据映射到[0, 1]的范围内,常用的归一化方法有线性归一化和非线性归一化。
线性归一化的计算公式如下:X' = (X - min) / (max - min)其中,X'为归一化后的数据,X为原始数据,min为原始数据的最小值,max 为原始数据的最大值。
无量纲化处理的步骤如下:1. 收集原始数据。
2. 计算原始数据的均值、标准差、最大值和最小值等统计量。
3. 根据选择的无量纲化方法,使用相应的公式对原始数据进行处理。
4. 得到无量纲化后的数据。
下面通过一个具体的示例来说明无量纲化处理的步骤。
假设我们有一份数据集,包含了身高和体重两个变量的数据。
我们希望对这些数据进行无量纲化处理。
首先,我们收集了1000个人的身高和体重数据。
然后,我们计算了身高和体重的均值、标准差、最大值和最小值:身高:均值为170cm,标准差为5cm,最大值为190cm,最小值为150cm。
数据的无量纲化处理数据的无量纲化处理是数据预处理的重要步骤之一,它将不同量纲的数据转化为统一的无量纲表示,以便于不同特征之间的比较和分析。
本文将详细介绍数据的无量纲化处理的意义、常用方法以及实际应用场景。
一、无量纲化处理的意义在实际应用中,数据的量纲往往是不同的,例如体重和身高的单位不同,收入和年龄的量级不同等等。
这样的数据在进行比较和分析时会受到量纲的影响,导致结果的不许确性。
因此,无量纲化处理的意义在于消除数据之间的量纲差异,使得不同特征之间具有可比性,从而更好地进行数据分析和建模。
二、常用的无量纲化处理方法1. 标准化(Standardization)标准化是将数据按照其均值和标准差进行线性变换,使得数据符合标准正态分布。
标准化的公式如下:x' = (x - mean) / std其中,x'是标准化后的数据,x是原始数据,mean是数据的均值,std是数据的标准差。
标准化后的数据具有均值为0,标准差为1的特点。
2. 区间缩放(Min-Max Scaling)区间缩放是将数据按照最大值和最小值进行线性变换,将数据映射到指定的区间范围内。
区间缩放的公式如下:x' = (x - min) / (max - min)其中,x'是缩放后的数据,x是原始数据,min是数据的最小值,max是数据的最大值。
区间缩放后的数据范围在0到1之间。
3. 归一化(Normalization)归一化是将数据按照其向量的模进行线性变换,使得数据落在单位圆上。
归一化的公式如下:x' = x / sqrt(sum(x^2))其中,x'是归一化后的数据,x是原始数据。
归一化后的数据具有单位长度的特点。
三、数据的无量纲化处理的实际应用场景1. 机器学习算法中的特征处理在机器学习算法中,特征的选择和处理对模型的性能有着重要的影响。
无量纲化处理可以匡助我们消除数据之间的量纲差异,提高特征的可比性,从而提高模型的准确性和稳定性。
数据的无量纲化处理一、引言在数据分析中,数据通常具有不同的量纲和量级,这使得数据间的比较和计算变得困难。
为了解决这一问题,我们常常需要对数据进行无量纲化处理。
无量纲化处理后的数据将不含有量纲单位,仅保留原始数据的相对大小或趋势,从而方便我们进行数据分析。
本文将对数据的无量纲化处理进行深入探讨,分析其方法、应用场景、优缺点以及参数选择等问题。
二、无量纲化的方法标准化:将数据减去均值,再除以标准差,使其变为均值为0,标准差为1的分布。
归一化:将数据缩放到0-1的范围内,通常是通过最小-最大缩放实现。
小数定标:将数据的特征值转化为一个小的正值或负值,便于计算和比较。
对数变换:将数据的值转换为以某一数为底的对数形式,常用于处理偏斜的数据分布。
三、无量纲化的应用场景数据比较:当需要比较不同量级的数据时,无量纲化可以消除量级差异带来的影响。
数据聚合:在多源数据融合时,由于数据来源不同,单位不同,无量纲化可以统一数据尺度。
数据挖掘:在进行数据挖掘和机器学习时,无量纲化可以提升模型的稳定性和准确性。
数据分析:在数据分析中,无量纲化可以使得数据更易于理解和可视化。
四、无量纲化的优缺点优点:消除了数据的量纲单位,简化了数据分析过程;保留了原始数据的相对大小或趋势;便于数据的可视化呈现。
缺点:可能会导致原始数据信息的损失;在某些情况下可能引入噪声;不适用于所有类型的数据,需根据实际情况选择合适的方法。
五、无量纲化的参数选择根据实际需求选择:在确定无量纲化方法时,需考虑数据分析的具体需求以及数据的特征。
尝试不同的参数组合:针对特定的数据集和问题,可以通过试验来找到最优的无量纲化参数组合。
参数调整的准则:应保持简单有效的原则,避免过度复杂化或导致信息丢失的无量纲化方法。
评价无量纲化效果:可通过对比无量纲化前后的数据分析结果来评价无量纲化的效果。
参数选择的重要性:选择合适的参数是无量纲化的关键步骤,这要求分析师具备对数据的深入理解和实验经验。
评价指标的无量纲化处理评价指标的无量纲化处理是将具有不同量纲的指标进行统一处理,使得各个指标之间可以进行比较和权衡。
在实际应用中,评价指标常常具有不同的单位和量纲,这给评价分析和决策带来了诸多困难。
无量纲化处理能够将评价指标转化为统一的无量纲指标,方便进行综合评价和比较分析。
无量纲化处理的常用方法包括以下几种:1.标准化处理:标准化处理是最常见和简便的无量纲化方法之一、标准化处理通过对指标进行减均值再除以标准差的操作,将指标转化为以0为均值、1为标准差的标准正态分布。
标准化处理可以消除指标之间的量纲差异,使得各个指标均具有相似的数值范围,方便进行比较和分析。
2.区间缩放法:区间缩放法通过线性变换将指标映射到预定的数值范围内。
常用的一种区间缩放方法是线性变换法,将指标的原始取值范围通过线性映射转化为指定的数值范围,如[0,1]或[-1,1]。
区间缩放法可以将指标的取值范围统一,便于进行比较和排序。
3.向量夹角余弦法:向量夹角余弦法是一种计算指标相似度的方法,它将指标看作多维空间中的向量,通过计算向量之间的夹角余弦值来衡量指标之间的相似程度。
夹角余弦值越大,表示两个指标之间的相似度越高;夹角余弦值越小,表示两个指标之间的相似度越低。
向量夹角余弦法可以将指标的相似度转化为无量纲的相似度指标,方便比较和排序。
4.主成分分析法:主成分分析法是一种将多个相关指标降维到少数几个相互独立的综合指标的方法。
主成分分析法通过线性变换将原始指标映射到新的无关指标空间中,新的指标可以解释原始指标的大部分变异。
主成分分析法可以将多个指标的信息综合起来,提取出主要信息,并将指标转化为无量纲的综合指标,便于进行比较和排序。
无量纲化处理在评价指标的应用中具有重要的意义。
它可以将具有不同量纲的指标进行统一处理,消除指标之间的量纲差异,方便进行比较和分析。
无量纲化处理还可以将多个指标进行综合处理,提取主要信息,生成无量纲的综合指标,为决策提供依据。
无量纲化法简单例子1.引言概述部分的内容应该对无量纲化法进行简单介绍,说明其基本概念和作用。
下面是一个示例:【1.1 概述】无量纲化法(Dimensionless Analysis)是一种在科学研究中常用的方法,用于简化问题和提取问题的本质特征。
在许多实际问题中,涉及到的物理量往往具有不同的量纲和单位,这给问题的分析和解决带来了困难。
为了解决这个问题,我们可以通过无量纲化法将问题转化为无量纲形式,从而消除了物理量的具体数值和单位,只保留了物理量之间的比例关系,从而简化了问题的复杂度。
无量纲化法的基本思想是将问题中涉及的各个物理量用一个适当的基本量纲进行标定,然后通过相应的变换将所有的物理量转化为无量纲形式。
这样做的好处在于,物理量的具体数值和单位不再重要,而重要的是它们之间的相对关系。
通过消除物理量的量纲和单位,我们可以更加深入地理解问题的本质,揭示其中的普遍规律。
无量纲化法在多个领域都有广泛的应用。
在物理学中,无量纲化法可以用于简化物理模型和方程的求解,使得原本复杂的问题变得更加易于处理。
在工程学中,无量纲化法可以用于优化设计,找到最佳的工艺参数和尺寸比例。
在生物学和经济学等社会科学领域,无量纲化法可以用于建立统一的评价指标,方便进行比较和分析。
本文将通过简单的例子来说明无量纲化法的具体应用。
希望读者能够通过本文的介绍,初步了解无量纲化法的基本概念和作用,从而对其更加深入地理解和应用。
在接下来的内容中,我们将首先介绍无量纲化法的概念,然后通过实例来展示无量纲化法的应用。
最后,我们将对无量纲化法进行总结,并提出一些对其思考和展望。
1.2 文章结构文章结构部分的内容可以按照以下方式编写:文章结构:本文将主要包括引言、正文和结论三个部分。
引言部分将对无量纲化法进行概述,介绍其作用和意义,并对文章的结构进行简要说明。
正文部分将重点介绍无量纲化法的概念和应用举例。
首先,将对无量纲化法的概念进行解释和阐述,包括其基本原理和使用方法。
数据的无量纲化处理数据的无量纲化处理是指将不同量纲的数据转化为统一的无量纲数据,以消除不同量纲对数据分析和建模的影响。
无量纲化处理是数据预处理的重要步骤之一,可以提高数据的可比性和模型的准确性。
本文将详细介绍数据的无量纲化处理方法及其原理。
一、无量纲化处理的原理无量纲化处理的目的是消除数据中不同量纲的影响,使得不同指标之间具有可比性。
常用的无量纲化处理方法有标准化、区间缩放法和归一化等。
1. 标准化标准化是将数据转化为均值为0,标准差为1的分布。
标准化的计算公式如下:\[ x' = \frac{x - \mu}{\sigma} \]其中,\( x' \)是标准化后的数据,\( x \)是原始数据,\( \mu \)是原始数据的均值,\( \sigma \)是原始数据的标准差。
2. 区间缩放法区间缩放法是将数据缩放到一个特定的区间范围内,常见的区间为[0, 1]或[-1, 1]。
区间缩放法的计算公式如下:\[ x' = \frac{x - \min(x)}{\max(x) - \min(x)} \]其中,\( x' \)是区间缩放后的数据,\( x \)是原始数据,\( \min(x) \)是原始数据的最小值,\( \max(x) \)是原始数据的最大值。
3. 归一化归一化是将数据缩放到单位范数内,常用的归一化方法有L1范数和L2范数。
归一化的计算公式如下:\[ x' = \frac{x}{\|x\|} \]其中,\( x' \)是归一化后的数据,\( x \)是原始数据,\( \|x\| \)表示数据的范数。
二、无量纲化处理的方法根据数据的特点和需求,可以选择不同的无量纲化处理方法。
下面将介绍三种常用的无量纲化处理方法及其适用场景。
1. 标准化标准化适用于数据分布近似正态分布的情况,可以消除数据的偏差和尺度差异,使得数据更加符合统计分析的要求。
例如,在进行聚类分析或者回归分析时,常常需要对数据进行标准化处理。
数据的无量纲化处理数据的无量纲化处理是数据预处理的一项重要任务,它可以将不同量纲的数据转化为统一的无量纲表示,以便于不同特征之间的比较和分析。
本文将介绍无量纲化处理的方法和步骤,并通过一个示例来说明如何进行无量纲化处理。
一、无量纲化处理的方法无量纲化处理的方法主要有标准化和归一化两种。
1. 标准化标准化是将数据转化为均值为0,方差为1的分布。
常用的标准化方法有Z-score标准化和小数定标标准化。
- Z-score标准化:对于给定的数据集,Z-score标准化将每一个样本的特征值减去该特征的均值,再除以该特征的标准差。
公式如下:$$x' = \frac{x - \mu}{\sigma}$$其中,$x$为原始特征值,$x'$为标准化后的特征值,$\mu$为特征的均值,$\sigma$为特征的标准差。
- 小数定标标准化:小数定标标准化将每一个特征值除以一个固定的数值,使得所有特征值都落在[-1, 1]之间。
公式如下:$$x' = \frac{x}{10^d}$$其中,$x$为原始特征值,$x'$为标准化后的特征值,$d$为使得所有特征值都落在[-1, 1]之间的最小整数。
2. 归一化归一化是将数据线性映射到[0, 1]或者[-1, 1]的范围内。
常用的归一化方法有最小-最大归一化和正则化。
- 最小-最大归一化:最小-最大归一化将每一个特征值减去该特征的最小值,再除以该特征的取值范围(最大值减最小值)。
公式如下:$$x' = \frac{x - \min(x)}{\max(x) - \min(x)}$$其中,$x$为原始特征值,$x'$为归一化后的特征值。
- 正则化:正则化是将每一个样本的特征向量转化为单位向量。
常用的正则化方法有L1范数和L2范数。
二、无量纲化处理的步骤无量纲化处理的步骤如下:1. 采集数据集:首先,需要采集包含不同量纲的数据集。
例如,一个包含身高、体重和年龄的数据集。
量纲分析与无量纲化量纲分析是物理学中的一种重要方法,用来研究物质世界中物理量之间的依存关系。
它的基本思想是,将物理量表示成无量纲形式,通过对无量纲式进行分析,可以得到物理量之间的关系,进而推导出各种物理规律和方程。
量纲分析的基本步骤是:选择若干个具有重要意义的物理量作为基本量,通过观察实验结果、提取经验关系或者运用理论推导等方法,找出它们之间的依存关系,建立起无量纲关系式。
然后在物理量之间建立起类似的关系,通过对齐每一项的量纲,可以求得未知物理量的量纲和关键系数。
在量纲分析中,无量纲化是一个非常重要的步骤。
无量纲化的目的是消除物理量的量纲影响,使得物理规律和方程能够更加简洁地表达。
常见的无量纲化方法有:1.选取合适的基本量纲:通常选择与问题相关的几个基本量纲,例如长度(L)、质量(M)和时间(T)。
根据具体问题的特点,还可以引入其他基本量纲,例如温度(Θ)和电流(I)等。
2.选择特征量:根据问题的特点,选择合适的特征量,例如流速、频率或能量等。
特征量可以帮助确定无量纲化中的关键变量。
3.建立无量纲关系:根据选取的基本量纲和特征量,建立起无量纲关系式。
在建立关系式时,需要将问题中的各个物理量分别表示成有关基本量纲和特征量的函数。
4.对无量纲式进行分析:通过对无量纲式进行分析,可以得到物理量之间的关系。
例如,通过无量纲化的关系式可以得到流体力学中的雷诺数和流固耦合问题中的康普顿数等。
量纲分析和无量纲化在科学研究和工程实践中具有广泛的应用。
它能够帮助研究人员理解物理问题的本质,简化问题的描述和计算,加快问题的求解速度,并提高问题的求解精度。
在各个领域中,如物理学、化学、工程、生物学等,都广泛使用了量纲分析和无量纲化方法。
总之,量纲分析和无量纲化是一种有效的工具,它能够帮助解决复杂的物理问题,揭示出物理现象背后的规律与关系。
无量纲化可以让我们更加清晰地认识物理世界的本质,简化问题的描述和计算,加速问题的求解过程,并提高问题的求解精度。
数据无量纲化处理方法一、数据无量纲化处理的定义和作用数据无量纲化处理是指将数据转换为无单位或统一单位的方法,以消除不同变量间的量纲差异,使得不同变量之间具有可比性,从而更好地进行数据分析和建模。
在机器学习、数据挖掘等领域中,数据无量纲化处理是一个非常重要的预处理步骤。
二、常见的数据无量纲化处理方法1. 最大最小值标准化(Min-Max Scaling)最大最小值标准化是一种线性变换方法,它将原始数据缩放到给定范围内。
具体地说,它将原始数据映射到[0,1]或[-1,1]之间。
这种方法适用于特征值分布有明显边界的情况。
2. Z-score标准化(Standardization)Z-score标准化也是一种线性变换方法,它将原始数据转换为均值为0、方差为1的分布。
这种方法适用于特征值分布没有明显边界的情况。
3. L1正则化(Least Absolute Deviations)L1正则化也被称为Lasso回归,在特征选择中比较常用。
它通过对每个特征进行加权来缩放特征,并且可以通过调整权重来选择最重要的特征。
4. L2正则化(Least Squares)L2正则化也被称为Ridge回归,它通过对每个特征进行加权来缩放特征,并且可以通过调整权重来平衡不同特征之间的影响。
5. PCA降维(Principal Component Analysis)PCA降维是一种非线性变换方法,它可以将高维数据映射到低维空间中。
这种方法适用于高维数据的可视化和降噪。
6. 特征缩放(Feature Scaling)特征缩放是一种简单的无量纲化处理方法,它将原始数据按比例缩小或扩大,以使得不同变量之间具有可比性。
这种方法适用于特征值分布较为均匀的情况。
三、数据无量纲化处理方法的选择在实际应用中,我们需要根据具体情况选择合适的数据无量纲化处理方法。
以下是一些常见情况下的建议:1. 如果数据分布没有明显边界,可以使用Z-score标准化或PCA降维。
数据无量纲化方法一、数据无量纲化的重要性。
1.1 数据的复杂性。
在处理数据的时候啊,那可真是千头万绪。
数据常常来自不同的源头,就像一群来自五湖四海的人,各有各的特点。
比如说,有的数据数值特别大,有的又特别小,这就好比一群人里有巨人也有小矮人。
这种情况下,如果不做处理,直接进行分析或者比较,那就好比让短跑运动员和长跑运动员在同一条赛道、用同样的规则比赛,根本不公平嘛。
1.2 无量纲化的意义。
无量纲化呢,就像是给这些数据来一场公平的“改造”。
它能把数据都放到同一个“起跑线”上,不管原来是大是小,经过无量纲化处理后,都能在同一个尺度下进行比较和分析。
这就像把不同种类的水果都切成小块,然后用同样的标准去衡量它们的甜度或者水分含量一样。
2.1 标准化方法。
这是一种比较常用的方法。
简单来说呢,就是根据数据的均值和标准差来进行变换。
就像给一群学生的成绩进行调整,先算出平均成绩,再看看每个学生的成绩和平均成绩的差距有多大,根据这个差距来重新给出一个相对的分数。
比如说,原来的成绩有90分、60分、30分,经过标准化之后,就都变成了在一个新的、统一的尺度下的分数,这样就可以公平地比较每个学生在整个班级中的相对位置了。
2.2 归一化方法。
归一化也很有趣。
它是把数据映射到一个特定的区间,通常是[0,1]或者[-1,1]。
这就好比把一群小动物按照大小排序,然后把最小的定义为0,最大的定义为1,其他的小动物就根据自己的大小在这个区间里找到对应的位置。
比如有一堆长度不同的小木棍,最短的是10厘米,最长的是50厘米,经过归一化处理后,10厘米的小木棍可能就变成0,50厘米的就变成1,中间长度的小木棍也都有了自己在[0,1]区间里的位置。
2.3 极差标准化方法。
这个方法呢,是考虑数据的最大值和最小值的。
就像在一场比赛中,要根据最好成绩和最差成绩来给每个选手重新打分。
比如说一场考试,最高分是95分,最低分是50分,那么其他同学的分数就根据这个极差的范围来重新调整,让所有的分数都能在一个新的、合理的尺度下体现出各自的水平,不会因为原始分数的差距过大而导致分析不准确。