统计思维导图
- 格式:docx
- 大小:8.95 KB
- 文档页数:4
判别分析Discriminant analysis 概念判断样品所属类别的一种多元统计分析方法,根据一批分类明确的样品资料在若干判别指标上的观测值,建立一个关于指标的判别函数和判别法则,使得按此法则来判断这批样品归属类别的正确率达到最高,进而对给定的新样品判断其所属的类别总体。
步骤(1)收集训练样本在定义类别时,单个类内的样本个数不能太少;组的个数不应大于判别变量的个数。
(2)建立判别函数Y b0b1 X1b2 X2bp XP(3)估计判别函数判别准则a:组重心间的距离作为组间差异的标准(两组/方差相近)判别准则b:组间离差平方和/组内离差平方和(即判别函数已解释平方和/未解释平方和)(4)检验判别函数检验判别准则(判别准则的最大值)λ=已解释离差平方和/未解释离差平方和Wilks'Lambda,“反向”评价指标=1/(1+λ),未解释离差平方和/总离差平方和(5)检验判别变量可利用Wilks'Lambda对每个判别变量单独检验其判别能力。
对于显著性检验,可使用F检验代替卡方检验。
(6)将新元素分类分类距离判别法又称最近邻方法基本思想样品和哪个总体距离最近(重心),就判它属哪个总体考虑常涉及多个变量间有相关性且量纲不同--马氏距离适用条件分布无特定的要求,适用于任意分布的资料分类两类总体的判别(协方差矩阵相等/不相等)多类总体的判别判别效果一般要求错判率小于0.1或0.2才有应用的价值。
错判率的估计有训练样本(回代考核)和新样本(前瞻考核)两种方法。
Fisher判别又称典则判别基本思想基本思想是投影,即将k组p维数据投影到某一个方向,使得投影后组与组之间尽可能地分开.借鉴方差分析的思想,即要求投影点的类间离差与类内离差之比最大适用条件分布无特定的要求,适用于任意分布的资料核心步骤计算组间离差阵B和组内离差阵E求特征根和特征向量特征值Eigenvalue:组间平方和与组内平方和之比值;典则相关系数:是组间平方和与总平方和之比的平方根;变换式。
第十一章 第一节统计与概率统计他们都是衡量一组数据波动大小的量 学习误区分不清集中趋势和离散趋势 总体弄不清三种统计图的表达意义的侧重点 个体总结升华统计的相关概念样本知能提升 样本容量扇形统计图样本估计总体的方法 条形统计图统计图表折线统计图数据的收集与整理频率分布图3.确定组距与组数; 直方图画频率分布直方图的步骤 普查 调查的方式画统计图抽样调查从总体中,抽取部分个体进行调查的方式统计 知识梳理//算数平均数画频数分布折线图的方法 学法指导平均数覘養i •踽矿加权平均数众数的大小只与数据中的部分数据有关 中位数分析数据众数 极差利用统计量解决实际问题 方差标准差数形结合法极差、方差与标准差 为了一定的目的,对考察对象进行全面的调查在统计中,所提取的样本个数平均数的大小与每一个数据有关,任一数据的变动都会引起平均数的变动取直方图中每个矩形上边的中点,把这些点用线段依次连接起来即可 在统计中,所有考察对象的全体在统计中,组成总体的每一个考察对象即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况,常用于设计实际应用题 中位数只与数据的排列位置有关,某些数据的变动对它没有影响3.对事件提出合理化的建议这三个量越小,这组数据的波动越小,也越稳定;反之亦然 理解各个统计量的作用,使分析数据更具有方向性 5.列频率分布表;在统计中,实际观测或调查的那部分个体平均数、众数和中位数的区别一组数据中,最大与最小数据的差7.写出统计图的名称和数据来源 4.确定分点 6.画直方图 3.注意题目的侧重点来选取合适的知识解题 2.植物长势的判断 2.计算数据中的最大值与最小值的极差(2)根据已知条件,绘制或补全各类统计图n 个数据按大小顺序排列,处于中间位置的一个数据(或中间两个数据的平均数)1.认真理解各个基本概念的实质,找出区别与联系 (1)观察分析各类统计图表,解决相关问题1.比赛成绩的评估 1.收集数据;(放到统计图内)一组数据中,出现次数最多的那个数(注:有时会有多个)■s 常见的命题形式总体、样本的概念混乱。
描述统计频数分析集中量数数据的集中趋势算数平均数(均值)arithmetic mean计算公式性质中位数 median众数 mode几何平均数 geometric mean调和平均数 harmonic mean特征比较离散量数数据的离散程度全距 range四分位差 quartile deviation平均差 average deviation方差 variance方差也叫变异数, 描述各个数据偏离中心的程度。
方差越大, 数据之间的差异越大。
总体方差&无偏估计总体方差样本数估计总体方差时, 分母为n会低估总体的变异。
可以证明,n -1 为分母时是无偏估计, 故将样本方差定义为平方和除以n-1。
这个n -1 是平和的自由度(degree of freedom)自由度自由度是指当以样本的统计量来估计总体的参数时, 样本中独立或能自由变化的数据的个数。
为什么用样本估计总体方差时, 其自由度就是( n -1 ) ?标准差 standard deviation代数和几何意义标准差即方差的算术平方根。
其最大的优点是与均值及原来变量有相同的见量单位。
计算方差时使了平方, 将数据与均值的" 直线距离“ 转化为“正方形面积” 将其开方, 则是将此面积再化会为直线距。
总体视角:样本均值(标准)估计各观测值时的平均误差个体视角:各观测值距离样本均值(标准)的平均差异应用:标准分数含义:以标准差为单位表示一个原始分数在团体中所处的相对位置,即原始分数在均值以上或以下几个标准差的位置标准分数的应用比较不同性质的观测值在各自数据分布中相对位置的高低身高和体重计算不同质的观测值的总和或者均值,以表示在团体中的相对位置。
高考的标准分线性转换后,表示标准测验分数IQ偏态系数数据的对称性统计图表统计图bar charthistogram chartpolygonline chartsequence chartpie chartscatter chartbox-and-whisker chart盒子的中间横线是中位线,盒子的上下两横线为上下四分位数;按照SPSS的默认选项,如果所有样本中的数目都在离四分位点1.5倍盒子高度之内, 则线的端点为最大和最小值, 否则线长就是1.5倍的盒子高度( 盒子高度称为四分位间距), 在其外面的单独点出。
统计思维导图应用
在统计学的教学工作中我们发现,学生普遍对统计方法的应用及创新存在困惑,究其根本的原因主要是对于知识的不理解,只是单纯地去记忆公式,违背了统计学的特点及规律。
为了解决这个问题,在课堂中引入统计学思维导图,经实践证明,有利于学生掌握统计知识,提高学习效率,增强应用能力及创新能力。
统计学是一门收集、分析、表述和解释数据的学科,在市场营销中有着十分广泛的应用。
首先,变异是社会中普遍存在的现象,采用统计方法,可以发现不确定现象背后隐藏的规律,从而对营销过程中提出的理论假设加以科学的验证。
其次,结合统计学的知识,可以针对企业的特点,开展企业的市场营销管理工作,制定合理的营销策略,对产品的质量进行分析,对客户的需求进行定量化的描述,明确销售工作的重点和关键。
因此,在我国目前的医药市场营销的相关专业中,普遍开设了统计类的课程,但是在教学过程中我们发现,学生在学习统计学时经常不知从何入手,教学内容主要以记忆为主,违背了统计学科应用性的特点,不利于学生对知识的掌握和对方法的创新。
为了让学生更好的理解统计学,应用统计学,我们将思维导图应用于日常的教学工作中,取得了一定的经验效果。
1 统计思维导图
统计学思维导图是表达发散性思维的有效的图形工具,是一种革命性的思维工具。
思维导图采用图文并重的方法,将各级各层的主题关系用相互隶属的
层级图形表现出来,把关键词和图形、图像、颜色等建立记忆链接。
思维导图充分利用人脑的机能,利用记忆、思维等规律,协助人们对问题进行学习和理解,可以将其广泛地应用于统计学的教学工作中。
2 统计学思维导图在教学中的应用
随着多媒体技术的普及,很多高等医学院校都采用了PPT 进行教学,这种教学方法比较直观,能通过生动的图像、声音等方法,调动学生的情绪,提高学习效率。
但是,由于其同样具有大信息量、大容量性的特点,使得学生在学习时感觉吃力,跟不上授课的进度。
而且,多数幻灯片对于学习内容的排列方式是线式的,不符合人脑的发散性思维模式,不利于学生对知识的掌握和理解。
统计学与一般的理科学科有所不同,它的知识自成体系,有逻辑,有层
次,在授课过程中,可以通过统计思维导图来帮助学生加深理解,并在此基础上进行应用及创新。
2.1 思维导图在统计描述中的应用统计描述是统计学中最基本的内容,也是统计分析中重要的一部分。
在统计学中,经常用统计指标和统计图表来揭示和反映原始资料的数量特征和信息。
在药学营销问题中,如果需要对理论问题加以验证,最常用的方法是通过实验数据来说明。
经过严谨的统计设计,将实验中收集的数据进行筛查或转换,然后就可以通过统计描述的方法来总结这组数据的一些重要的特征,使得实验得到的数据表达清晰,便于做进一步的分析。
在统计学中,对数据的描述可以是直观的图表,也可以是客观定量的计
算,无论是何种方式,都需要根据数据的类型及分布的类型等因素进行适当的选
择。
同学们在学习的过程中,经常容易出现的问题就是方法选择的不准
确。
如果计算的指标是错的,那么得到的结论以及后面的所有与之有关的分
析都是没有意义的。
如何能帮助学生掌握正确的选择方法的技巧呢?我们在授课的过程中,将统计描述的主要知识及关键点通过统计思维导图描述出来,具体的图形如图 1 所示。
有了这张图形后,同学们在复习及以后的科研活动中,就可以根据不同的需要、不同的方法、不同的特点,做出正确的选择。
2.2 统计思维导图在统计推断中的作用统计推断是指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
简单来说,统计推断指的是经由上面的统计描述,无论是图表还是指标,我们都可以得到与数据有关的一些特征和特点,但是,这些特征和特点针对的仅仅是样本数据,即总体数据中的一部分,对于总体而言,是否具有相同的特征和特点呢?这需要统计推断来回答。
参数估计是指由样本统计量估计总体参数,主要包括点估计和区间估计两种。
其中点估计由于误差较大,所以在实际中应用较少,主要以区间估计为主。
区间估计即按照预先给定的置信度计算置信区间,使得要估计的总体参数有较大可能落在所计算得到的置信区间内。
在应用中可以根据数据类型的不同选择适当的区间计算方法,相关的思维导图如图 2 所示。
假设检验是统计学中重要的一部分内容,大多数药物制剂与营销问题都需要与假设检验相结合,才能得出更为科学的结论。
假设检验亦称为显著性检验,是先对总体的参数或分布作出某种假设,然后用适当的方法,根据样本对总体提供的信息,推断此假设应当被接受或被拒绝。
这种方法主要是建立在反证法和小概率思想的基础上,当然,所得到的结论并不是完全准确的,有一定的犯错误的概率,但由于概率较小,因此在临床实践中,比一般直观的判断要准确合理得
多。
假设检验方法的选择需要结合数据的类型、分布的
类型、实验设计的类型等因素进行选择,相对较复杂,我们同样可以通过统
计思维导图来展示各种方法的特点,通过这种层级关系的展示,使得这些常用的统计方法更加清晰易懂。
除了前面几种常见统计方法的思维导图外,统计学中一些其他的统计方
法如相关与回归,也可以通过统计思维导图来展示,这种图示的方式更利于学生对技术的掌握及进一步的应用。
3 结论
统计思维导图是一种组织性思维工具,将其运用到医药统计学的教学
工作中,可以帮助学生系统地、有逻辑地、有层次地掌握一些常用的统计方
法,使得统计这门学科不再是一些复杂的公式,而是变成了我们思想中的一
部分,当学生掌握了这种思维后,才能更好地去利用它,达到学以致用的目。