统计软件DPS数据处理系统_简版共155页
- 格式:ppt
- 大小:18.52 MB
- 文档页数:155
第一篇DPS数据处理系统DPS数据处理系统,英文名称为Data Processing System,取首字母缩写为DPS。
该系统采用多级下拉式菜单,用户使用时整个屏幕犹如一张工作平台,随意调整,操作自如,故形象地称其为DPS数据处理工作平台,简称DPS平台。
DPS平台是作者设计研制的通用多功能数理统计和数学模型处理软件系统。
它将数值计算、统计分析、模型模拟以及画线制表等功能融为一体。
因此,DPS 系统主要是作为数据处理和分析工具而面向广大用户。
DPS系统兼有如Excel等流行电子表格软件系统和若干专业统计分析软件系统的功能。
与流行的电子表格系统比较,DPS平台具有强大得多的统计分析和数学模型模拟分析功能。
与国外同类专业统计分析软件系统(如SAS、STAT、STATISTICA等)相比,DPS系统具有操作简便,在统计分析和模型模拟方面功能齐全,易于掌握,尤其是对广大中国用户,其工作界面友好,只需熟悉它的一般操作规则就可灵活应用。
DPS数据处理系统的第一版于1997年出版发行,运行环境是直接写屏的软汉字DOS操作系统。
当前的版本已升级到DPS 7.05版,其运行环境是当前流行的中文Windows 98/2000/XP视窗系统。
DPS数据处理系统集数据全屏幕编辑制表、试验设计及统计分析、多元分析、数值计算以及建立各种数学模型等多项功能为一体,可广泛适用于教学、科研和生产各个领域。
不管是青年学生、还是高级科研人员,不管是计算机应用的初学者,还是经验丰富的计算机应用专家,用户都可以在本系统中找到自己感兴趣或有用的部分。
本篇介绍DPS平台的主要性能和技术特点。
·1·第1章DPS系统简介第1节系统功能简介1.独特优良的人机用户界面一旦开机进入DPS平台系统,用户的整个数据处理过程,无论是计算还是数学公式分析都将处于全屏幕编辑状态。
可把整个系统视为一张稿纸,键盘和鼠标作为笔,用户可以任意地在上面写、擦、画表和进行数值计算、统计分析、建立数学模型等,计算结果也都返回于编辑状态下。
第18章 多因子分析多因子分析是一种将多变量(指标)样本在结构上进行简化的有效方法。
通过分析找到一个包含最佳变量的子集合,使其所包含的变量能反映总体的结构。
这种简化结构的处理对研究多因素之间的规律和构造模型等有重要的作用。
DPS 系统提供的关于多因素分析的主要功能模块包括主成分分析、因子分析、对应分析及典型相关分析等5种分析方法。
18.1 主成分分析18.1.1 基本原理主成分概念由Karl Pearson 于1901年提出,由Hottelling 于1933年推广到随机变量,主成分分析是多元统计分析中的重要统计方法,是用较少的综合指标来代替原来较多的指标。
多元分析中的随机变量,是对同一个体进行测量结果。
从多个实测变量提取较少、互不相关综合指标,反映总体信息,这种综合指标就称为主成分。
主成分分析可在不丢掉主要信息前提下,避开变量间共线性问题,便于继续用其他多元统计方法进行分析。
设两个变量n 个样品,在二维空间分布大致为一椭圆。
作坐标旋转,使新坐标系为椭圆长、短轴方向,坐标旋转公式为⎩⎨⎧+-=+=θθθθcos sin sin cos 212211j j jj j j x x y x x y 对于标准化后的数据,旋转角度为45︒。
如有11个样本的两个变量数据,实施标准化后显示如图18-1中的小圆圈。
图18-1 两变量主成分分析−−坐标旋转·632·第18章 多因子分析从图18-1可以看出,各点坐标呈正相关。
主成分分析,数据点顺时针旋转45︒后处于星号点位置。
这时数据点大部分在横坐标方向,变异(方差)集中在横轴,为第一主成分;纵轴方向变异(方差)较小,为第二主成分。
且相关为零。
一般地,设变量x i 的样本均数和样本样本差分别为i x 和s i ,i =1,2,…,m 。
变量标准化公式为()s x x z i i i /-=对标准化后的变量z i 寻求主成分。
第一主成分C 1是z 1,z 2,…,z m 的线性组合,即m m z a z a z a C 12121111+++=C 1要尽可能多地反映原m 个变量的信息,在121212211=+++m a a a 的条件下,C 1的方差Var(C 1)要尽可能大。
DPS数据处理系统使用要点一..基本参数估计、异常值检基本参数估计将数据在电子表格区(即数据编辑器)输入后,定义成数据块,然后点数据分析→基本参数估计。
就会立即得到基本参数。
异常值检验先将待检验数据输入—→定义为数据块—→点数据分析—→点异常值检验。
如果有异常数据,则异常数据就会变为红色。
(异常值检验)⏹二、次数分布及t 检验1.样本次数分布DPS作次数分布表步骤:(1)输入数据并定义成数据块(2)试验统计→次数分布及平均数比较→次数分布→OK→输出样本次数分布表结果⏹2.单样本均数与总体均数比较的t检验⏹步骤:⏹按行输入7个数,第二行输入总体平均数→定义数据块→选试验统计→单样本平均数检验→在弹出的对话框中输入总体平均数→OK(不能做)⏹3.配对样本t检验⏹步骤:⏹输入数据→定义数据块→选试验统计→两样本比较→配对两处理t检验→输出结果配对样本t检验(不能做)4.两样本均值差异t检验方法:(1)将两个处理的样本观察值分两行输入,并定义成数据块。
(2)试验统计→次数分布及平均数比较→student t检验→输出结果(两样本t检验)5.小样本均值差异检验方法:(1)输入数据,并定义成数据块(2)试验统计→次数分布及平均数比较→样本较少时平均数差异检验→输出(显示)结果。
三、试验设计及统计分析一)全面试验设计(一)单因素完全随机设计 1.试验方案设计 用DPS 系统产生随机数:为安排试验中所有试验次数的试验随机顺序,DPS 系统操作步骤如下: 试验设计→完全随机及随机区组设计→完全随机分组→弹出“完全随机试验设计”对话框→输入“实验样本数”和“分组组数”→确认后就输出要试验的次数的随机顺序。
(样本数和分组数一般是一样的)DPS 单因素试验设计步骤(可以不看) 因素水平按列排列 A1 A2 . Am定义数据块 → 试验设计→完全随机及随机区组设计→单因素随机区组设计→在弹出对话框中输入重复数→OK2.统计分析(方差分析方法) 用DPS 对单因素试验资料分析步骤 ①数据输入格式在数据编辑器中按规定格式将试验资料整理表中的数据输入。