当前位置:文档之家› 多元统计实验报告

多元统计实验报告

多元统计实验报告
多元统计实验报告

数学1001 李倩1010810122

在某年级44名学生的期末成绩中,有的课程采用闭卷,有的课程采用开卷(成绩如下),其中X1,X2,X3,X4,X5分别表示力学(闭),物理(闭),代数(开),分析(开),统计(开)。

(1)试用因子分析分析这组数据。

(2)试对闭卷(X1,X2)和开卷(X3,X4,X5)两组变量进行典型相关分析.

(1)首先我们明确因子分析是一种降维的方法,它将多个变量综合为少数几个因子。首先建立数学模型:

对这道题的具体解法如下:

先将数据写入excel中保存成文本格式,而后用read.table读取数据。> chengji<-read.table("F:/chengji.txt",header=T)

> fact1<-factanal(x=chengji,factors=2,scores="Bartlett")

> fact1

Call:

factanal(x = chengji, factors = 2, scores = "Bartlett")

Uniquenesses:

X1 X2 X3 X4 X5

0.521 0.582 0.363 0.482 0.005

Loadings:

Factor1 Factor2

X1 0.691

X2 0.135 0.633

X3 0.476 0.640

X4 0.545 0.470

X5 0.997

Factor1 Factor2

SS loadings 1.537 1.510

Proportion Var 0.307 0.302 方差贡献率

Cumulative Var 0.307 0.609 累积方差贡献率

Test of the hypothesis that 2 factors are sufficient.

The chi square statistic is 0.11 on 1 degree of freedom.

The p-value is 0.739

Test of the hypothesis that 2 factors are sufficient.

由此可知两个主成分是足够的

载荷矩阵是用“Bartlett”方法得到的,根据结果得到这六门课程与两个潜在因子的关系为:

X1=0.691F2

X2=0.135F1+0.633F2

X3=0.476F1+0.640F2

X4=0.545F1+0.470F2

X5=0.997F1

根据F1和F2的系数知道两个因子与五门课程都有正相关性,第一个因子主要和统计(开)有很强的正相关,相关系数为0.997;而第二个因子主要与力学(闭)、物理(闭)有很强的正相关性分别为0.691、0.633、同时第一个因子和第二个因子与代数(开)、分析(开)均有差不多的正相关性,因此可以讲第一个因子解释为计算因子而将第二个因子解释为理论因子,这样便很好的解释了结果:统计偏向于计算,而力学和物理偏向于理论,代数和分析则于两个因子均有差不多的关系。如果用promax方法进行正交旋转则得到下面的结果:

> chengji<-read.table("F:/chengji.txt",header=T)

> fact1<-factanal(x=chengji,factors=2,rotation="promax")

> fact1

Call:

factanal(x = chengji, factors = 2, rotation = "promax") Uniquenesses:

X1 X2 X3 X4 X5

0.521 0.582 0.363 0.482 0.005

Loadings:

Factor1 Factor2

X1 0.775 -0.240

X2 0.694 -0.114

X3 0.649 0.247

X4 0.445 0.390

X5 -0.114 1.048

Factor1 Factor2

SS loadings 1.715 1.381

Proportion Var 0.343 0.276

Cumulative Var 0.343 0.619

Test of the hypothesis that 2 factors are sufficient. The chi square statistic is 0.11 on 1 degree of freedom. The p-value is 0.739

这时五门课程与两个潜在因子之间的关系变为:

X1=0.775F1-0.240F2

X2=0.694F1-0.114F2

X3=0.649F1+0.247F2

X4=0.445F1+0.390 F2

X5 =-0.114F1+1.048F2

这样的话第一个因子与力学(闭)、物理(闭)、代数(开)有很强的正相关性,相关系数分别为0.775、0.694、0.649,而第二个因子主要与统计(开)有很强的正相关性,相关系数为1.048,分析(开)与两个因子相关性没有太大的区别,同样的我们称第一个因子为“理论因子”称第二个因子为“计算因子”。

显然第二种方法比较好。

(2)数学模型如下:

> ###读取数据

> chengji<-read.table("F:/chengji.txt",header=T) > ###做典型相关分析

> chengji<-scale(chengji)

> ca<-cancor(chengji[,1:2],chengji[,3:5]); ca $cor

[1] 0.62991255 0.09592154

$xcoef

[,1] [,2]

X1 0.09553760 0.1391077

X2 0.08479416 -0.1459052

$ycoef

[,1] [,2] [,3]

X3 0.13114462 0.05212337 0.1268583

X4 0.07651773 -0.01824329 -0.1823259

X5 -0.07715853 -0.16244197 0.0667433 $xcenter

X1 X2

1.892426e-16 -5.724587e-17

$ycenter

X3 X4 X5 3.521489e-16 -4.522897e-16 -2.996341e-18

> ###计算因子得分

> U<-as.matrix(chengji[,1:2])%*% ca$xcoef ; U

[,1] [,2]

[1,] 0.386196021 -0.015394649

[2,] 0.305518286 0.079553680

[3,] 0.148356423 0.086739285

[4,] 0.095209644 -0.085053774

[5,] 0.119162028 0.115037164

[6,] 0.079826145 -0.036646512

[7,] -0.037999834 0.122222768

[8,] -0.132055100 -0.132737321

[9,] 0.061730807 -0.181004995

[10,] 0.015146945 0.294015827

[11,] 0.002293616 -0.078731473

[12,] -0.240969662 -0.362129030

[14,] -0.034854628 -0.014810522 [15,] -0.050762328 0.056435622 [16,] -0.034945463 -0.321770676 [17,] -0.277936237 0.315712228 [18,] -0.067809265 -0.133600625 [19,] -0.021043733 0.005298861 [20,] -0.018946929 -0.086056666 [21,] -0.187298682 -0.213174853 [22,] -0.003563430 -0.134463928 [23,] 0.259801156 -0.105023569 [24,] 0.159979680 -0.108755959 [25,] 0.064442647 0.011760750 [26,] 0.172742173 -0.042968813 [27,] 0.222128710 -0.018263736 [28,] 0.122831435 -0.044835008 [29,] 0.162167319 0.106848667 [30,] 0.135069728 0.043791020 [31,] 0.047919911 -0.201114378 [32,] -0.176632993 -0.056032180 [33,] -0.111772122 0.227225788 [34,] -0.022616336 0.073815506

[36,] -0.303552059 -0.122822218

[37,] -0.199446140 0.005159272

[38,] -0.073051275 0.094788192

[39,] -0.228640535 0.033457151

[40,] -0.070863636 0.310392819

[41,] -0.131964265 0.174222832

[42,] -0.010468878 -0.144518620

[43,] -0.066670028 0.127681765

[44,] -0.050762328 0.056435622

> V<-as.matrix(chengji[,3:5])%*% ca$ycoef ; V

[,1] [,2] [,3] [1,] 0.130913472 -0.2536506284 0.028******* [2,] 0.192506357 -0.2221985749 0.1248618323 [3,] 0.216507338 -0.0885843063 -0.1618898620 [4,] 0.136968404 -0.1275490453 -0.0098790666 [5,] -0.032787111 -0.1909871285 -0.0457739647 [6,] 0.093548574 -0.0126687962 -0.1052233512 [7,] 0.033900391 -0.0565815681 0.2124558555 [8,] -0.066160788 -0.1947187236 0.1327777664 [9,] -0.138128648 -0.0265865595 0.028******* [10,] 0.090390403 0.1038894251 0.0305958954

[11,] -0.022984475 0.0155263033 -0.2536771482 [12,] 0.047425280 -0.1407515604 -0.0320887077 [13,] -0.149497643 0.010******* 0.2383330591 [14,] 0.069901863 0.1438398347 -0.2176716859 [15,] 0.135629050 0.2550973189 0.2409047172 [16,] -0.163964957 0.0376559223 -0.0317846562 [17,] -0.071819488 -0.1235470277 -0.1283178526 [18,] -0.252236836 0.0007218597 0.1943009251 [19,] -0.005620400 0.2312569412 0.1138309830 [20,] -0.064981724 0.1992214164 0.0654675543 [21,] 0.015196961 0.1103341582 0.0957315082 [22,] -0.193515263 0.1606093815 0.0603896045 [23,] 0.399618514 -0.1677698773 0.1782755697 [24,] 0.155512242 -0.1550387365 -0.1756027601 [25,] 0.228262932 -0.1265040396 0.1604525053 [26,] 0.217812290 0.0268069723 0.0698266635 [27,] 0.127073588 0.0836092104 -0.1175813176 [28,] 0.113877520 0.0868068294 -0.1394038105 [29,] 0.064554094 0.1681319069 -0.0301254996 [30,] -0.008483456 0.1277199630 -0.0001381297 [31,] 0.068461390 0.1091177204 0.0828481885 [32,] 0.090281028 -0.0815066068 -0.0359222900

[33,] -0.091247972 -0.0729322070 0.3208493060 [34,] -0.082345799 -0.0165092215 -0.3020405768 [35,] -0.154827522 0.0009260784 -0.2891296160 [36,] -0.287100508 -0.3500702518 -0.0084789371 [37,] -0.221204094 -0.1803591057 -0.0987176308 [38,] 0.006750874 0.1242420817 -0.1962363411 [39,] -0.292010082 -0.2213545210 -0.020******* [40,] 0.016232945 0.1797554402 -0.021******* [41,] -0.004693790 0.1152821912 -0.0699369031 [42,] 0.011247703 0.2621979652 -0.1169177590 [43,] -0.153522570 0.1163173570 -0.0574130905 [44,] -0.205440085 0.1400754530 0.2868623340 > ###找对数

> corcoef.chengji<-function(r, n, p, q, alpha=0.1){

+ m<-length(r); Q<-rep(0, m); lambda <- 1

+ for (k in m:1){

+ lambda<-lambda*(1-r[k]^2);

+ Q[k]<- -log(lambda)

+ }

+ s<-0; i<-m

+ for (k in 1:m){

+ Q[k]<- (n-k+1-1/2*(p+q+3)+s)*Q[k]

+ chi<-1-pchisq(Q[k], (p-k+1)*(q-k+1))

+ if (chi>alpha){

+ i<-k-1; break

+ }

+ s<-s+1/r[k]^2

+ }

+ i

+ }

> corcoef.chengji(r=ca$cor,n=44,p=2,q=3)

[1] 1

由结果可知只需选一对典型变量就可以了。

U1=0.09553760 X1*+0.08479416X2*

V1=0.13114462X3*+0.07651773X4 *-0.07715853X5*

U1、V1的相关系数为0.62991255,具有正相关关系,但是相关性不高。U1中都是闭卷,权系数都不大,V1中都是开卷,权系数最大的是代数(开)为0.13114462,其次是分析(开)为0.07651773,学好了分析和代数对力学和物理有促进作用,于是(U1、V1)这对典型变量主要反映了基础课--专业课的关系。体现的是考试方法的特点。

0.62991255为第一对典型变量的相关系数,所以比较分散。

散。

统计学实验报告汇总

本科生实验报告 实验课程统计学 学院名称商学院 专业名称会计学 学生姓名苑蕊 学生学号0113 指导教师刘后平 实验地点成都理工大学南校区 实验成绩 二〇一五年十月二〇一五年十月

依据上述资料编制组距变量数列,并用次数分布表列出各组的频数和频率,以及向上、向下累计的频数和频率, 并绘制直方图、折线图。 学生 实验 心得

2.已知2001-2012年我国的国内生产总值数据如表2-16所示。 学生 实验 心得 要求:(1)依据2001-2012年的国内生产总值数据,利用Excel软件绘制线图和条形图。

(2)依据2012年的国内生产总值及其构成数据,绘制环形图和圆形图。 学生 实验 心得 3.计算以下数据的指标数据 1100 1200 1200 1400 1500 1500 1700 1700 1700 1800 1800 1900 1900 2100 2100 2200 2200 2200 2300 2300 2300 2300 2400 2400 2500 2500 2500 2500 2600 2600 2600 2700 2700 2800 2800 2800 2900 2900 2900 3100 3100 3100 3100 3200 3200 3300 3300 3400 3400 3400 3500 3500 3500 3600 3600 3600 3800 3800 3800 4200

4.一家食品公司,每天大约生产袋装食品若干,按规定每袋的重量应为100g。为对产品质量进行检测,该企业质检部门采用抽样技术,每天抽取一定数量的食品,以分析每袋重量是否符合质量要求。现从某一天生产的一批食品8000袋中随机抽取了25袋(不重复抽样),测得它们的重量分别为: 学生实验心得 101 103 102 95 100 102 105 已知产品重量服从正态分布,且总体方差为100g。试估计该批产品平均重量的置信区间,置信水平为95%.

SPSS实验报告(一)

SPSS实验报告(一)

湖南涉外经济学院 实验报告 课程名称:应用统计软件分析(SPSS) 专业班级: 姓名 学号: 指导教师: 职称:副研究员 实验日期: 2016.4.19 成绩评定指导教 师 签字 签字 日期

学生实验报告实验序号 一、实验目的及要求 实验目的 通过本次实验,使学生熟练掌握转换菜单和数据菜单的具体功能及操作,熟练应用两个菜单中的计算变量、重新编码、选择个案、个案排序、分类汇总等几个主要过程 实验要求 能够根据相关要求选用正确的过程对变量或者文件进行管理和操作,得到结果,并能对得出的结果进行解释。 二、实验描述及实验过程 实验描述一、下载数据(以下情况选一种): (一)分地区(31个省市区)环境污染治理投资数据(2014年) 环境污染治理投资总额(亿元),城市环境基础设施建设投资额(亿元) ,城市燃气建设投资额(亿元) ,城市集中供热建设投资额(亿元),城市排水建设投资额(亿元),城市园林绿化建设投资额(亿元),城市市容环境卫生建设投资额(亿元)

工业污染源治理投资(万元) 建设项目“三同时”环保投资额(亿元) (二)分地区(31个省市区)经济发展总体数据(2014年) 国民总收入,国内生产总值,第一产业增加值,第二产业增加值,第三产业增加值,人均国内生产总值,人口总量,城镇失业率,基尼系数等 (三)各省市房地产开发2014年相关数据 投资额,房地产开发企业个数,从业人员数,收入,税金,利润,资产,负债,平均销售价格,等等。 (四)各省市科技2014年相关数据 包括GDP,研发投入,研发投入强度(研发投入/GDP),R&D研发人员,专利授权数,发明专利授权量。 (五)查找相关行业(钢铁行业、水泥行业、医药制造、工程机械、汽车制造业、旅游酒店行业、航空、电子商务企业等)上市公司2015年度数据。包括销售收入、利润、固定资产净值、总资产利润率、营业利润率、销售净利率、净资产收益率、流动比率、资产负债率、主营业务收入增长率、营收账款周转率、存货周转

多元统计学SPSS实验报告一

华东理工大学2016–2017学年第二学期 《多元统计学》实验报告 实验名 称实验1数据整理与描述统计分析

教师批阅:实验成绩: 教师签名: 日期: 实验报告正文: 实验数据整理 (一)对“employee”进行数据整理 1.观察量排序 ( based on current salary) 2.变量值排序(based on current salary : rsalary) 3.计算新的变量(incremental salary=current salary - beginning salary)

4.拆分数据文件(based on gender) 结论:There are 215 female employees and 259 male employees. 5.分类汇总 (break variable: gender ; function: mean ) 结论:The average current salary of female is . The average current salary of male is . (二)分别给出三种工作类别的薪水的描述统计量 实验描述统计分析 1)样本均值矩阵 结论:总共分析六组变量,每组含有十个样本。 每股收益(X1)的均值为;净资产收益率(X2)的均值为;总资产报酬率(X3)的均值为;销售净

利率(X4)的均值为;主营业务增长率(X5)的均值为;净利润增长率(X6)的均值为. 2)协方差阵 结论:矩阵共六行六列,显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)的协方差。 3)相关系数 结论:矩阵共六行六列,显示了每股收益 (X1)、净资产收益率(X2)、总资产报酬 率(X3)、销售净利率(X4)、主营业务增 长率(X5)和净利润增长率(X6)之间的 相关系数。 每格中三行分别显示了相关系数、显著性 检验与样本个数。 4)矩阵散点图

(完整word版)运动会分数统计系统实验报告

运动会分数统计系统的实现 09计科(2)班 E10914044 杨素传 一、设计要求 1、问题描述 参加运动会有n个学校,学校编码为1,2,…,n,比赛分成m个男子项目和w个女子项目。项目编号为男子1,2,…,m,女子m+1,m+2,…,m+w。不同的项目取前五名或前三名积分;取前五名的积分分别为7,5,3,2,1;前三名的积分分别5,3,2;哪些取前五名或前三名由学生自己设定(m<=20,n<=20)。 2、需求分析 (1)可以输入各个项目的前三名或前五名成绩; (2)能统计各学校成绩; (3)可以按学校编号、学校总分、男女团体总分排序输出; (4)可以按学校编号查询学校某项目情况,可以按项目编号查询取得前三名或前五名的学校。 二、概要设计 1、主界面设计 为了实现运动会分数统计系统,设计一个含有多个菜单项的主控菜单子程序以连接系统的各项子程序,方便用户使用本程序。本系统主控菜单运行界面图1所示。 图1 运动会分数统计系统程序主菜单 2、存储结构设计 本程序采用链式存储类型(LNode)存储运动会分数统计系统的节点信息。运动会分数统计系统的链表中的结点包括8个域:项目编号域(objnum)、项目类型(objtype)、运动员编号(athnum)、运动员姓名(athname[20])、学校编号(schnum)、校名(schname[30])、

运动员分数(athscore)和指向下一个节点的指针欲(struct LNode *next)。 3、系统功能设计 本系统设置了8个子功能菜单。8个子功能的设计描述如下: (1)录入各项目的成绩。由函数creatLink()实现。当用户选择该功能时,系统会以用户输入的数据运动会分数统计链表。 (2)统计各学校分数。由函数schoolScore()实现。当用户选择该功能时,系统会统计各学校分数。 (3)按学校编号顺序输出。由函数printfSchoolNumber()实现。当用户选择该功能时,系统会按学校编号顺序输出数据。 (4)按学校总分顺序输出。由函数printfSchoolScore()实现。当用户选择该功能时,系统会按学校总分顺序输出数据。 (5)按男女团体总分顺序输出。由函数printfManWomanScore()实现。当用户选择该功能时,系统会按男女团体总分顺序输出数据。 (6)按学校编号查询学校某项目情况。由函数printfSchoolObject()实现。当用户选择该功能时,系统会按学校编号输出学校某项目情况。 (7)按项目编号查询取得前三名或前五名的学校。由函数printfObjectSchool()实现。当用户选择该功能时,系统会按项目编号查询取得前三名或前五名的学校情况。 (8)退出。由exit(0)函数实现。 三、模块设计 1、模块设计 本程序包含两个模块:主程序模块和工作区选择模块。其调用关系如图2所示。 主程序模块工作区选择模块 图2 模块调用示意图 2、系统子程序及功能设计 本系统共设置个6子程序,各子程序的函数名及功能说明如下。 (1)LinkList creatLink() //创建链表(录入各项目的成绩) (2)int schoolScore(LinkList L) //统计各学校总分 (3)void printfSchoolNumber() //按学校编号顺序输出 (4)void printfSchoolScore() //按学校总分顺序输出 (5)void printfManWomanScore(LinkList L //按男女团体总分排序输出 (6)void printfSchoolObject(LinkList L) //按学校编号查询学校某项目情况 (7)void printfObjectSchool(LinkList L) //按项目编号查询取得前三名或前五名的学校 (8)int main() //主函数 3、函数主要调用关系图 本系统6个子系统之间的主要调用关系如图3所示,图中数字是各函数的编号。

多元统计分析实验报告

实验一 一、实验目的及要求 对应分析是你也降维的思想以达到减化数据结构的目的,凤的研究广泛用于定义属性变量构成的列联表利用对应分析方法分析问卷中教育程度与网上购物支付方式之间的相互关系。 二、实验环境 SPSS 19.0 window 7系统 三、实验内容及实验步骤(实践内容、设计思想与实现步骤) 实验题目: 通过分析问卷数据,绘制如下的教育程度与网上购物支付方式的交叉表,运用对应分析方法研究教育程度与网上购物所选择的支付方式之间的相关性,及揭示不同人群网上购物的特征等问题。 设计思想:原假设:H1:χ2>χα2[(n?1)(p?1)] 实现步骤: 1.在变量视窗中录入3个变量,用edu表示【教育程度】,用fangshi表示【在网上购物时采用什么样的支付方式】,用pinshu表示【频数】;如图所示:

2.先对数据进行预处理。执行【数据】→【加权个案】命令,弹出【加权个案】对话框。选中【加权个案】按钮,把【频数】放入【频率变量】框中,点击【确定】按钮完成。 3.打开主窗口,选择菜单栏中的【分析】→【降维】→【对应分析】命令,弹出【对应分析】对话框。 4.将【教育程度】导入【行】,将【在网上购物时采用什么样的支付方式】导入【列】。 5. 单击【定义范围(D)】,打开【对应分析:定义行范围】对话框; 定义行变量分类全距最小值为1,最大值为4,单击【更新】;点击【继续】,返回【对应分析】对话框;同方法打开【对应分析:定义列范围】对话框; 定义列变量全距最小值为1,最大值为5,单击【更新】; 6. 单击【统计量】打开【对应分析:统计量】对话框;选择【行轮廓表】,【列轮廓表】;单击【继续】,返回【对应分析】对话框, 7.选择【绘制】→【对应分析:图】对话框,选择【散点图】中的【行点】、【列点】选择【线图】中的【已转换的行类别】、【已转换的列类别】,单击【继续】,返回【对应分析】对话框。 8.单击【确定】按钮,完成设置并执行列联表分析。 四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。记录实验的结果) SPSS实验结果及分析: 上表显示了在32155名被调查者中,大多数消费者在网上购物时选择第三方支付和网上银行支付,在网上购物的消费人群以大学本科生相对最多。

多元统计分析实验报告

1. 正态性检验 Kolmogorov-Smirnov a Shapir o-Wilk 统计量df Sig. 统计量df Sig. 净资产收益率.113 35 .200*.978 35 .677 总资产报酬率.121 35 .200*.964 35 .298 资产负债率.086 35 .200*.962 35 .265 总资产周转率.180 35 .006 .864 35 .000 流动资产周转率.164 35 .018 .885 35 .002 已获利息倍数.281 35 .000 .551 35 .000 销售增长率.103 35 .200*.949 35 .104 资本积累率.251 35 .000 .655 35 .000 *. 这是真实显著水平的下限。 a. Lilliefors 显著水平修正 此表给出了对每一个变量进行正态性检验的结果,因为该例中样本中n=35<2000,所以此处选用Shapiro-Wilk统计量。由Sig.值可以看到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面的分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成的向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司的获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似的度量。 2. 主体间因子 N 行业电力、煤气及水的生产和供应 业 11 房地行业15 信息技术业9 多变量检验a 效应值 F 假设 df 误差 df Sig. 截距Pillai 的跟踪.967 209.405b 4.000 29.000 .000 Wilks 的 Lambda .033 209.405b 4.000 29.000 .000 Hotelling 的跟踪28.883 209.405b 4.000 29.000 .000 Roy 的最大根28.883 209.405b 4.000 29.000 .000 行业Pillai 的跟踪.481 2.373 8.000 60.000 .027 Wilks 的 Lambda .563 2.411b8.000 58.000 .025 Hotelling 的跟踪.698 2.443 8.000 56.000 .024 Roy 的最大根.559 4.193c 4.000 30.000 .008 a. 设计 : 截距 + 行业

统计实验报告

浙江万里学院实验报告 课程名称:2011/2012学年第二学期统计实验 实验名称: 统计推断 专业班级:金融107 姓名:吴妮娜2010011245 李红叶2010011246 赵烨2010011248 一、实验目的:通过本实验项目,使学生熟悉点估计概念与操作方法, 熟悉区间估计的概念与操作方法,熟练掌握T 检验的SPSS 操作以及学会利用T 检验方法解决身边的实际问题。 二、实验内容:1.单个总体均值的区间估计 2.两个总体均值之差的区间估计 (1)Group Statistics (分组统计量)表 (2)Independent Sample Test (独立样本T 检验)表 3.单个总体均值的假设检验 (单样本T 检验) 4.两独立样本的假设检验(两独立样本T 检验) 5.配对样本T 检验 三、实验过程: 1.单个总体均值的区间估计 打开SPSS ,选择区间估计选项,方法如下: 选择菜单“Analyze —>Descriptive Statistics —>Explore ” ,打开图3.1Explore 。将变量移入Dependent List 框中。单击上图右下方的“Statistics ”按钮打开“Explore: Statistics ”。在Confidence Interval for Mea n:的选项中,键入95%,表示计算选择的置信区间。完成后单击“Continue ”按钮回到Explore 窗口。返回主窗口点击ok 运行操作。 2.两个总体均值之差的区间估计 打开SPSS ,按如下图示格式输入原始数据,建立数据文件。计算两总体均值之差的区间估计,采用“独立样本T 检验”方法。选择菜单“ Analyze →Compare Means →Independent-Sample T Test ”, 打开Independent-Sample T Test 对话框。定义分组 单击Grouping Variable 框下面的Define Groups 按钮,打开Define Groups 。在Group1 中输入1,在Group2 中输入2。完成后单击“Continue ”按钮回到Independent-Sample T Test 窗口。计算结果 单击上图中“OK ”按钮,输出结果。 成绩: 教师:

统计学实验报告1

统计学实验报告1 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

实验报告

二、打开文件“数据 3.XLS”中“城市住房状况评价”工作表,完成以下操作。 1)通过函数,计算出各频率以及向上累计次数和向下累计次数;2)根据两城市频数分布数据,绘制出两城市满意度评价的环形图三、打开文件“数据 3.XLS”中“期末统计成绩”工作表,完成以下操作。 1)要求根据数据绘制出雷达图,比较两个班考试成绩的相似情况。 实验过程: 实验任务一: 1)利用函数frequency制作一张频数分布表 步骤1:打开文件“数据 3. XLS”中“某公司4个月电脑销售情况”工作表 步骤 2.在“频率(%)”的右侧加入一列“分组上限”,因统计分组采用“上限不在内”,故每组数据的上限都比真正的上限值小0.1,例如:“140-150”该组的上限实际值应为“150”,但我们为了计算接下来的频数取“149.9”. 步骤3.选定C20:C29,再选择“插入函数”按钮 3 步骤 4.选择类别“统计”—选择函数“FREQUENCY”

步骤5.在“data_array”对话框中输入“A2:I13”,在“bins_array”对话框中输入“E20:E29 该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限. 步骤6.选定C20:C30区域,再按“自动求和” 按钮,即可得到频数的合计

步骤7.在D20中输入“=(C20/$C$30)*1OO” 步骤8:再将该公式复制到D21:D29中,并按“自动求和”按钮计算得出所有频率的合计。

多元统计实验报告--因子分析

多元统计实验报告设计题目:因子分析

一、分析数据 1995年我国社会发展状况的数据 二、基本原理 因子分析的基本思想是把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。 三、实验步骤及其结果分析 1、选择Analyze→Data Reduction→Factor,打开Factor Analysis主对话框; 2、选择变量X1至X6,点击向右的箭头按钮,将六个变量移到Variable栏中; 3、点击Descriptives…按钮,打开Descriptives子对话框。在此对话框的Statistics下选择Initial solution;Correlation Matrix下选择coefficients,单击Continue按钮,返回Factor Analysis主对话框; 4、单击Extraction…按钮,打开Extraction子对话框。在此对话框的Method 下选择Principal components;Analyze下选择Correlation Matrix;Extract下选择Number of Factor,并在其右端的矩形框键入6;Display下选择Unrotated factor 和Scree plot,单击Continue按钮,返回Factor Analysis主对话框;点击OK按钮,显示结果清单。

(1)相关矩阵 从表Correlation Matrix(相关矩阵)可知,各变量间存在较强的相关关系,因此有必要进行因子分析。表中主对角线上的元素为1,表明变量自身于自身的相关系数为1。 (2)解释总方差 从表Total Variance Explained(解释总方差)可知,前三个因子一起解释总方差的93.466%(累计贡献率),这说明前三个因子提供了原始数据的足够信息。 5、根据以上分析提取因子情况,单击Extraction…按钮,打开Extraction子对

多元统计分析实验报告,计算协方差矩阵,相关矩阵,SAS

院系:数学与统计学学院 专业:__统计学 年级:2009 级 课程名称:统计分析 ____ 学号:____________ 姓名:_________________ 指导教师:____________ 2012年4月28日 (一)实验名称 1. 编程计算样本协方差矩阵和相关系数矩阵;

2. 多元方差分析MANOVA。 (二)实验目的 1. 学习编制sas程序计算样本协方差矩阵和相关系数矩阵; 2. 对数据进行多元方差分析。 (三)实验数据 第一题: 第二题:

(四)实验内容 1. 打开SAS软件并导入数据; 2. 编制程序计算样本协方差矩阵和相关系数矩阵; 3. 编制sas程序对数据进行多元方差分析; 4. 根据实验结果解决问题,并撰写实验报告; (五)实验体会(结论、评价与建议等) 第一题: 程序如下: proc corr data=sasuser.sha n cov; proc corr data=sasuser.sha n no simple cov; with x3 x4; partial x1 x2; run; 结果如下: (1)协方差矩阵 $AS亲坯 曲;15 Friday, Apr: I SB,沙DO COUR过程 x4 目由度=30 Xi x2x3x4x5X? -10.I9B4944-0.45E2GJ5I.3347097-G.1193E48-£0.e75?GS

-ID. 188494669,36&Q3?9-7.22IO&OS1J5692043I5.49ee^91S.Oa97SM -8.45S2645■7,221050829.S78&S46-6.372E47I-15.3084183-21.7352376-11.5674785 1.3841097 1.G5S2M7t.3726171IJ24?17B 4.e093011 4.4C12473 2.B747CM -G. I1S3S49 1.GS92043-is.soul aa 4.B09B01I68.7978495劣』S670971S.57ai1B3 -IH.05l6l?a15.43S6569-J1.73S2376孔耶124TB27.0387097105.103225&S7.3505S7E: -2D K5752??319-11337204-1L55M7S52r9747?3i19,573118337.3S0&87E33.3SQ6452 (2) 相关系数矩阵 Pearson相关系数” N =引 当HO: Rho=0 时.Prob > |r| Xi Xi xl 1.QQ000 x2 -C.23954 0.2061 x3 -0,30459 0.0957 x4 0.18975 Q.3092 x5 '0.14157 0.4475 x6 -0.83787 0.0630 -0.49292 0.0150 x2-0.23354 1.00000-0.162750.143510.022700.181520.24438 x20.20C10.31:1?0.441?0.90350.32640.1761 x3-0.30459-0.16275 1.00000-0.06219-0.34641-0.^797-0.23674 x30.095?0.381?<.00010.0563o.oses0 JS97 x40.1S8760.14351-0.86219L000000.400540,313650.22610 x40.30920.4412<.0001 D.02EG Q.085S0.2213 x5-0J 41570.02270-0.946410.40054 1.000000.317370.26750 x50.4J750.90350.0G68Q.025&0.08130 + 1620 x6-0.33?e?0.1S162-0.397970.813650.31787LOOOOO0.82976 x60.0S300.32840.02660.08580.0813C0001辺-0.432920.24938-0.288740.22810 D.267600.92976 1.00000 x70,01500J7610.19970.22130JG20<.0001 第二题: 程序如下: proc anova data=sasuser.hua ng; class kind; model x1-x4=k ind; manova h=k ind; run; 结果如下: (1)分组水平信息 The ANNA Procedure Cla^s Level Informat ion Class Level?Values kind 3 123 Number of observatIons CO (2) x1、x2、x3、x4的方差分析

概率统计实验报告

概率统计实验报告 班级16030 学号16030 姓名 2018 年1 月3 日

1、 问题概述和分析 (1) 实验内容说明: 题目12、(综合性实验)分析验证中心极限定理的基本结论: “大量独立同分布随机变量的和的分布近似服从正态分布”。 (2) 本门课程与实验的相关内容 大数定理及中心极限定理; 二项分布。 (3) 实验目的 分析验证中心极限定理的基本结论。 2、实验设计总体思路 2.1、引论 在很多实际问题中,我们会常遇到这样的随机变量,它是由大量的相互独立的随机 因素的综合影响而形成的,而其中每一个个别因素在总的影响中所起的作用是微小的,这种随机变量往往近似的服从正态分布。 2.2、 实验主题部分 2.2.1、实验设计思路 1、 理论分析 设随机变量X1,X2,......Xn ,......独立同分布,并且具有有限的数学期望和方差:E(Xi)=μ,D(Xi)=σ2(k=1,2....),则对任意x ,分布函数 满足 该定理说明,当n 很大时,随机变量 近似地服从标准正 态分布N(0,1)。因此,当n 很大时, 近似地服从正 态分布N(n μ,n σ2). 2、实现方法(写清具体实施步骤及其依据) (1) 产生服从二项分布),10(p b 的n 个随机数, 取2.0=p , 50=n , 计算n 个随 机数之和y 以及 ) 1(1010p np np y --; 依据:n 足够大,且该二项分布具有有限的数学期望和方差。 (2) 将(1)重复1000=m 组, 并用这m 组 ) 1(1010p np np y --的数据作频率直方图进 行观察. 依据:通过大量数据验证随机变量的分布,且符合极限中心定理。

多元统计分析实验报告

多元统计分析实验报告 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

1. 正态性检验 Kolmogorov-Smirnov a Shapir o-Wilk 统计量df Sig.统计量df Sig. 净资产收益 .11335.200*.97835.677 率 总资产报酬 .12135.200*.96435.298 率 资产负债率.08635.200*.96235.265 总资产周转 .18035.006.86435.000 率 流动资产周 .16435.018.88535.002 转率 已获利息倍 .28135.000.55135.000 数 销售增长率.10335.200*.94935.104 资本积累率.25135.000.65535.000 *. 这是真实显着水平的下限。 a. Lilliefors 显着水平修正 此表给出了对每一个变量进行正态性检验的结果,因为该例中样本中 n=35<2000,所以此处选用Shapiro-Wilk统计量。由Sig.值可以看到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面的分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成的向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司的获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似的度量。 2. 主体间因子 N

行业电力、煤气及水的 生产和供应业 11 房地行业15 信息技术业9 多变量检验a 效应值F假设 df 误差 df Sig. 截距Pillai 的跟 踪 .967.000 Wilks 的 Lambda .033.000 Hotelling 的跟踪 .000 Roy 的最大 根 .000 行业Pillai 的跟 踪 .481.027 Wilks 的 Lambda .563.025 Hotelling 的跟踪 .698.024 Roy 的最大 根 .559.008 a. 设计 : 截距 + 行业 b. 精确统计量 c. 该统计量是 F 的上限,它产生了一个关于显着性级别的下 限。 上面第一张表是样本数据分别来自三个行业的个数。第二张表是多变量检验表,该表给出了几个统计量,由Sig.值可以看到,无论从哪个统计量来看,三个行业的运营能力(从净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标的整体来看)都是有显着差别的。 3. 主体间效应的检验

运动会成绩统计 实验报告

实验说明 题目:运动会分数统计 一.需求分析: 1.在该程序中,参赛学校编号为1~n(n<=20)。比赛分成m(m<=30)个 男子项目和w(w<=20)个女子项目,分别编号为1~m和m+1~m+w, 姓名长度不超过20个字符; 2.输入各个项目信息的详细信息,包括项目号,姓名,性别,学校和名 次。 3.对于项目编号为奇数的取前五名,得分顺序为7,5,3,2,1;为偶数 的取前三名,得分顺序为5,3,2。 4.程序执行的命令包括: 1)构造线性表的存储结构。 2)根据每个学生的名次确定相应的得分。 3)输出各个学校的成绩单和男子团体总分,女子团体总分和团体总分。二.概要设计 1.该程序包含两个结构体分别为: 结构体(1)运动员信息 结构体(2)学校信息 2.本程序包括4个模块: 1>初始化学校信息。 2>依次输入每个运动员的信息。 3>根据每个学生的成绩计算对应的得分,及个学校的总得分、男团总分、 女团总分。

4>生成个学校的成绩单,并输出。三.详细设计 1.数据结构的定义: ○1描述运动员的线性表 typedef struct { int item[MAXSIZE]; //参赛项目号 char thletename[MAXSIZE][20];//姓名 char sex[MAXSIZE];//性别 int schoolnum[MAXSIZE];//所在学校编号 int num[MAXSIZE];//名次 int point[MAXSIZE];//得分 int last; }Thlete; ○2描述学校的线性表 typedef struct { int schoolnum[MAXSIZE];//学校编号 int Tgirl[MAXSIZE];//女生团体总分 int Tboy[MAXSIZE];//男生团体总分 int Tall[MAXSIZE];//学校总成绩 int last; }School; ○3.控制输入的函数 int input(Thlete *S1,int n,int m,int w)

统计学实验报告

统计学实验报告 一.实验步骤总结数据的搜集与整理 一.数据的搜集 ●间接数据的搜集 方法一:直接通过进入专业的数据库网站查询数据 方法二:使用搜索引擎进行数据的搜索 ●直接数据的搜集 抽样调查: 1.调查方案设计 2.调查问卷设计 3.问卷发放 4.问卷回收 二.数据的整理 ●数据编码 1.在Excel中选择三列,将三列分别命名,后两列为:编码符号、代表含义 2.数据搜集好后,按照他们的特征进行分类,并依次放入第一列 3.在“编码符号”列为每一个列别编码,并在“代表含义”列说明编码的含义 ●数据的录入 转置(行与列换位): 1.激活数据所在单元格 2.单击鼠标右键,选中“复制” 3.在空白处激活另一单元格,点击鼠标右键,选中“选择性粘贴”项。 4.在弹出的“选择性粘贴”对话框中,粘贴项选中“全部”,运算选中“无”,选中“转置” 复选框,点击确定按钮既得转置的结果。 单元格内部换行:“Alt+Enter”组合键 ●数据的导入 方法一:1.单击菜单栏“文件—打开”,在弹出的的“打开”对话框中找到要导入的文件。 2.双击鼠标左键或者单击打开按钮,所需要的文件就被导入了。 方法二:1.单击菜单栏“数据—导入外部数据—导入数据”,在弹出的“选取数据源”的对话框中找到要导入的文件。 2.双击鼠标左键或者单击打开按钮,所需要的文件就被导入了。 ●数据的筛选 自动筛选: 1.选中要筛选的数据区域 2.使用菜单栏中的“数据—筛选—自动筛选”,这时每列的第一个单元格的右边都会出现 一个下拉箭头,我们就可以通过下拉菜单中的选择实现筛选。 3.如果选择了下拉菜单中的“自定义”,就会弹出一个“自定义自动筛选方式”对话框, 在对话框中可自己选择筛选条件,然后点击确定按钮。 高级筛选: 1. 将要筛选数据区域的列标题复制粘贴在空白区域,并在他们对应下的单元格中输入所要

统计学原理实验报告1

附件1 中北大学经济与管理学院 实验报告 课程名称统计学原理学号学生姓名辅导教师 系别经济学系实验室名称信息化综合实验室实验时间2010-12-23 1.实验名称 EXCEL的基本统计功能 2. 实验目的 1、能熟练地运用Excel进行数据筛选、排序。 2、熟练掌握统计资料分组的方法、变量数列的编制方法、统计表的设计和统计图的绘制。 3、能熟练地运用Excel创建统计表和统计图。 3. 实验内容 “数据”—“筛选”,满足单方面要求时,选择自动筛选,满足多方面要求时,选择高级筛选。 8名学生的成绩 姓名统计数学英语经济学 a 83 72 66 71 b 54 88 8484 c 75 58 76 90 d 75 96 81 83 e 69 68 84 86 f 81 60 86 64 g 87 76 92 77 h 91 75 95 94 要求: (1)找出数学成绩等于88分的学生 (2)经济学成绩最低的两名学生 (3)四门课程都高于70分的学生 4. 实验原理 原理:单击数据区域内的任何一个单元格 (1)选取“数据”菜单中的“排序”命令 (2)选择主要关键字 (3)指定“升序”或“降序”

5. 实验过程及步骤 1.在excel表中粘贴出8名学生的成绩 2.选中“数学”栏,点击“数据-筛选-自动筛选-数学-88 3.选中“经济学”栏,点击“数据-筛选-自动筛选-经济学-小于或等于71” 4.选中“统计、数学、英语、经济学”栏,点击“数据-筛选-自动筛选-统计-大于70, 数学-大于70,英语-大于70,经济学-大于70” 6.实验结论及心得 通过实验操作,了解了excel表格在统计中的强大功能,这大大减少了我们的工作量。充分说明了excel的作用,是一个值得我们大力推广和使用的软件。 我院任课教师有实验课的均要求有实验报告,每个实验项目要求有一份实验报告,实验报告按照格式书写完毕后,经辅导实验的教师批改后按照实验室收集存档。

多元统计分析实验报告doc

多元统计与程序设计》课程实验报告 项目名称: 学生姓名: 学生学号: 指导教师: 完成日期:

1 实验内容 2 模型建立与求解 2.1聚类分析的形成思路 2.2.1类平均法 2.2.2谱系图的形成 2.3.快速聚类法 (以上内容见课本) 3 实验数据与实验结果 3.1实验数据 设有20个土壤样品分别对5个变量的观测数据如表5.16所示,试利用 聚类法对其进行样品聚类分析 样品号 含沙量1X 淤泥含量2X 粘土含量3X 有机物4X PH 值5X 1 77.3 13.0 9.7 1.5 6.4 2 82.5 10.0 7.5 1.5 6.5 3 66.9 20.0 12.5 2.3 7.0 4 47.2 33.3 19.0 2.8 5.8 5 65.3 20.5 14.2 1.9 6.9 6 83.3 10.0 6.7 2.2 7.0 7 81.6 12.7 5.7 2.9 6.7 8 47.8 36.5 15.7 2.3 7.2 9 48.6 37.1 14.3 2.1 7.2 10 61.6 25.5 12.6 1.9 7.3 11 58.6 26.5 14.9 2.4 6.7 12 69.3 22.3 8.4 4.0 7.0 13 61.8 30.8 7.4 2.7 6.4 14 67.7 25.3 7.0 4.8 7.3 15 57.2 31.2 11.6 2.4 6.3 16 67.2 22.7 10.1 33.3 6.2 17 59.2 31.2 9.6 2.4 6.0 18 80.2 13.2 6.6 2.0 5.8

19 82.2 11.1 6.7 2.2 7.2 20 69.7 20.7 9.6 3.1 5.9 3.2实验过程及结果 Case Processing Summary(a) Cases Valid Missing Total N Percent N Percent N Percent 20 100.0% 0 .0% 20 100.0% a Squared Euclidean Distance used 上表是接近度矩阵,计算距离使用的是平方欧氏距离,所以样品间距离越大,样品越相异,由表中矩阵可以看出样品8号和样品9号的距离是最小的,因此它们最先聚为一类。 Average Linkage (Between Groups) Agglomeration Schedule Stage Cluster Combined Coefficient s Stage Cluster First Appears Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2 1 8 9 .153 16

统计学实验报告

实验1:数据整理 一、实验目的 1)掌握Excel中基本的数据处理方法; 2)学会使用Excel进行统计分组,能以此方式独立完成相关作业 二、实验时间及地点 试验时间:2014年9月23日实验地点:计算机房 三、实验内容和操作步骤 (一)问题与数据 某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 (二)实验内容:使用FREQUENCY函数绘制频数分布表(图) (三)实验步骤: 1.在A1输入:某百货公司连续40天的商品销售额如下。选中A1:D1选 择合并单元格。 2.在单元区域A2:D11中输入原始数据。 3.并计算原始数据的最大值(在单元格B12中)与最小值(在单元格D12 中)。 4.根据Sturges经验公式计算经验组距(在单元格B13)和(经验数据D13 中)。 5.根据步骤3的计算结果,计算并确定各组上限、下限(在单元区域E2: F7). 步骤1~5如图所示:

6.绘制频数分布表框架,如图所示: 7.计算各组频数: 1)选定i7:i12作为存放计算结果的区域。 2)从“插入”菜单中选择“函数”项。 3)在弹出的“插入函数”对话框中选择“统计”函数FREQUENCY。 步骤(1)~(3)如图所示:

4)单击“插入函数”对话框中的“确定”按钮,弹出 “FREQUENCY”对话框。 5)确定FREQUENCY函数的两个参数的值。其中: Data-array:原始数据或其所在单元格区域(A2:D11) Bins-array:分组各组的上限值或其所在的单元格区域 (F2:F7). 步骤(4)~(5)如图所示: 6)按Shift+Ctrl+Enter组合键,如图所示 7)用公式:频数密度=频数/组距选定G7输入=i7:i12/4按 Shift+Ctrl+Enter组合键 频率=频数/总数 如图所示:

实验报告1

广西大学数学与信息科学学院 实验报告2016年3月29日

随机数代码: public class RandomNumber { public static void main(String[] args){ int min=99; int max=0; int temp; int count=0; for(int i=0;i<100;i++){ temp=(int)(Math.random()*100); //System.out.println(temp); if(temp>50){ count++; } if(min>temp){ min=temp; } if(max

int m7=0;//五毛 int m8=0;//一毛 double t; Scanner in=new Scanner(System.in); DecimalFormat m=new DecimalFormat("#.0"); System.out.println("请输入金额:(金额限定到毛例如198.6,只计算到小数点后一位)"); double money=in.nextDouble(); System.out.println(money); t=money+0.006; m1=(int) (t/100); if(m1!=0){ t= (t-m1*100);System.out.println("需要一百元"+m1+"张!"); } System.out.println("金额是:"+t); m2=(int) (t/50); if(m2!=0){ t= (t-m2*50);System.out.println("需要五十元"+m2+"张!"); } System.out.println("金额是:"+t); m3=(int) (t/20); if(m3!=0){ t= (t-m3*20);System.out.println("需要二十元"+m3+"张!"); } System.out.println("金额是:"+t); m4=(int) (t/10); if(m4!=0){ t= (t-m4*10);System.out.println("需要十元"+m4+"张!"); } System.out.println("金额是:"+t); m5=(int) (t/5); if(m5!=0){ t= (t-m5*5);System.out.println("需要五元"+m5+"张!"); } System.out.println("金额是:"+t); m6=(int) (t/1); if(m6!=0){ t= (t-m6*1);System.out.println("需要一元"+m6+"张!"); }

相关主题
文本预览
相关文档 最新文档