sas第一次作业
- 格式:doc
- 大小:992.00 KB
- 文档页数:12
要求:打印,A4,单面或者双面均可。
第二页列出原题(直接拷贝),从第三页开始给出结果。
一般要求进行分析的要写出程序代码,给出主要或者关键的分析结果,并进行必要的解释和说明。
12月29日交给张海峰,过期不候。
1.对sasuser.gpa(1)用tabulate过程分析satm分布并简述结果;(2)计算hss、hsm和hse的相关系数;(3)绘制satm的直方图;(4)画satv对satm的散点图。
(gpa数据集在C:\Program Files\SAS Institute\SAS\V8\insight\sample文件夹下)提示:gpa(College Grade Point Average)大学平均成绩,hsm(High School Math Average)高中数学平均成绩,hss(High School Science Average)高中科学平均成绩,hse(High School English Average)高中英语平均成绩,satm(Math SAT Score)数学统计得分,satv(Verbal SAT Score)口语表达统计得分。
2. 某小麦良种的千粒重μ0=34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?(提示用mean过程做t检验)1.用tabulate过程绘制sasuser.gpa中gpa按性别分类及不分类的平均值、标准差,及男女生人数。
使用中文标签。
(gpa数据集在C:\Program Files\SAS Institute\SAS\V8\insight\sample文件夹下)提示:gpa(College Grade Point Average)大学平均成绩,hsm(High School Math Average)高中数学平均成绩,hss(High School Science Average)高中科学平均成绩,hse(High School English Average)高中英语平均成绩,satm(Math SAT Score)数学统计得分,satv(Verbal SAT Score)口语表达统计得分。
sas课后习题答案
SAS课后习题答案
在学习SAS(统计分析系统)课程的过程中,课后习题是巩固知识、提高技能
的重要环节。
通过完成课后习题,我们可以更好地掌握SAS的基本操作和数据
分析方法,提高数据处理和统计分析的能力。
首先,课后习题答案的准确性是非常重要的。
在完成习题时,我们需要仔细阅
读题目,理解要求,然后按照SAS的语法和规范进行操作。
只有通过正确的操
作和分析,才能得出准确的答案。
因此,我们需要在课后对照答案进行核对,
及时发现并纠正错误,以确保自己的理解和操作是正确的。
其次,课后习题答案也是我们学习和进步的标志。
通过对比答案,我们可以发
现自己在SAS操作和数据分析方面的不足之处,进而及时进行补充和提高。
同时,课后习题答案也可以帮助我们发现一些常见的错误和容易忽略的问题,从
而提高我们的综合分析能力和问题解决能力。
最后,课后习题答案也是我们自我评估的重要参考。
通过对比答案,我们可以
了解自己在SAS学习中的掌握程度和学习效果,及时调整学习方法和学习计划,以更好地提高自己的SAS技能和应用能力。
总之,SAS课后习题答案对我们的学习和提高都具有重要意义。
我们应该重视
课后习题的完成和答案的对比,不断提高自己的SAS技能和应用能力,为今后
的学习和工作打下坚实的基础。
手套编织机的主运动为针头板的往复直线运动,该机构一般采用由一个曲柄滑块机构和一个五连杆串联而成的串联机构。
为减小针头板在高速往复运动中的冲击、噪声,设计该机构时,应在满足针头板一定的运动行程和运动速度前提下,使针头板的加速度变化越小越好。
机构常用的设计方法是传统试凑法和优化方法。
传统试凑法得到的参数可以满足运动要求,但不一定是最好的,因此,优化设计方法成为人们研究的热点。
但对于复杂的非线性约束优化问题,无论是惩罚函数法、还是遗传算法(Genetic A190rithms,简称GA)、模拟退火算法(Simulation A1只orithms,简称sA)与神经网络(Neu同Networks,简称NN)等其它现代优化方法,若惩罚函数(因子)选择不当,优化结果也不理想,常常会陷入局部最优解或者花费的时间代价太大n’21。
笔者曾经利用遗传算法对该机构的参数进行优化,但效果不佳。
本文利用人机一体优化的方法对该机构的主要参数进行了优化。
主运动机构的运动分析及数学模型建立图1为手套机主运动机构简图。
以点D为坐标原点,建立如图l所示的坐标系xoy,对机构进行运动学分析,推得机构的位移、速度和加速度方程。
限于篇幅,这里仅给出铰点E的位移、速度和加速度方程。
1.1主运动机构的位移方程铰点E(即针头板)的位移方程为式中,Z;为杆件i的长度;Z∞为杆件3上c、D两铰点间的长度;a;为杆件i与菇轴正向的夹角;戈凹为铰点c、D间的水平距离,为常量;K为位置常量。
主运动机构的设计要求在手套编织机主运动机构的设计过程中,除满足机构设计的一般条件外,还要满足如下要求:1)针头板在极限位置时的加速度要尽量小,以减小振动和噪声;2)针头板在往复直线运动过程中,速度变化要尽量平缓,以保证纱线编织的均匀性;3)针头板的速度不能太低;4)为使机器小型化,针头板的行程也要控制在一定范围内。
由此,可以建立优化数学模型:目标函数取为F(石)=穷。
关于怎样学习SAS编程技术本课程的主要目的是培养动手能力,所以一定要花时间去操作SAS系统,运行《SAS 编程技术与金融数据处理》一书中的例子。
切记不能只听课看书,不操作。
1.关于习题各章节所配习题的目的,基本上是为了同学们能够加深对相关章节内容的理解与熟练SAS软件的操作,因此这些作业很少有比较综合的(因为刚开始不可能作综合的练习,等学完第9章,SAS软件的基本框架都掌握后就可以综合且有创造的习题了),都比较基础,也比较简单。
更确切地说,这些习题只能叫复习题,是为了大家能够打下SAS程序扎实的基本功而设置,更多地为课外复习时所用。
一些比较综合和需要发挥性思考的题目则要等掌握SAS 的基本框架时才能作,这些课后习题能够帮助大家对SAS的程序有更深入的了解和掌握,也会对解决复杂问题起到很好的帮助作用。
2.关于例题学习任何一种软件,最好参考资料是有大量能运行的例子。
SAS程序是比较灵活且技术性很强,需要循序渐进才能把它学好,所以我们刚开始学时只需要掌握其最基本的内容,如系统的基础知识、语句、函数等,不需要在一些很有技术性的语句上花太多时间去推敲。
很多东西是系统预设好的语句,是无法推理的,也不需要去推理,初学的关键是通过运行书上的例子,来掌握基础的知识和语句,越牢固越好。
初学者切记不要死扣复杂语句等,很多东西等有了基本框架后就很容易明白了。
由于SAS编程技术的特殊性,很多前几章的例题会涉及以后才讲的概念(这也是所有软件都存在的问题),这个时候不要着急去理解后面的概念,重要的是通过记忆和理解的结合,把当前讲的东西都理解好,巩固好。
学完第9章,就会掌握SAS编程的基本框架,这时所有的东西都能综合在一起,自己的编程技术也上一个大台阶,处理起问题来才会越来越得心应手。
所以一开始学习的时候,切忌急躁,要有耐心,有了整体的框架后再来解决问题,才是最有效率的。
3.关于作业严格来讲,本课程不会有很难的作业题,也考虑了同学们的时间而设置。
SAS上机指导一、SAS系统的熟悉与了解 (4)二、SAS编程 (5)1.创建数据集 (5)1.1 自由格式 (5)1.2列方式 (5)1.3规定格式 (5)2.数据集的整理 (6)2.1建立新变量、累加、选择变量 (6)2.2条件语句 (6)2.3循环语句 (6)2.4数据集的连接与合并 (7)2.5 SAS与外部数据的交换 (8)三、Means和Univariate过程 (10)1.计算统计量 (10)2.图形概括 (10)四、随机数的产生与模拟 (11)1.非均匀随机数的产生 (11)1.1逆变换法 (11)1.2合成法 (11)1.3筛选抽样法 (11)2. Monte Carlo方法在解确定性问题中的应用 (12)3. 随机模拟方法在随机服务系统中的应用 (14)4. 随机模拟方法在理论研究中的应用 (14)五、区间估计和假设检验 (17)1.正态总体的均值、方差的区间估计 (17)2. 均值、方差的假设检验 (18)3.正态性检验 (19)4. 非参数秩和检验 (20)六、方差分析 (21)七、回归分析 (23)八、附录:insight简介 (24)SAS系统上机一、SAS系统的熟悉与了解1起动SAS系统2 SAS系统的窗口PGM、LOG、OUTPUT、KEY、DIR、V AR、LIB3 SAS菜单条(不同的窗口其内容有所不同)4工具栏5 命令条:在里面输入显示管理(DM)命令后回车或点击前面的对号6状态栏其左边显示一些重要的帮助信息或提示。
右边有一个用于更改工作目录的图标,双击它可改变SAS的当前的工作目录,7了解菜单栏8 在程序窗口输入以下程序,data bodyfat;inPUt sex $ fatpct @@;fat=fatpct/100;cards;M 13.3 F 22 M 19 F 26 M 20 F 16 M 8 F 12 M 18 F 21.7M 22 F 23.2 M 20 F 21 M 31 F 28 M 21 F 30 M 12 F 23M 16 M 12 M 24RUN;PROC means data=bodyfat;var fatpct;run;(1)执行该程序,看看LOG窗、OUTPUT窗的表示,并将这两个窗口的内容保存(2)回到程序窗口,将原程序调回,并将该程序保存到磁盘(3)三个窗口的切换(4)退出SAS系统,并重新启动,在程序窗口中打开刚才保存的SAS程序。
实验一 SAS系统基本操作实验目的:掌握SAS系统的启动与退出,熟练掌握SAS9.0系统主窗口的各部分组成与功能;根据所给数据编成构造SAS数据集。
实验内容:1、SAS9.0的启动与退出。
2、SAS9.0环境下的几个主要窗口及它们的作用。
3、掌握基本的SAS程序的编写及运行,学会查看输出结果与程序运行日志。
4、学会使用系统帮助。
5、SAS9.0的交互式操作。
6、根据所给数据构造SAS数据集。
实验步骤:一、SAS9.0的启动与关闭。
1、修改系统时间:计算机启动后,首先要修改系统时间,把系统时间改到2004年9月份之前就可以了。
2、启动:方法一:方法二:顺序单击:“开始”→“程序(P)” →“SAS” →“The SAS System for Windows 9.0(简体中文)” 。
3、退出:方法一:在SAS主界面左上角的“输入命令”框输入ENDSAS”或“BYE”,而后回车。
方法二:单击SAS主界面右上角的关闭图标:,系统提问“确实要结束该SAS会话吗?“,而后用户予以确认,即可退出SAS返回Windows.方法三:操作:“文件(F)” →“退出(X)”。
二、SAS9.0系统各窗口的使用。
1、编辑窗口1在此窗口编写一份SAS基本程序,提交该程序2、输出窗口在输出窗口查看运行结果3、日志窗口在日志窗口查看运行日志4、graph窗口若程序有图形输出的话,则在此窗口浏览5、结果窗口分类查看程序运行结果三、SAS9.0的交互式操作。
1、数据集的建立与维护(1)“文件(F)”→“新建程序(E)”,此后,出现一个“编辑器”,(2)利用“表编辑器”对数据集的维护和更新(3)利用“解决方案”的功能产生数据集“解决方案(S)”→“分析(S)”→“分析家(S)”2、SAS与其它软件系统的数据交换3、交互式数据分析的简单操作(1)建立处理的数据集“解决方案(S)”→“分析(S)”→“分析家(S)”(2)数据处理菜单栏:“统计(S)”→“方差分析(A)”→“因子方差分析(F)”四、建立逻辑库:方法一:命令方式格式:LIBNAME 逻辑库名“DOS路径”;例如:LIBNAME abc “C:\dir3”;方法二:交互式方式操作:鼠标右击SAS浏览器中的图标“逻辑库”,出现如图的“新建逻辑库”窗口。
第一次作业(第一章──第四章)一、写出下列程序的运行结果。
#include <iostream.h>void main(){int a1,a2;int i=5,j=7,k=0;a1=!k;a2=i!=j;cout<<"a1="<<a1<<'\t'<<"a2="<<a2<<endl;}a1=1 a2=1二、编程实现输入一整数,判断其能否被3,5,7整除,并输出以下信息之一:(1)能同时被3,5,7整除;(2)能被其中两数(要指出哪两数)整除;(3)能被其中一个数(要指出哪一个)整除;(4)不能被3,5,7任一个整除。
#include <iostream.h>void main(){int m;do {cout<<"请输入一个整数:"<<endl;cin>>m;if ((m%3==0) && (m%5==0) && (m%7==0))cout<<"能被3,5,7同时整除......"<<endl<<endl;else if ((m%3==0)&&(m%5==0))cout<<"能被3,5整除......"<<endl<<endl;else if ((m%3==0)&&(m%7==0))cout<<"能被3,7整除......"<<endl<<endl;else if ((m%5==0)&&(m%7==0))cout<<"能被5,7整除......"<<endl<<endl;else if (m%3==0)cout<<"能被3整除......"<<endl<<endl;else if (m%5==0)cout<<"能被5整除......"<<endl<<endl;else if (m%7==0)cout<<"能被7整除......"<<endl<<endl;else cout<<"不能被3或5或7整除......"<<endl<<endl;}while (m!=0);}三、用do…while或while或for语句编程计算级数,要求精度为10-8。
实验设计与数据处理第三章(7)(1)金球。
将数据输入SAS生成数据文件。
打开SAS Analyst选择数据文件。
采用One-Sample t-test for a Mean,将待分析变量x送入Variable中,在单击Tests,选中Interval,设置confidence level设置为90.0%。
SAS处理结果。
Sample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------6 6.68 0.00 0.00Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------4228.344 5 <.000190 % Confidence Interval for the MeanLower Limit: 6.67Upper Limit: 6.68μ的置信度为0.9的置信区间(6.67,6.68)。
金球σ2置信度为0.9的置信区间。
采用One-Sample Test for a Variance,将待分析变量x送入Variable中,并在Null:Var中设置一个大于0的数,再单击Intervals,选中Interval,设置confidence level设置为90.0%。
Sample Statistics for xN Mean Std. Dev. Variance---------------------------------------------6 6.6782 0.0039 15E-6Hypothesis TestNull hypothesis: Variance of x = 1Alternative: Variance of x ^= 1Chi-square Df Prob---------------------------------0.000 5 <.000190% Confidence Interval for the VarianceLower Limit Upper Limit----------- -----------676E-8 0.0001σ2的置信度为0.9的置信区间(676E-8,0.0001)。
SAS Enterprise Guide 教学课程!学习 SAS Enterprise Guide 的基本概念欢迎使用 SAS Enterprise Guide 入门教学课程。
当您完成本教学课程中的主题后,您将学会如何使用 SAS Enterprise Guide 的主要功能。
您应依照顺序完成这些主题。
SAS Enterprise Guide 含有您在接受此教学课程时所将用到的范例数据。
在范例数据目录中有三个数据文件,其中包含取自特色食品商店的资料:使用这项资料,可让您执行分析及建立报表,以显示产品的库存、销售与利润。
您将会在教学课程的过程中,学习到如何执行下列作业:∙建立及储存项目∙将 SAS 资料新增至项目∙从文本文件汇入数据∙建立及修改列表报表∙建立直方图与饼图∙使用查询联结表格∙使用查询建立计算栏∙产生摘要统计表∙对您的数据执行线性模型分析∙将报表合并成单一文件首先我们将学习 SAS Enterprise Guide 与 SAS 软件之间关系的一些相关信息。
什么是 SAS Enterprise Guide?SAS Enterprise Guide 是一个方便使用的 Windows 客户端应用程序,具有下列功能:∙可存取多种 SAS 功能∙直觉式而可视化的可自定义接口∙可明确存取资料∙现成可用的分析与报告工作∙可将数据与结果导出至其他应用程序的简易方式∙脚本与自动化∙程序代码编辑工具当您使用 SAS Enterprise Guide 时,也会同时在背景中使用 SAS 软件。
SAS Enterprise Guide 可联机至您本机计算机上的 SAS,或联机至另一个名为 SAS 服务器之计算机上的 SAS。
在您存取数据及建立工作时,SAS Enterprise Guide 会产生 SAS 程序代码。
当您执行工作时,产生的程序代码会传送至 SAS 以进行处理,并将结果传回至 SAS Enterprise Guide。
实验内容1试用产生标准正态分布的随机数normal(seed)产生参数为10的卡方分布随机数100个。
2根据数据集:(1)创建一个仅包含地区、销售的产品类型、销售数量和销售额的数据集。
(2)分别创建一个仅包含产品类型a100和产品类型a200和SAS数据集。
(3)选择一个人口在50000以上的部分子集。
3 以下数据来自7位同学的高考语文、数学和英语成绩,试用编程的方法计算出平均成绩在75以上的男同学的人数。
实验步骤:实验1:data a (drop=i) ;do i=1to100by1;z=normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+no rmal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2; output;end;结果如下:实验2:(1)data biao1;input region$ product$ quantity price; cards;es a100 150 3750so a100 410 10250es a100 350 8750so a100 710 17750es a100 750 18750so a100 760 19000es a100 150 3000so a100 410 8200es a100 350 7000so a100 710 14200es a100 750 15000so a100 760 152000es a200 165 4125so a200 425 10425es a200 365 9125ne a100 200 5000we a100 180 4500ne a100 600 15000we a100 780 19500ne a100 800 20000we a100 880 22000ne a100 200 4000we a100 180 3600ne a100 600 12000we a100 780 15600ne a100 800 16000we a100 880 17600ne a200 215 5375we a200 195 4875ne a200 615 15375;实验结果:(2)data biao2;input region$ citisize$ pop product$ saketype$ quantity price; cards;es s 25000 a100 r 150 3750so s 48000 a100 r 410 10250es m 125000 a100 r 350 8750so m 348000 a100 r 710 17750es l 62500 a100 r 750 18750so l 748000 a100 r 760 19000es s 25000 a100 s 150 3000so s 48000 a100 w 410 8200es m 125000 a100 w 350 7000so m 348000 a100 w 710 14200es l 62500 a100 w 750 15000so l 748000 a100 w 760 15200ne s 37000 a100 r 200 5000we s 32000 a100 r 180 4500ne m 237000 a100 r 600 15000we m 432000 a100 r 780 19500ne l 837000 a100 r 800 20000we l 93200 a100 r 880 22000ne s 37000 a100 w 200 4000we s 32000 a100 w 180 3600ne m 237000 a100 w 600 12000we m 432000 a100 w 780 15600ne l 837000 a100 w 800 16000we l 932000 a100 w 880 17600;data biao3;input region$ citisize$ pop product$ saketype$ quantity price; cards;es s 25000 a200 r 165 4125so s 48000 a200 r 425 10425es m 125000 a200 r 365 9125ne s 37000 a200 r 215 5375we s 32000 a200 r 195 4875ne m 237000 a200 r 615 15375;run;(3)data biao4;input region$ citisize$ pop product$ saketype$ quantity price; if pop <= 50000then delete;cards;es s 25000 a100 r 150 3750so s 48000 a100 r 410 10250es m 125000 a100 r 350 8750so m 348000 a100 r 710 17750es l 62500 a100 r 750 18750so l 748000 a100 r 760 19000es s 25000 a100 s 150 3000so s 48000 a100 w 410 8200es m 125000 a100 w 350 7000so m 348000 a100 w 710 14200es l 62500 a100 w 750 15000so l 748000 a100 w 760 15200es s 25000 a200 r 165 4125so s 48000 a200 r 425 10425es m 125000 a200 r 365 9125ne s 37000 a100 r 200 5000we s 32000 a100 r 180 4500ne m 237000 a100 r 600 15000we m 432000 a100 r 780 19500ne l 837000 a100 r 800 20000we l 93200 a100 r 880 22000ne s 37000 a100 w 200 4000we s 32000 a100 w 180 3600ne m 237000 a100 w 600 12000we m 432000 a100 w 780 15600ne l 837000 a100 w 800 16000we l 932000 a100 w 880 17600ne s 37000 a200 r 215 5375we s 32000 a200 r 195 4875ne m 237000 a200 r 615 15375;run;实验结果:实验3:data biao5;input sex$ yuwen shuxue yingyu @@;ave=sum(yuwen+shuxue+yingyu)/3;if ave>75 & sex='m'then n+1;else delete;cards;m 82 78 69 f 90 78 89 m 79 86 98 m 76 56 80 f 72 76 81 f 69 78 91 m 92 71 85;实验结果:。
SAS 第二次作业
光科1201 梁修业
7-4-2一种合金在某种添加剂的不同浓度之下,各做三次实验,得数据如下表: 浓度x 10.0 15.0 20.0 25.0 30.0 抗压强度y 25.2 27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8 (1)作散点图;
(2)以模型y=b
0+b1x+b2x+
ε
,2~0N εσ(,),拟合数据,其中b0,b1,b2,2σ与x 无
关,求回归方程2012ˆˆˆˆy b b x b x =++。
解:(1)
(2)将x 看成x1,x^2
看成x2,在表格中增加变量x2,此题即转化为多元线性回归
所以2ˆ19.0333 1.00860.0204y x x =+-。
7-4-3对§7.4例3的钢包容积y和使用次数x的数据,假定
b
x
y ae-=。
(1)画散点图;
(2)试分别作变量替换,化非线性回归模型为线性回归模型并讨论回归方程的显著性。
解:
(1)
(2)利用Insight模块求解。
增加两个变量,u=lny,v=-1/x,
说明:方程为
1
ˆ
ln 4.71410.0903()
y
x
=+-,方差分析表中p-值小于0.0001,说明
了回归方程高度显著。
7-4-4槲寄生是一种寄生在大树上部树枝上的寄生植物,它喜欢寄生在年轻的大树上,下表给出在一定条件下完成的实验中采集的数据。
x 3 4 9 15 40
y 28
33
22
10
36
24
15
22
10
6
14
9
1
1
(1)作出(x
i
,y
i
)的散点图,
(2)令z
i
=lny
i
,作出(x
i
,z
i
)的散点图
(3)以模型2
,ln~(0,)
bx
y ae N
εεσ
=拟合数据,其中a,b,2σ与x无关,试求曲线回归方程ˆbx
ˆ
ˆy=ae。
解:(1)
(2)Insight模块。
增加变量z=lny
(3)承接题(2)数据表。
对bx y ae ε=两边取对数,则lny=lna+bx+ln ε。
线性方程为:
逆运算化为曲线回归方程:
0.09ˆ32.46x y
e -=
1.(第七章补充题)16次发酵猪饲料实验结果如下表,其中x 1,x 2,x 3,x 4和y 分别表示发酵温度,发酵时间,pH 值,投曲量和酸度。
使用逐步回归方法选择适当的x 1,x 2,x 3和x 4的二次多项式,以预报y 的值。
序号
x 1 x2 x3 x4 y 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 10 10 10 10 20 20 20 20 30 30 30 30 50 50 50 50 12 24 48 72 12 24 48 72 12 24 48 72 12 24 48 72 7 6 5 4 6 7 4 5 5 4 7 6 4 5 6 7 5 10 10 5 10 5 5 10 5 10 10 5 10 5 5 10 6.36 7.43 10.30 11.56 8.66 5.39 15.5 19.53 12.08 13.13 8.03 12.45 13.49 10.77 9.80 16.64
解:
说明:
Step 1: 在只有一个自变量的回归模型中, x2 的回归平方和最大, 经F检验, 它符合选入标准, 于是得到一个自变量的回归方程
y=7.96038+0.08614 x2
Step 2: 对其余3个自变量计算偏回归平方和, 发现其中x3 的偏回归平方和最大, 经F检验, 符合引入上式的回归模型标准; 在引入x3的回归方程中计算x2, x3 的偏回归平方和, 发现它们都足够大, 不能剔除, 于是得两个自变量的回归方程
y=17.05188+0.08614x2-1.653x3
Step 3: 再对其余2个自变量计算偏回归平方和, 经F检验, 发现它们的作用都不显著, 不符合引入第二式的回归模型标准, 于是第二式便是预报y值的最优回归方程.而且从11.17718→ 7.83325 两个MS残的逐次减少, 可见表示回归方程精度的剩余标准差SQRT(MS残)也越来越小。
8-1-2.下表是我国30个省、自治区、直辖市2001年的地区工业、企业的经验效益指标数据,试作主成分分析。
x1每百元固定资产原值实现的产值 (元), x2
每百元固定资产原值实现的乎税(元), x3资金利税率(%),x4产值利税率(%),x5每百元销售收入实现的利润(元), x6每百元销售成本实现的利润, x7流动资金周转次数(次/年)
解:利用“分析家”
说明:前3个主成分累计方差贡献率达到96.29%,前3个主成分与原7个单指标的线性组合为:
y1=0.3370z1+0.4811z2+0.4869z3+0.3270z4+0.2930z5+0.2924z6+0.3736z7 y2=-0.4564z1-0.1112z2-0.1204z30.2975z4+0.5100z5+0.5319z6-0.3652z7 y3=0.3156z1-0.2941z2-0.1776z3-0.6406z4+0.4043z5+0.3451z6+0.2989z7 由于第一主成分系数大致相同,可见第一主成分y1为经济效益的全面能力的综合指标;第二主成分系数在x5,x6为较大正数,y2反映一个地区工业、企业的盈利能力;第三主成分系数在x4为绝对值较大负数,y3为产值利税所决定的反映经济效益的一个综合指标。
8-2-1选拔职员对应聘人员测验6门科目:词汇、阅读、同义词、算术、代数、微积分,分别记为x 1,x 2,x 3,x 4,x 5,x 6,将所有应聘者的考试成绩作计算机处理,得样本相关阵,试对这六科成绩作因子分析。
样本相关阵为
1
0.720.630.090.090.000.7210.570.1050.150.090.630.5710.140.140.090.090.150.1410.570.630.090.160.150.5710.720.000.090.090.630.721⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥
⎣⎦
解:
说明:因子1反映了考生的平均综合能力,因子2反映了语文能力和数学能力的差异。
第一因子解差的方差是2.601939,占信息量的43.37%,是主要因子。
8-3-1现有6个铅弹头,用“中子活化”方法测得7种微量元素的含量数据如下表所示,试用系统聚类法对6个弹头进行分类。
元素样品号Ag
X1
Al
X2
Cu
X3
Ca
X4
Sb
X5
Bi
X6
Sn
X7
1 0.05798 0.5150 347.10 21.910 8586 174
2 61.69
2 0.08441 3.9700 347.20 19.710 7947 2000 2440
3 0.07217 1.1530 54.85 3.052 3860 1445 9497
4 0.15010 1.7020 307.50 15.030 12290 1461 6380
5 5.74410 2.8540 229.60 9.657 8099 126
6 12520
6 0.21300 0.7058 240.30 13.910 8980 2820 4135 解:
说明:
(1)分成5类,{2,6},{1},{3},{4},{5}
(2)分成4类,{1,2,6},{3},{4},{5}
(3)分成3类,{1,2,4,6},{3},{5}
(4)分成2类,{3,5},{1},{2},{4},{6}
(5)分成1类,{1,2,3,4,5,6}
8-4-1对28个人,调查他们乘车还是骑车上班,得数据如下表所示,其中y=1表示乘车上班,y=0表示骑车上班,age表示年龄,income表示月收入,gender 表示性别,gender=1表示男性,gender=0表示女性。
对于表中数据,设某位男士年龄50岁,月收入2000元,用最大概率判别法判断他是否乘车。
解:
说明:在misclassified observation 中,如标号29所示,该男子乘车的后验概率为0.6625,判定该男子乘车。