当前位置:文档之家› 数据分析实验报告

数据分析实验报告

数据分析实验报告
数据分析实验报告

广东石油化工学院

数据分析(抽样调查)实验报告题目:多元统计分析在股票投资中的作用

摘要:随着我国股票市场的迅速发展和逐步完善,股票的投资特点和前景越来越受到投资者的追捧。理性的投资者,将会更加重视上市公司的经营业绩和股票的内在价值。但如何对股票的价值进行评价在实践中是个难点,对此进行探讨十分必要。本文首先运用图形分析法和移动平均法分析股票风险,再运用聚类分析对影响上市公司股票业绩的变量进行分类,运用因子分析模型得出决定股票业绩的公因子,并进行了比较。

关键词:图形分析法;移动平均法;聚类分析;因子分析;SAS;股票投资分析

一、研究目的及意义

随着我国股票市场的不断发展,股票投资已经成为我国投资者的主要投资途径,而且也将成为我国投资者的重要投资渠道。因此,他们必须重视上市公司的经营业绩,重视股票自身的品质,即重视投资对象的选择。面对众多股票及各个公司的财务数据,怎样才能客观、全面、准确的分析并选出绩优股和潜力股呢?本文选择30家上市公司作为研究对象,进行业绩评价。目的是对上市公司财务分析的基础上,探索各上市公司的投资价值,为投资者提供一定的决策指导和理论参考。

二、研究方法

多元统计分析方法中的图表分析法、移动平均法、聚类分析和因子分析在股票的综合评价中有着广泛的应用。本文采用的分析方法是图表分析法、移动平均法、因子分析和聚类分析。在对上市公司进行综合评价时,先用图表分析法和移动平均法分析其风险,接着用聚类分析进行分类,然后再利用因子分析法对多维变量进行降维,降维后的变量是原变量的线性组合,并能反映原变量绝大部分信息,使信息的损失最小,对原变量的综合解释能力强。该方法通过因子的方差贡献率来表示变量的作用,可避免在系统分析中对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服

变量之间的多重相关性,使系统分析简化。

三、文献综述

1、国外研究

Serpil(2006)将主成分分析法和判别分析法结合起来,用来对早期综合预警模型的估计。April Kerby, James Lawrence运用多元统计方法中的主成分分析和判别分析来作为选择好或不好股票的依据,另外,他认为这也是处理多变量高维复杂财经数据的一种方法。Newton Da Costa, Jr等(2005)提出了一种根据风险回报准则的基于聚类分析对现货市场中的股票分组的技术,然后分析了信息灵通的投资者运用聚类分析在北美和南美选择股票赚钱的方式。Anderon, Leslie P(1967)运用多元统计分析中的判别分析将独立变量分成不同的组或种类,来对资本市场作进一步的研究。另外还有一些文章单独运用多元统计分析方法中的主成分分析法、因子分析法或者它们的组合来对股票的价值投资进行分析。Pinches、Mingoand and Caruthers 采用主成分分析的方法,研究了221家公司1951、1957、1963、1969四年的财务指标,他们将公司的财务指标分成了48组。Gomabola and Kets(1983)设计了40个财务指标,通过主成分分析提取了8个可以近似代表所有指标的主成分对公司进行了分析等。

2、国内研究

在我国证券市场走向成熟的过程中,提倡运用这种理性的投资分析方法,可以降低投资风险,规范投资行为,已有相关学者作了相关工作,如彭文洁在《多元统计分析方法在证券投资中的应用》(2007)中将聚类分析法和因子分析法相结合,应用到证券投资分析中作了研究和探讨,对指导证券投资提供了一条有效的途径。杨桦在《聚类分析在投资决策中的应用》(2006)中将聚类分析模型应用于证券投资中作了拓展性的研究和探讨,分析了股票的内在价值,反映了上市公司的盈利能力和成长性,并且降低了投资风

险。李敏与何理在《聚类分析在证券投资基本分析中的应用》(2006)中选用14个聚类分析统计指标,用离差平方和法对31家上市公司的股票进行聚类分析,借以通过对股票的基本面的分析,为证券投资者提供长期理性投资的依据,降低投机性带来的风险,树立以基本投资为主,技术分析为辅的理性投资理念,找出真正具有投资价值的股票,进行长期投资。周焯华等在《聚类分析在证券投资中的应用》(2002)中通过建立完善的综合评价将聚类分析对指导广大投资者尤其是中小投资者进行投资决策具有很强的实践性。王君波等在《聚类分析在证券投资中的应用》(2003)中将企业管理中计划管理的程序引入证券投资管理之中,为证券投资提供了定性分析的工具,使证券投资定性定量分析相结合,满足投资的需要,对聚类分析在证券投资中的应用价值必须进行实证研究。罗本德与彭小兵在《股票投资群体动态聚类研究》(2005)中利用聚类分析的基本思想,构建投资群体动态聚类方法的模型,以及股票市场投资群体聚类分析框架。陶冶与马健在《基于聚类分析和判别分析方法的股票投资价值分析》(2005)中利用38家中小企业板上市公司的2004年会计和财务数据,运用聚类分析和判别分析方法对其盈利、成长和扩张能力进行定量分析研究,并据此归纳出整个板块股票的分类及其特点,为投资者和市场各参与主体有效把握中小企业上市公司及其成长趋势提供借鉴。柯冰与钱省三在《聚类分析和因子分析在股票研究中的应用》(2002)中应用聚类分析和因子分析对汽车及配件行业的上市公司进行了综合分析,把上市公司分为蓝筹股、绩优股、一般股和劣质股,与公司的实际情况相符。冯伟与孙德山在《聚类分析在金融投资分析中的应用》(2008)中将聚类分析和方差分析相结合进行投资分析,对股票的收益性、成长性等方面进行分析,建立较为合理的指标体系,衡量样本股票的“相似程度”,再通过聚类分析为投资者确定投资范围和投资价值。李庆东与李颖在《证券投资分析方法新探索―聚类分析方法应用》(2005)中介绍了在证券投资中,投资者必须对股票进行基本面分析以减少投资风

险。而当进行分析时,会遇到多个指标,且每个指标意义不同,有时很难进行决策,采用聚类分析可以解决这一问题。

四、多元统计方法

1、数据的选取

本文所选数据来自和讯网。选择30家湖北省的上市公司,根据2012年前三个季度报告中的信息及数据,选择每股收益、每股净资产、净资产收益率、主营业务收入、净利润等8项财务指标,对这些公司进行了聚类分析和因子分析,将它们进行分类,为股票的分析和选择提供决策依据。

2、图形分析法

图形分析法是证券市场上短期投资者运用的最为普遍的一种方法。所谓图形分析法是指投资者利用图形来描述证券市场上各种要素的实际价格他以及各种趋势,并根据图形显示特征,来预测未来价格及趋势的一种分析方法。常用的的技术分析方法有K线图,线性图,点形图等。

(1)K线图

K线图是技术分析中应用最普遍的一种方法。它是将每天的开盘价,收盘价,最高价,和最低价的变动情况分别用特定的符号描绘成图表,以观察价格的走势,从而分析风险的方法。如图1:

图1 K线图的基本形状示意图

该图把开盘价与收盘价的价差用矩形(实体)表示,长度取决于价差的大小,着色取决与两种价格的对比。若收盘价大于开盘价,则矩形涂成红色(或中空),此时又称为阳线;若收盘价小于开盘价,则矩形涂成蓝色(或实空),此时又称为阴线。最高价与实体的最高价的连线成为上影线,最低价与实体的最低价的连续称为下影线。实体,上影线和下影线的长短,以及连续一段时间内各日K线的组合等显示了市场价格的不同走势。

(2)线形图

线形图是按时间顺序,将一定时期内的各时间间隔中选定的时点用线条连接起来,从而形成一条反映一定时期内市场价格变动情况的情况的曲线。线形图与其它图形分析法相比,可以更为直观地看出价格波动情况,既可以直接判断证券投资风险的大小,也可以结合其他分析法来分析价格的走势,来预测证券投资风险的大小。根据时间间隔的不同,可分为日线形图,周线形图,月线形图等。(如图2)

3、移动平均法

移动平均法式运用较为广泛的一种统计工具。移动平均值的计算公式为:

1

1T t t i i MA P T --==∑

图2 线形图

其中:T 为移动平均期间(一般是3天或10天),t MA 为第t 天的移动平均数,t i P -为第t-i

天的开盘价,收盘价,市场指数等。运用移动平均法绘制的移动平均图可以消除价格变动中的非正常因素或偶然因素,从而比较真实地反映出市场价格的实际走势。

4、聚类分析

通过SAS 软件对样本数据进行系统聚类分析,系统聚类分析中,样本间的距离计算欧式距离、小类间距离以离差平方和法计算,对样本数据进行Z 处理,即标准化,得表1。

输出结果第一行数据的含义是在聚类分析的第一步中,17号样本与19号样本聚成一类,他们的样本离差平方和是0.260,这个小类将在聚类分析的第6步用到。同理,第6行数据的含义是在聚类分析的第6步中,27号样本与第一步聚成的小类又聚成另外一小类,他们的离差平方和是21458.748,这个小类将在聚类分析的第13步用到。可见,经过29步聚类过程,30个样本最后聚成了一类。

聚类谱系图(表2)直观地显示了聚类的过程,从图上可以清楚地看出各种股票的归属。根据选择距离的不同我们可以根据图形对股票进行新的分类。另外根据聚类谱系图可以清晰地看出每一种股票的原始分类及其聚类过程,从中我们可以了解各种股票的亲疏关系程度。

5、因子分析

通过SAS软件对原变量进行因子分析,求出该矩阵的五个特征根的大小、贡献率及累计贡献率,其结果参见表3。

从表3中可以发现,最主要的特征根有三个,其贡献率分别是43.555%、30.125%和15.035%,累计贡献率达到88.715%。这三个特征根所反映出来的信息量占全部信息量的88.715%,所以,只取前三个特征根来进行分析。

通过SAS求出因子载荷矩阵,结果如下表4。

上表中的每个数据表示了相应因子变量对相应原变量的相对重要程度。对因子载荷矩阵按照方差极大法进行旋转。没旋转前,因子变量在许多变量上都有较高的载荷,那么它的实际含义就比较模糊。经过旋转后,因子变量反映的实际含义就比较清楚,因子载荷矩阵旋转后的结果如下表5所示。

从表5中可以发现,第1个因子变量即第1个主成分与主营业务收入、总资产和净资产有关,因此可称之为“收入利润因子”。此外第2个主成分与每股收益,每股净资产有关,说明其主要反映了投资效率,因此称之为“投资效率因子”。第3个主成分与每股现金流高度相关,故可称之为“每股现金流因子”。

根据因子分析,可以对这30家上市公司进行分类,最直观最简单的分类方法是根据因子的得分值,在因子轴所构成的空间进行分类每个因子的得分。

首先得出因子得分函数见表

上表给出了用回归法计算出的因子得分函数的系数,根据它写出以下因子得分函数: F1=﹣0.057X1-0.010X2-0.085X3+0.313X4+0.108X5+0.320X6+0.324X7-0.012X8 F2=0.374X1+0.322X2+0.267X3-0.047X4+0.259X5-0.030X6-0.036X7-0.020X8

F3=﹣0.037 X1-0.453X2+0.281X3+0.025X4+0.094X5-0.071X7+0.720X8

SAS将根据因子得分函数自动计算各样本的3个因子得分,结果如下表7。

接下来,在因子分析的基础上,对30家湖北上市公司进行综合实力分析。采用的变量不再是原有的8个变量,而是经过因子分析后得到的3个因子变量,利用3个因子变量,可以计算出每个公司的综合实力得分。由于3个因子变量反映的是财务数据的不同侧面,

因此在计算综合实力时,应给不同的侧面以不同的权数。这些权数一般应由这方面的专家给定,这里,我们仅以这3个因子变量的方差贡献率作为权数,于是得到下面的计算公式:综合实力得分=0.43555F1 0.30125F2 0.15035F3

按照这个公式,我们就可以得出这30家上市公司的综合实力得分,结果如下。

通过综合实力得分,可以把30家上市公司分为四类,分类结果如下:

第一类:武钢股份和湖北宜化的综合实力得分远远大于其他公司的综合实力得分,因此,划为第一类,称为蓝筹股。

第二类:鄂武商A、湖北能源、福星股份和烽火通信的综合实力得分低于武钢股份和湖北宜化的综合实力得分,但是高于其他公司的综合实力得分,并且为正数,所以划为第二类,称为绩优股。

第三类:武汉塑料、双环科技、大冶特钢、中百集团、武汉中商、江钻股份、华工科技、永安药业、台基股份、华灿光电和楚天高速的综合实力得分在0附近,所以划为第三类,称为一般股。

第四类:其他公司的综合实力得分很低,与其他公司的综合实力得分差距很大,并且都为负数,所以划为第四类,称为劣质股。

通过上述分析可以得到如下结论,应用图形分析法、移动平均法、聚类分析和因子分析对上市公司进行了综合分析,把上市公司区分为蓝筹股、绩优股、一般股和劣质股,与公司的实际情况基本相符。其中因子分析将财务指标综合为三个综合变量,收入利润因子,投资效率因子,每股现金流因子,为股票投资者对上市公司的分类、评估和选择提供了很好的依据。

参考文献

[1] 彭文洁. 多元统计分析方法在证券投资中的应用. 科技信息,2007,16:173-174

[2] 杨桦. 聚类分析在投资决策中的应用. 当代经理人(中旬刊),2006,21:1547-1549

[3] 李敏,何理. 聚类分析在证券投资基本分析中的应用. 辽宁师范大学报(自然科学版),2006,29(2):145-146

[4] 周焯华,陈文南,张宗益. 聚类分析在证券投资中的应用. 重庆大学学报,2002,25(7):122-126

[5] 王君波,杨义群,欧阳浙江. 聚类分析在证券投资中的应用. 商业研究,2003,282:102-104

[6] 罗本德,彭小兵. 股票投资群体动态聚类研究[J]. 经济体制改革,2005(3):108-110

[7] 陶冶,马健. 基于聚类分析和判别分析方法的股票投资价值分析. 财经理论与实践,2005(10):45-48

[8] 柯冰,钱省三. 聚类分析和因子分析在股票研究中的应用. 上海理工大学学报,2002(4):371-374

[9] 冯伟,孙德山. 聚类分析在金融投资分析中的应用. 辽宁师范大学学报,2008(3):43-45

[10] 李庆东,李颖. 证券投资分析方法新探索―聚类分析方法应用. 现代情报,2005(11):11-15

[11] Serpil.Prediction of financial distress by multivariate stahttps://www.doczj.com/doc/768113852.html,/b-3624d738b90d6c85ec3ac63a.htmltistical snalysis: the case of firms taken into the surveillance market in the Istanbul stock exchange, International journal of theoretical &applied finance; Feb2006, vol.9 issue 1, p133-150,18p, 9 charts, 1 diagram 1.

[12] April Kerby, James Lawrence. A Multivariate Statistical Analysis of Stock Trends.

[13] Newton Da Costa, Jr. Stock selection based on cluster analysis, Economics Bulletin.2005.

[14] Anderson, Leslie P. Capital Markets, Journal of Financial & Quantitative Analysis; Dec67, Vol.2 Issue 4, p424

Abstract

Securities investment risk is modern economic development in a very important question, in securities investment market, we have all kinds of risks, including foreign exchange risk of interest rate risk, credit risk, liquidity risk, stock market, price risk, etc. This thesis mainly discussed the various is securities investment risk measurement .

This article will first discussed the definition of from risk, specify start of the classification of securities risk with specific causes, let the reader to risk this professional term has a specific understanding, and propose some risk management methods.

Then there is the core part of this paper, here I introduce securities risk measurement and prediction. My two process from measurement and prediction to elaborate, this will involve a lot of statistics in the knowledge and some mathematical model.

【key words 】: risk identification risk measure risk prediction risk prevention strategies

数据分析实验报告

数据分析实验报告 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2 )W 检验 结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5 多维正态数据的统计量 数据:

数据分析实验报告

《数据分析》实验报告 班级: 07信计0班 学号: 姓名: 实验日期 2010-3-11 实验地点: 实 验楼505 实验名称: 样本数据的特征分析 使用软件名称:MATLAB 1. 熟练掌握利用Matlab 软件计算均值、方差、协方差、相关系数、标准差 与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2. 熟练掌握jbtest 与lillietest 关于一元数据的正态性检验; 3. 掌握统计作图方法; 4. 掌握多元数据的数字特征与相关矩阵的处理方法; 安徽省1990-2004年万元工业GDP 废气排放量、废水排放量、固体废物排放 量以及用于污染治理的投入经费比重见表 6.1.1,解决以下问题: 表6.1.1 实 验 目 的

1. 计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2. 计算各指标的偏度、峰度、三均值以及极差; 3?做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDR废气排放量,安徽省与江苏省是否 服从同样的分布?

程序如下: clear;clc format ba nk %保留两位小数 %%%%%%%%%%%安徽省%数据%%%%%%%%%%%%%%%%%% A=[104254.40 519.48 441.65 0.18 94415.00 476.97 398.19 0.26 89317.41 119.45 332.14 0.23 63012.42 67.93 203.91 0.20 45435.04 7.86 128.20 0.17 46383.42 12.45 113.39 0.22 39874.19 13.24 87.12 0.15 38412.85 37.97 76.98 0.21 35270.79 45.36 59.68 0.11 35200.76 34.93 60.82 0.15 35848.97 1.82 57.35 0.19 40348.43 1.17 53.06 0.11 40392.96 0.16 50.96 0.12 37237.13 0.05 43.94 0.15 34176.27 0.06 36.90 0.13]; %计算各指标的均值、方差、标准差、变异系数、偏度、峰度以及极差 A1=[mea n(A);var(A);std(A);std(A)./mea n(A);skew ness(A,0);kurtosis(A,0)-3;ra nge( A)] %E均值 A2=[1/4 1/2 1/4]*prctile(A,[25 50 75]) % 十算各指标的相关系数矩阵 A3=corrcoef(A) %做岀各指标数据直方图 subplot(221),histfit(A(:,1),8) subplot(222),histfit(A(:,2),8) subplot(223),histfit(A(:,3),8) subplot(224),histfit(A(:,4),7) %检验该数据是否服从正态分布 for i=1:4 [h(i),p(i),lstat(i),cv(i)]=lillietest(A(:,i),0.05); end h,p %十算岀前二列不服从正态分布,利用boxcox变换以后给岀该数据的密度函数[t1,l1]=boxcox(A(:,1)) [t2,l2]=boxcox(A(:,2)) [t3,I3]=boxcox(A(:,3))

数据分析实验报告册

《数据分析》 实验报告册 20 15 - 20 16 学年第一学期 班级: 学号: 姓名: 授课教师:实验教师:

目录 实验一网上书店的数据库创建及其查询 实验1-1 “响当当”网上书店的数据库创建 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验1-3 “响当当”网上书店会员分布和图书销售查询 实验二企业销售数据的分类汇总分析 实验2-1 Northwind公司客户特征分析 实验2-2 “北风”贸易公司销售业绩观测板 实验三餐饮公司经营数据时间序列预测 实验3-1 “美食佳”公司半成品年销售量预测 实验3-2 “美食佳”公司月管理费预测 实验3-3 “美食佳”华东分公司销售额趋势预测 实验3-4 “美食佳”公司会员卡发行量趋势预测 实验3-5 “美食佳”火锅连锁店原料年度采购成本预测 实验四住房建筑许可证数量的回归分析 实验4-1 “家家有房”公司建筑许可证一元线性回归分析实验4-2 “家家有房”公司建筑许可证一元非线性回归分析实验4-3 “家家有房”公司建筑许可证多元线性回归分析实验4-4 “家家有房”公司建筑许可证多元非线性回归分析 实验五手机用户消费习惯聚类分析 实验六新产品价格敏感度测试模型分析

实验一网上书店的数据库创建及其查询实验1-1 “响当当”网上书店的数据库创建 实验类型:验证性实验学时:2 实验目的: ?理解数据库的概念; ?理解关系(二维表)的概念以及关系数据库中数据的组织方式; ?了解数据库创建方法。 实验步骤: 这个实验我们没有直接做,只是了解了一下数据库的概念。 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验目的 ?理解odbc的概念; ?掌握利用microsoft query进行数据查询的方法。 实验步骤: 1..建立odbc数据源:启动microsoft office query应用程序,在microsoft office query应用程序窗口中,执行“文件/新建”命令,出现“选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。 选择数据源对话框创建新数据源窗口 做图上所示的选择odbc microsoft access安装对话框

大数据分析技术与应用_实验2指导

目录 1实验主题 (1) 2实验目的 (1) 3实验性质 (1) 4实验考核方法 (1) 5实验报告提交日期与方式 (1) 6实验平台 (1) 7实验内容和要求 (1) 8实验指导 (2) 8.2 开启Hadoop所有守护进程 (2) 8.2 搭建Eclipse环境编程实现Wordcount程序 (3) 1.安装Eclipse (3) 2.配置Hadoop-Eclipse-Plugin (3) 3.在Eclipse 中操作HDFS 中的文件 (7) 4.在Eclipse 中创建MapReduce 项目 (8) 5.通过Eclipse 运行MapReduce (13) 6.在Eclipse 中运行MapReduce 程序会遇到的问题 (16)

1实验主题 1、搭建Hadoop、Eclipse编程环境 2、在Eclipse中操作HDFS 3、在Eclipse中运行Wordcount程序 4、参照Wordcount程序,自己编程实现数据去重程序 2实验目的 (1)理解Hadoop、Eclipse编程流程; (2)理解MapReduce架构,以及分布式编程思想; 3实验性质 实验上机内容,必做,作为课堂平时成绩。 4实验考核方法 提交上机实验报告,纸质版。 要求实验报告内容结构清晰、图文并茂。 同学之间实验报告不得相互抄袭。 5实验报告提交日期与方式 要求提交打印版,4月19日(第10周)之前交到软件学院412。 6实验平台 操作系统:Linux Hadoop版本:2.6.0或以上版本 JDK版本:1.6或以上版本 Java IDE:Eclipse 7实验内容和要求 (1)搭建Hadoop、Eclipse编程环境; (2)运行实验指导上提供的Wordcount程序; (3)在Eclipse上面查看HDFS文件目录; (4)在Eclipse上面查看Wordcount程序运行结果; (5)熟悉Hadoop、Eclipse编程流程及思想; 程序设计题,编程实现基于Hadoop的数据去重程序,具体要求如下: 把data1文件和data2文件中相同的数据删除,并输出没有重复的数据,自己动手实现,把代码贴到实验报告的附录里。 设计思路: 数据去重实例的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。具体就是Reduce的输入应该以数据作为Key,而对value-list则没有要求。当Reduce 接收到一个时就直接将key复制到输出的key中,并将value设置成空值。在MapReduce流程中,Map的输出 经过shuffle过程聚集成后会被交给Reduce。所以从设计好的Reduce输入可以反推出Map输出的key应为数据,而

数据分析实验报告

《数据分析》实验报告 班级:07信计0班学号:姓名:实验日期2010-3-11 实验地点:实验楼505 实验名称:样本数据的特征分析使用软件名称:MATLAB 实验目的1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2.熟练掌握jbtest与lillietest关于一元数据的正态性检验; 3.掌握统计作图方法; 4.掌握多元数据的数字特征与相关矩阵的处理方法; 实验内容安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:表6.1.1废气、废水、固体废物排放量及污染治理的投入经费占GDP比重 年份 万元工业GDP 废气排放量 万元工业GDP 固体物排放量 万元工业GDP废 水排放量 环境污染治理投 资占GDP比重 (立方米)(千克)(吨)(%)1990 104254.40 519.48 441.65 0.18 1991 94415.00 476.97 398.19 0.26 1992 89317.41 119.45 332.14 0.23 1993 63012.42 67.93 203.91 0.20 1994 45435.04 7.86 128.20 0.17 1995 46383.42 12.45 113.39 0.22 1996 39874.19 13.24 87.12 0.15 1997 38412.85 37.97 76.98 0.21 1998 35270.79 45.36 59.68 0.11 1999 35200.76 34.93 60.82 0.15 2000 35848.97 1.82 57.35 0.19 2001 40348.43 1.17 53.06 0.11 2002 40392.96 0.16 50.96 0.12 2003 37237.13 0.05 43.94 0.15 2004 34176.27 0.06 36.90 0.13 1.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2.计算各指标的偏度、峰度、三均值以及极差; 3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDP废气排放量,安徽省与江苏省是 否服从同样的分布?

数值分析实验报告

学生实验报告实验课程名称 开课实验室 学院年级专业班 学生姓名学号 开课时间至学年学期

if(A(m,k)~=0) if(m~=k) A([k m],:)=A([m k],:); %换行 end A(k+1:n, k:c)=A(k+1:n, k:c)-(A(k+1:n,k)/ A(k,k))*A(k, k:c); %消去end end x=zeros(length(b),1); %回代求解 x(n)=A(n,c)/A(n,n); for k=n-1:-1:1 x(k)=(A(k,c)-A(k,k+1:n)*x(k+1:n))/A(k,k); end y=x; format short;%设置为默认格式显示,显示5位 (2)建立MATLAB界面 利用MA TLAB的GUI建立如下界面求解线性方程组: 详见程序。 五、计算实例、数据、结果、分析 下面我们对以上的结果进行测试,求解:

? ? ? ? ? ? ? ? ? ? ? ? - = ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? - - - - - - 7 2 5 10 13 9 14 4 4 3 2 1 13 12 4 3 3 10 2 4 3 2 1 x x x x 输入数据后点击和,得到如下结果: 更改以上数据进行测试,求解如下方程组: 1 2 3 4 43211 34321 23431 12341 x x x x ?? ???? ?? ???? ?? ???? = ?? ???? - ?? ???? - ???? ?? 得到如下结果:

宏观经济实验报告

学生实验报告

注:1.指导教师和学生成绩一栏由指导教师填写,其它栏目内容均由学生填写。 2.“实验项目名称”要与该实验课程教学大纲中的“实验项目”相对应。

附一: 四、实验指南 (一)宏观经济分析的基本方法 1.总量分析法 总量分析法是对影响宏观经济的总量指标进行分析,如GDP,消费额、投资额、银行贷款总额、物价水平等。总量分析主要是一种动态分析,主要研究总量指标的变动规律 2.结构分析法 是指对经济系统中各组成部分及其对比关系变动规律的分析。比如分析第一产业、第二产业、第三产业之间的比例,分析消费与投资的比例关系。结构分析主要是一种静态分析,即对一定时间内经济系统中各组成部分变动规律的分析 3.宏观分析资料的搜集与处理 宏观分析所需的有效资料一般包括政府的重点经济政策与措施、一般生产统计资料、金融物价统计资料、贸易统计资料、每年国民收入统计与景气动向、突发性非经济因素等。 (二)宏观经济分析的主要内容 宏观经济分析主要包括宏观经运行的变动、宏观经济政策、国际金融环境以及对证券市场的

供求关系等几个方面。当然像人口因素、能源因素以及包括政治因素、战争因素、灾害因素都有可能对证券市场产生决定性的影响,但在一般情况下,上述因素的作用机制必须单独分析研究。宏观经济分析的内容重在对宏观经济形势与经济背景作出基本判断,以分析在新兴加转型背景下中国宏观经济对证券市场的的影响,把握证券市场总体变动趋势,掌握宏观经济政策对证券市场的影响力度与方向,判断整个证券市场的投资价值。 1.宏观经济变动对证券市场的影响 宏观经济分析最重要的参考依据要选取官方公开公布的数据,尤其是国家统计局的数据相对最可靠。可借助统计工具与手段,了解证券价格变化与经济运行形势的关联性。 宏观经济分析包含的内容有许多,在此可重点选取几个方面进行分析,比如可以以国民生产总值对证券价格的影响,看看经济持续增长与衰退对证券市场的影响;也可以选取就业状况的变动对证券市场影响分析,就业状况的好坏不仅反映了经济状况,而且对证券市场资金供给的增减变化有密切关系。通过具体因素的分析,掌握宏观经济形势对证券市场的影响方式与影响程度。宏观经济的运行形势对证券市场的影响可见表3-1、3-2、3-3。 表3-1 评价宏观经济形势的基本指标 表3-2 宏观经济运行对证券市场的影响

数据分析实验报告

数据分析实验报告 【最新资料,WORD文档,可编辑修改】 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50 751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689

1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验 单样本Kolmogorov-Smirnov 检验 身高N60正态参数a,,b均值139.00

标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z.686 渐近显着性(双侧).735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验

数据仓库与数据挖掘实验二(多维数据组织与分析)

一、实验内容和目的 目的: 1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系; 2.理解多维数据集创建的基本原理与流程; 3.理解并掌握OLAP分析的基本过程与方法; 内容: 1.运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。 2.使用维度浏览器进行多维数据的查询、编辑操作。 3.对多维数据集进行切片、切块、旋转、钻取操作。 二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Windows 7 数据库平台:SQL Server 2008 SP2 三、实验原理 在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。 OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。 建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基

于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的OLAP,简称关系OLAP。 OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。 四、实验方法、步骤 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。 五、实验过程原始记录(数据、图表、计算等) 本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。 首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis Service项目,命名为:DW

数值分析实验(2)word版本

数值分析实验(2)

实验二 插值法 P50 专业班级:信计131班 姓名:段雨博 学号:2013014907 一、实验目的 1、熟悉MATLAB 编程; 2、学习插值方法及程序设计算法。 二、实验题目 1、已知函数在下列各点的值为 试用4次牛顿插值多项式()4P x 及三次样条函数()S x (自然边界条件)对数据进行插值用图给出(){},,0.20.08,0,1,11,10i i i x y x i i =+=,()4P x 及()S x 。 2、在区间[]1,1-上分别取10,20n =用两组等距节点对龙格函数()2 1125f x x = +作多项式插值及三次样条插值,对每个n 值,分别画出插值函数及()f x 的图形。 3、下列数据点的插值 可以得到平方根函数的近似,在区间[]0,64上作图 (1)用这9个点作8次多项式插值()8L x (2)用三次样条(第一边界条件)程序求()S x 从得到结果看在[]0,64上,哪个插值更精确;在区间[]0,1上,两种插值哪个更精确? 三、实验原理与理论基础

1、拉格朗日差值公式 )()(111k k k k k k x x x x y y y x L ---+ =++ 点斜式 k k k k k k k k x x x x y x x x x y x L --+--=++++11111)( 两点式 2、n 次插值基函数 ....,2,1,0,)()(0n j y x l y x L i j n k k k j n ===∑= n k x x x x x x x x x x x x x l n k n k k k k k ,...,1,0,) () (... ) () (... ) () ()(1100=------= -- 3、牛顿插值多项式 ...))(](,,[)](,[)()(102100100+--+++=x x x x x x x f x x x x f x f x P n ))...(](,...,[100---+n n x x x x x x f )(],...,,[)()()(10x x x x f x P x f x R n n n n +=-=ω 4、三次样条函数 若函数],,[)(2b a C x S ∈且在每个小区间],[1+j j x x 上是三次多项式,其中, b x x x a n =<<<=...10是给定节点,则称)(x S 是节点n x x x ,...,,10上的三次样条函数。若在节点j x 上给定函数值),,...,2,1,0)((n j x f y j i ==并成立,,...,2,1,0,)(n j y x S i j ==则称)(x S 为三次样条插值函数。 5、三次样条函数的边界条件 (1)0)()(''''''00''====n n f x S f x S (2)'''00')(,)(n n f x S f x S == 四、实验内容 1、M 文件: function [p]=Newton_Polyfit(X,Y) format long g r=size(X); n=r(2); M=ones(n,n); M(:,1)=Y'; for i=2:n

数据分析实验报告

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share

price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75 3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

经济数据分析实验报告

(此文档为word格式,下载后您可任意编辑修改!) 实验报告格式: 商学院经济与管理实验教学中心 实验报告 实验名称经济数据分析综合实验 班级学号姓名 同组学生姓名实验时间:7-18周 得分:批改时间:2014年01月03日实验教师(签名):孙小红评语: 实验一:数据文件的建立 一、实验目的 1、理解并掌握数据类型的概念。 2、掌握一份具体问卷转化为数据文件。 3、掌握正确设置变量及属性,区分处理主观题与客观题、单选题、多选题及表格式题目 的不同之处。 4、掌握带标签值数据的录入。 二、实验内容 见《实验手册》。 三、实验步骤 本次试验的内容是“数据文件的建立”。以下介绍两种不同的数据文件建立方法。 第一种输入变量和数据建立数据文件,以“温州企业基本情况”数据文件为例 1、双击打开SPSS 17.0软件,在弹出的对话框中选择“输入数据” 2、切换到“变量视图”,单击“名称”下的空格,输入“ID”,单击“类型”下的空格,选 择“数值,宽度为2,小数为0”,单击“标签”下的空格,输入“问卷编号”,其他各列选择默认值 3、同步骤2,在“名称”下输入“企业名称”,在“类型”下选择“字符串,宽度为30,

小数为0”,其余默认。 4、在“名称”下输入“企业性质”,在“类型”下选择“数值,宽度为1,小数为0”。单击“值”,弹出“值标签”对话框,在“值”栏输入“1”,在“标签”输入“国有及国有控股企业”,选择“添加”,同理输入其他的选项,接着按“确定”,其余默认。 5、按照步骤4,输入“企业经营情况”和“所属行业” 6、切换到“数据视图”,在各个变量下输入数据 7、选择“文件”菜单,下拉,按“保存” 第二种导入EXCEL文件建立数据文件,以“学生”数据文件为例 1、双击打开SPSS.17.0 2、选择“文件”菜单,下拉,选择“打开---数据”,在弹出的对话框中,在“文件类型”下拉,选择“EXCEL”,然后再选择“查找范围”,选中所要导入的EXCEL“学生”文件。 3、切换到“变量视图”,在“gender”变量的“值”栏,单击添加“1=男生,2=女生”,点击“确认”。 4、选择“文件”菜单,下拉,按“另存为”,存在D盘 四、实验结果与分析 1 企业基本情况 2 态度与认识 3 资金投入、人力资源和企业文化

光电效应实验报告数据处理 误差分析

表1-1:不同频率下的遏止电压表 λ(nm)365 404.7 435.8 546.1 577 v(10^14)8.219 7.413 6.884 5.493 5.199 |Ua|(v) 1.727 1.357 1.129 0.544 0.418 表1-2:λ=365(nm)时不同电压下对应的电流值 U/(v)-1.927 -1.827 -1.727 -1.627 -1.527 -1.427 -1.327 I/(10^-11)A-0.4 -0.2 0 0.9 3.9 8.2 14 -1.227 -1.127 -1.027 -0.927 -0.827 -0.727 -0.718 24.2 38.1 52 66 80 97.2 100 表1-3:λ=404.7(nm)时不同电压下对应的电流值 U/(v) -1.477 -1.417 -1.357 -1.297 -1.237 -1.177 -1.117 I/(10^-11)A -1 -0.4 0 1.8 4.1 10 16.2 -1.057 -0.997 -0.937 -0.877 -0.817 -0.757 -0.737 24.2 36.2 49.8 63.9 80 93.9 100 表1-4:λ=435.8(nm)时不同电压下对应的电流值 U/(v)-1.229 -1.179 -1.129 -1.079 -1.029 -0.979 -0.929 I/(10^-11)A-1.8 -0.4 0 2 4.2 10.2 17.9 -0.879 -0.829 -0.779 -0.729 -0.679 -0.629 -0.579 -0.575 24.8 36 47 59 71.6 83.8 98 100 表1-5:λ=546.1(nm)时不同电压下对应的电流值 U/(v)-0.604 -0.574 -0.544 -0.514 -0.484 -0.454 -0.424 I/(10^-11)A-4 -2 0 3.8 10 16.2 24 -0.394 -0.364 -0.334 -0.304 -0.274 -0.244 -0.242 34 46 56.2 72 84.2 98.2 100 表1-6:λ=577(nm)时不同电压下对应的电流值 U/(v)-0.478 -0.448 -0.418 -0.388 -0.358 -0.328 -0.298 I/(10^-11)A-3.1 -1.8 0 2 6 10.2 16.1 -0.268 -0.238 -0.208 -0.178 -0.148 -0.118 -0.088 -0.058 22.1 31.8 39.8 49 58 68.2 79.8 90.1 -0.04 100

数据分析实验报告p

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 2.00 1 . 03 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验 数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下: (1)K—S检验 单样本 Kolmogorov-Smirnov 检验 身高 N 60 正态参数a,,b均值139.00 标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z .686 渐近显着性(双侧) .735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验 正态性检验

结果:在Shapiro-Wilk 检验结果972.00=w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5多维正态数据的统计量 均值向量为:)767.33,505.4,836.27,219.18(=- X

数值分析实验报告册

实验名称:Lagrange插值(实验一) 实验目的: 掌握Lagrange插值数值算法,能够根据给定的函数值表达求出插值多项式和函数在某一点的近似值。实验准备: 1.在开始本实验之前,请回顾教科书的相关内容; 2.需要一台准备安装Windows XP Professional操作系统和装有数学软件的计算机。 实验内容及要求 已知数据如下: 要求: 试用Lagrange插值多项式求0.5626,0.5635,0.5645 x 时的函数近似值. 实验过程: 编写Matlab函数M文件Lagrange如下: function yy=lagrange(x,y,xi) m=length(x); n=length(y); if m~=n,error('向量x与y的长度必须一致');end for k=1:length(xi) s=0; for i=1:m z=1; for j=1:n if j~=i z=z*(xi(k)-x(j))/(x(i)-x(j)); end end s=s+z*y(i); end yy=s end 在命令窗口调用函数M文件lagrange,输出结果如下: >>x=[0.56160, 0.56280, 0.56401, 0.56521]; >>y=[0.82741, 0.82659, 0.82577, 0.82495]; >>xi=[0.5626, 0.5635, 0.5645]; >>yi= lagrange (x,y,xi)

yi= 0.8628 0.8261 0.8254 实验总结(由学生填写): 教师对本次实验的评价(下面的表格由教师填写): 实验名称:曲线拟合的最小二乘方法(实验二) 实验目的: 掌握最小二乘方法,并能根据给定数据求其最小二乘一次或二次多项式,然后进行曲线拟合。实验准备: 1.在开始本实验之前,请回顾教科书的相关内容;

spss相关分析实验报告

实验五相关分析实验报关费 一、实验目的: 学习利用spss对数据进行相关分析(积差相关、肯德尔等级相关)、偏相关分析。利用交叉表进行相关分析。 二、实验内容: 某班学生成绩表1如实验图表所示。 1.对该班物理成绩与数学成绩之间进行积差相关分析和肯德尔等级相关 分析。 2.在控制物理成绩不变的条件下,做数学成绩与英语成绩的相关分析(这 种情况下的相关分析称为偏相关分析)。 3.对该班物理成绩与数学成绩制作交叉表及进行其中的相关分析。 三、实验步骤: 1.选择分析→相关→双变量,弹出窗口,在对话框的变量列表中选变量 “数学成绩”、“物理成绩”,在相关系数列进行选择,本次实验选择 皮尔逊相关(积差相关)和肯德尔等级相关。单击选项,对描述统计 量进行选择,选择标准差和均值。单击确定,得出输出结果,对结果 进行分析解释。 2.选择分析→相关→偏相关,弹出窗口,在对话框的变量列表选变量“数 学成绩”、“英语成绩”,在控制列表选择要控制的变量“物理成绩” 以在控制物理成绩的影响下对变量数学成绩与英语成绩进行偏相关分 析;在“显著性检验”框中选双侧检验,单击确定,得出输出结果, 对结果进行分析解释。 3.选择分析→描述统计→交叉表,弹出窗口,对交叉表的行和列进行选 择,行选择为数学成绩,列选择为物理成绩。然后对统计量进行设置, 选择相关性,点击继续→确定,得出输出结果,对结果进行分析解释。 四、实验结果与分析:

表1

五、实验结果及其分析:

分析一:由实验结果可观察出,数学成绩与物理成绩的积差相关系数r=,肯德尔等级相关系数r=可知该班物理成绩和数学成绩之间存在显著相关。

试验设计与数据分析

1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和 多重比较? (1)方差分析的意义 方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。 (2)平方和及自由度的分解 方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。 (3)F检验和多重比较 ①F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得的F值与根据df1=df t(分子均方的自由度)、df2=df e(分母均方的自由度)查附表4(F值表)所得的临界F值(F0.05(df1,df2)和F0.01(df1,df2))相比较做出统计判断。若F< F0.05(df1,df2),即P>0.05,不能否定H0,可认为各处理间差异不显著;若F0.05(df1,df2)≤F<F0.01(df1,df2),即0.01

相关主题
文本预览
相关文档 最新文档