多元统计分析
(第一次作业)
学院:信息与计算科学学院
专业: ____________ 指导老师: ____________ 小组成员:罗健水(20080560)
许志欢(20080574)
庄娜(20080595)
卓玛(20080561)
2011年4月10日
题目:某行政系统所属独立核算工业企业16个行业经济实力强弱的聚类分析
独立核算:独立核算是指对本单位的业务经营活动过程及其成果进行全面、系统的会计核算。独立核算单位的特点是:在管理上有独立的组织形式,具有一定数量的资金,在当地银行开户;独立进行经营活动,能同其他单位订立经济合同;独立计算盈亏,单独设置会计机构并配备会计人员,并有完整的会计工作组织体系。
非独立核算又称报帐制,是把本单位的业务经营活动有关的日常业务资料,逐日或定期报送上级单位,由上级单位进行核算。非独立核算单位的特点是:一般由上级拔给一定数额的周转金,从事业务活动,一切收入全面上缴,所有支出向上级报销,本身不单独计算盈亏,只记录和计算几个主要指标,进行简易核算
数据来源:上海市青浦区统计局数据链接:数据5?11.sav
固定资产原价:指企业在建造、改置、安装、改建、扩建、技固定资产计量术改造固定资产时实际支出的全部货币总额。该指标根据企业会计"资产负债表"中"固定资产原价"项的期末数填列。
固定资产净值平均余额:每月逐步减少。有部分企业单位,是按季度计提折旧,那么在没有提折旧的月
份,比如10月份,和9月份比较,固定资产净值平均余额就没有变化,也就是说,还是等于9月份的
固定资产净值平均余额
例:如09年底的固定资产净值余额为5000万元,2010年元月份完成固定资产投资1000万元,那么元月份的固定资产净值平均余额是多少?2月份又完成投资500万元,那2月份的固定资产净值平均余额是多少?(计算公式是怎样)
解:平均余额等于期初的加期末的除以2
所以一月份=(5000+6000-当月折旧)/2
二月份的=(6000+6500-两个月的折旧)/2
所有者权益(Owne' s Equities:资产扣除负债后由所有者应享的剩余利益。即一个会计主体在一定时期所拥有或可控制的具有未来经济利益资源的净额。
营业税金及附加:主营业务税金及附加”科目改名为“营业税金及附加”,
“营业税金及附加”科目用法如下:
一、本科目核算企业经营活动发生的营业税、消费税、城市维护建设税、资源税和教育费附加等相关税费。
房产税、车船使用税、土地使用税、印花税在“管理费用”等科目核算,不在本科目核算。
二、企业按规定计算确定的与经营活动相关的税费,借记本科目,贷记“应交税费”等科目。企业收到的返还的消费税、营业税等原记入本科目的各种税金,应按实际收到的金额,借记“银行存款”科目,贷记本科目。
三、期末,应将本科目余额转入“本年利润”科目,结转后本科目应无余额。
12. 由于分期收款销售商品核算方法与以前不同,新增加科目“长期应收款”, “长期应收款”科目核算如下:
一、本科目核算企业融资租赁产生的应收款项和采用递延方式分期收款、实质上具有融资性质的销售商品和提供劳务等经营活动产生的应收款项。
二、本科目应当按照承租人或购货单位(接受劳务单位)等进行明细核算。
三、长期应收款的主要账务处理
1. 操作步骤
(1)打开数据文件后,在数据编辑窗口中的菜单栏中选择Analyze | Classily | Hierarchical Cluster (分层聚类)命令,即可打开分层聚类的主对话框。
(2)将变量“本月”选人Variable(s)列表框,作为分层聚类的变量。
(3)在Cluster 选项组中选择Variable 单选按钮,及要求按变量进行聚类。
(4)单击Plots 按钮,在如图所示的Hierarchical Cluster Analysis:Plots 对话框中选择Dendrogram 复选框,要求输出谱系图。单击Continue 按钮确认选择并返回主对话框。
(5)其他设置采用系统默认设置。
6)单击OK 按钮,执行分层聚类操作
用最短距离法分析:
表1个案摘要
a. Squared Euclidean Distance Undefined error #14704 - Cannot open tex
从表中看出,观测个案数为16个,没有缺失值,采用平方欧氏距离
表2相似矩阵
相似矩阵是一个对角矩阵,只需看上三角或下三角,它是用来度量两个样本之间的相似性,先把相似系数小的聚为一类,依次下去。
在表4中,第一列(Stage表示聚类分析的部署;第二列,第三列(Cluster Combined) 表示这
一步聚类中哪两个样本合小类样本聚成一类;第四列(Coefficie nts)是个体距离或
小
类距离;第五列和第六列(Stage Cluster First Appea)表示这一部中的样本在上面几步中哪一步出现过;第七列(Next Stage)表示本不聚类的结果将在以下第几步中用到。
举例分析:第一行中,8和11聚为一类,接下来,第十二行中,2和5聚为一类,2在第十行聚类中出现过,5上一次在第五行聚类中出现过,接下来,转向第十三行聚类。。。
冰川图
Rescaled Distance Cluster Corribine
Case 8 Case 11
* Case 14
Case 5 Case 7
Case 2 Case 6 Case 13 Case 16
Case 3
Case 15 Case 10
Case 4
Ca3e 12 Case 9 Case 1
树形图以躺倒数的形式展现了聚类分析中的每一次类合并的情况。 SPSS 自动将各类见得距离映射在
0到25之间,并将聚类过程近似的表示在图上。由表 5可以看出,首先合并成一类的是家具制造业,文 教体育用品制造业,纺织服装、鞋、帽制,日用金属制品业 等聚为一类。直到所有观测个案都合并成一 类,此时之间的距离已经变得非常大了。
举例分析:聚三类,{8 11 14 5 7
2 6 13
16 15
10 4
12},{9},{1}聚为一类。
树形图的结果与冰状图的结果是吻合的,二者反映的类合并情况是一样的。
最短距离法
CASE Lalcel Mu B 11 14
5 7
2
5 13
16 3
15 10
4 12 9 t
5
10
15
20
25
重心法
Rescaled D istance Cluster Combine
c 0S E□Lebu 1Num+—
—Case88—
—Case1111
Cass1414
Case77—i Case55
Case04
Case1212
Case33
Ca3e1515
Case1010
Case22
Case66
Case1313II g曰亡1616」
99
Case11ia2025
-+—I
最长距离法
Rescaled Distance Cluster Contoine
Label Pluim+—Case88—1 Case1111
Case55—Case171 Case1414
Case44
Case1212
Case33
Case1515J Case1010
Case22
Case66
Case1313
Case1616-1 Case99
Case11is -+
1.农副食品加工业
2.食品制造业
3. 饮料制造业
4. 纺织业
5. 纺织服装、鞋、帽制
6.皮革、毛皮、羽毛(绒)及其制品业
7. 木材加工及木、竹、藤、棕、草制品业
8.家具制造业9. 造纸及纸制品业10. 印刷业和记录媒介的复制11.文教体育用品制造业
12.化学原料及化学制品制造业13. 医药制造业14. 日用金属制品业15. 仪器仪表及
文化、办公用机械制造业16. 工艺品及其他制造业我们分别用最短距离法,重心法,最长距离法三种不同的方法将样本聚为三类,结果如上图所示,把三种方法中都为第一类的归为第一类,第二类的归为第二类,第三类的归为第三类,其中有争议的是医药制造业和工艺品及其他制造业,最短距离法和重心法都将其聚在第一类,故医药制造业和工艺品及其他制造业应聚在第一类。最终结果如下所示:
第一类:8 11 14 5 7 2 6 13 16 15 10 4 12
第二类:9
第三类:1
最终结果如下:
第一类:8 11 14 7 5 4 12 3 15 10 2 6 第二类:13 16
第三类:9
第四类:1