基于聚类分析方法的我国高等学校的分类研究
- 格式:pdf
- 大小:6.08 MB
- 文档页数:7
我国普通高中教育发展水平分类——基于因子分析和聚类分
析方法
顾天竹
【期刊名称】《内蒙古教育:职教版》
【年(卷),期】2016(000)006
【摘要】本文从教育投入、参与和产出这三个方面构建指标体系,运用因子分析和聚类分析方法对我国各省、自治区、直辖市的普通高中教育发展水平进行排序和分类,进一步描述和分析其差异性,为各地普通高中教育的发展提供参考依据,从而为缩小区域间高中教育发展水平的差距、促进教育公平作出贡献。
【总页数】3页(P16-18)
【作者】顾天竹
【作者单位】南京农业大学经济管理学院
【正文语种】中文
【中图分类】G639.21
【相关文献】
1.基于因子分析和聚类分析的我国高等教育发展水平分类 [J], 申新鑫
2.基于聚类分析方法的我国高等学校的分类研究 [J], 薛新龙;李立国
3.基于聚类分析方法的我国高等学校的分类研究 [J], 薛新龙;李立国;
4.我国西北五省区高等教育发展水平研究\r——基于因子分析法 [J], 王烁;张春海
5.我国西北五省区高等教育发展水平研究——基于因子分析法 [J], 王烁; 张春海
因版权原因,仅展示原文概要,查看原文内容请购买。
聚类分析与判别分析在高校贫困生认定中的应用[摘要] 基于高校贫困生认定时不同高校贫困生情况不同的事实,本文利用系统聚类分析和Fisher判别分析将全国典型的60所高校分为了五类,并得到了每一类高校的判别函数,以此对我国其余高校进行分类。
通过每类高校贫困生特征的总结,论文很大程度上提高了高校贫困生认定的准确性,优化了国家贫困生资助体系,为当前高校贫困生认定工作提供科学依据。
[关键词] 贫困生认定高校分类聚类分析Fisher判别分析[Abstracts] After investigating the different situations 60 schools have faced in identifying financially strapped students, the various situations were classified into five categories using Cluster Analysis and Fisher Discriminant Analysis, the discriminant function of each category was acquired, and the rest Chinese schools were categorized following the functions. The advantages of the discriminant function is that, by summarizing the traits poor students possess, the profoundly promoted identifying accuracy, a optimized national financial aid system, and a scientific foundation in each school’s works on poor students nowadays will be achieved.[Key words] Identification of Strapped Students Categorization of schools Cluster AnalysisFisher Discriminant Analysis1.当前我国贫困生认定现状与对策分析1.1我国当前贫困生认定工作状况胡锦涛总书记在中国共产党第十七次全国代表大会上的报告中指出:“教育是民族振兴的基石,教育公平是社会公平的重要基础。
课程设计:应用元统计分析浅析“985工程”高校学院:理学院专业:统计学:启哲学号:1031040238指导老师:闫霏霏摘要:改革开放30多年来,随着我国“科教兴国”和“人才强国”战略的深入实施,科技进步和技术创新已成为经济与社会发展的第一推动力。
实施“985”工程,是中国政府推进高等教育发展,促进高等教育与经济社会发展相适应的一项重要措施。
研究它有利于推动我国高校的发展,这里我们运用聚类分析的方法,从我国高校的“人才培养”和“科学研究”两大职能入手,对“985工程”高校进行分类评价,为高校良性竞争并提升办学水平和社会影响力,以及这些国家一流高校以后的发展提供一些力所能及的参考关键词:聚类分析统计高校排名1 引言“985工程”是我国政府为建设若干所世界一流大学和一批国际知名的高水平研究型大学而实施的高等教育建设工程。
“985工程优势学科创新平台项目”是以国家和行业发展急需的重点领域和重大需求为导向,围绕国家科技发展战略和学科前沿,加大学科结构调整力度,促进学科交叉,大力提高建设学科的科技创新能力和解决制约经济社会发展重大瓶颈问题的能力而开始进行的国家级教育建设工程。
“985”高校如下:“985”一期学校(34所)清华大学大学中国科技大学大学复旦大学交通大学交通大学大学工业大学南开大学天津大学东南大学华中科技大学大学大学大学大学中国海洋大学中南大学大学理工大学理工大学航空航天大学大学电子科技大学大学华南理工大学大学大学东北大学西北工业大学同济大学师大学中国人民大学“985”二期学校(4所)中国农业大学国防科技大学中央民族大学西北农林科技大学本次评价从高校的“人才培养和科学研究”两大职能入手,以“衡量高校科学与人才的贡献能力”为评价目标,对我国高校的进行综合选优排序。
排名选用二级评价指标体系,一级指标由“人才培养”、“科学研究”和“综合声誉”三个指标构成。
二级指标由科研基地、科研项目、科研成果、培养基地、师资队伍、杰出校友和综合声誉构成。
2015第6期 也章篇專敎言N〇.6,2015 (总第 19 期)SHANDONG HIGHER EDUCATION General No.19基于聚类分析方法的我国高等学校的分类研究薛新龙李立国(中国人民大学教育学院,北京100872)摘要:高等学校的分类问题是目前我国高等教育领域亟待解决的问题。
在确定分类准则时,应当以人才培养为导向对我国高校进行分类。
由于目前针对我国高校分类问题的研究只停留在理论探讨层面上,缺乏相 应的实证研究,因而有必要通过聚类分析算法的快速聚类将全国高校进行分类,将分类方法与高校具体情况相结合进行实证研究探索,使分类结果得以具体化、形象化。
关键词:高校;高校分类;人才培养;聚类分析中图分类号:G647 文献标识码:A文章编号:2095-6800(2015)06-013-0718世纪以前,高等教育机构基本上只有大学一种组织形式"1](178),那时的高校指的就是大学。
随着高 等教育职能的拓展,高等教育的内涵发生了巨大的改变,高校的形式和类型出现了分化。
尤其是在20世 纪人类社会拓展了高校社会服务的职能之后,大学的作用得到了普遍的认可和肯定;在国家政府的支持 之下,高等教育机构如雨后春笋般建立起来。
由于各国经济基础、历 在 ,一国家,之的经济、化发展 在 现象,由此建立的高等教育机构形态各。
既然高等教育机构在客观上存在 ,无论是一国的高等教育,还是对高校的发展和导,一学的分类标准对高等学校 分类。
如日本学 :“在的大学构成高等教育 的国家,一定的 大学 、分类,之类型化。
上,在高等教育大众化、普及化阶段,高等学校走向多样化、多元化、国际化的 ,并不存在某种高校分类 能 一国的高校发展 。
美国的卡内基“高等教育机构分类”之以1973 出版之后,其基本分类模式和分类 ,大 上就是 高等学校是发展变化的,的一分类高校在变的。
那,既然高校分类是高等教育大化高校 化发展的 ,国的高校普遍在着“分类清、定 明”的,们应该按照什么原则、采用什 国高校 分类定?一、应当以人才培养为导向对我国高等学校进行分类定位我国高等教育发展较国外起步晚,因此在进行国内高等教育分类研究时,对于国外的经验进行分析 总结借鉴研究是的。
聚类分析算法聚类分析算法对高校学生成绩分析的应用研究聚类分析算法对高校学生成绩分析的应用研究 *** 15级信管4班 2220__602063077 摘要:数据挖掘就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程。
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
聚类分析的目标就是在相似的基础上对收集数据来分类。
聚类的应用源于很多不同的领域,包括数学,计算机科学,统计学,生物学和经济学。
在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
聚类分析常用算法原理:K-means,DBSCAN,层次聚类。
聚类分析是非监督学习的很重要的领域。
所谓非监督学习,就是数据是没有类别标记的,算法要从对原始数据的探索中提取出一定的规律。
关键词:数据挖掘聚类分析学生成绩分析 1.概述 1.1研究意义数据挖掘的方法有很多种,聚类分析法是目前最有应用前景的方法之一。
聚类分析法能作为一个独立的工具来获得数据分布的情况,观察每个簇的特点,并能集中对特定的某个簇进行特定的分析。
本文旨在研究如何将聚类算法应用到学生成绩分析中,对学生成绩进行评价和分析,并从大量的学生成绩中提取出更有用的信息。
传统的方法是基于绝对分数的评价,这种方法存在一定的缺陷,不能充分反映学生原始成绩中蕴涵的信息。
对学生原始成绩进行登记评定是教学管理中的重要环节,传统的评定方法是基于分数的绝对评价,这种方法存在一定缺陷。
学生成绩分析是一个典型的多层次、多角度、多指标的综合评估分析问题,利用数据挖掘中的聚类分析算法获取学生成绩中隐含的规律,挖掘各科成绩背后所表达出来的学生的个性能力差异。
因此,论文应用聚类分析的思想,对学生的成绩进行划分和评价,弥补了传统方法的缺陷,其评价结果为教学人员提供了有利的依据。
聚类分析案例—我国各地区普通高等教育发展状况分析聚类分析又称群分析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。
对样本进行分类称为Q型聚类分析,对指标进行分类称为R型聚类分析。
本案例运用Q型和R型聚类分析方法对我国各地区普通高等教育的发展状况进行分析。
1.案例研究背景近年来,我国普通高等教育得到了迅速发展,为国家培养了大批人才。
但由于我国各地区经济发展水平不均衡,加之高等院校原有布局使各地区高等教育发展的起点不一致,因而各地区普通高等教育的发展水平存在一定的差异,不同的地区具有不同的特点。
对我国各地区普通高等教育的发展状况进行聚类分析,明确各类地区普通高等教育发展状况的差异与特点,有利于管理和决策部门从宏观上把握我国普通高等教育的整体发展现状,分类制定相关政策,更好的指导和规划我国高教事业的整体健康发展。
-592-2.案例研究过程(1)建立综合评价指标体系高等教育是依赖高等院校进行的,高等教育的发展状况主要体现在高等院校的相关方面。
遵循可比性原则,从高等教育的五个方面选取十项评价指标,具体如图4。
(2)数据资料指标的原始数据取自《中国统计年鉴,1995》和《中国教育统计年鉴,1995》除以各地区相应的人口数得到十项指标值见表6。
其中:1x为每百万人口高等院校数;2x为每十万人口高等院校毕业生数;3x为每十万人口高等院校招生数;4x为每十万人口高等院校在校生数;5x为每十万人口高等院校教职工数;6x为每十万人口高等院校专职教师数;7x为高级职称占专职教师的比例;8x为平均每所高等院校的在校生数;9x为国家财政预算内普通高教经费占国内生产总值的比重;10x为生均教育经费。
图4高等教育的十项评价指标(3)R型聚类分析定性考察反映高等教育发展状况的五个方面十项评价指标,可以看出,某些指标之间可能存在较强的相关性。
比如每十万人口高等院校毕业生数、每十万人口高等院校招生数与每十万人口高等院校在校生数之间可能存在较强的相关性,每十万人口高等院校教职工数和每十万人口高等院校专职教师数之间可能存在较强的相关性。
2015第6期 也章篇專敎言N〇.6,2015 (总第 19 期)SHANDONG HIGHER EDUCATION General No.19基于聚类分析方法的我国高等学校的分类研究薛新龙李立国(中国人民大学教育学院,北京100872)摘要:高等学校的分类问题是目前我国高等教育领域亟待解决的问题。
在确定分类准则时,应当以人才培养为导向对我国高校进行分类。
由于目前针对我国高校分类问题的研究只停留在理论探讨层面上,缺乏相 应的实证研究,因而有必要通过聚类分析算法的快速聚类将全国高校进行分类,将分类方法与高校具体情况相结合进行实证研究探索,使分类结果得以具体化、形象化。
关键词:高校;高校分类;人才培养;聚类分析中图分类号:G647 文献标识码:A文章编号:2095-6800(2015)06-013-0718世纪以前,高等教育机构基本上只有大学一种组织形式"1](178),那时的高校指的就是大学。
随着高 等教育职能的拓展,高等教育的内涵发生了巨大的改变,高校的形式和类型出现了分化。
尤其是在20世 纪人类社会拓展了高校社会服务的职能之后,大学的作用得到了普遍的认可和肯定;在国家政府的支持 之下,高等教育机构如雨后春笋般建立起来。
由于各国经济基础、历 在 ,一国家,之的经济、化发展 在 现象,由此建立的高等教育机构形态各。
既然高等教育机构在客观上存在 ,无论是一国的高等教育,还是对高校的发展和导,一学的分类标准对高等学校 分类。
如日本学 :“在的大学构成高等教育 的国家,一定的 大学 、分类,之类型化。
上,在高等教育大众化、普及化阶段,高等学校走向多样化、多元化、国际化的 ,并不存在某种高校分类 能 一国的高校发展 。
美国的卡内基“高等教育机构分类”之以1973 出版之后,其基本分类模式和分类 ,大 上就是 高等学校是发展变化的,的一分类高校在变的。
那,既然高校分类是高等教育大化高校 化发展的 ,国的高校普遍在着“分类清、定 明”的,们应该按照什么原则、采用什 国高校 分类定?一、应当以人才培养为导向对我国高等学校进行分类定位我国高等教育发展较国外起步晚,因此在进行国内高等教育分类研究时,对于国外的经验进行分析 总结借鉴研究是的。
在现有的研究果,国外高校分类关注的焦点在于美国内基“高等教育机构分类”、联合国教 组织的“国教育分类”、国加州高等教育 以欧洲“大学图”等内容的 介绍。
有学者进行我国高等教育分类研究的尝试,在提出分类 时,多以模仿国外高校分类指标为主,创点较少,在选取指时并未社会调查 学性、性分析,大量设置的投入性指会造高校竞争和攀高现象出现。
在一些自主研发的高校分类 ,国学和政策研究作者简介:薛新龙,中国人民大学教育学院博士研究生;李立国,中国人民大学教育学院教授,博士生导师。
成弇省岑致有-2015年第6期的设计思路仍然存在单一学术型标准和层次分类等传统分类方法的影响,将学科类、专业类高校与职业 类高校视为层次上的差别。
在高等职业教育被纳人高等教育体系之后,高等职业教育已经占据我国高等 教育半壁江山,这种分类思路存在不合理,这三类高校的差异应当是体现在人才培养类型上的不同,而 非层次上的差异。
潘懋元先生认为,高校定位不只是高低层次的定位,也不只是学科门类的定位;定位的主要依据应 当是高等学校培养人才的职。
&3],我的社会主义现代化建设,要当数量的研究型专家和高层次专门人才,也要数以万计的各级各类、各行各业的生、管理、的职业型、技能型专门人才。
在 经济体 的,高校的 设要教育的 ,也应 以提升。
高等学校的主要功能是人才培养;行业分工、经 人才的需求,而只 的高等教育形式才能培养 的人类型。
传统的以学科 的分类方法导致“千校一面”,高校 为学术性研究型学,在这种高校 同培养出的学生 应社的和。
我国高等学校的分类体系和分类标准应当以经济社会发展、行业发展职业要求为依据,以实现人才 培养体系的元化、高等教育体系功能的多元为,以人才培养的质量和 为 。
在设置具体的分类体系和分类准、对我高等学校进行分类定位,可以 人才培养的 *、硕士、学士、专科)、类型*学术人才与理论人才、应用人才、人才),以及高校学生学科专业和高校学生就业的业职业把我高等学校分为学术研究类高校、应用研究类高校、应用技术类高校、应 类高校、职业技能类高校五种类型。
这五种高校的 类 学科 人才培养 一分为综合型、多科型、单科型。
种类型,培养目标及发展方向。
这五类高校的分类与学校在、系、、校名、办学历史没有必然关系,它们既可以是大学,也以是学院。
这五类高校的设与专业设置、人才培养以学科、专业一行业、职业为坐。
学 术研究类高校人才培养是 学科专业设%应研究类高校、应 术类高校、应 类高校是按照学科、专业一业、职业来设%职业技能类高校则主要依据职业与行业 专业设置与高校设。
学术研究类高校主要培养学术人才与理型人才,个一级学科的博士学位授予权,主要应于少数进行高水2人才培养的研究型大学;应用研究类高校主要培养应型理论型人才,博士学位授予权 个一级学科 学位授予权,对应于具有一定科研 的高校;应用技术类高校主要培养应 术类的通用型人才,学位授予权,主要对应一般的本科院校;应用技能类高校主要立足于培养具有一定理论基础的技能型、岗位型人才,具有学士学位授予权,主要应于新建本科院校;职 业技能类高校主要培养职业岗位需求的岗位型、操作型人才,主要应于高职院校。
二、聚类分析方法对我国高等学校分类的作用我国目前所开展的高校分类研究中,分类研究者对于高校分类类型的提出大多基于深厚的思辨能 力和对被分类高校的深人认知。
在 的分类方法后,分类方法的优劣与是否合宜难以借助范性的格式体现,并缺乏相应的证研究。
很多学者 我国高等学校分类方法的 仅仅是一个构想,具体落实在我国2000多所高校之后是什么样的分类效果,尚不得而知。
而高等学校的分类对于整个高 等教育系统的影响极其深远,一种分类方法没有基 证层面上的研究,现实发展状况的指导意是十分有限的。
分类框架应高等教育结构的现 ,对高等教育系统分化与组的历史线索和现实状况 描述归纳建立,而不是从理论出发,凭空设想一套理想的分类框架、分类标准分类指标,然后凭借这些框架、标准和指标去规范高等教育结构分化和高校分类学。
[4]我国 拥的高等薛新龙等:基于聚类分析方法的我国高等学校的分类研究学校数量较为庞大,高等学校的发展情况千差万别,如果说数据对现实情况的描述具有客观性,能够在 一定程度上代表高校的发展状况,那么以数据表示下的高校各项特征已经构成了一个极其复杂的系统,单凭人为已经很难对这些代表高校发展现状的数据进行总结分析。
因此,如果想要在一定分类体系下较 为客观地描述我国高等学校的现状,并从中得出规律,需要 一 具算法对全国性的高校数据进行统 分析。
SPSS软件的逐步聚类分析算法对我国高校进行分类研究。
聚类分析算法的本质是人 能够依据 对 分为不同的,每个中的对此 有相类似的属性有 系。
对数据量的数据进行分类,比如个数的数据,可以手工对数据进行分类,但是当数据量 分析 个对 实。
[5]因此,在对量数据进行统分类,以使聚类分析 。
在聚类分析中,描述个案%&类个以类类系的远程度是体现 差异程度一个定量描述,聚类分析 是描述两者之间差异程度量。
距离越小,表示两者关系越近,相似特征越多,越有可能被分为同一类;距离越大,则表示两 者之间差异越大。
聚类分析距离有 (Euclidean distance)、(Squared Euclidean distance)( (Chebychev)等,在聚类分析中最常用的是 。
[6](274)根据分类对象的不同,聚类类 分为个聚类(;聚类)量聚类(R聚类)。
个聚类是据被观个的各种特征各变量值进行分类,而变量聚类则在描述同一 特征量很情况下,为找准研究,其中具有代表性 是独立的变量进行研究。
根据聚类分析过程 ,聚类分析算法又可以分为逐步聚类、分成聚类与二阶段聚类。
[7](329)以逐步聚类方法,是因为分类情况已经根据高等学校的人才培养导向讨论得出,当给定分类的类数时,使用逐步聚类过程能够较快地据分类数对数据进行处理并得出符合分类数的结果。
S P S S的K-means Cluster%?-均值聚类)程 执行逐步聚类分析,可以利用系统默认设置执行命令,也以对聚类过程设置各参数,如样本分类数和聚类程终止的判据;其他聚类 ,如分层聚类,是在未知分类数的前提下,参分类的个量进行分解或凝聚,分层进行分类,最后得出所有可能的类别结果;该 以绘制出树状聚类图,但缺点是 量较,对大批数据的聚类效率不高。
K-均值聚类法不是把所有可能的聚类结果都列出来,是要求研究先制要划分的类别个数,然后确定各聚类中心,再计算出各样本到聚类中心的 ,最后按 的进行分类。
K-均值聚类中的“K”是指事先 要分的类别个数,而“均值”则是聚类的中心。
该方法的步骤包括+1.确定要分的类别数目。
2.确类别的初始类中心(在 SPSS进行聚类时,也以由系统初始聚类中心,本文数据的初始聚类中心就是由系统据数据指定的)。
3.根据确定的初始聚类中心,依次计算 每个样本到聚类中心的 ,并根据 的原 有的样本分到事先确定的K个类别中。
4.据所分成的K个类别,计算出各类别中每个变量的均值,并以均值点作为新的K个类别中心。
5.重复 第4步,直到满足终止聚类的条件为止(SP S S隐含的终止条件是,迭代次数为10次,或新确定的聚类中 心 上一次迭代形成的中心点的 偏移量 的0.02)。
[8](2G5)在对我国2000 高校进行分类时,根据人 在现有的全国高校相关数据中进行一的特征获取,就能根据特征代表的数据在空上的,通 分类数,这些高校分成不同的类别,从而达到对之前提出的分类方法进行实证研究的目的。
三、数据说明及分析用于聚类分析的数据来源于教育部提供的2011年普通高校学生、教师情况;2011年全国普通高校成弇省岑致有-2015年第6期在校博士学位研究生按类别统计;2011年全国普通高校在校普通本科生按类别统计;2011年全国普通 高校在校硕士学位研究生按类别统计;2011年全国普通高校在校专科生按类别统计。
根据数据,共得到 2364所高校的121项有效数据。
在选择特征变量进行聚类分析时,由于高校分类应当是以人才培养为 导向,因此在数据中选取与高校人才培养相关的变量作为聚类特征变量。
变量并不是直接选用原始数 据,而是经过简单处理,以便更好地 高校特征;用’,如不同规格学生分布情况用在校生比例来描,而非各级学生总人数。
变量 :本科学位授予和人才培养学科门类数、硕士学位授予和人才培养学科门类数、博士学位授予和人才培养学科门类数、本科生 在校比例、硕士研究生在校比例、博士研究生在校比例、授予学位中学士学位比例、授予学位中硕士研究 生学位比例、授予学位中博士研究生学位比例,共9项变量。