统计学第1阶段测试题
- 格式:docx
- 大小:17.35 KB
- 文档页数:5
医院统计学测试题库含答案1、下列属于非概率抽样调查方式的是()A、简单随机抽样B、系统抽样C、分层抽样D、整群抽样E、滚雪球抽样答案:E2、标化后的总死亡率A、仅仅作为比较的基础,它反映了一种相对水平B、它反映了实际水平C、它不随标准选择的变化而变化D、它反映了事物实际发生的强度E、以上都不对答案:A3、下列变量的观测结果属于等级资料的是()A、白细胞计数B、住院天数C、门诊就诊人数D、患者病情分级E、各临床科室的患者数答案:D4、计算乙肝疫苗接种后血清抗体检查的阳转率,分母是()A、乙肝易感人数B、乙肝患病人数C、乙肝疫苗接种抗体阳转人数D、乙肝疫苗接种人数E、乙肝治愈人数答案:D5、下列关于率的标准误的叙述,错误的是A、样本率的标准差称为率的标准误B、率的标准误反映率的抽样误差大小C、率的标准误越小,用样本率估计总体率的可靠性越大D、率的标准误越小,用样本率估计总体率的可靠性越小E、适当增加样本含量可减少率的标准误6、从婴儿死亡率与新生儿死亡率的关系中A、可看出一个国家的卫生水平B、不可看出一个国家的卫生水平C、只能看到婴儿死亡原因的不同D、可以看出新生儿与婴儿死亡率的差别E、以上均不对答案:A7、以下关于非概率抽样的说法不正确的是()A、不需要考虑等概率原则B、依赖研究人员的经验和专业知识C、可以取代概率抽样D、简便易行,节约资源E、结果的稳定性容易受主观性影响答案:C8、下列关于调查设计的叙述,正确的是A、明确调查目的是调查研究最核心的问题B、采用抽样调查还是普查是由该地区的经济水平决定的C、调查设计出现缺陷时,都可以通过相应的统计分析方法弥补D、一旦制定了调查研究计划,在实际操作过程中就不能改变E、调查的质量控制主要在调查问卷设计阶段答案:A9、检测一组病人的血型(A、B、O、AB)是属于A、离散型定量变量B、连续型定量变量C、分类变量D、有序变量E、等级变量答案:C10、红细胞数是A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体11、出院情况的填写只有哪一项是客观的()A、治愈B、好转C、未愈D、死亡E、其他答案:D12、财务科报表反映()A、当月医院应得的业务收入B、当月出院病人费用C、当月门诊病人费用D、当月结算病人费用E、当月病人欠费答案:A13、疾病统计的研究对象视调查目的不同而有不同的规定范围,比如门诊疾病的统计对象应是A、门诊患者B、门诊诊断为患病者C、住院+门诊患者D、以上都对E、以上都不对答案:B14、在病案统计系统数据库中病床使用率是最常用的指标。
练习题一考试科目:《统计学》第1章至第5章(总分100分)一、单项选择题(共20小题,每小题2分,共计40分)1.运用样本数据的统计量来推断总体的特征、变量的关系属于:BA描述统计B推断统计C科学统计D经验统计2.根据无锡市1000个家庭的调查数据,推断无锡市居民家庭订阅《江南晚报》的比例属于:A描述统计B推断统计C科学统计D经验统计B3.根据样本调查数据,制作统计数据分布直方图属于:A描述统计B推断统计C科学统计D经验统计4.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是:A 分类变量B 顺序变量C 数值型变量D 离散变量5.要反映我国工业企业的整体业绩水平,总体单位是:A 我国每一家工业企业B 我国所有工业企业C 我国工业企业总数D 我国工业企业的利润总额6.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是: CA 1000个消费者B 所有在网上购物的消费者C所有在网上购物的消费者的平均消费额D 1000个消费者的平均消费额7.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于: CA分类数据B顺序数据C截面数据D时间序列数据8.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。
他收集数据的方法属于: DA访问调查B邮寄调查C个别深度访问D观察调查9.下面哪一项属于连续性变量CA学生的籍贯B保险公司雇员数C奶牛24小时的产奶量D某杂货店一天销售的牛奶件数(箱)10.抽样调查与重点调查的主要区别是( D)A作用不同B组织方式不同C灵活程度不同D选取调查单位的方法不同11.调查时限是指( B)A调查资料所属的时间B进行调查工作的期限C调查工作登记的时间D调查资料的报送时间12.统计整理阶段最关键的问题是( B)A对调查资料的审核B统计分组C统计汇总D编制统计表13.调查项目( A )A是依附于调查单位的基本标志B与填报单位是一致的C与调查单位是一致的D是依附于调查对象的基本指标14.为了反映商品价格与需求之间的关系,在统计中应采用(C)A划分经济类型的分组B说明现象结构的分组C分析现象间依存关系的分组D上述都不正确15. 下面的哪一个图形最适合描述结构性问题(B)A条形图B饼图C对比条形图D直方图16.下面的哪一个图形适合比较研究两个或多个总体或结构性问题(A)A环形图B饼图C直方图D折线图17.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( B)A单变量值分组B组距分组C等距分组D连续分组18.下面的哪一个图形最适合描述大批量数据分布的图形( C)A条形图B茎叶图C直方图D饼图19.由一组数据的最大值最小值中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为( D)A环形图B茎叶图C直方图D箱线图20.有10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。
第一章练习题一、单项选择题⒈社会经济统计学是一门()①方法论的社会科学②方法论的自然科学;③实质性的科学④既是方法论又是实质性的科学。
⒉要了解某企业职工的文化水平情况,则总体单位是()①该企业的全部职工②该企业每一个职工的文化程度;③该企业的每一个职工④该企业全部职工的平均文化程度。
⒊总体与总体单位不是固定不变的,是指()①随着客观情况的变化发展,各个总体所包含的总体单位数也是在变动的②随着人们对客观认识的不同,对总体与总体单位的认识也是有着差异的③随着统计研究目的与任务的不同,总体和总体单位可以相互转化④客观上存在的不同总体和总体单位之间,总是存在着差异⒋下列总体中,属于无限总体的是()①全国的人口总数②水塘中所养的鱼;③城市年流动人口数④工业中连续大量生产的产品产量。
⒌下列标志中,属于数量标志的是()①学生性别②学生年龄③学生专业④学生住址⒍下列标志中,属于品质标志的是()①工人性别②工人年龄③工人体重④工人工资⒎下列属于数量指标的有()①劳动生产率②废品量③单位产品成本④资金利润率⒏下列属于质量指标的有()①平均工资②工资总额③销售总量④上交利润额⒐某工人月工资150元,则“工资”是()①数量标志②品质标志③质量指标④数量指标⒑标志与指标的区别之一是()①标志是说明总体特征的,指标说明总体单位的特征②指标是说明总体特征的,标志是说明总体单位的特征③指标是说明有限总体特征的,标志是说明无限总体特征的④指标是说明无限总体特征的,标志是说明有限总体特征的⒒某单位有500名职工,把他们的工资额加起来除以500,则这是()①对500个标志求平均数②对500个变量求平均数③对500个变量值求平均数④对500个指标求平均数⒓变异是指()①标志的具体表现不同②标志和指标各不相同③总体的指标各不相同④总体单位的标志各不相同⒔下列变量中,属于连续变量的是()①大中型企业个数②大中型企业的职工人数③大中型企业的利润额④大中型企业拥有的设备台数⒕统计设计、统计调查、统计整理和统计分析的关系是()①统计设计是基础②统计分析是基础③统计调查是基础④统计整理是基础⒖一个统计总体()①只能有一个标志②只能有一个指标③可以有多个标志④可以有多个指标二、多项选择题⒈对某地区工业生产进行调查,得到如下资料,其中,统计指标有( ) ①某企业亏损20万元②全地区产值3亿元③某企业职工人数2000人④全地区职工6万人⑤全地区拥有各种设备6万台。
统计学1.总体与总体单位之间的关系是( B )A.在同一研究目的下,两者可以相互变换B.在不同研究目的下,两者可以相互变换C.两者都可以随时变换D.总体可变换成总体单位,而总体单位不能变换成总体2. 下列标志哪一个是品质标志( C )A. 产品成本B. 企业增加值C. 企业经济类型D. 企业职工人数3. 构成统计总体的总体单位( D )A. 只能有一个指标B. 只能有一个标志C. 可以有多个指标D. 可以有多个标志4. 某连续变量数列,其末组为开口组,下限有500,相邻组的组中值为480,则末组的组中值为( A )A.520B.510C.500D.5405. 社会经济现象构成统计总体的必要条件是总体单位之间必须存在( B )A. 差异性B. 同质性C. 社会性D. 综合性6. 研究某市工业企业生产设备的使用情况,则总体单位是( C )A. 该市全部工业企业B. 该市每一个工业企业C. 该市工业企业的每一台生产设备D. 该市工业企业的全部生产设备7.对某市占成交额比重大的7个大型集市贸易市场的成交额进行调查,这种调查的组织方式是( C )A.普查 B.抽样调查C.重点调查 D.典型调查8.某一学生的统计学成绩为85分,则85分是( D )A. 品质标志B. 数量标志C. 数量指标D. 标志值9.下列变量中属于连续变量的是( C )A. 职工人数B. 设备台数C. 学生体重D. 工业企业数10. 某企业1994年计划规定劳动生产率提高8%,实际提高6%,则计划完成程度为( B )A.75%B.98.15%C.133.33%D.101.89%11. 假设计划任务数是五年计划中规定最后一年应达到的水平,计算计划完成程度相对指标可采用( B )累计法 B.水平法 C.简单平均法 D.加权平均法12.“平均每个人占有钢产量”这个指标是( D )A.总量指标 B.平均指标C.比较相对指标 D.强度相对指标13. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需要分别计算其( A )来比较A.标准差系数 B.平均差C.极差 D.均方差14.产品单位成本、产品合格率、劳动生产率、利润总额这四个指标中有几个属于质量指标?( C )A. 一个B. 两个C. 三个D. 四个15.在校学生数和毕业生人数这两个指标( A )A. 前者为时点指标,后者为时期指标B. 均为时期指标C. 前者为时期指标,后者为时点指标D. 均为时点指标1、构成统计总体的个别事物称为( D )A、调查单位B、标志值C、品质标志D、总体单位2、对一批商品进行质量检验,最适宜采用的方法是( B ) 。
第一章测试1【判断题】(5分)总体分为有限总体与无限总体A.对B.错2【判断题】(5分)统计分析包括统计描述和统计推断A.对B.错3【多选题】(5分)指出下列资料的类型中属于计量资料的是()A.20例患者的血型构成B.20例患者的粪便潜血试验-、+、++C.20例患者的白细胞计数( 109/L)分别为9.8,11.6,12.3…D.20名学生的考试分数20名学生的考试分数20名学生的考试分数4【单选题】(5分)指出下列资料的类型中属于计数资料的()A.20名学生的考试分数B.20例患者的粪便潜血试验-、+、++C.20例患者的白细胞计数(⨯109/L)分别为9.8,11.6,12.3…D.20例患者的血型构成5【单选题】(5分)指出下列资料的类型中属于等级资料的是()。
A.20例患者的粪便潜血试验-、+、++B.20名学生的考试分数C.20例患者的血型构成D.20例患者的白细胞计数(⨯109/L)分别为9.8,11.6,12.3…6【判断题】(5分)统计中所说的样本是指从总体中抽出的典型部分。
A.错B.对7【判断题】(5分)变异是指同质基础上,各观察单位之间的差异。
A.错B.对8【判断题】(5分)样本量选择的原则是越多越好。
A.错B.对9【判断题】(5分)小概率事件一般是指发生概率≤0.05或者0.01的随机事件。
A.错B.对。
1.判断数据类型,三者的层次关系。
①分类数据(=、≠):只能分类。
EG.性别(男为0,女为1)、水果种类。
②顺序数据(>、<):可进行类别排序,但是类别间尺度不定。
顺序数据虽然有类别,但是这些类别是有序的。
EG.文化程度(小学、初中、高中、大学)、获奖(一等奖、二等奖、三等奖),身高(160—170、170—180、180—190)。
③数值型数据(+、-):按数字尺度测量的观察值,计算两个测度之间的差值。
类别排序是根据一定的尺度来进行的。
EG.身高(168、170、178、189)、年龄、收入。
①—③是从低层次数据(包含的信息量少)到高层次数据(包含的信息量多)。
定类数据与定序数据是品质数据(定性数据),定距数据是数量数据(定量数据)。
定类数据包含了定序数据,定序数据包含了定距数据。
所以定距数据涵盖的信息量最多。
2.总体分布、样本分布、抽样(样本统计量)分布总体:是包含所研究的全部个体(数据)的集合。
总体中的每一个个体都是总体单位。
有限总体(抽样中每次抽取后不放回)、无限总体(抽取后放回)样本:从总体中抽取的一部分元素的集合。
构成样本元素的数目叫样本量(样本中有几个元素)。
3.参数、统计量参数:描述总体特征的概括性数字度量。
EG.总体平均数、总体标准差、总体比例。
统计量:描述样本特征的概括性数字度量。
EG.样本平均数、样本标准差。
4.变量、变量值、指标指标:反映统计总体数量特征的概念和数值。
(指标值是由变量值综合计算得到的。
)变量:总体单位普遍具有的属性和特征。
(分类变量、顺序变量、数值型变量『离散型变量EG.自然数,可以一一列举;连续型变量EG.实数,不能一一列举』)变量值:变量的具体取值就是变量值。
5.各特点、辨别应使用的抽样方式概率抽样(随机抽样):1) 简单随机抽样:从总体N的样本框中随机、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。
(简单直观,计算估计量误差方便;N较大时,构建抽样框不易且抽取过程繁琐,实施调查有困难。
统计学原理考试题一、选择题。
1. 下列哪个不是统计学的基本概念?A. 总体。
B. 样本。
C. 参数。
D. 统计量。
2. 在统计学中,描述总体特征的数字指标称为什么?A. 参数。
B. 样本。
C. 统计量。
D. 方差。
3. 下列哪个不是描述数据集中心位置的统计量?A. 均值。
B. 中位数。
C. 众数。
D. 标准差。
4. 如果一个数据集的标准差很大,表示什么?A. 数据集的离散程度大。
B. 数据集的离散程度小。
C. 数据集的中心位置偏移。
D. 数据集的分布形状不规则。
5. 在统计学中,概率分布的形状是由哪个参数控制的?A. 均值。
B. 标准差。
C. 方差。
D. 自由度。
二、填空题。
1. 样本容量为100,样本均值为30,总体标准差为5,样本标准误差为?答,0.5。
2. 一组数据的中位数为35,下四分位数为30,上四分位数为40,该组数据的四分位差为?答,10。
3. 某随机变量X的期望为20,方差为16,标准差为?答,4。
4. 在正态分布曲线上,距离均值两个标准差之外的数据占比约为?答,95.44%。
5. 在t分布中,自由度为10时,t分布的峰度为?答,3。
三、简答题。
1. 请解释参数和统计量的区别。
答,参数是用来描述总体特征的数字指标,如总体均值、总体标准差等;统计量是用来描述样本特征的数字指标,如样本均值、样本标准差等。
参数是对总体进行推断的依据,而统计量是对样本进行推断的依据。
2. 请解释正态分布曲线的特点。
答,正态分布曲线是一个钟形曲线,以均值为中心对称,曲线两侧尾部逐渐下降。
正态分布曲线的均值、中位数、众数重合,曲线的标准差决定了曲线的宽窄。
在正态分布曲线上,距离均值一个标准差之外的数据占比约为68%,距离均值两个标准差之外的数据占比约为95.44%,距离均值三个标准差之外的数据占比约为99.73%。
3. 请解释t分布与正态分布的区别。
答,t分布与正态分布的区别在于t分布是以样本容量为自由度的分布,而正态分布是以总体为基础的分布。
统计学测试题(附答案)一、单选题(共50题,每题1分,共50分)1、在双侧检验中,原假设与备择假设应选为()。
A、H0:M ≠M0,H1:M = M0B、H0:M= M0 ,H1:M<M0C、H0:M= M0 ,H1:M ≠M0D、H0:M = M0 ,H1:M ≥M0正确答案:C2、由变量y倚变量x回归和由变量x倚变量y回归所得到的回归方程是不同的,这表现在()。
A、一个是直线方程,另一个是曲线方程B、与方程对应的两条直线只有一条经过点C、方程中参数不同,意义也不同D、参数估计的方法不同正确答案:C3、连续调查与不连续调查的划分依据是()。
A、调查的组织形式B、调查单位包括的范围是否全面C、调查登记的时间是否连续D、调查资料的来源正确答案:C4、重点调查中重点单位是指()。
A、能用以推算总体标志总量的单位B、具有典型意义或代表性的单位C、标志总量在总体中占有很大比重的单位D、那些具有反映事物属性差异的品质标志的单位正确答案:C5、统计整理是()。
A、统计调查的前提,统计分析的继续B、统计研究的最终阶段C、统计分析的前提,统计调查的继续D、统计研究的初始阶段正确答案:C6、标志的具体表现是指()。
A、标志名称之后所列示的属性B、标志名称之后所列示的数值C、标志名称之后所列示的属性或数值D、如性别正确答案:C7、按水平法计算的平均发展速度推算可以使()。
A、推算的各期水平之和等于各期实际水平之和B、推算的各期增长量等于实际的逐期增长量C、推算的各期定基发展速度等于实际的各期定基发展速度D、推算的期末水平等于实际期末水平正确答案:D8、现有一数列:3,9,27,81,243,729,2 187,反映其平均水平最好用()。
A、算术平均数B、调和平均数C、几何平均数D、中位数正确答案:C9、某质量管理部门对某企业准备出厂的180件产品进行抽样调查,发现有170件为合格品,为证明该企业的全部产品的合格率是否达到95%,应采用哪一种假设检验()。
第一章测试1【判断题】(2 分)医学统计学主要是指医学研究数据分析中有关计算原理的数学方法。
A.错B.对2【判断题】(2 分)医学研究中的统计设计主要是指数据分析中拟使用的统计分析方法。
A.对B.错3【判断题】(2 分)研究设计上的失误可以在数据分析阶段更正,所以选用好的统计方法很重要。
A.错B.对4【判断题】(2 分)统计设计包括统计描述与统计推断。
A.对B.错5【判断题】(2 分)统计工作基本步骤中数据分析是最为重要的步骤。
A.错B.对6【判断题】(2 分)医学研究中第一手数据的价值大于二手数据。
A.错B.对7【判断题】(2 分)来自大样本的指标称为参数,来自小样本的指标称为统计量。
A.对B.错8【判断题】(2 分)定量数据是指连续型变量的取值。
A.错B.对9【判断题】(2 分)某社区各家庭成员数属于分类计数资料。
A.对B.错10【判断题】(2 分)分布是一种对应关系,可以用图、表、函数来描述。
A.错B.对第二章测试1【判断题】(2 分)实验研究是根据研究目的将同质的研究对象随机分组,分别给予不同的干预或处理,在合理控制非处理因素条件下,比较不同干预或处理的实验效应的一种研究方法。
属于研究对象随机分组的被动性研究。
A.对B.错2【判断题】(2 分)以人作为受试对象的试验研究,要求有伦理委员会的批准,但不一定全部需要受试对象签署知情同意书。
A.错B.对3【判断题】(2 分)实验研究中要抓住所有的非处理因素才能保证研究结果的科学性。
A.对B.错4【判断题】(2 分)临床试验中我们常以单、双日就诊的患者进行随机化化分组,因为患者哪天就诊是随机的。
A.对B.错5【判断题】(2 分)一般而言,完全随机设计就可以达到组间均衡的目的。
A.对B.错6【判断题】(2 分)随机区组设计要求区组内受试对象个数与处理因素的水平数相同,若同一区组内有数据缺失,该区组的其它数据就无法利用,因此需要重新补做该缺失数据的实验。
(一) 单选题1. 对中国大学教育状况进行调查,调查单位是( )。
(A) 中国的所有大学(B) 中国的每一所大学(C) 中国的每个大学生(D) 中国教育部参考答案:(B)2. 具有时效快,费用低等特点调查方法是( )。
(A) 电话调查(B) 邮寄调查(C) 网上调查(D) 短信调查参考答案:(A)3. 统计学通常把指标分为数量指标和( )。
(A) 时期指标(B) 品质指标(C) 质量指标(D) 总量指标参考答案:(C)4. ( )是根据统计设计的要求搜集统计数据的阶段,是定量认识的起点。
(A) 统计设计(B) 统计调查(C) 统计整理(D) 统计分析参考答案:(B)5. 质问题答案由表示不同等级的形容词组成,并按照一定的程度排序,由被调查者依次选择的方法是( )。
(A) 配对比较法(B) 赋值评价法(C) 评定尺度法(D) 双向列联法参考答案:(C)6. 温度可以运用( )来测度。
(A) 定类尺度(B) 定序尺度(C) 定距尺度(D) 定比尺度参考答案:(C)7. 统计设计的基本任务是制定( )。
(A) 统计指标体系(B) 统计调查方案(C) 统计分析方案(D) 各种统计工作方案参考答案:(D)8. 按调查误差产生原因,统计调查误差分为工作误差和( )。
(A) 代表性误差(B) 人为误差(C) 方法误差(D) 源头误差参考答案:(A)9. 采用组距分组时,一定要遵循的原则( )。
(A) 不重不漏(B) 组距相等(C) 组数从少(D) 操作简单参考答案:(A)10.英国的戈塞特( ,1876~1937)用笔名发表了关于分布的论文。
该事件发生在( )。
(A) “城邦政情”阶段(B) “政治算术”阶段(C) “统计分析科学”阶段(D) “统计学帝国主义”阶段参考答案:(C)11. 用直方形的宽度和高度来表示频数分布的图形是( )。
(A) 条形图(B) 直方图(C) 箱线图(D) 平面图参考答案:(B)12. “一母生九子,九子各不同”说明总体中个体具有( )。
江南大学现代远程教育013年上半年第一阶段测试卷
考试科目:《统计学》第0章至第4章(总分100分)时间:90分钟
_______________ 习中心(教学点)批次:___________ 层次:__________
专业:_______________ 学号: _________________ 身份证号:___________________ 姓名:______________________ 得分:____________________________________________
一、简答题(每题5分,共40分)
1、简述统计一词有几种的含义。
统计有三种理解:统计工作,统计资料,统计学,
三者关系:统计工作与统计资料是统计过程与活动成果的关系,统计工作与统计学是统计实践与统计理论的关系,统计工作先于统计学。
统计学研究的对象是统计研究所要认识的客体。
2、简述什么是描述统计和推断统计,并说明两者的关系。
描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工
处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描
述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
描述统计和推断统计是统计方法的两个组成部分。
描述统计是整个统计学的基础,推断统计则
是现代统计学的主要内容。
由于在对现实问题的研究中,所获得的数据主要是样本数据,因此, 推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。
当然,这并不等于说描述统计不重要,如果没有描述统计收集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出切合实际的结论。
从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
3、什么是参数,什么是统计量?
参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
统计量:统计量是统计理论中用来对数据进行分析、检验的变量。
4、什么是统计规律?
统计规律:对大量偶然事件整体起作用的规律,表现这些事物整体的本质和必然的联系
而个别事件的特征和偶然联系退居次要地位。
统计规律是自然科学和人类社会生活中的普遍规
律之一。
5、统计数据有哪几种计量类型。
在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量。
1. 定类数据(Nominal ):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。
2. 定序数据(Ordinal ): 数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。
3. 定距数据(Interval ): 具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。
例如,温度。
4. 定比变量(Ratio ): 数据的最高级,既有测量单位,也有绝对零点,例如职工人数,身高。
一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。
不同测度级别的数据,应用范围不同。
等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功
6、简述统计调查方案的内容。
统计调查方案是统计调查前所制订的实施计划,是全部调查过程的指导性文件。
是调查工作有计划、有组织、有系统进行的保证。
统计调查方案应确定的内容有:调查目的与任务、调查对象与调查单位、调查项目与调查表、调查时间和调查时限、调查的组织实施计划。
7、什么叫离散系数,它有什么特征和作用。
离散系数,离散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度及平均数的代表性。
变异系数是衡量资料中各观测值变异程度的一个统计量。
当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
8、简述统计描述数据分布特征的统计图有哪些?
(1)条图:又称直条图,表示独立指标在不同阶段的情况,有两维或多维,图例位于右上方。
(2)百分条图和圆图:描述百分比(构成比)的大小,用颜色或各种图形将不同比例表达出来。
(3)线图:用线条的升降表示事物的发展变化趋势,主要用于计量资料,描述两个变量间关系。
(4 )半对数线图:纵轴用对数尺度,描述一组连续性资料的变化速度及趋势。
(5 )直方图:描述计量资料的频数分布。
(6 )散点图:描述两种现象的相关关系。
(7)统计地图:描述某种现象的地域分布。
二、计算与操作题(每题15分,共60分)
1、以下是某地区收入数据的分组资料
要求:(1)填上上表中的累积频率;
(2 )画出频率分布的直方图、累积频率折线图;
(3)计算收入的平均数、中位数和众数。
2、下面是某班50名同学数学和外语的考试成绩,要求计算:
(1)50名数学成绩平均数、中位数和标准差;
(2)50名外语成绩平均数、中位数和标准差;
(3)分别计算数学和外语的标准差系数,并说明那门课程程及分布的离散程度大。
解答:
1) 平均数:x= (35*3+45*5+55*8+65*14+75*10+85*6+95*4)/(3+5+8+14+10+6+4)=66.4
中位数:3+5+8+14+10+6+4=50 为偶数中间两位是65, 65 所以中位数是(65+65)/2=65
标准差: d =V{[3* ( 35-66.4 )
人2+5*(45-66.4)人2+8*(55-66.4)人2+14*(65-66.4)人2+10*(75-66.4)人2+6*(85-66.4 ) A2+4*(95-66.4)A2]/(50-1)}=16
2 )和1)类似只要把数据换一下 1
3 6 15 22 2 1
3 )数学标准差系数V c = d / x =16/66.4=0.2
4 根据 2 )求出外语的标准差系数比较哪个
离0远,哪个的离散度就大
2、对10名成年人和10名儿童的身高(cm)进行抽样,结果如下: 要求(1)要比较成年组和儿童组的身高差异,应该选择什么指标;
(2)比较分析哪一组的身高差异大。
解:)可以采用全距,平均差,方差2,标准差,离散系数s来描述成年组和幼儿组的身高差异。
(2)从以上结果来看,全距 R ,平均差MAD
,方差S 2,标准差S 所体现的都是成年组的身高 差异较大,但是比较均值不相同两组数据的相对离散程度时,
,采用离散系数更为准确一些,
因
此,从本例中可以看出,儿童组的离散系数较大,也就是说儿童组的身高差异较大。
3、对某地区90
要求:(1)计算90家企业销售额的众数、中位数、平均数。
(2)计算标准差和标准差系数。
解:
兰-E
9
45-30
胚=£+ ------ xd = 1D004- ------------- x500
凡 35
H- I
(3 5- 2C&
(35-20) + (35- 15)^ 500。