统计学基础-第一次作业
- 格式:docx
- 大小:70.98 KB
- 文档页数:7
统计学原理第一次作业参考答案一、判断题1、√2、×3、×4、×5、×6、×7、√8、×9、√ 10、√二、单项选择题1、C2、B3、B4、D5、D6、D7、A8、C9、B三、多项选择题1、AD2、BCE3、ACE4、BCE5、BE或BCE6、ACD四、填空题1、品质标志2、统计总体;总体单位3、离散型变量;连续型变量4、数量;质量5、时点;时期6、重点调查7、分组标志的选择;分组方法的选择;分组标志的选择8、每一个人;每户;每户;每户9、普查;全面统计报表;重点调查;抽样调查;典型调查10、数量;品质11、离散型变量;连续型变量12、品质;变量五、简答题(略)六、计算题1、答案:(1)等距分配数列不等距分配数列(2)向上累计(等距数列)向下累计(等距数列)2、答案:(1)(2)分组标志为“成绩”,其类型为“品质标志”;本班学生的考试成绩的分布呈两头小, 中间大的钟型分布统计学原理第二次作业参考答案一、判断题1、×2、×3、√4、×5、√6、×7、×8、√9、×10、×二、单项选择题1、D(该题有问题)2、C3、D4、B5、B6、C7、D8、B9、B 10、D 11、A 12、D 13、D 14、B三、多项选择题1、BE2、ADE3、ABC4、DE5、ADE6、ADE7、ABCDE8、ACE9、BDE 10、CE四、填空题1、的可比性2、在一定地点、时间条件下;总体各单位某一数量标志所达到的一般水平3、集中趋势4、各组权数相等5、Σxf/Σf6、各组权数;各组标志值7、正;逆8、该题有问题9、平均指标10、算术平均数;调和平均数五、简答题(略)六、计算题1、解:甲产品的产量动态相对数=2002年的实际产量/2001年的实际产量=42480/35070=121.13%甲产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=42480/36000=118%乙产品的产量动态相对数=2002年的实际产量/2001年的实际产量=19775/15540=127.25% 乙产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=19775/17500=113%丙产品的产量动态相对数=2002年的实际产量/2001年的实际产量=8016/7448=107.63%丙产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=8016/8350=96%2、解:(1)(2)平均日产量=⨯+⨯+⨯+⨯+⨯=∑∑=4065.47105.4295.3785.3275.27fxf x 37.5(件)3、解:x 是销售价格;f/Σf 各组商品销售量占总销售量的比重;平均销售价格=⨯+⨯+⨯=∑∑=%3045%5035%2025ff xx 36(元)4、解:x :工人劳动生产率,f :工人数平均劳动生产率5030701001505095308570751006515055++++⨯+⨯+⨯+⨯+⨯=∑∑=fxf x=68.25(件/人)5、解:m :实际产量,x :计划完成百分比平均计划完成百分比x ==++++++=∑∑%115184%105126%95%8518412657685768xm m 103.57%6、(1)m :实际产量,x :计划完成百分比。
作业题第一部分:统计中的相关概念1、某研究部门准备在全市200万个家庭抽取2000个家庭,推断该城市所有职工家庭的年人均收入,指出这项研究的总体、样本、参数、统计量。
第二部分:抽样方法及误差1、为调查某校学生的购书费用支出,分别采用如下抽样方法:A 从男生中抽60人,从女生中抽40人B 从全校抽取4个班级的学生作全部调查C 将全校学生名单按拼音顺序排列后每隔50名抽1名调查请指出上述分别采用的何种抽样方法第三部分:数据的整理及显示1、课后习题:3.52、课后习题:3.9第四部分数据的概括性度量1、算术平均数的基本公式中,(ACD)多选题A 分子分母属于同一总体B 分子分母计量单位相同C 分子的标志是数量标志D 分母是分子的直接承担者E 分子是分母的直接承担者2、用组距数列计算算术平均数,其结果与分组前资料计算的结果是否相同?为什么?一般情况下不相同。
因为用组距数列计算算术平均数时,是用组中值为组内变量值的代表值,其假定条件是各单位变量值在本组范围内呈均匀分布或对称分布,即组中值等于组平均数。
但这种条件在多数情况下得不到满足,所以,以组中值计算的算术平均数只能是一个近似值。
3、某企业工人日产量的分组资料如表1所示表1试根据表中资料分别计算4月份和5月份工人日产量的算术平均数,并分析工人平均日产量变化的原因,说明两个月次数分布的特点。
.((45xf 2950x 295f 100xf 3700x 37.0f100======∑∑∑∑千克)千克)从计算结果得知,5月份比4月份平均每人日产量多7.5千克,其原因是不同日产量水平的工人所占比重发生变化。
4月份日产量在30千克以上的工人只占工人总数的45%,5月份这部分工人所占比重则上升为75%。
这体现了权数对平均数的影响。
从以上计算看出,该企业工人日产量的分布状况是,4月份日产量呈右偏分布,而5月份日产量呈左偏分布。
4、把全部产品分为一级品、二级品和三级品,其中一级品占全部产品的比重为70%,则这个70%属于(B )单选 A 平均数 B 结构相对数C 具有某一属性的单位数在总体中的成数p 5、标准差和平均差的共同点是(ABC )多选A 两者都以平均数为中心来测定总体各单位标志值的离散程度B 两者在反映总体标志变异程度方面都比全距准确C 两者都考虑了总体的所有变量值得差异程度D 两者都受极端值较大影响E 两者都计算方便6、两种不同的水稻品种分别在5块田里试种,其产量资料如表3。
对错参考答案:√
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:×
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:×
对错参考答案:×
对错参考答案:√
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:×
对错参考答案:×
对错参考答案:×
对错参考答案:√
对错参考答案:×
对错参考答案:×
对错参考答案:×
对错参考答案:√
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:√
对错参考答案:×
对错参考答案:×
对错参考答案:√
对错参考答案:√
对错参考答案:×。
《统计学》第一次作业题答案第一章绪论练习题一、填空题:1.统计总体的特征可概括成同质性、大量性和差异性3.统计的作用主要体现在它的三大职能上,即信息职能、咨询职能及监督职能4.从认识的特殊意义上看,一个完整的统计过程,一般可分为三个阶段,即统计调查、统计整理及统计分析5.当某一标志的具体表现在各个总体单位上都相同时,则为不变标志6.当某一标志的具体表现在各个总体单位上不尽相同时,则为可变标志。
7.同一变量往往有许多变量值,变量按变量值是否连续可分为离散变量和连续变量8.凡是客观存在的,并在某一相同性质基础上结合起来的许多个别事物组成的整体,我们称之为总体二、单项选择题:1.要了解某市工业企业的技术装备情况,则统计总体是()。
A、该市全部工业企业B、该市每一个工业企业C、该市全部工业企业的某类设备D、该市工业企业的全部设备2.对交院学生学习成绩进行调查,则总体单位是()。
A、交院所有的学生B、交院每一位学生C、交院所有的学生成绩D、交院每一位学生成绩3.对全国城市职工家庭生活进行调查,则总体单位是()。
A、所有的全国城市职工家庭B、所有的全国城市职工家庭生活C、每一户城市职工家庭D、每一户城市职工家庭生活4.对全国机械工业企业的设备进行调查,则统计总体是()。
A、全国所有的机械工业企业B、全国所有的机械工业企业的设备C、全国每一个机械工业企业E、全国每一个机械工业企业的设备5.对食品部门零售物价进行调查,则总体单位是()。
A、所有的食品部门零售物B、每一个食品部门零售物C、所有的食品部门零售物价D、每一个食品部门零售物价6.港口货运情况调查,则统计总体是()。
A、所有的港口货运B、每一个港口货运C、所有的港口货运情况D、每一个港口货运情况7.某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。
A、指标B、标志C、变量D、变量值8.下列属于品质标志的是()。
A、工人年龄B、工人性别C、工人体重D、工人工资9.一个统计总体()。
一.单选题(共20题,48.0分)1一个研究者应用有关车祸的统计数据估计在车祸中死亡的人数,在这个例子中使用的统计属于( )。
•A、推断统计学;•B、描述统计学;•C、既是描述统计学,又是推断统计学;•D、既不是描述统计学,有不是推断统计学。
我的答案:A得分:2.4分2某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是( )。
•A、2000个家庭•B、200万个家庭•C、2000个家庭的年人均收入•D、200万个家庭的总收入我的答案:B得分:2.4分3对某地区5000个企业的企业注册类型、产值和利润总额等调查数据进行分析,下列说法中正确的是( )。
•A、企业注册类型是定序变量•B、利润总额是品质标志•C、产值是定类变量•D、产值和利润总额都是连续变量我的答案:D得分:2.4分4为了了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。
这种数据收集方法称为( )。
•A、面访式问卷调查•B、实验调查•C、观察式调查•D、自填式问卷调查我的答案:A得分:2.4分5对同一总体选择两个或两个以上标志重叠起来进行分组,称为( )。
•A、简单分组•B、平行分组•C、一次性分组•D、复合分组我的答案:D得分:2.4分6统计表的横行标题表明( )。
•A、全部统计资料的内容•B、研究总体及其组成部分•C、总体特征的统计指标的名称•D、现象的具体数值我的答案:B得分:2.4分7下列指标属于比例相对指标的是( )。
•A、2000年北京市失业人员再就业率为73%•B、三项社会保险统筹基金收缴率95%•C、北京人口性别比为103•D、北京每百户居民拥有电脑32台我的答案:C得分:2.4分8一组数据排序后处于25%和75%的位置上的值称为( )。
•A、众数•B、中位数•C、四分位数•D、算术平均数我的答案:C得分:2.4分9权数对加权算术平均数的影响作用,决定于( )。
郭晓兰12213641 微生物学统计学第一次作业100名40~50岁健康男子总胆固醇(mg/dl)的频率表组段组中值X i频数频率f i/% 累积频率/%138~ 152~ 166~ 180~ 194~ 208~ 222~ 236~ 250~ 264~278 1451591731872012152292432572712411152314148542411152314148542617325569839196100合计—100 100 —由上表可得出如下直方图:根据原始数据,经SPSS处理,可得到含包络线的直方图,如下:根据直方图可知其为正态分布分布(2)答:由于是正态分布,所以采用算术均数描述它的平均水平,采用标准差描述它的变异程度。
算术均数4.207=X mg/dl 和标准差8.29=S mg/dl(3)答: P 25=5.187%17-%25%1514180=+)((mg/dl ) P 75=222+0.228%)69%75(%1414=-(mg/dl )P 95=250+2.261%91-%95%514=)((mg/dl)2. 某地对120名微丝蚴血症患者治疗3个疗程后,用IFA 间接荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平。
抗体滴度1:51:101:201:401:801:1601:320例 数 5 16 27 34 22 13 3答:应用几何均数G 求抗体滴度的平均水平 G=lg -1(∑f*lgX )=lg -1(1.5603)=36.3 所以抗体滴度的平均水平为1:36.3。
案例2-4案例辨析:该案例通过合计的病死率得出了乙医院治疗水平优于甲医院的结论。
虽然甲医院总的病死率比乙医院高,但是从表中我们可以看出轻、中和重三个层级患者的病死率均是甲医院低于乙医院。
这就产生了矛盾。
仔细思考,原因是因为甲医院接收的重症患者比较多,轻症患者较少,所以造成了总的病死率高。
两家医院的病情不均衡,所以不能用总的病死率来比较医院的治疗水平,而是应该标准化之后再进行比较。
《统计学原理》第一次作业一、单项选择题1,统计研究在( B )阶段的方法属于大量观察法。
A,统计设计 B,统计调查 C,统计整理 D,统计分析2,把一个工厂的工人组成总体,那么每一个工人就是( A )。
A,总体单位 B,数量标志 C,指标 D,报告单位3,几位工人的工资分别为1500元、1800元和2500元,这几个数字是( C )。
A,指标 B,变量 C,变量值 D,标志4,变异的涵义是( A )。
A,统计中标志的不同表现。
B,总体单位有许多不同的标志。
C,现象总体可能存在各种各样的指标。
D,品质标志的具体表现。
5,下列各项中,属于统计指标的是( D )。
A,老王今年55岁。
B,钢材 C,宁波至北京机票1480元。
D,公司今年利润50万。
6,某市进行一次零售业质量与价格抽查,其调查单位是( C )。
A,该市所有食品商店 B,每一个食品商店 C,每一种零售食品 D,全部零售食品7,某市组织一次物价大检查,要求12月1日至12月15日全部调查完毕,这一时间规定则是( B )。
A,调查时间 B,调查期限 C,标准时间 D,登记时间8,规定普查标准时点旨在保证调查的( A )。
A,准确性 B,时效性 C,周期性 D,可比性9,对于生产过程中产品质量的检查和控制应采用( D )的方法。
A,重点调查 B,典型调查 C,普查 D,抽样检验10,对现象总体最有代表性的调查单位要推( D )单位。
A,典型调查 B,重点调查 C,抽样调查 D,普查11,某市工业企业2004年生产经营成果年报时间规定在2005年1月31日,则调查期限为( B )。
A,一日 B,一个月 C,一年 D,一年零一个月12,在全国人口普查中,( B )。
A,男性是品质标志 B,人的年龄是变量 C,人口的平均寿命是数量标志 D,全国人口是统计指标二、填空题1.社会经济统计学所研究的数量问题有自己的特点,即(数量性)、总体性和(变异性)三个。
统计学第一次作业〔2012年3月15日〕注意:作业全部为课后习题,请将必要的推导过程写出,不能只写答案。
本次作业共包括前四章的14道题目,个别题目有删减:第一章统计学的性质1-3答:〔1〕对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果〔n=1500〕年度共和党民主党民主党候选人P*(1-P)/n 95%置信度总体比例的置信区间〔%〕实际选举结果〔%〕1960 尼克松49% 肯尼迪51% 0.0001666 51±2.5298 肯尼迪50.11964 戈德沃特36% 约翰逊64% 0.0001536 ☆64±2.4291 约翰逊61.31968 尼克松57% 汉弗莱50% 0.0001634 50±2.5303 汉弗莱49.71972 尼克松62% 麦戈文38% 0.0001571 38±2.4564 麦戈文38.21976 福特49% 卡特51% 0.0001666 51±2.5298 卡特51.11980 里根52% 卡特48% 0.0001664 ☆48±2.5283 卡特44.7〔2〕注☆:实际选举结果证明错误的置信区间2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:18 20 16 6 16 17 12 14 16 1814 14 16 9 20 18 12 15 13 1616 2l 2l 9 16 20 14 14 16 16第二章描述性统计学2-2答:1) 将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;解:〔1〕数据分组如下:表:丈夫所受教育年限X频数分布表〔n=30〕分组编号组下、上限组中值X值〔年〕频数〔f〕相对频率〔 f / n 〕累积频率〔%〕1 [4.5,7.5〕6 6 1 0.0333 3.332 [7.5,10.5〕9 9、9 2 0.0666 10.003 [10.5,13.5〕12 12、12、13 3 0.1000 20.004 [13.5,16.5〕15 14、14、14、14、14、15、16、16、16、16、16、16、16、16、16 15 0.5000 70.005 [16.5,19.5〕18 17、18、18、18 4 0.1333 83.006 [19.5,22.5〕21 20、20、20、21、21 5 0.1666 100.00总计463 30 1.00002) 作出频数分布的直方图;解:〔图〕丈夫所受教育年限X数据直方图〔单位:年;n=30〕3) 问10.5年的教育在第几百分位数上?13年呢?解:10.5年的教育,累积频率为10.00%,前面有10.00%个样本,所以在第10个百分位数上;13年的教育,累积频率为20.00%,前面有20.00%个样本,所以在第20个百分位数上。
吉大17春《统计学基础》在线作业1吉大17春《统计学基础》在线作业1一、单选题(共10 道试题,共30 分。
)1. 计算样本平均数或均值是为了估计、推断()平均指标。
A. 某一组B. 总体C. 包括样本的组D. 不包括样本的组正确答案:2. 从总体中抽取样本,样本容量充分大时,服从或近似服从()分布。
A. 二项分布B. 超几何分布C. 正态分布D. 泊松分布正确答案:3. 就某一变量数列而言,组距和组数的关系是()。
A. 组距大小与组数多少成反比B. 组距大小与组数多少成正比C. 组距大小与组数多少无关D. 组数越多,组距越大正确答案:4. 事先将总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,称为()。
A. 分层抽样B. 简单随机抽样C. 整群抽样D. 等距抽样正确答案:5. 将统计总体按照一定标志区分为若干个组成部分的统计方法是()。
A. 统计整理B. 统计分析C. 统计调查D. 统计分组正确答案:6. 2010年我国进行的第六次全国人口普查是()。
A. 重点调查B. 典型调查C. 一次性调查D. 经常性调查正确答案:7. 统计认识的对象为()。
A. 个体B. 客体C. 总体单位D. 总体正确答案:8. 增长速度的计算方法为()。
A. 数列发展水平之差B. 数列发展水平之比C. 绝对增长量和发展速度之比D. 绝对增长量同基期水平之比正确答案:9. 根据统计研究的目的、客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合,称为()。
A. 总体B. 总体单位C. 客体D. 对象集正确答案:10. 如果总体单位可以合计在一起,此总体称为()。
A. 不可加总体B. 可加总体C. 有限总体D. 无限总体正确答案:吉大17春《统计学基础》在线作业1二、多选题(共10 道试题,共40 分。
)1. 定基指数和环比指数之间的关系是()。
A. 定基指数等于相应的环比指数的连乘积B. 通过这种联系进行两者之间的转化C. 这种联系,对于个体指数来说是永远存在的D. 对于总指数来说,这种联系是永远存在的正确答案:2. 以下关于调和平均数的使用对的是()。
统计学原理第一次作业参考答案一、判断题1、√2、×3、×4、×5、×6、×7、√8、×9、√ 10、√二、单项选择题1、C2、B3、B4、D5、D6、D7、A8、C9、B三、多项选择题1、AD2、BCE3、ACE4、BCE5、BE或BCE6、ACD四、填空题1、品质标志2、统计总体;总体单位3、离散型变量;连续型变量4、数量;质量5、时点;时期6、重点调查7、分组标志的选择;分组方法的选择;分组标志的选择8、每一个人;每户;每户;每户9、普查;全面统计报表;重点调查;抽样调查;典型调查10、数量;品质11、离散型变量;连续型变量12、品质;变量五、简答题(略)六、计算题1、答案:(1)等距分配数列不等距分配数列(2)向上累计(等距数列)向下累计(等距数列)2、答案:(1)(2)分组标志为“成绩”,其类型为“品质标志”;本班学生的考试成绩的分布呈两头小, 中间大的钟型分布统计学原理第二次作业参考答案一、判断题1、×2、×3、√4、×5、√6、×7、×8、√9、×10、×二、单项选择题1、D(该题有问题)2、C3、D4、B5、B6、C7、D8、B9、B 10、D 11、A 12、D 13、D 14、B三、多项选择题1、BE2、ADE3、ABC4、DE5、ADE6、ADE7、ABCDE8、ACE9、BDE 10、CE四、填空题1、的可比性2、在一定地点、时间条件下;总体各单位某一数量标志所达到的一般水平3、集中趋势4、各组权数相等5、Σxf/Σf6、各组权数;各组标志值7、正;逆8、该题有问题9、平均指标10、算术平均数;调和平均数五、简答题(略)六、计算题1、解:甲产品的产量动态相对数=2002年的实际产量/2001年的实际产量=42480/35070=121.13%甲产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=42480/36000=118%乙产品的产量动态相对数=2002年的实际产量/2001年的实际产量=19775/15540=127.25% 乙产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=19775/17500=113%丙产品的产量动态相对数=2002年的实际产量/2001年的实际产量=8016/7448=107.63%丙产品的产量计划完成相对数=2002年的实际产量/2002年的计划产量=8016/8350=96%2、解:(1)(2)平均日产量=⨯+⨯+⨯+⨯+⨯=∑∑=4065.47105.4295.3785.3275.27fxf x 37.5(件)3、解:x 是销售价格;f/Σf 各组商品销售量占总销售量的比重;平均销售价格=⨯+⨯+⨯=∑∑=%3045%5035%2025ff xx 36(元)4、解:x :工人劳动生产率,f :工人数平均劳动生产率5030701001505095308570751006515055++++⨯+⨯+⨯+⨯+⨯=∑∑=fxf x=68.25(件/人)5、解:m :实际产量,x :计划完成百分比平均计划完成百分比x ==++++++=∑∑%115184%105126%95%8518412657685768xm m 103.57%6、(1)m :实际产量,x :计划完成百分比。
统计学基础第一次作业
一、填空题
1、按照所采用的计量尺度不同,可以将统计数据分为_分类数据_、_顺序数据_和_数值型
数据_。
2、按照数据的收集方法的不同,可将统计数据分为_观测数据_和__实验数据_。
3、按照被描述的对象与时间的关系,可将统计数据分为_截面数据__和_时间序列数
4、体重的数据类型是:clear all。
5、民族的数据类型是:CHAR。
6、空调销量的数据类型是:电器。
7、支付方式(购买商品)的数据类型是:分类变量。
8、学生对教学改革的态度(赞同、中立、反对)的数据类型是:顺序数据。
9、从总体中抽出的一部分元素的集合,称为___样本_____。
10、参数是用来描述_总体特征_______的概括性数字度量;而用来描述样本特征的概括
性数字度量,称为___统计量_____。
11、参数是用来描述_总体特征_的概括性数字度量;而用来描述样本特征的概括性数字
度量,称为_统计量_。
12、统计数据有两种不同来源:一是_直接来源__,二是__间接来源___。
13、统计数据的误差有两种类型,即__抽样误差_和_非抽样误差。
14、统计表由_数据__、__表头__、___行标题_和__列标题__四个部分组成。
15、统计分组应遵循“不____重_____不__漏_______”、“___上限______不在组内”的
原则。
16、按取值的不同,数值型变量可分为_离散型变量__和_连续型变量_。
17、在数据分组中,_离散型变量_______可以进行单变量值分组,也可以进行组距分组,
而___连续型变量_____只能进行组距式分组。
18、组距分组中,向上累积频数是指某组_上限以下_的频数之和。
19、将某地区100个工厂按产值多少分组而编制的频数分布中,频数是_各组的工厂数
__。
20、频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这
种分布的类型是_U型分布_。
21、一组数据向某一中心值靠拢的倾向反映了数据的_中心点_。
22、__众数_是一组数据中出现次数最多的变量值。
23、一组数据排序后处于中间位置上的变量值称_中位数__。
24、不受极端值影响的集中趋势度量指标有__中位数_和_众数__。
25、一组数据的最大值与最小值之差称__极差___。
26、__标准差系数__是一组数据的标准差与其相应的平均数之比。
27、数据分布的不对称性是_偏态_。
28、数据分布的平峰或尖峰程度称_峰态__。
29、当偏态系数为正数时,说明数据的分布是_右偏分布__。
30、集中趋势度量指标中的算术平均数、调和平均数_数值_______(容易、不易)受极
端变量值影响。
31、中位数适用于顺序变量和定量变量,不适用于_名义变量和次序变量_______。
二、简答题
1、什么是数据的集中趋势?反映数据集中趋势的指标有哪些?
答:数据的集中趋势在统计学中是指一组数据向某一中心值拢的程度,它反映了一组数据中心点的位置所在。
反映数据集中趋势的指标主要有:众数、中位数、分位数、平均数等。
2、什么是数据的离散程度?常用的测度离散程度的指标有哪些?
答:离散程度反映的是各变量值远离其中心值的程度。
常用的测度离散程度的指标有:四分位差、方差、标准差、极差、离散系数等。
3、简述众数、中位数和均值的特点和关系。
答:特点:众数是总体中出现次数最多的标志值。
反映了标志值分布的集中趋势,是一种由位置决定的平均数。
可以没有众数也可有两个。
众数是一种位置代表值,它的应用场合比较有限。
如:在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的众数值为代表。
中位数是将总体中各数据排序后,位于中点位置的。
中位数也反映标志值的集中趋势,也是由位置决定的平均数。
如,要在若干个连锁店间选择仓库或商品配送中心就可以利用这一性质,因而在工程设计中有应用价值。
均值集算术平均数,是数据集中趋势的最主要测度值。
它反映了一组数据中心点或代表值,是数据误差互相抵消后客观事物必然性数量特征的反映。
总之,众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合较少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分。
特别是当要用样本信息对总体进行推断时,均值就更显示出它的各种优良特征。
均值在整个统计方法中应用最广,对经济、管理和工程等实际工作也是最为重要的一个代表值和统计量。
关系:若数据足够多,而且次数分布适度偏斜情况下,均值、中位数和众数三者间有较固定的关系。
不论是在右偏还是左偏,中位数始终居于均值与众数之间。
如果将均值和众数之间的距离视为1,则中位数与均值之间的距离为,中位数与众数之间的距离约占。
根据这一关系,当已知其中两个代表值时,可用公式求出第三个代表值。
三、综合计算题
1、某班40名学生考试成绩如下:
66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60-70分为及格,70-80分为中,80-90分为良,90-100分为优。
(1)将该班学生分为不及格、及格、中、良、优五组,编制一张分数统计表。
(2)指出分组标志及类型、分组方法的类型、分析本班学生考试情况。
答:分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学不及格人数和优秀生的人数都较少,分别为7.5%和10%。
大部分同学成绩集中在70~90分之间,说明该班同学成绩总体良好。
考试成绩一般用正整数表示时,可视为离散变量,也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。
2、甲乙两班各有30名学生,统计学考试成绩如下:
(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图;
(2)比较两班考试成绩分布的特点。
答:乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。
因此乙班学生考试成绩平均比乙班好。
两个班学生都呈现出"两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。
3、某班级25名学生的统计学考试成绩数据如下:
89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80,
79,81,70,87,60
试计算:
(1)该班统计学成绩的均值、中位数和四分位数;答:⎺X=81.2 M e=82 Q l=74 Q M=89
(2)该班统计学成绩的方差、标准差。
答:S=11.18 S2=124.92
4、某企业工人生产产品件数的分组资料如下:
(1)计算该企业工人的平均产量
答:⎺X=41.88
(2)计算该企业工人产量的平均差和均方差;
答: M d=6.25 s=7.39
5、某学院二年级两个班的学生外语考试成绩如下表:
试分别计算两个班的平均成绩和标准差,并比较说明哪个班的外语考试成绩差异程度更大。
答:英语统考成绩学生人数 A班 B班 60以下 4 6 60~70 12 13 70~80 24 28 80~90 6 8 90以上 4 5 合计 50 60
四、实操题(附加题)
完成教材P71Excel操作题,完成后将Excel文件连同此Word答案文档一同打包上传,完成效果如下图所示。