统计学 2
- 格式:doc
- 大小:186.00 KB
- 文档页数:8
统计学基础知识统计学是研究收集、分析和解释数据的科学。
它涵盖了许多基本概念和方法,以下是一些统计学的基础知识:1. 数据类型:统计学中的数据可以分为两种类型,即定量数据和定性数据。
定量数据是可以进行数值计量和统计分析的数据,如身高、体重等。
定性数据是用于描述性目的的数据,如性别、职业等。
2. 数据收集:统计学的一个重要方面是数据的收集。
数据可以通过问卷调查、实验、观察等方式获得。
在数据收集过程中,要注意样本的选择和抽样方法,以保证数据能够代表所研究的总体。
3. 描述统计学:描述统计学是通过数据的基本统计量,如均值、中位数、标准差等来描述数据的特征和分布。
它可以帮助我们了解数据的集中趋势、散布程度和形状等。
4. 推论统计学:推论统计学是从样本数据中推断总体参数的学科。
它使用抽样方法和概率理论来进行推理,并通过假设检验和置信区间等方法判断观察到的差异是否具有统计学意义。
5. 概率:概率是统计学的基础之一,它用于描述随机事件发生的可能性。
概率理论提供了一种数学工具,用于描述和推理随机事件。
6. 假设检验:假设检验是统计学中用来判断观测数据与某个假设是否一致的方法。
它根据样本数据的统计量,如均值、比例等,与某个理论上的期望值进行比较,从而进行推断。
7. 回归分析:回归分析是一种用于研究变量之间关系的统计方法。
它可以用来建立预测模型,通过自变量对因变量的影响程度进行分析。
8. 抽样方法:抽样方法是从总体中选取样本的过程。
常见的抽样方法包括简单随机抽样、分层抽样、系统抽样等,它们的目的是确保样本能够代表总体,并减少误差和偏差。
以上是统计学的一些基础知识,它们是进行统计分析和解读数据的基础。
对于想要学习统计学的人来说,这些概念和方法是必备的基础知识。
1 标志与指标的区别标志:说明总体单位属性和特征的名称。
概括的是总体。
指标:说明总体现象数量特征的概念及其数值。
概括的是个体。
2 统计数据:A定类数据:主要特征是”=”或者”不等于”B定序数据:主要特征是”<”或者”>”C定距数据:主要特征是”+”或者”-“D定比数据:主要特征是”÷”或者”×”3 统计学的研究方法A大量观察法B统计描述法(基础):是对调查或实验得到的统计数据资料进行整理、归类,计算出各种能反映总体数量特征的综合指标,并加以分析研究,从而得出需要的数据资料信息,用表格、图形和统计指标数值来表示的统计方法。
C综合指标法(基本方法)D统计推断法E统计模型法(最严密)4 搜集数据的方法A直接观察法:是调查人员直接对呗调查对象进行登记的调查方法。
特点:获得第一手数据B采访法:是调查者与被调查者通过面对面交谈从而得到所需数据的调查方法。
包括:标准式访问(优点:对调查过程加以控制,结果比较可靠)与非标准式访问(优点:可以获得意想不到的结果)。
C报告法:被调查者按隶属关系,以各种原始记录和核算资料为基础,逐级向上提供统计资料的方法。
特点:可以取得比较精确的资料。
D 邮寄调查:通过邮寄方式将调查或者问卷送至被调查者手中,由被调查者填写,然后将调查表寄回或投放到收集点的调查方法。
特点:信息传递依赖调查表,回收率比较低。
E电话调查:调查人员利用电话同受访者进行语言交流,从而获得信息的一种调查方法。
特点:时效快、费用低。
F网络调查:通过互联网所进行的统计调查。
特点:组织方便、全天候运作、调查对象比较局限等。
5 普查(全面调查)组织方式:A组织专门的普查机构,配备一定数量的普查人员直接对调查单位进行登记B利用被调查单位的原始记录、统计和核算资料,颁发一定的普查表格,有被调查单位填写。
组织方式的特点:A通常是一次性或周期性B规定统一的标准时点C规定统一的普查期限D规定普查的项目或指标E数据一般比较精准,规范化程度较高,可以为抽样调查或其他调查提供基本依据F使用范围比较窄,只能调查一些最基本及特定的现象。
第2章练习题1、二手数据的特点是(B)A.采集数据的成本低,但搜集比较困难B. 采集数据的成本低,但搜集比较容易2、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为(A)D.整群抽样3、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为(A)C.分层抽样4、一个元素被抽中后不再放回总体,然后从所剩下的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为(A)5、在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为(C)A. 简单随机抽样B. 系统抽样D.整群抽样6、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
这样的抽样方式称为(C)A. 分层抽样B. 简单随机抽样7、先将总体划分为若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为(D)A. 系统抽样B. 多阶段抽样8、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方是(D)B. 整群抽样9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是(D)A. 系统抽样B. 简单随机抽样10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是?(C)B. 整群抽样11、为了了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。
这种调查方式是(C)A. 简单随机抽样B. 分层抽样12、研究人员根据研究对象的了解有目的的选择一些单位作为样本,这种调查方式是(A)A. 判断抽样B. 分层抽样13、下面的那种调查方式不是随机选取的(D)A. 分层抽样B. 系统抽样14、下面的那种抽样调查结果不能用于对总体有关参数进行估计(D)A.分层抽样B. 系统抽样15、调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
一、选择题1、经验公式来确定组数,K=( )。
A 、1+lg(n)/lg2B 、(1+ lg(n))/2C 、1/2+lg(n)D 、1+lg(n) 2、 缺上限的组中值计算公式为( )。
A 、下限-临组组距/2B 、上限-临组组距/2C 、上限+临组组距/2D 、下限+临组组距/2 3、最小平方法是要求( )A 、min )(>---∑∧Y Y B 、0)(2=--∑bx a Y C 、min )(2>----∑bx a Y D 、0)(=-∑∧Y Y4、已知4个水果店的苹果单价和销售额,计算4个商店苹果的平均单价,采用:()。
A 、简单算术平均数B 、加权算术平均数C 、加权调和平均数D 、几何平均数5、某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足( )。
A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数6、根据一个具体的样本求出的总体均值的95%的置信区间( )A 、以95%的概率包含总体均值B 、有5%的可能性包含总体均值C 、一定包含总体均值D 、要么包含总体均值,要么不包含总体均值7、一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。
计算该投资者在这四年内的平均收益率( )。
A 、8.08% B 、10.43% C 、8.5% D 、7.72% 8、如果某个分布式极度右偏,则其偏度系数为( ) A 、-0.3 B 、0.3 C 、-2.9 D 、2.99、甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差8.4分,因此( )。
A 、甲班学生平均成绩代表性好一些 B 、乙班学生平均成绩代表性好一些C 、无法比较哪个班学生平均成绩代表性好D 、两个班学生平均成绩代表性一样10.某地有2万亩稻田,根据上年资料得知其中平均亩产的标准差为50公斤,若以95.45%的概率保证平均亩产的误差不超过10公斤,应抽选()亩地作为样本进行抽样调查。
A、100B、250C、500D、1000二、多选题1、下列属于正相关的现象是( ) 。
A、家庭收入越多,其消费支出也越多B、某产品产量随工人劳动生产率的提高而增加C、流通费用率随商品销售额的增加而减少D、生产单位产品所耗工时随劳动生产率的提高而减少E、产品产量随生产用固定资产价值的减少而减少2、简单回归分析与简单相关分析的区别有()。
A、相关分析所研究的两个变量是对等的,而回归分析不是B、对两个变量只能计算出一个相关系数,但可以根据不同的研究目的建立两个回归方程C、相关分析对资料的要求是,两个变量都是随机变量;回归分析要求自变量是给定的,因变量是随机的D、回归分析对资料的要求是,两个变量都是随机变量;相关分析要求自变量是给定的,因变量是随机的E、回归分析所研究的两个变量是对等的,而相关分析不是3、在假设检验中,α与β的关系是()。
A、在其它条件不变的情况下,增大α,必然会减少βB、α和β不可能同时减少C、在其它条件不变的情况下,增大α,必然会增大βD、只能控制α不能控制βE、增加样本容量可以同时减少α和β4、已知总体服从正态分布,现抽取一小样本,拟对总体方差进行双侧假设检验,α=0.05,则原假设的拒绝区域应该包含()。
A、(- ∞,)1(2975.0-nχ)B 、(0, )1(2975.0-n χ)C 、( )1(2025.0-n χ,+ ∞) D 、()1(2975.0-n χ,+ ∞) E 、(0,)1(2025.0-n χ)5、集中趋势的测度指标有( )。
A 、中位数B 、众数C 、均值D 、分位数E 、调合平均数 三、判断题1、在平均指标变动因素分析中,可变构成指数是专门用以反映总体构成变化影响的指数。
( )2、用平均数指数形式计算总指数,既可以用全面调查资料,也可以用非全面资料。
( )3、如果物价上涨16%,则用同样多的货币能买到原来商品数量的84%。
( )4、对于一个呈上升趋势的现象,其拟合的直线趋势方程 y ˆ= a + b t 中, b 肯定不会为0。
( )5、如果所掌握的变量值本身是比率的形式,而且个比率的乘积等于总的比率时,则此时应该采用调和平均数来计算平均比率。
( )6、最不受极端值影响的数值平均数是几何平均数。
( )7、甲班男生33人,女生25人,乙班男生25人,女生20人,所以学生性别差异甲班大于乙班。
( )8、研究发现,花在看电视上的小时数与阅读测验得分之间是负相关,因而可以认为看电视是使阅读能力降低的原因。
( )9、当相关系数r 为正时,回归系数b 一定为正。
( )10、正确选择分组标志的原则之一是应选择能够反映事物本质或主要特征的标志。
( ) 四、简答题1、何谓上限、下限,组中值及组数的确定公式。
答:2、拉氏、派氏指数的数值关系 答:3、简述多阶段抽样的过程,并举例说明。
答:五、计算题1问:(1)要分析成年组和幼儿组的身高差异,采用什么统计量?(2)分别计算平均身高,比较分析哪一组的身高差异大?(保留两位小数)2、某公司希望新的耐磨球与当前型号的高尔夫球有相同的击球距离,为比较两种球的击球距离,用30只新型号球与30只当前型号球来做距离检验,所得数据如下:问:(1(2)当前球与新球击球距离是否无显著不同?(显著水平0.05)4、某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%、96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽取多少件商品?5、随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:航空公司编号航班正点率(%)投诉次数1 81.8 212 76.6 583 76.6 854 75.7 685 73.8 746 72.2 937 71.2 728 70.8 1229 91.4 1810 68.5 125问:(1)用航班正点率作为自变量,投诉次数作为因变量,求出估计的回归方程,并解释回归系数的意义。
(2)检验回归系数的显著性。
(显著水平为0.05)(3)如果航空正点率为80%时,估计顾客的投诉次数。
(4)航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。
(保留两位小数)x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.97672.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.99983.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998附表2:t分布临界值表(上α分位点)单侧α0.1 0.05 0.025 0.01 0.005 双侧α0.2 0.1 0.05 0.02 0.011 3.077684 6.313752 12.7062 31.82052 63.656742 1.885618 2.919986 4.302653 6.964557 9.9248433 1.637744 2.353363 3.182446 4.540703 5.8409094 1.533206 2.131847 2.776445 3.746947 4.6040955 1.475884 2.015048 2.570582 3.36493 4.0321436 1.439756 1.94318 2.446912 3.142668 3.7074287 1.414924 1.894579 2.364624 2.997952 3.4994838 1.396815 1.859548 2.306004 2.896459 3.3553879 1.383029 1.833113 2.262157 2.821438 3.24983610 1.372184 1.812461 2.228139 2.763769 3.16927311 1.36343 1.795885 2.200985 2.718079 3.10580712 1.356217 1.782288 2.178813 2.680998 3.0545413 1.350171 1.770933 2.160369 2.650309 3.01227614 1.34503 1.76131 2.144787 2.624494 2.97684315 1.340606 1.75305 2.13145 2.60248 2.94671316 1.336757 1.745884 2.119905 2.583487 2.92078217 1.333379 1.739607 2.109816 2.566934 2.89823118 1.330391 1.734064 2.100922 2.55238 2.8784419 1.327728 1.729133 2.093024 2.539483 2.86093520 1.325341 1.724718 2.085963 2.527977 2.84534。