社会统计学习题 卢淑华
- 格式:doc
- 大小:154.50 KB
- 文档页数:12
社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
1、P58习题十五(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。
3、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)(1)试作频率统计表、直方图和折线图(2)试求四分互差。
4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为,静止不流动的概率为,求服务性行业代际向上流动的概率是多少6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为;处于异族文化的吸引占;而两种动机兼而有之的占.问旅游动机为游览名胜或为异族文化吸引的概率是多少8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少两名孕妇都生女婴的概率是多少其中一名孕妇生男婴、一名孕妇生女婴的概率是多少9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。
《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、)(28.516200182525400)(5252004025504000元元=´++==´-+=M M d )(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==´-+==´-+=Q Q Q Q Q )(66.225509245092410050924001001005260032760000)(2222元====-=-=åås s N N b n b n i i i i i i 四、(1)极差R=1529-65=1464R=1529-65=1464(百元)(百元)(2)将数据从小到大排序:)将数据从小到大排序:65 92 106 118 122 135 148 174 185 65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===´-+==´-+==+´==+=Q Q (3))(92.42164.178017101026742495204)(222百元==-=-=ååNNx x i i s五、五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、六、633.010*******)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=´===´=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P x(2) 10口井皆不产油的概率为:02825.07.03.0)0(1010===C P x(3)该公司赢利的机会为:85069.07.03.07.03.01)2(911101010=--=³C C P x八、八、1465.071828.28!24)2(4442=´====--e x P l 九、九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==££=--e ex P x P x P l 十、十、。
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
1、P58习题十五(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。
3、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)(1)试作频率统计表、直方图和折线图(2)试求四分互差。
4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?5、P73例12根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少?6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少?8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少?9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少?12、P83例2210人抓阄,其中共有2张球票,问第2个人抓到球票的概率?13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。
设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。
问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少?14、P99例27已知随机变量的概率分布为求σ²=?15、P106习题三某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。
(1)只定人民日报的(2)至少订以上一种报纸的(3)只订以上一种报纸的(4)以上两种报纸都不订的16、P107习题6根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?17、P107习题7问卷调查中,首先问“您是否结婚?”如果回答是未婚,将跳过以下问题不问。
如果回答是已婚,则进一步询问“您是否有孩子”设未婚概率为0.4;已婚中有孩子的概率为0.8.问访问中回答有孩子的概率是多少?18、P107习题8某产品由甲乙两家乡镇企业生产,其中甲厂提供95%的产品,乙厂提供5%的产品。
甲厂产品的合格率为95%;乙厂产品的合格率为70%。
现抽得一件事次品的情况下,问来自甲厂得概率是多少?19、P107习题12居民楼共有十二户居民,其中有九户为干部,三户为工人。
现从中任抽一户,若抽到的是工人户,则不放回再抽一户,直到抽到干部户为止。
求在抽到干部户以前已抽出的工人户的概率分布、均值µ和方差σ²。
20、P119例8根据生命表,年龄为60岁的人,可望活到下年的概率为p=0.95.设某单位年龄为60岁的人共有十人。
问:(1)其中有9人活到下年概率为多少?(2)至少有9人活到下年的概率是多少?21、P110例9某中学平均升学率为70%,设随机抽查六名学生。
问(1)其中有四名升学的概率是多少?(2)至少有四名升学的概率是多少?22、P123例10设公司对某经理候选人进行民意调查,结果公司有三分之一员工表示赞成;三分之一员工表示反对;其余为不表态。
问如果任抽三名,其调查结果的概率分布如何?23、P130例14某兄弟民族学习班共有成员十名,其中回族三名,维吾尔族无名,蒙古族两名,求任访四名,其各族人数的概率分布?24、P133例15设在填写居民证1000张卡片中共发现300个。
为每张居民正出现错字的概率分布如何?25、P137习题1某地区回族占全体居民人数的6%,今随机抽取十名,问其中恰有两名是回族的概率是多少?26、P137习题2在一百箱出口商品中,有十箱为乡镇企业的产品,问第三次才抽到箱中是乡镇企业产品的概率是多少?(假定是非重复抽样)27、P137习题3工人中吸烟的比例为0.5%,某车间有工人300名,求以下概率:(1)全不吸烟(2)一人吸烟(3)二人吸烟(4)三人吸烟28、P137习题4某民族地区,汉族占50%,回族占30%,蒙古族占20%。
求任抽四名中汉、回人数的概率分布?29、P137习题5某车间共有四十名工人,其中妇女有十名。
今任抽五名进行访问,问被访中至少有四名妇女的概率是多少?30、P137习题6十户人家中有五户参加了才财产保险,三户参加了人寿保险;其余为参加任何保险。
求随机抽查四户中参加财产保险户数、人寿保险户数的概率分布?31、P154例11已知ξ~N(0,1),求满足P(׀ξ׀≥λ)=0.05中之λ值。
32、P155例12根据统计,北京市初婚年龄服从正态分布。
其均值为25岁,标准差为5岁,问25岁到30岁之间的结婚的人,其百分数是多少?33、P157例13已知k=9,α=0.025,求满足下式P(χ²<χ²1-α)=α中之χ²1-α值34、P162例14某地进行了电话费用的情况调查。
电话费用的分布不清楚。
但直到平均电话费用为80元,标准差为10元。
问60-100元之间的概率是多少?35、P175例16某地区少数民族占0.5%。
今作10^4人的随机抽查,求少数民族不多于70人的概率36、P177习题1已知随机变量ξ满足正态分布ξ~ N(50,5²),求P(ξ>61)=?37、P178习题2接上题,求P(44≤ξ≤55)=?38、P178习题3已知Z满足标准正态分布N(0,1),求以下各α情况下,P(׀Z׀>λ)=α中的λ值。
(1)当α=0.1(2)当α=0.05(3)当α=0.0139、P178习题4根据调查,儿童智商分布为N(100,10²),某幼儿园共有儿童100人,问智商在110-120之间的儿童共有多少人?40、P178习题5共有5000个同龄人参加人寿保险,设年死亡率为0.1%。
参加保险的人在年初应缴纳保险费1000元,死亡时家属可领10万元,求保险公司一年内从这些保险的人中,获利不少于400万元的概率?41、P184例1根据抽样调查,以下是八名同学社会统计学考试得分42、P185例2工会为了了解春游期间需租用几辆公共汽车,在公司一万名员工中进行了共一百的假单随机抽样调查。
统计结果,其中有二十名愿意外出春游。
设每辆可载乘客五十名,问估计要预租多少辆公共汽车?43、P202例4为了对某企业职工闲暇时间进行研究。
根据一次样本你(n=33)的调查,平均每天看电视时间为:X=0.96(小时)S=0.47(小时)试求企业职工平均每天看电视时间的区间估计(置信度取95%)。
假定看电视时间ξ满足正态分布N(µ,σ²),其中σ²是未知。
44、P207例5设某企业女员工从事家务劳动时间服从正态分布N(µ,0.66²)。
根据三十六人的随机抽样调查,每天平均从事家务劳动时间X为:X=2.65小时,求µ的双侧置信区间(置信度取0.95和0.99两种)45、P208例6设某社区受教育程度服从正态分布N(µ,σ²),σ²未知。
根据二十五人的随机抽样调查,平均受教育年限X和S为:=11.5年,S=3.6年,求µ的双侧置信区间(1-α=0.99)46、P210例7设某村平均家庭购买化肥的支出服从正态分布。
现根据十户指出的抽样调查,得数据:578;572;570;568;572;570;570;596;584;572.求方差σ²和标准差σ的置信区间(1-α=0.95)47、P211例8设某区受教育程度的总体分布、方差都不知道。
根据五十人的抽样调查结果,平均受教育年限X及标准差S为:X=11.5年,S=3.6年,求置信度为0.99的µ的双侧置信区间。
48、P214例9设根据某地一百户的随机抽查,其中有六十户拥有手机,求该地拥有手机成数p的置信区间(置信度为0.95)49、P216、例10为理解甲、乙里那个地中学毕业生成绩的差别,两地做了抽样调查,结果有:甲地X1=520(分);S1=40(分);n1=800(名)乙地X2=505(分);S2=50(分);n2=1000(名),求置信度为0.95两地平均成绩差的区间估计。
50、P218、例11甲乙两地各作1000户抽样调查,其中甲地拥有汽车为825户;乙地拥有汽车为760户。
求置信度为0.95两地汽车拥有成数差的置信区间。
52、P221习题2根据居民区一百户闲暇时间的抽样调查,居民用于看电视时间占总闲暇时间的比例,平均为75%,比例的标准差为20%。
求看电视时间占居民总闲暇时间的比例的区间估计(置信度为95%)53、P221习题3接上题,如果置信度改为99%,求区间估计值?并与上题结果比较之。
51、P221习题1设X1,X2,X3为简单随机抽样的三个观测值,如果采用如下不等全的平均值X’=2/5 X1+2/5 X2+1/5 X3,作为总体均值的点估计值,试说明它将比采用等权的平均值X=1/53X1+1/3 X2+1/3 X3作为总体均值的点估计值要差。
解答:根据方差的性质'12322212321232221232221()()()()555221()()()()()()555441()()()252525925111()()()()333111()()()()()()333111()()()99913D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X D X σσ=++=++=++==++=++=++= 因为'()()D X D X ,所以采用等权的平均值X作为总体均值的点估计值比采用不等权的平均值'X 作为总体均值的点估计值更有效。