社会统计学 第二章 单变量
- 格式:ppt
- 大小:1.90 MB
- 文档页数:72
《社会经济统计学》各种重点知识第二章1、总体是根据一定的目的要求所需研究事物的全体,它由客观存在的具有某种共同性质的许多个别事物所组成。
2、总体单位是指组成总体的基本单位,它是所要统计的各种数量特征的承担者。
3、确定总体和总体单位,必须注意:构成总体的单位必须是同质的;构成总体的单位必须是大量的、足够多的;总体与总体单位具有相对性;随着研究目的的不同,总体和总体单位可以相互转化。
4、标志是指用来说明总体单位数量特征或属性特征的概念或名称。
5、标志分为品质标志与数量标志,品质标志表示事物质的特征,一般用文字说明;数量标志表示事物量的特征,一般用数值说明6、指标是用来反映总体数量特征的概念,应该包括他的概念和数值。
7、指标按其所反映总体的内容不同分为数量指标和质量指标。
数量指标是指反映社会经济现象总体规模或工作总量的统计指标;质量指标是指反映社会经济现象的相对水平或工作质量的统计指标。
8、指标按其功能和作用分为描述指标、评价指标和预警指标。
描述指标是指用于反映社会经济现实状况和社会生产、生活过程及其结果的统计指标;评价指标是指用于对社会经济活动的结果进行比较、评估、考核,以检查其经济效益和工作质量的统计指标;预警指标主要用于对宏观经济运行状况进行监控,并依据其指标值的变化,预报国民经济即将出现不平衡状态和突发事件,以及某些结构性障碍。
9、统计指标体系是指由一系列相互联系的统计指标所构成的指标群体,用以说明所研究的社会经济现象总体各方面相互依存和相互制约的关系。
10、变异是标志或指标具体表现的差异。
11、变量是指可变的数量标志和指标。
变量的数值表现就是变量值,亦即可变的数量标志或指标的不同取值。
12、定类尺度是指分组标志是对一些客观事物的名称进行排列。
它的特点是只能对数据进行平行的分组或分类,具有互斥性,不能对各组的编号进行加减乘除等数学运算。
13、定序尺度指把各类事物按一定特征的强弱、高低等顺序排列起来。
第一章数据与统计学数据分析所使用的方法大体上可分为描述统计和推论统计(推断统计),描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。
推断统计主要研究如何根据样本信息来推断总体的特征,内容包括参数估计和假设检验两大类。
变量:是描述观察对象某种特征的概念,其特点是从一次观察到下一次观察可能会出现不同的结果(具有一个以上取值的概念)1、下列哪一个选项不是变量?( )A. 民族B. 智商C. 衣服的尺寸D. 女性答案:C2、下列变量属于数值型变量的是( )A. 工资收入B. 产品等级C. 学生对考试改革的态度D. 企业的类型答案:A解析:3、社会统计学的数据分析方法主要包括统计描述和( )A. 统计描述B. 统计推导C. 统计推论D. 统计分析答案:C4、能计算均值和标准差的必须是哪种变量( )A. 自变量B. 因变量C. 数值型变量D. 字符串型变量答案:C5、在SPSS中最多可以设置几个独立的缺失值?( )A. 3B. 4C. 5D. 8答案:A6、描述统计可以最恰当地表述为( )A.数据作概括性的表达B.对总体所作的结论C.测量操作的应用D.原始数据到标准分的转变答案:A解析:描述统计主要是利用图表形式对数据进行展示,或通过计算一些简单的统计量(诸如:比例、比率、平均数、标准差等)对数据进行分析。
第二章数据的描述性分析:图表展示1、欲以图形显示两变量X和Y的关系,最好创建( )。
A. 直方图B. 圆形图C. 柱形图D. 散点图答案:D第三章数据的描述性分析:概括性度量1、下列统计指标中,对极端值的变化最不敏感的是( )。
A. 众值B. 中位值C. 四分位差D. 均值答案:A2、经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( )A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据答案:B解析:根据标准得分可以判断一组数据中是否存在离群点。
社会统计学整理第二章:单变量统计描述分析各种图:定类:圆瓣图、条形图定序:条形图定距:直方图、折线图组界:真实组界=标明组界0.5 条形图:定类变量:长条排列次序任意,条形离散。
定序变量:长条按序排列,条形是离散或紧挨。
直方图:由紧挨着的长条组成,面积表示频次或相对频次,高度是频次密度。
众值:用具有频数最多的变量值来表示集中值。
连续型变量用中心值来表示众值。
定类预测犯错最少。
异众比率:是非众值在总数N中所占的比例(:众值的频次)质异指数:理论上最多可能差异中实际出现了多少差异(k:类比数f:每类次数)中位值:定序预测犯错最少。
(也可以求25%和75%,改为和)n:中位值组的频次cf:含中位值区间的真实下界累积(向上)平次N:调查总数极差:极差=观察的最大值-观察的最小值四分互差:结论:50%位于*间均值:定距变量预测犯错最少。
标准差:第三章:概率互不相容:两者不能同时出现。
互为对立:不同时出现且两者相加为整体。
如果事件A与B互为对立,则必然满足互不相容,但逆定理不存在。
P(A);P(B),互不相容一定不满足互相独立,反之亦然。
互为对立与相互独立不能同时满足。
全概公式:逆概公式:方差:SKEWNESS(偏态)=>0:正偏态=0:对称<0:负偏态(峰在右边)KURTOSIS(峰态)=>0:正峰态=0:正态分布<0:负峰态(峰矮)第四章:二项分布及其他离散型随机变量的分布排列组合:第五章:正态分布、常用统计分布和极限定理大数定理:在什么条件下,随机事件可以转化为不可能事件或必然事件。
中心极限定理:在什么条件下,随机变量之和的分布可以近似为正态分布。
切贝谢夫不等式:贝努利大数定理:m是n次实验中事件A出现的次数,p是A每次出现的概率切贝谢夫大数定理:μ:数学期望:总体均值中心极限定理:只要n足够大,正态分布:众值=均值=中位值1S-68.26%;2S-95.46%;3S-99.37%;0.05-1.65;0.025-1.96;0.01-2.33;0.005-2.58;0.001-3.09;0.0005-3.30第六章:参数估计点估计:均值—样本均值成数—样本成数方差—样本方差S2是σ2的无偏估计,但S不是σ的无偏估计。
《社会统计学》复习资料一、概念辨析(3×8') 1.参数估计与假设检验参数估计是通过样本对总体的未知参数进行估计,假设检验指通过样本对总体的某种假设进行检验。
参数估计是先看样本的情况,再看总体的情况。
假设检验是先假设总体的情况,再以一个随机样本的统计值来检验这个假设是否正确。
换言之,要先构思总体情况,才进行抽样和分析样本的资料。
2.点估计与区间估计点估计指根据样本资料以一个最适当的样本统计值来代表总体的参数值,简单明确,但不能说明估计结果的抽样误差和把握程度;区间估计指以两个数值之间的间距来估计参数值。
点估计是区间估计的基础。
3.置信度和置信度水平置信度又称置信概率或置信系数,表示用置信区间估计的可靠性,即置信区间包含参数Q 的概率。
置信度水平表示用置信区间估计不可靠的概率。
置信度与置信度水平之和为1。
4.虚无假设与研究假设虚无假设0H 又称原假设、零假设。
是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。
研究假设1H 又称备择假设,是研究者所需证实的假设。
否定0H 后可以认为1H 是对的。
5.甲种误差与乙种误差甲种误差又称第一类错误,是指0H 为真,但小概率事件发生了,拒绝了0H ,即把真的当成假的,它是在拒绝原假设时出现的错误。
犯甲种误差的概率是显著性水平α。
乙种误差即纳伪的错误,又称第二类错误,是指0H 为假,但小概率事件没有发生,接受即把假的当成真的,它是在接受原假设时出现的错误。
犯乙种误差的概率为β,β的值随着真值μ与原假设中0μ的偏离程度而变化,0μμμ-=∆越小,β的数值就越大。
α大β就小,α小β就大。
6.独立样本和配对样本独立样本指从二个总体中,分别独立地各抽取一个随机样本进行比较和研究。
配对样本指它只有一个样本,但样本中每个个体要先后观测两次,这样所有个体先观测的值看作是来自第一个总体的样本值,所有个体后观测的值,看作是来自另一个个体的样本值,以此来比较两总体之间的不同。