统计学基础知识

  • 格式:pdf
  • 大小:172.43 KB
  • 文档页数:3

下载文档原格式

  / 3
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章基本概念

本章主要内容

总体样本

统计量参数

资料类型

概率频率

1.1 统计学的基本概念

统计学和统计数字在英语中共用statistics一词作为复数名词意指统计数字作为单数名词表示统计学这个词源于state可见早期的统计数字是指官方所要求的信息现在

仍然如此但不限于此各行各业都有大量的统计数字其中蕴涵着丰富的信息Webster国际大词典第三版中说统计学是 a science dealing with the collection, analysis, interpretation and presentation of masses of numerical st JM主编的一本词典中统计学是the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable results从上面对统计学的定义中我们不难看到统计学至少含有如下三方面的内容第一统计学是处理资料中变异性的科学和艺术第二统计学的目的在于取

得可靠性的结果其求实性毫不含糊第三统计学是在搜集归纳分析和解释大量数据

的过程中完成使命的

简单地讲统计学是研究数据的搜集整理与分析的一门科学

在信息社会的今天统计学的原理与方法几乎应用于科技的所有领域产生了许多应用性分

支如工业统计卫生统计商业统计等等

一般而言统计工作的基本过程的主要包括设计搜集资料整理资料分析资料

1.2 统计学中的基本概念

1.2.1 总体与样本

总体(population)根据研究目的确定的同质观察单位的全体

总体的调查应包括内容单位范围时间

有限总体只包含有限个观察对象的总体

无限总体观察对象无限的总体

个体构成总体的基本单位

样本(sample)从总体中随机抽取部分观测单位其实测值的全体

调查总体对总体进一步限制使对总体的调查具备可操作性

在市场调查中问卷中的每一个题目都代表着一个特定的总体

如某次调查被访者均为20~30岁男性居民样本量为400

题目Q1 当您想到洋酒时您最先想到的品牌是什么

总体为该市20~30岁男性居民最先想到的洋酒品牌的全体

样本这400个被访者首先想到的品牌的全体

题目Q2 您的个人收入是多少

总体该市20~30岁男性居民的个人收入的全体

样本这400个被访者的个人收入

由此可见界定总体一个是甄别条件一个是指标

1.2 .2 参数统计量

参数描述总体特征的指标

参数常用希腊字母表示如µσϕτυ等等

如某单位共10000人其中吸烟人数为3000人吸烟率π=30%

1999年11月人口普查发现某区15万个家庭中3万个家庭拥有大屏幕彩电则该区家庭大屏幕彩电普及率π=20%该区户均存款µ=5万元人民币

上述指标是总体特征指标因而称为总体参数

统计量由样本计算的不含未知参数的函数

假定调查了100个家庭其中75个家庭装有电话电话普及率75%100家庭共计300人

吸烟者100人吸烟率为33.33%… … 75%33.33%由样本计算因而称为统计量

企业在经营过程中需要了解总体参数以安排生产制定营销计划或了解本企业产品或品

牌的市场表现一般情况下总体中的个体数目往往较大或无限因而总体指标参数往

往是未知的人们在实践过程中逐渐认识到样本统计量与相应总体参数间有着某种联系

可以通过样本去了解总体情况由样本信息来推断相应的总体特征而这正是市场调查业存

在和发展的基础

1.2.3 计数资料计量资料等级资料

计数资料将资料按某种属性进行分组各属性或类别间互不相容清点每组个数后获得

的资料称为计数资料

如100名被访者按性别分组30名男性70名女性3070即为计数资料推而广之35人吸烟65非吸烟按是否吸烟分类3565即为计数资料

又如100名被访者按所属公司性质分类国营单位60人私营单位30人外资10人

从上述示例可见计数资料表现为互不相容的类别或属性变量值是定性的

计量资料

一项针对中学生消费状况及营养状况的调查100名被访者体重身高月个人消费等资料均为计量资料

等级资料将资料按某种属性进行分组各类之间有程度的差别给人以半定量的概

念这类资料称为等级资料

如CPT研究中按非常好很好好一般不好5个等级进行评价所获的资料称为等级资料

资料间的转换

计数资料及等级资料均为按某种属性分组因而均称为分类变量(categorical variable)所不同的是计数资料的类别间无等级的概念如男性与女性间户籍是广州或北京或上海等所

以也称计数资料为无序分类资料(unordered categories)称等级资料为有序分类资料(ordinal

categories)

根据实际需要可以进行资料的转换

如对家庭年总收入可按2万元以下2万~5万5万以上进行划分将计量资料转换为等级资料

将非常好很好好一般不好转换为评分12345或54321

则将计量资料转换为计量资料

计数资料转化为计量资料比较复杂目前尚未得到很好的解决一般将其转换为取值为(01)的两分变量

当有2类时如对性别资料变量为x将男性定义为1x=1女性定义为2x=0

当有多类时如职业调查对象分为企业管理人员技术人员一般职工共3类需设置2