1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。
统计学重点笔记 第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。 (2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。其容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。 (3)两者的关系:描述统计是基础,推断统计是主体 二、比较分类数据、顺序数据和数值型数据: 根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 (1)分类数据是只能归于某一类别的非数字型数据。它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。 (2)顺序数量是只能归于某一有序类别的非数字型数据。也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 (3)数值型数据是按数字尺度测量的观察值。其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。 总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。 三、比较总体、样本、参数、统计量和变量:
考研计算机数据结构模拟试题及答案(五) 一、选择题(30分) 1. 设一组权值集合W={2,3,4,5,6},则由该权值集合构造的哈夫曼树中带权路径长度之和为( )。 (A) 20 (B) 30 (C) 40 (D) 45 2.执行一趟快速排序能够得到的序列是( )。 (A) [41,12,34,45,27] 55 [72,63] (B) [45,34,12,41] 55 [72,63,27] (C) [63,12,34,45,27] 55 [41,72] (D) [12,27,45,41] 55 [34,63,72] 3.设一条单链表的头指针变量为head且该链表没有头结点,则其判空条件是( )。 (A) head==0 (B) head->next==0 (C) head->next==head (D) head!=0 4.时间复杂度不受数据初始状态影响而恒为O(nlog2n)的是( )。 (A) 堆排序(B) 冒泡排序(C) 希尔排序(D) 快速排序 5.设二叉树的先序遍历序列和后序遍历序列正好相反,则该二叉树满足的条件是( )。 (A) 空或只有一个结点(B) 高度等于其结点数 (C) 任一结点无左孩子(D) 任一结点无右孩子 6.一趟排序结束后不一定能够选出一个元素放在其最终位置上的
是( )。 (A) 堆排序(B) 冒泡排序(C) 快速排序(D) 希尔排序 7.设某棵三叉树中有40个结点,则该三叉树的最小高度为( )。 (A) 3 (B) 4 (C) 5 (D) 6 8.顺序查找不论在顺序线性表中还是在链式线性表中的时间复杂度为( )。 (A) O(n) (B) O(n2) (C) O(n1/2) (D) O(1og2n) 9.二路归并排序的时间复杂度为( )。 (A) O(n) (B) O(n2) (C) O(nlog2n) (D) O(1og2n) 10. 深度为k的完全二叉树中最少有( )个结点。 (A) 2k-1-1 (B) 2k-1 (C) 2k-1+1 (D) 2k-1 11.设指针变量front表示链式队列的队头指针,指针变量rear表示链式队列的队尾指针,指针变量s指向将要入队列的结点X,则入队列的操作序列为( )。 (A) front->next=s;front=s; (B) s->next=rear;rear=s; (C) rear->next=s;rear=s; (D) s->next=front;front=s; 12.设某无向图中有n个顶点e条边,则建立该图邻接表的时间复杂度为( )。 (A) O(n+e) (B) O(n2) (C) O(ne) (D) O(n3) 13.设某哈夫曼树中有199个结点,则该哈夫曼树中有( )个叶子结点。 (A) 99 (B) 100 (C) 101 (D) 102
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 整理by__kiss-ahuang 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。
考研计算机数据结构模拟试题及答案(二) 一、选择题(30分) 1.下列程序段的时间复杂度为( )。 for(i=0; i (A) O(m*n*t) (B) O(m+n+t) (C) O(m+n*t) (D) O(m*t+n) 2.设顺序线性表中有n个数据元素,则删除表中第i个元素需要移动( )个元素。 (A) n-i (B) n+l -i (C) n-1-i (D) i 3.设F是由T1、T2和T3三棵树组成的森林,与F对应的二叉树为B,T1、T2和T3的结点数分别为N1、N2和N3,则二叉树B的根结点的左子树的结点数为( )。 (A) N1-1 (B) N2-1 (C) N2+N3 (D) N1+N3 4.利用直接插入排序法的思想建立一个有序线性表的时间复杂度为( )。 (A) O(n) (B) O(nlog2n) (C) O(n2) (D) O(1og2n) 5.设指针变量p指向双向链表中结点A,指针变量s指向被插入的结点X,则在结点A的后面插入结点X的操作序列为( )。 (A) p->right=s; s->left=p; p->right->left=s; s->right=p->right; (B) s->left=p;s->right=p->right;p->right=s; p->right->left=s; (C) p->right=s; p->right->left=s; s->left=p; s->right=p->right; (D) s->left=p;s->right=p->right;p->right->left=s; p->right=s; 6.下列各种排序算法中平均时间复杂度为O(n2)是( )。
第一章导论 概念: 统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。 统计的分类: 描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。 推断统计:是研究如何利用样木数据进行推断总体特征。 数据: 1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类 2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 3.数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm,190cm,200cm 参数:描述总体特征。有总体均值(μ)、标准差()总体比例(T) 统计量:描述样本特征,样本标准差(s),样木比例(p) 统计方法 描述统计推断统计 参数估计假设检验
第二章 数据的搜集 1. 数据来源包括直接来源(一手数据)和间接来源(二手数据) 2. 抽样方式包括概率抽样与非概率抽样 3. 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都 有一定的机会被抽中。 4. 5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述 的是所有样本可能的结果与总体真值之间的平均差异。 统计数据的分类 按计量层次 分类的 数据 顺序的数据 数值型数 据 按时间状况 截 面 的 数 据 时序的 数据 按收集方法 观察的数 据 实验的数 据
6.抽样误差的大小与样本量的大小和总体的变异程度有关。 第三章数据的图表展示 计算机实训内容, 要求: 1.数据筛选,自动筛选 2.高级筛选, 3.数据排序 4.分类汇总-利用数据透视表 5.对比条形图 6.环形图 7.累计频数图 8.散点图 9.雷达图 等等 频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据 数据-数据透视表数据透视表 第四章数据的概括性度量
第一章: 1、什么是统计学 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。
统计学(第五版)贾俊平课后答案(完整版) 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。
第一章: 1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特 征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数 值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。
考研真题精选 一、选择题 1.若查找每个记录的概率均等,则在具有n个记录的连续顺序文件中采用顺序查找法查找一个记录,其平均查找长度ASL为( )。 A.(n-1)/2 B. n/2 C. (n+1)/2 D. n 2. 对N个元素的表做顺序查找时,若查找每个元素的概率相同,则平均查找长度为( ) A.(N+1)/2 B. N/2 C. N D. [(1+N)*N ]/2 3.顺序查找法适用于查找顺序存储或链式存储的线性表,平均比较次数为((1)),二分法查找只适用于查找顺序存储的有序表,平均比较次数为((2))。在此假定N为线性表中结点数,且每次查找都是成功的。 A.N+1 B.2log2N C.logN D.N/2 E.Nlog2N F.N2 4. 下面关于二分查找的叙述正确的是( ) A. 表必须有序,表可以顺序方式存储,也可以链表方式存储 C. 表必须有序,而且只能从小到大排列 B. 表必须有序且表中数据必须是整型,实型或字符型 D. 表必须有序,且表只能以顺序方式存储 5. 对线性表进行二分查找时,要求线性表必须() A.以顺序方式存储 B.以顺序方式存储,且数据元素有序 C.以链接方式存储 D.以链接方式存储,且数据元素有序 6.适用于折半查找的表的存储方式及元素排列要求为( ) A.链接方式存储,元素无序B.链接方式存储,元素有序 C.顺序方式存储,元素无序D.顺序方式存储,元素有序 7. 用二分(对半)查找表的元素的速度比用顺序法( ) A.必然快 B. 必然慢 C. 相等 D. 不能确定 8.当在一个有序的顺序存储表上查找一个数据时,即可用折半查找,也可用顺序查找,但前者比后者的查找速度( ) A.必定快 B.不一定 C. 在大部分情况下要快 D. 取决于表递增还是递减 9. 具有12个关键字的有序表,折半查找的平均查找长度() A. 3.1 B. 4 C. 2.5 D. 5 10. 折半查找的时间复杂性为() A. O(n2) B. O(n) C. O(nlog n) D. O(log n) 11.当采用分快查找时,数据的组织方式为( ) A.数据分成若干块,每块内数据有序 B.数据分成若干块,每块内数据不必有序,但块间必须有序,每块内最大(或最小)的数据组成索引块 C. 数据分成若干块,每块内数据有序,每块内最大(或最小)的数据组成索引块 D. 数据分成若干块,每块(除最后一块外)中数据个数需相同 12. 二叉查找树的查找效率与二叉树的( (1))有关, 在((2))时其查找效率最低 (1): A. 高度 B. 结点的多少 C. 树型 D. 结点的位置 (2): A. 结点太多 B. 完全二叉树 C. 呈单枝树 D. 结点太复杂。 13. 要进行顺序查找,则线性表(1);要进行折半查询,则线性表(2);若表中元素个数为n,则顺序查找的平均比较次数为(3);折半查找的平均比较次数为(4)。 (1)(2):A. 必须以顺序方式存储;B. 必须以链式方式存储;C. 既可以以顺序方式存
第十章习题 10.1 H0:三个总体均值之间没有显著差异。 H1: 三个总体均值之间有显著差异。 答:方差分析可以看到,由于P=0.1078>0.01,所以接受原假设H0。说明了三个总体均值之间没有显著差异。 10.2 H0:五个个总体均值之间相等。 H1: 五个总体均值之间不相等。
答:方差分析可以看到,由于P=1.02E-05<0.01,所以拒接原假设H0。说明了五个总体均值之间不相等。 10.3 H0:四台机器的装填量相等。 H1: 四台机器的装填量不相等 答:方差分析可以看到,由于P=0.00068<0.01,所以拒接原假设H0。说明了四台机器装填
10.4 H0:不同层次管理者的满意度没有差异。 H1: 不同层次管理者的满意度有差异. 答:方差分析可以看到,由于P=0.000849<0.05,所以拒接原假设H0。说明了不同层次管理者的满意度有差异。 10.5 H0:3个企业生产的电池平均寿命之间没有显著差异。 H1: 3个企业生产的电池平均寿命之间有显著差异 单因素方差分析
平方和df 均方 F 显著性组间615.600 2 307.800 17.068 .000 组内216.400 12 18.033 总数832.000 14
答:方差分析可以看到,由于P=0.00031<0.01,所以拒接原假设H0。说明了不同3个企业生产的电池平均寿命之间有显著差异。 通过SPSS分析(1,2,3代表A,B,C公司),通过显著性对比可知道A和B以及B和C 公司有差异。 10.6 H0:不同培训方式对产品组装的时间没有显著影响。 H1: 不同培训方式对产品组装的时间没有显著影响。 答:方差分析可以看到,由于P=0.00196<0.05,所以拒接原假设H0。说明了不同培训方式对产品组装的时间没有显著影响。 10.8
亲爱的,一章一章来,肯定能弄完的,你是最棒的! 统计学(第五版)贾俊平课后习题答案(完整版) 第一章思考题 1.1 什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2 解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3 统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类 别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4 解释分类数据,顺序数据和数值型数据 答案同 1.3 1.5 举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就 是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的 寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比 如说灯泡的寿命。 1.6 变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7 举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8 统计应用实例 人口普查,商场的名意调查等。 1.9 统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1 什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进
哈尔滨工业大学 二〇〇八年硕士研究生考试模拟试题(一) 考试科目:计算机专业基础 适用专业:计算机科学与技术 I 数据结构(含高级语言)部分(共75分) 一、填空题(每空1分,共9分) +?++的后缀表达式 1.表达式23((12*32)/434*5/7)108/9 是。 2.设有一个10阶对称矩阵A采用压缩存储方式(以行为主序存储:a11=1),则a85 的地址为。 3.设有广义表A=(((a,b),x),((a),(b)),(c,(d,(y)))),得到y的对广义表 A的操作序列为。 4.如果二叉树有20个叶结点,有30个结点仅有一个孩子,则该二叉树的总节点数 为。 5.G是一个非连通无向图,共有28条边,则该图至少有个顶点。 6.构造n个结点的强联通图,至少有条弧。 7.设表长为1023的有序线性表,查找每个元素的概率相等,采用折半查找方法,查 找成功的ASL是。 8.分别采用堆排序、快速排序、冒泡排序和归并排序,对初太为有序的表,则最省时 间的是算法,最费时间的是算法。 二、单项选择题(每题1分,共11分) 1.静态链表中指针表示的是() A 下一元素的地址 B 内存储器的地址 C 下一元素在数组中的位置 D 左链或右链指向的元素的地址 2.计算算法的时间复杂度是属于一种() A 事前统计的方法 B 事前分析估算的方法 C 事后统计的方法 D 时候分析估算的方法 3.若用一个大小为6的数组来实现循环队列,且当前rear和front的值分别为0和3, 当从队列中删除一个元素,再加入两个元素后,rear和front的值分别为() A 1和5 B 2和4 C 4和2 D 5和1 4.若6行5列的数组以列序为主序顺序存储,基地址为1000,每个元素占2个存储 单元,则第3行第4列的元素(假定无第0行第0列)的地址是() A 1040 B 1042 C 1026 D 都不正确 5.一棵124个叶节点的完全二叉树,最多有()个节点。
第一章导论 1、1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1、2 (1)总体就是该市所有职工家庭得集合;样本就是抽中得2000个职工家庭得集合。 (2)参数就是该市所有职工家庭得年人均收入;统计量就是抽中得2000个职工家庭得年人均收入。 1、3 (1)总体就是所有IT从业者得集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1、4 (1)总体就是所有在网上购物得消费者得集合。 (2)分类变量。 (3)参数就是所有在网上购物者得月平均花费。 (4)参数 (5)推断统计方法。 第二章数据得搜集 1、什么就是二手资料?使用二手资料需要注意些什么? 与研究内容有关得原始信息已经存在,就是由别人调查与实验得来得,并会被我们利用得资料称为“二手资料”。使用二手资料时需要注意:资料得原始搜集人、搜集资料得目得、搜集资料得途径、搜集资料得时间,要注意数据得定义、含义、计算口径与计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2、比较概率抽样与非概率抽样得特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样就是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中得概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中得概率,概率抽样得技术含量与成本都比较高。如果调查得目得在于掌握与研究总体得数量特征,得到总体参数得置信区间,就使用概率抽样。 非概率抽样就是指抽取样本时不就是依据随机原则,而就是根据研究目得对数据得要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中得专业技术要求不就是很高。它适合探索性得研究,调查结果用于发现问题,为更深入得数量分析提供准备。非概率抽样也适合市场调查中得概念测试。 3、调查中搜集数据得方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据得方法? 实验式、观察式等。 4、自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题得压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员得作用。缺点:成本比较高,对调查过程得质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程得控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5、请举出(或设计)几个实验数据得例子。 不同饲料对牲畜增重有无影响,新旧技术得机器对组装同一产品所需时间得影响。
统计学知识点 导论部分 描述统计与推断统计概念比较,举例说明。 统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。 几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。 数据搜集部分 数据的间接来源:二手数据的特点 数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记) 调查数据:概率抽样和非概率抽样的比较。简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。 搜集数据的基本方法:自填式、面谈时、电话式优缺点。 数据误差:抽样误差和非抽样误差(系统误差和随机误差)。抽样框误差、回答误差、无回答误差、测量误差概念。误差的控制方法。 数据的概括性度量 集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。 偏态和峰态的概念。 概率部分(全部是概念) 随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。离散型随机变量及其分布:随机变量及其分类、泊松分布。 连续型随机变量及其分布:概率密度、正态分布的曲线及其性质 统计量和抽样分布部分(参数估计的基础) 常用统计量 抽样分布的概念 正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。另外标准正态分布和正态分布的概念特点,条件分布的概念。 中心极限定理 样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布 从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。
() ()()()() 扁平 尖峰分布;,3s *n 组数 *X -分组峰态系数正值,右偏分布越大偏斜越大, ,该组的中值;s *n 组数 *X -SK 分组s *2-n 1-n X -n SK 未分组偏态系数04.%99/%95/%68个标准差3/2/1经验法则:.03,越大,离散系数越大 X s 小) 离散系数(衡量差异大-离散程度标准差 /数值型数据:方差顺序数据:四分位差 总频数 (众数频数) f -1V 分类数据:异众比率 离散程度 02.x 几何平均X 加权平均数.014 4 3 33 3 s m r n <>= = = ±=== =∑∑∑∏∑∑i i i i i i i M K SK M M X V G W X W PS :()0.3P x μ-≤=1919x P n σ?? -≤≤ ? ?? 双侧:H 0≠A 无显著差异,同α/2比较 左单侧:希望数值越大越好H 0 μ ≥A 右单侧:希望数值越小越好 H 0 μ ≤A ;同α比较 P 值检验方法,求出Z ,若x >μ,计算P (Z>Z 值)值 双侧:P<α/2 拒绝原假设 单侧P<α 拒绝原假设 运用置信区上下限比较 n Z σα2 (边际误差)=?(单侧为α) n 总体标准差 抽样标准误差= 若?>0-x μ,则拒绝H 若σ未知,用s 代替,使用t 分布 ()() 遇小数点向前进一)() 1(定 估计比例时样本量的确.22(边际误差): 定一个估计时样本量的确.211 -n 自由度s )1n (s )1n (总体方差.13) 1(总量)的区间估计 (样本样本比率.12)1(方差未知,小样本,总体正态)2(置信区间为。。 即,该样本平均或:未知/大样本且方差已知)1(计 一个总体均值的区间估.112 2 2 222 22 22 2 /122 22 /22 22E P P Z n n Z E E Z n n P P Z P P n S n t X n S Z X -?= ???? ? ?== -≤≤--±÷-±?±-αααααααασσ λλσλσ
简单样本平均数 n ' X i i丄 X 二 n 总体均值的置信区间(正 态总体,◎已知) 总体均值的置信区间(a 未 知,大样本) CT _ s —2「亠{ 几何平 均数 总体比例的置信区间 异众比 V r f m f i f m f i 总体方差的置信区间 简单加 权 平均差M d k S |Mi -x|fi i 4 n 估计总体均值时的样本容 量 简单样本方差标准方s2 n ' (X i -x)2 i =4 n —1 n '(X -X)2 i -1 n —1 估计总体比例时的样本容 量 加权样 k 2 (M i -x) f i i A n —1 总体均值检验的统计量 (正态总体,匚已 知) 加权样本标准差 ’ (M i -X)2f i 『广n—1 总体比例检验的统计量 判定系数 相关系数检验的统计量 标准分数 指数平滑法预测 移动平均法预测 R2 SSR「(?i -y)2 SST「、⑶-y)2 总体方差检验的统计量 t ~ t(n - 2) -X 一 S Xi - 散 数 离 ?系 F t 1 T t (1 -〉)F t 拉氏 权 均 数 售 q 1 又 加 平 指 销 P1q 划 Y* 丫一 2 ?…匕Y t F t 1 二Y t k I P P(1 - P) 1」 N 2 2 (n -1)s 岂_2 岂(n -1)s P-乙.2 ' pg ' qp o P0q0q' q°P0 q P1 z q1 1 p P1 2 //_2 估计标准 误差 线性关系 检验的统 计量 2 2 (乙2)二 n = _______ E2 (Z-.2)2二(1 - 二) —E2 X _ J 匚/Jn x z 二 s/\ n t _ X _ "0 s/\Tn 兀0(1一兀0) n Z2(n-1)s2 2 -0 p 0 I q 2 pg 瓦P°q1 q1 P1 q°P1 q 为 加 权 平 均 指 数 销 售 M o 权 O q o p SSR1 SSE n-2 ~ F (n - 2) MSA=SSA/k-1 MSE=SSE/n-k
第一部分 1.在一个单链表中,已知指针p 指向其中的某个结点,若在该结点前插入一个由指针s 指向的结点,则需执行()。 A.s->next = p->next; p->next = s; B.p->next = s; s->next = p; C. r = p->next; p->next = s; s->next = r; D.仅靠已知条件无法实现 2.设顺序表长度为n,从表中删除元素的概率相等。则在平均情况下,从表中删除一个元素需要移动 的元素个数是()。 A.(n?1)/2 B.n/2 C.n(n ? 1)/2 D.n(n + 1)/2 3.在一个具有n 个单元的顺序栈中,假定以高端(即第n?1 单元)作为栈底,以top 为栈顶指针,则当作出栈运算时,top 变化为()。 A.top 不变 B.top = 0 C.top-- D.top ++ 4.若一个栈以向量V[n]存储,设栈空时,栈顶指针top 为n?1,则下面x 进栈的正确操作是()。 A.top = top + 1;V[top] = x B.V[top] = x;top = top + 1 C.top = top ? 1;V[top] = x D.V[top] = x;top = top ? 1 5.经过以下栈运算后,x 的值是()。 InitStack(s); Push(s, a); Push(s, b); Pop(s, x); Push(s, c); Pop(s, x); GetTop(s, x); A. a B.b C.c D.d 6.若一棵二叉树有126 个节点,在第7 层(根结点在第1 层)的结点个数至多有()。 A.32 B.64 C.63 D.不存在第7 层 7.具有n 个顶点的有向图的边最多有()。 A.n B.n(n?1) C.n(n+1) D.n2 8.设连通图G 的顶点数为n,则G 的生成树的边数为()。 A.n B.n?1 C.2n D.2n?1 9.散列查找中k 个关键字具有同一哈希值,若用线性探测法将这k 个关键字对应的记录存入哈希表中,至少要进行()次探测。 A.k B.k + 1 C.k(k + 1)/2 D.1 + k(k + 1)/2 10.一组记录的关键字为(45,80,55,40,42,85)则利用堆排序的方法建立的初始堆为()。 A.(80,45,55,40,42,85) B.(85,80,55,40,42,45) C.(85,80,55,45,42,40) D.(85,55,80,42,45,40) 11. 假设某文件经内部排序得到100 个初始归并段,若要使多路归并三趟完成排序,则应取归并的路数至少为多少?()。 A.2 B.3 C.4 D.5 第二部分 1. 判断带头结点的线性链表L 是否为空的条件是()。 A.L.elem=NULL B.L.length = 0 C.L->next=NULL D.L = NULL 2. 设有多项式A 和B 的项数分别为m 和n ,均采用单链表表示,进行A 加B 运算的时间复杂度为()。 A.O(m )(当m>n 时) B.O(n)(当n>m 时) C.O(m + n) D.O(m *n) 3.若用一个大小为6 的数组来实现循环队列,且当前rear 和front 的值分别为0 和3。当从队列中删除一个元素,再加入两个元素后,rear 和front 的值分别为()。
数据结构考研模拟试题及详解(一) 一、单项选择题(每小题2分,共20分) (1)设Huffman树的叶与节点数为m,则节点的点数为()。 A.2m B.2m-1 C.2m+l D.m+l 【答案】B 【解析】Huffman不存在一个分支的节点,对于任意的二叉树都有n0=n2+1,而n0=m,故推出Huffman的总结点数为m+m-1。 (2)若顺序存储的循环队列的QueueMaxSize=n,则该队列最多可存储()个元素。 A.n B.n-1 C.n+l D.不确定 【答案】B 【解析】循环队列Q.rear==Q.front用来表示队列为空,而(Q.rear+1)%QueueMaxSize==Q.front来判断队列是否已满。也就是说循环队列需要一个额外的数据空间来表示循环队列已经存满的。所以最多只能存n-1。
(3)下述哪一条是顺序存储方式的优点?() A.存储密度大 B.插入和删除运算方便 C.获取符合某种条件的元素方便 D.查找运算速度快 【答案】A 【解析】因为顺序存储方式把分配给存储单元全用来存放结点数据,结点之间的逻辑关系没有占用额外的存储空间。所以相比链式存储方式同样大小的空间它可以存下更多的数据。 (4)设有一个二维数组A[m][n],假设A[0][0]存放位置在为 每个元素占一个空 间. A.658 B.648 C.633 D.653 【答案】D 【解析】根据二维数组地址计算公式LOC(A[i][j])=LOC(A[p][q])+((i?p)*n+(j?q))*t(t表示字节),把t=1、A[0][0]及A[3][3]代入得到n=25。故A[2][3]