当前位置:文档之家› 文科概率与统计基础知识

文科概率与统计基础知识

文科概率与统计基础知识
文科概率与统计基础知识

概率与统计

一、统计

1.三种抽样方法的比较

2.常用的统计图表:一“表”(频率分布表);两“图”(频率分布直方图和茎叶图)(1)频率分布直方图

①小长方形的面积=组距×频率

组距

=频率;

②各小长方形的面积之和等于1;

③小长方形的高=频率

组距

,所有小长方形的高的和为

1

组距

【注意】直方图的纵轴(小长方形的高)一般是频率除以组距的商(而不是频率),横轴一

般是数据的大小,小长方形的面积表示频率. (2)茎叶图

在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数

数字特征 样本数据

频率分布直方图 众数

出现次数最多的数据

取最高的小长方形底边中点

的横坐标

中位数

将数据按大小依次排列,处

在最中间位置的一个数据(或最中间两个数据的平均数)

把频率分布直方图划分成左右两个面积相等的分界线与

x 轴交点的横坐标

平均数 样本数据的算术平均数 每个小长方形的面积乘以小

长方形底边中点的横坐标之 和

(2)平均数12()n x x x x n

=++???+. 方差2

222121

[()()()]n s x x x x x x n

=

-+-+???+-. 标准差222121

[()()()]n s x x x x x x n

=

-+-+???+-. 【提醒】标准差、方差越大,数据的离散程度越大,越不稳定. 4.变量间的相关关系 知识点分析

1、线性回归方程:a x b y

???+=(x 叫做解释变量,y 叫做预报变量) 线性回归方程系数公式:

( 公式说明:回归直线过样本的中心点)(y x , ,也就是平均值点.) 2、相关系数公式

3、几个结论:

(1)回归直线过样本的中心点)(y x ,.

(2)b >0时,y 与x 正相关,散点图呈上升趋势;b <0时,y 与x 负相关,散点图呈下降趋势.

(3)斜率b 的含义(举例):

如果回归方程为y =2.5x +2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y =-2.5x +2,说明x 增加1个单位时,y 平均减少2.5个单位. (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r

r 越大.,相关性越强.

。0>r 时,y 与x 正相关;0

R 表示模型的拟合效果。范围:]10[2

∈R 2R 越大.,拟合效果越好.,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,带状区域宽度越窄,拟合精度越高).

2R 表示解释变量x 对于预报变量y 变化的贡献率。

例如:64.02≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。

(6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。(y 是由x 和e 共同确定的) 二、概率

1.概率的五个基本性质

(1)随机事件A 的概率:0≤()P A ≤1. (2)必然事件的概率为1. (3)不可能事件的概率为0.

(4)如果事件A 与事件B 互斥(不可能同时发生),则()()()P A B P A P B +=+. (5)如果事件A 与事件B 互为对立事件(不会同时发生,但一定有一个发生),那么

()()()1P A B P A P B +=+=,即()1()P A P B =-.

对立必互斥,互斥未必对立.

2.古典概型

(1)特点:①有限性,②等可能性. (2)概率公式:()A P A =事件中所含的基本事件数

试验的基本事件总数

3.几何概型

(1)特点:①无限性,②等可能性.

(2)概率公式:()

()()

A P A =

构成事件的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.

三、独立性检验

(一)知识点分析

1、 2×2列联表:统计被调查者的两种状态,每种状态又分两种情况的调查结果表.对于性别变量,其取值为男和女两种,这种变量的不同值表示个体所属的不同类别,像这类变量称为分类变量。

2、卡方统计量:为了研究事件X 与Y 的关系,经调查得到一张2×2列联表,如下表所示:

独立性检验原理:也叫假设性检验(类似反证法原理),一般情况下,假设分类变量X 和Y 之间没有关系,通过计算2

K 值,然后查表对照相应的概率P ,发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P),也就是“X 和Y 有关系”.(表中的k 就是2

K 的观测值,即2K k =)

统计量2

K (读做“卡方”),它的表达式是:)

)()()(()(2

2

d b c a d c b a bc ad n K ++++-=

独立性检验临界值表

P(k 2>k ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 k

0.455

0.708

1.323

2.072

2.706

3.841

5.024

6.635

(表中的K 是理论值,2K 是实际观测值,2K 越大.,说明变量间越有关系...)

(二)独立性检验举例

例1、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:

非统计专业

统计专业 男 13 10 女

7

20

为了检验主修统计专业是否与性别有关系,根据表中的数据,查对临界值

P(k 2>k ) 0.10 0.05 0.025 0.010 k

2.706

3.841

5.024

6.635

根据表中数据,得到。所以有 的把握认为主修统计专

业与性别有关系。

例2、某电视台在一次对收看文艺节目和新闻节 目观众的抽样调查中,随机抽取了100名电视观 众,相关的数据如表所示:

(1)由表中数据分析,收看新闻节目的观众是 否与年龄有关?

(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?

(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率。 参

))()()(()(22d b c a d c b a bc ad n K ++++-=

经济数学基础-概率统计课后习题答案

习 题 一 写出下列事件的样本空间: (1) 把一枚硬币抛掷一次; (2) 把一枚硬币连续抛掷两次; (3) 掷一枚硬币,直到首次出现正面为止; (4) 一个库房在某一个时刻的库存量(假定最大容量为M ). 解 (1) Ω={正面,反面} △ {正,反} (2) Ω={(正、正),(正、反),(反、正),(反、反)} (3) Ω={(正),(反,正),(反,反,正),…} (4) Ω={x ;0 ≤x ≤ m } 掷一颗骰子的试验,观察其出现的点数,事件A =“偶数点”, B =“奇数点”, C =“点数小于5”, D =“小于5的偶数点”,讨论上述各事件间的关系. 解 {}{}{}{}{}.4,2,4,3,2,1,5,3,1,6,4,2,6,5,4,3,2,1=====D C B A Ω A 与B 为对立事件,即B =A ;B 与D 互不相容;A ?D ,C ?D. 3. 事件A i 表示某个生产单位第i 车间完成生产任务,i =1,2,3,B 表示至少有两个车间完成生产任务,C 表示最多只有两个车间完成生产任务,说明事件B 及B -C 的含义,并且用A i (i =1,2,3)表示出来. 解 B 表示最多有一个车间完成生产任务,即至少有两个车间没有完成生产任务. 313221A A A A A A B ++= B - C 表示三个车间都完成生产任务 321321321321+++A A A A A A A A A A A A B = 321321321321321321321A A A A A A A A A A A A A A A A A A A A A C ++++++= 321A A A C B =- 4. 如图1-1,事件A 、B 、C 都相容,即ABC ≠Φ,把事件A +B ,A +B +C ,AC +B ,C -AB 用一些互不相容事件的和表示出来. 解 B A A B A +=+ C B A B A A C B A ++=++ C B A B B AC +=+ BC A C B A C B A AB C ++=- 5.两个事件互不相容与两个事件对立的区别何在,举例说明. 解 两个对立的事件一定互不相容,它们不可能同时发生,也不可能同时不发生;两个互不相容的事件不一定是对立事件,它们只是不可能同时发生,但不一定同时不发生. 在本书第6页例2中A 与D 是对立事件,C 与D 是互不相容事件. 6.三个事件A 、B 、C 的积是不可能事件,即ABC =Φ,问这三个事件是否一定互不相容?画图说明. 解 不一定. A 、B 、C 三个事件互不相容是指它们中任何两个事件均互不相容,即两两互不相容.如图1-2,事件ABC =Φ,但是A 与B 相容. 7. 事件A 与B 相容,记C =AB ,D =A+B ,F =A -B. 说明事件A 、C 、D 、F 的关系. 解 由于AB ?A ?A+B ,A -B ?A ?A+B ,AB 与A -B 互不相容,且A =AB +(A -B). 因此有 A =C +F ,C 与F 互不相容, D ?A ?F ,A ?C. 8. 袋内装有5个白球,3个黑球,从中一次任取两个,求取到的两个球颜色不同的概率. 解 记事件A 表示“取到的两个球颜色不同”. 则有利于事件A 的样本点数目#A =1 315 C C .而组成试验的样本点总数为#Ω=235+C ,由古典概率公式有 图1-1 图1-2

高三文科数学统计概率的总结课件.doc

实用标准文案 统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社 区做分层抽样调查。假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96 人。若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为() A 、101 B、808 C、1212 D、2012 02、某个年级有男生560 人,女生420 人,用分层抽样的方法从该年级全体学生中抽取一个容量为280 的 样本,则此样本中男生人数为____________. 03、一支田径运动队有男运动员56 人,女运动员42 人。现用分层抽样的方法抽取若干人,若抽取的男运 动员有8 人,则抽取的女运动员有______人。 04、某单位有840 名职工, 现采用系统抽样方法, 抽取42 人做问卷调查, 将840 人按1, 2, , 840 随机 编号, 则抽取的42 人中, 编号落入区间[481, 720] 的人数为() A .11 B.12 C.13 D.14 05、将参加夏令营的600 名学生编号为:001,002,,, 600,采用系统抽样方法抽取一个容量为50 的样 本,且随机抽得的号码为003.这600 名学生分住在三个营区,从001 到300 在第Ⅰ营区,从301 到495 住在第Ⅱ营区,从496 到600 在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26, 16, 8 B.25,17,8 C.25,16,9 D.24,17, 9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100 户居民进行月用电量调查, 发现其用电 量都在50 到350 度之间, 频率分布直方图所示. (I) 直方图中x的值为________; (II) 在这些用户中, 用电量落在区间100,250 内的户数为_____. 02、下图是样本容量为200 的频率分布直方图。根据样本的频率分布直 方图估计,样本数据落在[6,10]内的频数为,数据落在(2, 10)内的概率约为 精彩文档

概率与统计高考解答题(文科)专题

概率与统计高考解答题(文科)专题 1、(2018全国新课标Ⅱ文、理)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型 ①:?30.413.5 y t =-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:?9917.5 y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 2、(2018全国新课标Ⅲ文、理)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 超过m不超过m 第一种生产方式 第二种生产方式 (3 附: 2 2 () ()()()() n ad bc K a b c d a c b d - = ++++ , 2 ()0.0500.0100.001 3.8416.63510.828 P K k k ≥ .

3、(2018全国新课标Ⅰ文)某家庭记录了未使用节水龙头50天的日用水量数据(单位: m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 日 用 水 量 [) 00.1 ,[) 0.10.2 ,[) 0.20.3 ,[) 0.30.4 ,[) 0.40.5 ,[) 0.50.6 ,[) 0.60.7 , 频 数 1 3 2 4 9 26 5 日用 水量 [) 00.1 ,[) 0.10.2 ,[) 0.20.3 ,[) 0.30.4 ,[) 0.40.5 ,[) 0.50.6 ,频数 1 5 13 10 16 5 ( (2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)

第一章 概率统计基础知识(2)概率的古典定义与统计定义

二、概率的古典定义与统计定义 二、概率的古典定义与统计定义(p5-11) 确定一个事件的概率有几种方法,这里介绍其中两种最主要的方法,在历史上,这两种方法分别被称为概率的两种定义,即概率的古典定义及统计定义。 (一) 概率的古典定义 用概率的古典定义确定概率的方法的要点如下: (1)所涉及的随机现象只有有限个样本点,设共有n个样本点; (2)每个样本点出现的可能性相同(等可能性); 若事件含有k个样本点,则事件的概率为: (1.1-1) [例1.1-3] [例1.1-3]掷两颗骰子,其样本点可用数组(x , y)表示,其中,x与y分别表示第一与第二颗骰子出现的点数。这一随机现象的样本空间为: 它共含36个样本点,并且每个样本点出现的可能性都相同。参见教材6页图。这个图很多同学看不懂!其实就是x+y=?在坐标系反映出来的问题。 (二)排列与组合 (二)排列与组合 用古典方法求概率,经常需要用到排列与组合的公式。现简要介绍如下: 排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。 (1)乘法原理: 如果做某件事需经k步才能完成,其中做第一步有m1种方法,做第二步m2种方法,做第k步有m k种方法,那么完成这件事共有m1×m2×…×m k种方法。 例如, 甲城到乙城有3条旅游线路,由乙城到丙城有2条旅游

线路,那么从甲城经乙城去丙城共有3×2=6 条旅游线路。 (2) 加法原理: 如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有m1种完成方法, 在第二类方法中又有m2种完成方法,在第k类方法中又有m k种完成方法, 那么完成这件事共有m1+m2+…+m k种方法。 例如,由甲城到乙城去旅游有三类交通工具: 汽车、火车和飞机,而汽车有5个班次,火车有3个班次,飞机有2个班次,那么从甲城到乙城共有5+3+2=10 个班次供旅游选择。 排列与组合 排列与组合的定义及其计算公式如下: ①排列:从n个不同元素中任取)个元素排成一列称为一个排列。按乘法原理,此种排列共有n×(n1) ×…×(n-r+1) 个,记为。若r=n, 称为全排列,全排列数共有n!个,记为,即:= n×(n-1) ×…×(n-r+1), = n! ②重复排列:从n个不同元素中每次取出一个作记录后放回,再取下一个,如此连续取r次所得的排列称为重复排列。按乘法原理,此种重复排列共有个。注意,这里的r允许大于n。 例如,从10个产品中每次取一个做检验,放回后再取下一个,如此连续抽取4次,所得重复排列数为。假如上述抽取不允许放回,则所得排列数为10×9×8×7=5040 。 ③组合: 从n个不同元素中任取x个元素并成一组 (不考虑他们之间的排列顺序)称为一个组合,此种组合数为: .特别的规定0!=1,因而。另外,在组合中,r个元素"一个接一个取出"与"同时取出"是等同的。例如,从10个产品中任取4个做检验,所有可能取法是从10个中任取4个的组合数,则不同取法的种数为: 这是因为取出的任意一组中的4个产品的全排列有4!=24 种。而这24种排列在组合中只算一种。所以。 注意:排列与组合都是计算"从n个不同元素中任取r个元素"的取法总数公式,他们的主要差别在于: 如果讲究取出元素间的次序,则用排列公式;如果不讲究取出元素间的次序,则用组合公式。至于是否讲究次序,应从具体问题背景加以辨别。 [例1.1-4] [例1.1-4] 一批产品共有个,其中不合格品有个,现从中随机取出n个,问:事

2020高考文科数学概率与统计专项练习

概率与统计专项练习 一、选择题(本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的) 1.[2019·山东滨州模考]若复数(1-a i)2 -2i 是纯虚数,则实数a =( ) A .0 B .±1 C .1 D .-1 答案:C 解析:(1-a i)2 -2i =1-a 2 -2a i -2i =1-a 2-(2a +2)i. ∵(1-a i)2 -2i 是纯虚数,∴? ?? ?? 1-a 2 =0,2a +2≠0,解得a =1,故选C. 2.[2019·广东广州执信中学测试]从某社区65户高收入家庭,280户中等收入家庭,105户低收入家庭中选出100户调查社会购买力的某一项指标,应采用的最佳抽样方法是( ) A .系统抽样 B .分层抽样 C .简单随机抽样 D .各种方法均可 答案:B 解析:因为社会购买力的某一项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以应采用分层抽样的方法,故选B. 3.用反证法证明命题“设a ,b 为实数,则方程x 3 +ax +b =0至少有一个实根”时,要做的假设是( ) A .方程x 3 +ax +b =0没有实根 B .方程x 3+ax +b =0至多有一个实根 C .方程x 3+ax +b =0至多有两个实根 D .方程x 3+ax +b =0恰好有两个实根 答案:A 解析:因为“方程x 3 +ax +b =0至少有一个实根”等价于“方程x 3 +ax +b =0的实根的个数大于或等于1”,因此,要做的假设是“方程x 3 +ax +b =0没有实根”. 4.[2019·山东烟台模拟]将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽到的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8

高三文科数学统计概率总结

统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规得知晓情况,对甲、乙、丙、丁四个社区 做分层抽样调查。假设四个社区驾驶员得总人数为N ,其中甲社区有驾驶员96人。若在甲、乙、丙、丁四个社区抽取驾驶员得人数分别为12,21,25,43,则这四个社区驾驶员得总人数N 为( ) A 、101 B 、808 C 、1212 D 、2012 02、某个年级有男生560人,女生420人,用分层抽样得方法从该年级全体学生中抽取一个容量为280得样 本,则此样本中男生人数为____________、 03、一支田径运动队有男运动员56人,女运动员42人。现用分层抽样得方法抽取若干人,若抽取得男运动 员有8人,则抽取得女运动员有______人。 04、某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机 编号, 则抽取得42人中, 编号落入区间[481, 720]得人数为( ) A.11 B.12 C.13 D.14 05、将参加夏令营得600名学生编号为:001,002,……600,采用系统抽样方法抽取一个容量为50得样本, 且随机抽得得号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中得人数依次为( ) A.26, 16, 8 B.25,17,8 C.25,16,9 D.24,17,9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100户居民进行月用电量调查,发现其用电 量都在50到350度之间,频率分布直方图所示、 (I)直方图中x 得值为________; (II)在这些用户中,用电量落在区间[)100,250内得户数为_____、 02、下图就是样本容量为200得频率分布直方图。 根据样本得频率分布直方图估计,样本数据落在[6,10] 内得频数为 ,数据落在(2,10)内得概率约为 03、有一个容量为200得样本,其频率分布直方图如图所示,根据样本得频率分布直方图估计,样本数据落 在区间)10,12??内得频数为 A.18 B.36 C.54 D.72 04、如上题得频率分布直方图,估计该组试验数据得众数为_______,

2013年全国各地高考文科数学试题分类汇编11:概率与统计

2013年全国各地高考文科数学试题分类汇编11:概率与统计 一、选择题 1 .(2013年高考安徽(文))若某公司从五位大学毕业生甲、乙、丙、丁、戌中录用三人,这五人被录用的机 会均等,则甲或乙被 录用的概率为 ( ) A . 23 B . 25 C . 35 D . 910 【答案】D 2 .(2013年高考重庆卷(文))下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落 在区间[20,30)内的概率为 ( ) A .0.2 B .0.4 C .0.5 D .0.6 【答案】B 3 .(2013年高考湖南(文))已知事件“在矩形ABCD 的边CD 上随机取一点P,使△APB 的最大边是AB”发生 的概率为.2 1 ,则 AD AB =____ ( ) A . 12 B . 14 C D 【答案】D 4 .(2013年高考江西卷(文))集合A={2,3},B={1,2,3},从A,B 中各取任意一个数,则这两数之和等于4的概 率是 ( ) A . 2 3 B . 1 3 C . 12 D . 16 【答案】C 5 .(2013年高考湖南(文))某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件. 为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从 丙车间的产品中抽取了3件,则n=___ D .____ ( ) A .9 B .10 C .12 D .13 【答案】D 6 .(2013年高考山东卷(文))将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分 为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示: 则7个剩余分数的方差为 ( ) A . 116 9 B . 367 C .36 D 【答案】B 8 7 7 9 4 0 1 0 9 1 x

高中数学概率统计知识万能公式文科

第六部分 概率与统计万能知识点及经典题型Ⅰ 【考题分析】 1、考试题型:选择填空1个,解答题:18(必考) 2、考题分值:17分; 3、解答题考点:①频率直方图的应用,②线性回归直线的应用,③独立性检验和概率 4、难度系数:0.7-0.8左右,(120分必须全对,100以上者全对) 【知识总结】 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 2 2 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。 分析:?i e 越小越好; 2、残差平方和:21 ?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑

概率与统计高考真题文科-含解析

概率与统计高考真题练习 1. [2016]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附参考:7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 () 0.55i i y y =-=∑,7≈2.646. 2.【2017】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ), 其频率分布直方图如下: (1) 记A 表示事件“旧养殖法的箱产量低于50kg”,估计A 的概率; (2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关: 箱产量<50kg 箱产量≥50kg 旧养殖法 新养殖法 (3) 根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。

3.【2018】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新生产方式.为比较两种生产方式效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表: 超过不超过 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 4.【2019】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业 第一季度相对于前一年第一季度产值增长率y的频数分布表. -[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80) y的分组[0.20,0) 企业数 2 24 53 14 7 (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表). (精确到0.01) ≈. 748.602 .

概率统计基础训练题

第一章基础训练题 一、填空 1、设}1),({},4),({2222>+=≤+=y x y x B y x y x A ,则=?B A 。 2、事件A 、B 、C 至少有一个发生可表示为 ,至少有两个发生 ,三个都不发生 。 3、设}6,5,4,3,2,1{},7,5,3,1{==B A ,则=-B A 。 4、设事件A 在10次试验中发生了4次,则事件A 的频率为 。 5、设,)(),()(p A p B A p AB p ==则=)(B p 。 6、A 、B 二人各抛一枚硬币3次,则出现国徽一面次数相同的概率是 。 7、筐中有4个青苹果和5个红元帅,随机地从中取出2个,则取出的苹果为同一品种的概 率为 ,恰好取出2个青苹果的概率为 ,恰好取出1个青苹果和1个红元帅的概率 为 。 8、从一批由45件正品,5件次品组成的产品中任取3件产品,其中恰有一件次品的概率为 ,至少有一件正品的概率为 。 9、从一筐装有95个一等品,5个二等品的苹果中,每次随机取一个,记录它的等级后放回 原筐搅匀后再取一个,共取50次,则无二等品的概率为 。 10、已知,3.0)(,4.0)(==B p A p 5.0)(=?B A p ,则=)(B A p 。 11、已知,8.0)(,6.0)(,5.0)(===A B p B p A p 则=)(AB p ,=?)(B A p 。 12、对任意二事件B A ,,=-)(B A p 。 13、已知,3.0)(,4.0)(==B p A p (1)当A ,B 互不相容时,=?)(B A p ,=)(AB p (2)当A ,B 相互独立时,=?)(B A p ,=)(AB p ;(3)当A B ?时,=)(A p , =)(A B p ,=?)(B A p ,=)(AB p ,=-)(B A p 。 14、设C B A ,,为三事件,A 与B 都发生而C 不发生,则用C B A ,,的运算关系可表示 为 。设A ,B ,C 都发生,则用C B A ,,的运算关系可表示为 。 15、设B A ,为互斥事件,且,8.0)(=A p 则)(B A p = 。 16、从一批由10件正品,3件次品组成的产品中,任取一件产品,取得次品的概率为 。 17、设B A ,为两事件,则=)(AB p 。若B A ,为互斥事件,则=?)(B A p 。 18、设2.0)(,5.0)(=-=A B p A p ,则=?=)()(B A p B A p 。 (7.0)()()(),()()(=?=-+-=-B A p A B p A p AB p B p A B p )

高三文科数学概率与统计

达濠侨中高三数学(文科)第二轮复习题 概率与统计 一 选择题 1.(2015·新课标全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化硫排放量的效果最显着 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 2.为了解某社区居民的家庭收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( ) A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 3.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为( ) A .15 B .16 C .17 D .19 4. 【2015高考新课标文】如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为( ) (A ) 310 (B )15 (C )110 (D )1 20 5. 设复数(1)z x yi =-+(,)x y R ∈,若||1z ≤,则y x ≥的概率( ) A .3142π+ B . 112π+ C .1142π- D . 112π - 6.某班级有50名学生,现用系统抽样的方法从这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并按编号顺序平均分成10组(1~5号,6~10号,…,46~50号),若在第三组抽到的编号是13,则在第七组抽到的编号是( ) A .23 B .33 C .43 D .53 7.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等

高中文科数学(统计与概率)综合练习

《概率与统计》练习 求:(Ⅰ)年降雨量在) 200 , 100 [范围内的概率; (Ⅱ)年降雨量在) 150 , 100 [或) 300 , 250 [范围内的概率; (Ⅲ)年降雨量不在) 300 , 150 [范围内的概率; (Ⅳ)年降雨量在) 300 , 100 [范围内的概率. > · 2.高三某班40名学生的会考成绩全部在40分至100分 之间,现将成绩分成6段:) 50 , 40 [、) 60 , 50 [ 、) 70 , 60 [、 ) 80 , 70 [、) 90 , 80 [、] 100 , 90 [.据此绘制了如图所示的频率分布直方图。在这40名学生中, (Ⅰ)求成绩在区间) 90 , 80 [内的学生人数; (Ⅱ)从成绩大于等于80分的学生中随机选2名学生,求至少有1名学生成绩在区间] 100 , 90 [内的概率. " @

3.已知集合}1,1(},2,0,2{-=-=B A . ; (Ⅰ)若},|),{(B y A x y x M ∈∈=,用列举法表示集合M ; (Ⅱ)在(Ⅰ)中的集合M 内,随机取出一个元素),(y x ,求以),(y x 为坐标的点位于区 域D :?? ? ??-≥≤-+≥+-10202y y x y x 内的概率. . 4.某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于%90,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如 A 组 B 组 C 组 ? 疫苗有效 673 x y 疫苗无效 77 90 z > 已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是33.0. (Ⅰ)求x 的值; (Ⅱ)现用分层抽样的方法在全体样本中抽取360个测试结果,问C 组应抽取几个? (Ⅲ)已知465≥y ,30≥z ,求不能通过测试的概率.

概率统计知识点全面总结

知识点总结:统计与概率 I 统计 1.三大抽样 (1)基本定义: ① 总体:在统计中,所有考查对象的全体叫做全体. ② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2)抽样方法: ①简单随机抽样:逐个不放回、等可能性、有限性。=======★适用于总体较少★ 抽签法:整体编号( 1~N )放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为 n 的样本。 随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机 (上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。 ②系统抽样:容量大.等距,等可能。=======★适用于总体多★ 用随机方法编号,若N 无法被整除,则剔除后再分组,n N k 。再用简单随机抽样法来抽取一个个体,设为l ,则编号为l ,k+l ,2k+l ……(n-1)k ,抽出容量为n 的样本。(每组编号相同)。 ③分层抽样:总体差异明显.按所占比例抽取.等可能.=======★适用于由差异明显的几部分构成的总体★ 总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样.抽样比为:k =n N 3.总体分布的估计: (1)一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 ★注:总体分布的密度曲线与横轴围成的面积为1。 (2)茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数.众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。

高三文科数学统计概率总结

高三文科数学统计概率 总结 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对 甲、乙、丙、丁四个社区做分层抽样调查。假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() 02、A、101 B、808 C、1212 D、2012 03、某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽 取一个容量为280的样本,则此样本中男生人数为____________. 04、一支田径运动队有男运动员56人,女运动员42人。现用分层抽样的方法抽取若 干人,若抽取的男运动员有8人,则抽取的女运动员有______人。 05、某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人 按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为() 06、A.11 B.12 C.13 D.14 07、将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取 一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营 区,三个营区被抽中的人数依次为() 08、A.26, 16, 8B.25,17,8 C.25,16,9 D.24,17,9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间, 频率分布直方图所示. 02、(I)直方图中x的值为________; 100,250内的户数为_____. 03、(II)在这些用户中,用电量落在区间[) 04、下图是样本容量为200的频率分布直方图。根据样本的 频率分布直方图估计,样本数据落在[6,10]内的频数 为,数据落在(2,10)内的概率约为

高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -=++++

2020年高考文科数学概率与统计题型归纳与训练

2020年高考文科数学《概率与统计》题型归纳与训练 【题型归纳】 题型一古典概型 例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(). A. 1 5B. 2 5 C. 8 25 D. 9 25 【答案】B 【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有: (甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42 105 =.故选B. 例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________. 【答案】2 3 【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6 种,其中2本数学书相邻的有4种,则其概率为:42 63 p==. 【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二几何概型 1 / 18

例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极 图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ). A. 14 B. π8 C. 12 D. π 4 【答案】B 【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为 8 22122 ππ=??? ????a a .故选B. 例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】3 2 【解析】方程2 2320x px p 有两个负根的充要条件是2121244(32)0 20320 p p x x p x x p ??=--≥? +=-? 即 2 1,3 p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503 -+-=-,故填:32. 【易错点】“有两个负根”这个条件不会转化. 【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可. D

初中数学统计与概率知识点精炼

统计与概率 一、统计的基础知识 1、统计调查的两种基本形式: 普查:对调查对象的全体进行调查; 抽样调查:对调查对象的部分进行调查; 总体:所要考察对象的全体; 个体:总体中每一个考察的对象; 样本:从总体中所抽取的一部分个体; 样本容量:样本中个体的数目(不带单位); 平均数:对于n 个数12,,,n x x x ,我们把121()n x x x n +++ 叫做这n 个数的平均数; 中位数:几个数据按大小顺序排列时,处于最中间的一个数据(或是最中间两个数据的平均数)叫做中位数; 众数:一组数据中出现次数最多的那个数据; 方差:2222121()()()n S x x x x x x n ??=-+-++-?? ,其中n 为样本容量,x 为样本平均数; 标准差:S ,即方差的算术平方根; 极差:一组数据中最大数据与最小数据的差称为这组数据的极差; 频数:将数据分组后落在各小组内的数据个数叫做该小组的频数; 频率:每一小组的频数与样本容量的比值叫做这一小组的频率; ★ 频数和频率的基本关系式:频率 = —————— 各小组频数的总和等于样本容量,各小组频率的总和等于1; 扇形统计图:圆表示总体,扇形表示部分,统计图反映部分占总体的百分比,每个扇形的圆心角度数=360°× 该部分占总体的百分比; 会填写频数分布表,会补全频数分布直方图、频数折线图; 频数 样本容量 各 基 础 统 计 量 频 数 的 分 布 与 应 用 2、 3、

二、概率的基础知识 必然事件:一定条件下必然会发生的事件; 不可能事件:一定条件下必然不会发生的事件; 2、不确定事件(随机事件):在一定条件下可能发生,也可能不发生的事件; 3、概率:某件事情A 发生的可能性称为这件事情的概率,记为P(A); P (必然事件)=1,P(不可能事件)=0,0<P(不确定事件)<1; ★概率计算方法: P(A) = ———————————————— 例如 注:对于两种情况时,需注意第二种情况可能发生的结果总数 例:①袋子中有形状、大小相同的红球3个,白球2个,取出一个球后再取出一个球,求两个球都是白球的概率;P = 1 10 ②袋子中有形状、大小相同的红球3个,白球2个,取出一个球后放回 ..,再取出一个球,求两个球都是白球的概率;P = 4 25 1、确定事件 事件A发生的可能结果总数 所有事件可能发生的结果总数 运用列举法(常用树状图)计算简单事件发生的概率 …………

2017高考理科数学第一轮基础知识点复习教案概率与统计1

(此文档为word格式,下载后您可任意编辑修改!) 第十二编概率与统计 §12.1 随机事件的概率 1.下列说法不正确的有 . ①某事件发生的频率为P(A)=1.1 ②不可能事件的概率为0,必然事件的概率为1 ③小概率事件就是不可能发生的事件,大概率事件就是必然发生的事件 ④某事件发生的概率是随着试验次数的变化而变化的 答案①③④ 2.给出下列三个命题,其中正确命题有个. ①有一大批产品,已知次品率为10%,从中任取100件,必有10件是次品;②做7次抛硬币的试验,结果3次出现正面,因此正面出现的概率是;③随机事件发生的频率就是这个随机事件发生的概率. 答案0 3.已知某台纺纱机在1小时内发生0次、1次、2次断头的概率分别是0.8,0.12,0.05,则这台纺纱机在1 小时内断头不超过两次的概率和断头超过两次的概率分别为, . 答案0.97 0.03 4.甲、乙两人下棋,两人和棋的概率是,乙获胜的概率是,则乙不输的概率是 . 答案 5.抛掷一粒骰子,观察掷出的点数,设事件A为出现奇数点,事件B为出现2点,已知P(A)=,P(B)=,则出现奇数点或2点的概率之和为 . 答案

例1盒中仅有4只白球5只黑球,从中任意取出一只球. (1)“取出的球是黄球”是什么事件?它的概率是多少? (2)“取出的球是白球”是什么事件?它的概率是多少? (3)“取出的球是白球或黑球”是什么事件?它的概率是多少? 解(1)“取出的球是黄球”在题设条件下根本不可能发生,因此它是不可能事件,其概率为0. (2)“取出的球是白球”是随机事件,它的概率是. (3)“取出的球是白球或黑球”在题设条件下必然要发生,因此它是必然事件,它的概率是1. 例2 某射击运动员在同一条件下进行练习,结果如下表所示: (1)计算表中击中10环的各个频率; (2)这位射击运动员射击一次,击中10环的概率为多少? 解(1)击中10环的频率依次为0.8,0.95,0.88,0.93,0.89,0.906. (2)这位射击运动员射击一次,击中10环的概率约是0.9. 例3(14分)国家射击队的某队员射击一次,命中7~10环的概率如下表所示: 求该射击队员射击一次 (1)射中9环或10环的概率; (2)至少命中8环的概率; (3)命中不足8环的概率. 解记事件“射击一次,命中k环”为A k(k∈N,k≤10),则事件A k彼此互斥. 2分

相关主题
相关文档 最新文档