文科概率与统计基础知识
- 格式:docx
- 大小:127.14 KB
- 文档页数:6
文科统计概率知识点总结统计学是一门研究数据的收集、分析、解释和展示的学科。
统计学是一种通过数学方法来分析数据的学科,它有着广泛的应用领域,包括经济学、心理学、社会学和政治学等。
统计学的应用范围也非常广泛,涵盖从商业到医学的各个领域。
而概率是统计学中一个非常重要的概念,它可以帮助我们预测和理解各种现象发生的可能性。
本文将对文科统计学中的概率知识点进行总结和分析。
一、概率的概念概率是一个用来描述事件发生可能性的数学概念。
在统计学中,概率通常用来描述随机事件发生的可能性大小。
概率的取值范围是0到1之间,其中0表示事件不可能发生,1表示事件一定会发生。
在现实生活中,我们经常会面临各种不确定性,比如天气预报、投资风险、疾病传播等。
概率可以帮助我们对这些不确定性进行量化和分析。
二、概率的性质概率有一些基本的性质,这些性质对于理解和计算概率都非常重要。
其中包括:1. 互斥事件的概率:两个事件互斥指的是它们不能同时发生。
如果A和B是互斥事件,那么它们的概率满足P(A∪B) = P(A) + P(B)。
2. 独立事件的概率:两个事件独立指的是它们的发生不会相互影响。
如果A和B是独立事件,那么它们的概率满足P(A∩B) = P(A) × P(B)。
3. 补事件的概率:对于一个事件A,它的补事件指的是A不发生的情况。
补事件的概率满足P(A') = 1 - P(A)。
4. 加法法则:对于两个事件A和B,它们的概率和满足P(A∪B) = P(A) + P(B) - P(A∩B)。
5. 乘法法则:对于两个独立事件A和B,它们的概率乘积等于它们各自的概率。
这些性质可以帮助我们在实际问题中计算概率,而理解这些性质也对于我们理解概率的本质有很大帮助。
三、离散型随机变量的概率分布在统计学中,随机变量是一个可以随机取不同值的变量。
离散型随机变量是指其可能取值是有限的或者可数的,而不是连续的。
1. 离散型随机变量的概率质量函数:对于一个离散型随机变量X,其概率质量函数P(X=x)描述了X取各个可能值的概率。
概率与统计复习一、典型问题与方法(一)随机抽样:简单随机抽样、系统抽样、分层抽样简单随机抽样:各个个体被抽中的机会都相等,不放回抽取,常有抽签法、随机数法。
系统抽样:用简单随机抽样确定一个个体,再按一定规则(加间隔)抽取。
分层抽样的比较:已知总体内部组成结构,各层按比例抽取。
例1.1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是()A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1002.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是3.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生()A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人4.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②. 则完成①、②这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法基础训练1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.某学校为了了解高一年级学生对教师教学的意见,打算从高一年级2007名学生中抽取50名进行抽查,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下2000人再按系统抽样的方法进行,则每人入选的机会()A. 不全相等B. 均不相等C. 都相等D. 无法确定3.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为()A.5,10,15,20B.2,6,10,14C.2,4,6,8D.5,8,11,144.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
概率统计文科知识点总结概率统计的知识点涉及很多,包括基本概率论、统计学基础、抽样调查、推断统计、多元统计分析等等。
同时,概率统计还包括了一系列数学工具和模型,如随机变量、概率分布、统计推断和假设检验等内容。
下面我们来具体总结一下文科领域中概率统计的知识点。
1.基本概率论概率论是概率统计的基础,在文科领域中,基本概率论的内容包括了概率的定义、事件的概率、条件概率、独立事件、概率分布等内容。
了解基本概率论可以让文科学生更好地理解概率统计的相关知识,对于后续的学习具有重要的作用。
2.统计学基础统计学基础是概率统计的另一个重要内容,包括了统计量、样本集中趋势、样本离散程度、概率分布等内容。
统计学基础是文科领域中概率统计的重要组成部分,它主要用来描述和分析文科数据的规律和特征。
3.抽样调查抽样调查是文科领域中概率统计的一个重要应用,它主要用来获取文科数据样本。
在实际的文科研究中,抽样调查是获取数据的常用方法,通过对抽样调查的了解可以帮助文科学生更好地进行文科研究和分析。
4.推断统计推断统计是文科领域中概率统计的一个重要内容,它主要用来从样本数据中推断总体数据的特征和规律。
推断统计包括了点估计、区间估计、假设检验等内容,通过推断统计可以帮助文科学生更好地分析文科数据。
5.多元统计分析多元统计分析是文科领域中概率统计的一个拓展内容,它主要用来分析多个变量之间的关系。
在文科研究中,多元统计分析可以帮助文科学生更好地理解文科数据之间的关系,对于文科研究具有重要的意义。
除了上述内容之外,文科领域中概率统计还包括了一系列数学工具和模型,如随机变量、概率分布、统计推断和假设检验等内容。
这些内容都是文科学生在概率统计学习中需要重点掌握的知识点。
总的来说,概率统计在文科领域中有着重要的地位,它不仅可以帮助文科学生更好地理解文科数据的规律和特征,还可以帮助文科学生更好地进行文科研究和分析。
因此,文科学生在学习概率统计的过程中需要重点掌握上述知识点,通过理论学习和实际应用,不断提高自己的概率统计分析能力。
高考文科概率统计大题高考文科概率统计大题一、引言高考作为中国教育体系的重要组成部分,对于学生来说意义重大。
其中,文科概率统计是一道常见的考题,对学生的数学思维能力和概率统计知识的掌握程度提出了挑战。
本文将从基本概念、计算方法和实际应用三个方面来探讨高考文科概率统计大题。
二、基本概念在开始解答概率统计大题之前,首先需要了解一些基本概念。
概率是指某一事件发生的可能性或者程度大小,而统计学则是利用样本数据推断总体的特征。
在解答概率题时,常见的概念包括样本空间、事件、频率和概率等。
理解这些基本概念,能够为我们后续的计算和分析打下基础。
三、计算方法在文科概率统计大题中,计算方法是解决问题的关键。
常见的计算方法包括排列、组合、加法原理、乘法原理等。
通过正确运用这些方法,我们可以快速准确地计算出答案。
此外,还需要掌握条件概率、贝叶斯定理等进阶计算方法,以应对更复杂的问题。
不同的计算方法适用于不同的场景,学生们需要掌握并善于选择合适的方法。
四、实际应用概率统计在实际生活中有着广泛的应用。
在文科概率统计大题中,常涉及到投资、风险评估、信用评分、调查统计等实际问题。
学生们需要通过解答这些实际应用题,了解并应用概率统计在现实生活中的重要性和实用性。
此外,还需要培养对问题分析和解决的能力,将概率统计知识与实际应用相结合。
五、答题技巧解答概率统计大题不仅要掌握基本概念和计算方法,还需要具备一定的答题技巧。
首先,学生们要仔细审题,理解问题要求和限制条件;其次,要对题目进行归类,将抽象问题具象化;还要善于利用已知条件,简化计算过程。
另外,还要注意答题过程中的合理化推测和合理性判断,确保答案的准确性。
六、总结综上所述,高考文科概率统计大题是一道考察学生数学思维和概率统计知识的重要题目。
通过理解基本概念、熟练掌握计算方法、应用实际问题和灵活应用答题技巧,学生们便能够在高考中应对这一考题。
希望本文的内容能够对广大考生在备战高考中有所帮助,实现更好的成绩。
高二数学 概率与统计考试要求1.统计(1)随机抽样① 理解随机抽样的必要性和重要性.② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. (3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 不要求记忆线性回归方程系数公式()()()1122211,nniiiii i nniii i x ynx y xxyyb a y bxxnxxx-------===---∑∑∑∑用最小二乘法求线性回归方程系数公式:7.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式. (2)古典概型①理解古典概型及其概率计算公式.②会计算一些随机事件所含的基本事件数及事件发生的概率. (3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率. ②了解几何概型的意义.1.课本概念与定理详解(1)随机抽样①简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少. ②系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.③分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.(2)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.在直方图中取频率为0.5处的频数。
高中统计与概率知识点(文科)(一)统计一、简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二、系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布成某种循环性规律,且这种循环和抽样距离重合。
系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
重难点05 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【限时检测】(建议用时:35分钟)一、单选题1.(2021·广西钦州一中高三开学考试(文))点在边长为2的正方形内运动,P ABCD 则动点到顶点的距离的概率为( )P A 2PA <A .B .C .D .14124ππ【答案】C 【解析】分析:先根据题意得出PA 等于2 的临界值情况,再根据几何概型求解即可.详解:由题可知当PA=2时是以A 为圆心2为半径的四分之一圆,所以概率为P=,故选C21444r ππ=2.(2020·全国高三其他模拟(文))从某高中女学生中选取10名学生,根据其身高、体重数据,得到体重关于身高的回归方程,用来刻画回归效(cm)(kg)ˆ0.8585yx =-果的相关指数,则下列说法正确的是( )20.6R =A .这些女学生的体重和身高具有非线性相关关系B .这些女学生的体重差异有60%是由身高引起的C .身高为的女学生的体重一定为170cm 59.5kgD .这些女学生的身高每增加,其体重约增加0.85cm 1kg 【答案】B【分析】因为回归方程为,且刻画回归效果的相关指数,所以,ˆ0.8585y x =-20.6R =这些女学生的体重和身高具有线性相关关系,A 错误;这些女学生的体重差异有60%是由身高引起的,B 正确;时,,预测身高为的女学生体重为,C 错170x =ˆ0.851708559.5y=⨯-=170cm 59.5kg 误;这些女学生的身高每增加,其体重约增加,D 错误.0.85cm 0.850.850.7225(kg)⨯=故选:B3.(2020·石嘴山市第三中学高三其他模拟(文))网络是一种先进的高频传输技5G 术,我国的技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款手5G 5G 机,现调查得到该款手机上市时间和市场占有率(单位:%)的几组相关对应数5G x y 据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月……,5代表2019年12月,根据数据得出关于的线性回归方程为.若用此方程分析并预y x0.042y x a =+测该款手机市场占有率的变化趋势,则最早何时该款手机市场占有率能超过0.5%(精5G 确到月)()A .2020年6月B .2020年7月C .2020年8月D .2020年9月【答案】C【分析】:,1(12345)35x =⨯++++=1(0.020.050.10.150.18)0.15y =⨯++++=点在直线上()3,0.1ˆˆ0.042y x a =+,ˆ0.10.0423a=⨯+ˆ0.026a =-ˆ0.0420.026yx =-令ˆ0.0420.0260.5y x =->13x ≥因为横轴1代表2019年8月,所以横轴13代表2020年8月,故选:C4.(2020·河南新乡市·高三一模(文))年的“金九银十”变成“铜九铁十”,全2020国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年2019月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月11202011份代码分别对应年月年月)113:2019112020:11根据散点图选择和两个模型进行拟合,经过数据处理得到的两y a =+ln y c d x =+个回归方程分别为,并得到以下一些0.9369y =+0.95540.0306ln y x =+统计量的值:是()A .当月在售二手房均价与月份代码呈正相关关系y xB .根据年月在售二手房均价约为万元/0.9369y =+20212 1.0509平方米C .曲线的图形经过点0.9369y =+0.95540.0306ln y x =+()x yD .回归曲线的拟合效果好于的拟合效0.95540.0306ln y x =+ 0.9369y =+果【答案】C【分析】对于A ,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正y x 相关关系,故A 正确;对于B ,令,由,16x =0.9369 1.0509y =+=所以可以预测年月在售二手房均价约为万元/平方米,故B 正确;20212 1.0509对于C ,非线性回归曲线不一定经过,故C 错误;()x y 对于D ,越大,拟合效果越好,故D 正确.2R 故选:C.5.(2020·全国高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A .样本中的女生数量多于男生数量B .样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C .样本中的男生偏爱两理一文D .样本中的女生偏爱两文一理【答案】D【分析】:由条形图知女生数量多于男生数量,故A 正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B 正确;男生偏爱两理一文,故C 正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D 错误.故选:D.6.(2021·全国高三专题练习(文))下图为中国古代刘徽的《九章算术注》中研究“勾股容方”问题的图形,图中为直角三角形,四边形为它的内接正方形,已知ABC :DEFC ,,在内任取一点,则此点取自正方形内的概率为(2BC =4AC =ABC :DEFC)A .B .C .D .12592949【答案】D【分析】解:,,4tan 22AC B BC === tan 2EFB FB ∴==,解得,22()2(2)EF FB BC EF EF ==-=-43EF =,,1142422ACB S AC BC ∴==⨯⨯=::4416339DEFC S =⨯=根据几何概型.164949P ==故选:D .7.(2021·江西新余市·高三期末(文))2013年华人数学家张益唐证明了孪生素数猜想的一个弱化形式.孪生素数猜想是希尔伯特在1900年提出的23个问题之一,可以这样描述:存在无穷多个素数,使得是素数.素数对称为孪生素数.从15以p 2p +(,2)p p +内的素数中任取2个构成素数对,其中是孪生素数的概率为()A .B .C .D .13141516【答案】C【分析】以内的素数有,,,,,,共个,任取两个构成素数对,则152********有:,,,,,,,,,,()2,3()2,5()2,7()2,11()2,13()3,5()3,7()3,11()3,13()5,7,,,,,共中取法,而是孪生素数的有,()5,11()5,13()7,11()7,13()11,1315()3,5,,其概率为.()5,7()11,1331155p ==故选:C.8.(2021·安徽阜阳市·高三期末(文))如图,根据已知的散点图,得到y 关于x 的线性回归方程为,则( )ˆ0.2y bx =+ˆb =A .1.5B .1.8C .2D .1.6【答案】D【分析】因为,所以,解得12345235783,555x y ++++++++====530.2b =+ .1.6b = 故选:D .9.(2021·全国高三专题练习(文))在上随机取一个数,则事件“直线与[]1,1-k y kx =圆相交”发生的概率为( )22(x 13)25y -+=A .B .12513C .D .51234【答案】C【分析】直线与圆相交y kx =22(x 13)25y -+=555,1212d k ⎛⎫⇒∈- ⎪⎝⎭直线斜率时与圆相交,故所求概率.55,1212k ⎛⎫∈- ⎪⎝⎭10512212P ==故答案选C10.(2021·全国高三专题练习(文))给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;ˆˆˆy bx a =+(,)x y ②两个变量相关性越强,则相关系数就越接近1;||r ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少ˆ20.5y x =-x ˆy0.5个单位.其中说法正确的是( )A .①②④B .②③④C .①③④D .②④【答案】B【分析】对于①中,回归直线恒过样本点的中心,但不一定过一个样本ˆˆˆy bx a =+(x y 点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,||r 所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程中,当解释变量增ˆ20.5y x =-x 加一个单位时,预报变量平均减少0.5个单位,所以是正确的.ˆy 故选:B.11.(2020·江西吉安市·高三其他模拟(文))给出一组样本数据:1,4,,3,它们出m 现的频率分别为0.1,0.1,0.4,0.4,且样本数据的平均值为2.5,从1,4,,3中任取m 两个数,则这两个数的和为5的概率为()A .B .C .D .12231314【答案】C【分析】由题意得,样本平均值为,解得,10.140.10.430.4 2.5m ⨯+⨯+⨯+⨯=2m =即这组样本数据为1,4,2,3,从中任取两个有,,,,,共6种情况,()1,4()1,2()1,3()4,2()4,3()2,3其中和为5的有,两种情况,()1,4()2,3∴所求概率为,2163P ==故选:C.12.(2020·全国高三专题练习(理))物流业景气指数反映物流业经济发展的总体LPI 变化情况,以作为经济强弱的分界点,高于时,反映物流业经济扩张;低于50%50%时,则反映物流业经济收缩。
高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。
因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。
一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。
(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。
(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。
2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。
(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。
二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。
2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。
3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。
4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。
总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率P(A)e(0,1)(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1•某校高一年级有900名学生,其中女生400名•按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.2•某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取名学生.3.某校老年、中年和青年教师的人数见右表,米用分层抽样的方法调查教类另U人数师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年老年教师900教师人数为中年教师1800 4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是青年教师1600 5•若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为•合计4300 6•重庆市2013年各月的平均气温(°C)数据的茎叶图如右图:o吕9则这组数据的中位数是•1252003127•某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国豕,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图的频率分布直方图.(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(III)估计居民月均用水量的中位数.0Q.511622.533.544.6月满意度评分低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意A 地区用户满意度评分的频率分布直方司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.(II) 根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(I) 应收集多少位女生的样本数据?(II) 根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(&10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6B 地区用户满意度评分的频数分布表 (I)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分 的平均值及分散程度(不要求计算出具 体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(III)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体 育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间 与性别有关”.n (ad 一bc\附:尺2步畝+d 儿+枫+d )P (2>k)0.10 0.05 0.01 0.005 k2.7063.8416.6357.8799.(2015全国II 文)某公03511.(2014全国I文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(I)在下表中作出这些数据的频率分布直方图: 12.(2014广东文)某车间20名工人年龄数据如下表: 年皤7舁工人執7人1912日329330531斗323401昔讦20(I)求这20名工人年龄的众数与极差;(II)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(III)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.14.___________________________________________________ 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(II)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是.(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是.的产品至少要占全部产品80%”的规定?17. (2016天津文)甲、乙两人下棋,两人下成和棋的概率为1,甲获胜的概率是-,则甲不23输的概率为.18. 已知5件产品中有2件次品,其余为合格品•现从这5件产品中任选2件,恰有一件次品 的概率为.24. 如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴19.某单位N 名员工参加“社区低碳你我他”活动•他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间 [25,30) [30,35) [35,40) [40,45) [45,50] 人数25 ab5丰25. 为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )17517517617717722. ____________________________________________ 在区间[-2,3]上随机选取一个数x ,则x <1的概率为23. ___________________________________ 若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是.(I )求y 关于t 的回归方程y =bt+a ;(II )利用(I )中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情4550年龄/驴(I )求正整数a ,b ,N 的值;(II )现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(III )在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率. 20.(2016全国丨文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( A.1B.1C.-D.- 21.(2016全国II 文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒•若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()10 B.5D.—10 则y 对X 的线性回归方程为()A .y =x 一1B .y =x +1C .y =88+-x广告费用x (万元)4 2 35 销售额y (万元)4926395426.某产品的广告费用x 与销售额y 的统计数据如下:D .y =176根据上表可得回归方程y =bx+a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元B .65.5万元C .67.7万元D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长•设某地区城乡居民人民币储蓄存款(年 底余额)如下表:年份 2011 2012 2013 2014 2015 时间代号t1 2 3 4 5 储蓄存款y (千亿兀)567810年(1=6)的人民币储蓄存款.V--‘’ty-nty _‘附:回归方程$=几+<2中,,a=y-bt.乙/2-nt 2i=l28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:乙校:(1)计算兀y 的值;况,并 预测 该地 区 2016P^Ki>k)0.10 0.05 0.010 k2.7063.8416.635参考数据与(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2X2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.公式:由列联表中数(a+b)(?+d)C+c)a+d),临界值表:29.—次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩兀(分) 89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90 分的概率;(2 )性回归100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.0.08°1—r---—r方程(系数精确到0.01).''''(1)求频率分布表中a、b的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标II)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:附:回归直线的方程是:y=bx+a上年度出险次数0 1 2 3 4 >5保费0.85a a 1.25a 1.5a 1.75a2a其中b=㈠(j——,a=y-b x;设该险种一续保人一年内出险次数与相应概率如下:ii=130•为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取一年内出险次数0 1 2 3 4 >5 概率0.30 0.15 0.20 0.20 0.10 0.05(I)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为.33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答•试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.34.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B帥反4567S9。
概率与统计
一、统计
1.三种抽样方法的比较
2.常用的统计图表:一“表”(频率分布表);两“图”(频率分布直方图和茎叶图)(1)频率分布直方图
①小长方形的面积=组距×频率
组距
=频率;
②各小长方形的面积之和等于1;
③小长方形的高=
频率组距,所有小长方形的高的和为1
组距
. 【注意】直方图的纵轴(小长方形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小长方形的面积表示频率. (2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
(2)平均数12()n x
x x x n
=++⋅⋅⋅+. 方差2
222121
[()()()]n s
x x x x x x n
=-+-+⋅⋅⋅+-. 标准差s =
【提醒】标准差、方差越大,数据的离散程度越大,越不稳定.
4.变量间的相关关系 知识点分析
1、线性回归方程:a x b y
ˆˆˆ+=(x 叫做解释变量,y 叫做预报变量)
线性回归方程系数公式:
( 公式说明:回归直线过样本的中心点)(y x , ,也就是平均值点.) 2、相关系数公式 3、几个结论:
(1)回归直线过样本的中心点)(y x ,.
(2)b >0时,y 与x 正相关,散点图呈上升趋势;b <0时,y 与x 负相关,散点图呈下降趋势. (3)斜率b 的含义(举例):
如果回归方程为y =2.5x +2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y =-2.5x +2,说明x 增加1个单位时,y 平均减少2.5个单位. (4)相关系数r 表示变量的相关程度。
范围:
1≤r ,即 11≤≤-r
r 越大.
,相关性越强.。
0>r 时,y 与x 正相关;0<r 时,y 与x 负相关.
(5)相关指数2
R 表示模型的拟合效果。
范围:]10[2
,
∈R 2
R
越大.,拟合效果越好.
,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,带状区域宽
度越窄,拟合精度越高).
2R 表示解释变量x 对于预报变量y 变化的贡献率。
例如:64.02
≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。
(6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。
(y 是由x 和e 共同确定的)
二、概率
1.概率的五个基本性质
(1)随机事件
A 的概率:0≤()P A ≤1.
(2)必然事件的概率为1. (3)不可能事件的概率为0.
(4)如果事件
A 与事件
B 互斥(不可能同时发生),则()()()P A B P A P B +=+. (5)如果事件
A 与事件
B 互为对立事件(不会同时发生,但一定有一个发生),那么
()()()1P A B P A P B +=+=,即()1()P A P B =-.
对立必互斥,互斥未必对立.
2.古典概型
(1)特点:①有限性,②等可能性.
(2)概率公式:()A P A =
事件中所含的基本事件数
试验的基本事件总数
.
3.几何概型
(1)特点:①无限性,②等可能性.
(2)概率公式:()
()()
A P A =
构成事件的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.
三、独立性检验
(一)知识点分析
1、 2×2列联表:统计被调查者的两种状态,每种状态又分两种情况的调查结果表.对于性别变量,其取值为男和女两种,这种变量的不同值表示个体所属的不同类别,像这类变量称为分类变量。
2、卡方统计量:为了研究事件X 与Y 的关系,经调查得到一张2×2列联表,如下表所示:
独立性检验原理:也叫假设性检验(类似反证法原理),一般情况下,假设分类变量X 和Y 之间没有关系,通过计算2
K 值,然后查表对照相应的概率P ,发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P),也就是“X 和Y 有关系”.(表中的k 就是2
K 的观测值,即2
K k =)
统计量2
K (读做“卡方”),它的表达式是:)
)()()(()(22
d b c a d c b a bc ad n K ++++-=
(表中的K 是理论值,2K 是实际观测值,2
K 越大,说明变量间越有关系) (二)独立性检验举例
例1、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
为了检验主修统计专业是否与性别有关系,根据表中的数据,查对临界值
根据表中数据,得到。
所以有 的把握认为主修统计专业与性别有关
系。
例2、某电视台在一次对收看文艺节目和新闻节 目观众的抽样调查中,随机抽取了100名电视观 众,相关的数据如表所示:
(1)由表中数据分析,收看新闻节目的观众是 否与年龄有关?
(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名? (3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率。
参考公式与数据:)
)()()(()(22
d b c a d c b a bc ad n K ++++-=。