当前位置:文档之家› 第34课时 频率分布与线性回归

第34课时 频率分布与线性回归

第34课时 频率分布与线性回归
第34课时 频率分布与线性回归

东华教育学科教师教案

课程/科目: 高中数学 合同编号: 学员姓名: 年级:高三 上课日期: 上课时间: 学科教师:汪连杰 学科组长签名及日期

课 题 第34课时 频率分布与线性回归分析

学习目标

1、学会看频率分布直方图、茎叶图,并求有关的数据

2、会求线性回归方程,并理解其意义

考点及考试要求

根据频率分布直方图求有关的频数和概率;根据散点坐标求线性回归方程

教学内容

知识点与考点

一、频率分布直方图

样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图来表示。 频率分布直方图: 具体做法如下:

(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。

注:频率分布直方图中小正方形的面积=组距×

组距

频率

=频率。 折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。

总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。

二、茎叶图

茎叶图的概念:当数据是几位有效数字时,用中间的数字表示高位数,两边的数字表示个位数,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图 茎叶图的特征:

(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示

(2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。

三、用样本的数字特征估计总体的数字特征

(1)众数、中位数

在一组数据中出现次数最多的数据叫做这组数据的众数;

将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数; (2)平均数与方差

如果这n 个数据是n x x x ,,.........,21,那么∑==n

i i x n x 1

1叫做这n 个数据平均数;

如果这n 个数据是n x x x ,,.........,21,那么)(11

2

∑=-=n

i i x x n S 叫做这n 个数据方差;同时=s

)(11

∑=-n

i i x x n 叫做这n 个数据的标准差。

四、线性回归方程与回归直线

1、线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,称这两个变量之间具有线性相关关系,

这条直线叫回归直线

2、最小二乘法:使得样本数据的点到回归直线的距离之和最小的方法:

3、回归方程:两个具有线性相关关系的的变量,其线性回归方程,?a bx y

+=a b ,叫回归系数.其中∑∑==--=n

i i

n

i i

i x

n x

y

x n y

x b 1

2

21

x b y a -=.点),(y x 叫回归直线的样本中心点. 注意:回归直线一定经过样本的中心点。

课前热身

1、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:

根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( ) (A)20 (B) 30 (C)40 (D )50 2、频率分布直方图的重心是( )

A. 众数

B. 中位数

C. 标准差

D. 平均数

3、从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的 人数为8人,其累计频率为0.4, 则样本容量是 ( ) A. 20人 B. 40人 C. 70人 D. 80人

4、已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本的范围是 ( ) A. [)5.5,7.5 B. [)7.5,9.5 C. [)9.5,11.5 D. [)11.5,13.5

5、两个样本甲和乙,其中x 甲=10,x 乙=10,2s 甲=0.055,2

s 乙=0.015,那么样本甲比样本乙波动 ( ) A. 大 B. 相等 C. 小 D.无法确定 6、线性回归方程^

y =bx+a 必过 ( )

A .(0,0)点

B .(x ,0)点

C .(0,y )点

D .(x ,y )点

典型例题

例1、为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:

组 别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 8 0.16 165.5~169.5 m n 合 计

M

N

(1)求出表中,,,m n M N 所表示的数分别是多少? (2)画出频率分布直方图.

(3)全体女生中身高在哪组范围内的人数最多?

例2、某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为

(490,]495,(495,]500,……(510,]515,由此得到样本的频率分布直方图,如图4所示. (1)根据频率分布直方图,求重量超过505克的产品数量.

(2)从流水线上任取5件产品,求恰有2件产品合格的重量超过505克的概率.

例3、从两个班中各随机的抽取10名学生,他们的数学成绩如下:

甲班 76 74 82 96 66 76 78 72 52 68 乙班

86

84

62

76

78

92

82

74

88

85

画出学生分数的茎叶图.

例4、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:

请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程.

解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系. 由测得的数据表可知:

101010

2

2

1

1

1

55,91.7,38500,87777,55950i i i i i i i x y x y x y ========∑∑∑

∴ 10

1

10

2

2

21

1055950105591.7

0.668385001055

10i i

i i i x y x y

b x x

==--??=

=

≈-?-∑∑ 91.70.6685554.96a y bx =-=-?≈,

因此,所求线性回归方程为 0.66854.96y bx a x =+=+

例5、假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料: 使用年限x 2 3 4 5 6 维修费用y

2.2

3.8

5.5

6.5

7.0

若由资料知y 对x 呈线性相关关系。

零件个数x (个) 10 20

30

40

50

60

70

80

90

100

加工时间y (分) 62

68

75

81

89

95

102

108

115

122

试求:(1)线性回归方程a bx y

+=?的回归系数a , b ; (2)估计使用年限为10年时,维修费用是多少?

经典练习

1、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的频率为

2、容量为100的样本数据,按从小到大的顺序分为8组,如下表:

组号 1 2 3 4 5 6 7 8 频数

10

13

x

14

15

13

12

9

第三组的频数和频率分别是 ( ) A .14和0.14 B .0.14和14 C .

14

1和0.14 D . 31和141

3、如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:

(1)79.5---89.5这一组的频数、频率分别是多少?

(2)估计这次环保知识竞赛的及格率(60分及以上为及格)

4、在10年期间,一城市居民的年收入与某种商品的销售额之间的关系如下数据:

第几年 城市居民收入x (亿元)

某商品销售额y(万元)

1 32.3 25.0

2 32.1 30.0 3

32.9

34.0

2400 2700 3000 3300 3600 3900 体重

0 001

频率/组距

4 35.8 37.0

5 37.1 39.0

6 38.0 41.0

7 39.0 42.0

8 43.0 44.0

9 44.6 48.0 10

46.0

51.0

(1)画出散点图;

(2)如果散点图中的各点大致分布在一条直线的附近,求y 与x 之间的线性回归方程。

5、已知10只狗的血球体积及红血球数的测量值如下:

x (血球体积,ml ),y (红血球数,百万)

(1)画出表中的散点图;(2)求出回归直线度且画出图形.

解:(1)图略 (2)1

(45424648423558403950)44.5010

x =+++++++++= 1

(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10

y =

+++++++++=7.37 设回归直线方程为 y bx a =+,则10

1

10

2

2

1

100.17510i i

i i

i x y x y

b x

x

==-=

=-∑∑,a y bx =-=0.418-

所以所求回归直线的方程为 0.1750.148y x =- 图形:

(略) 课时作业

1、长方形的面积一定时,长和宽具有( ) (A)不确定性关系 (B)相关关系 (C)函数关系 (D)无任何关系

2、200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约有( )

x

45 42 46 48 42 35 58 40 39 50 y

6.

53

6.30

9.52

7.50

6.99

5.90

9.49

6.20

6.59

8.72

0.02

0.03 0.04 频率 组距

(A) 30辆 (B) 40辆 (C) 60辆 (D) 80辆

3、我国西部一个地区的年降水量在下列区间内的概率如下表所示:

年降水量/mm

[ 100, 150 ) [ 150, 200 ) [ 200, 250 ) [ 250, 300 ] 概率

0.21

0.16

0.13

0.12

则年降水量在 [ 200,300 ] (m,m )范围内的概率是___________ 4、设有一个直线回归方程为 ^

^

2 1.5y x =- ,则变量x 增加一个单位时( ) A. y 平均增加 1.5 个单位 B. y 平均增加 2 个单位 C. y 平均减少 1.5 个单位 D. y 平均减少 2 个单位

5、已知线性回归方程为:81.050.0?-=x y

,则x =25时,y 的估计值为________ 6、从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。由图中数据可知a = 。若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为 。

7、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有_ ___根在棉花纤维的长度小于20mm 。

8、在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间相应的一组观察值如下表: x(s) 5 10 15 20 30 40 Y(um) 6 10 10 13 16 17 x(s)

50

60 70 90 120

Y(um) 19

23

25

29

46

求腐蚀深度y 对腐蚀时间x 的线性回归方程。

9、中小学生的视力状况受到全社会的广泛关注,某市有关部门对全市4万名初中生的视力状况进行一次抽样调查统计,所得到有关数据绘制成频数分布直方图,如下图,从左至右五个小组的频率之比依次是2:4:9:7:3,第五小组的频数是30。

(1)本次调查共抽测了多少名学生?

(2)如果视力在4.9~5.1(含4.9,5.1)均属正常,那么全市初中生视力正常的约有多少人?

10、给出施化肥量对水稻产量影响的试验数据:

施化肥量x 15 20 25 30 35 40 45

水稻产量y 330 345 365 405 445 450 455

(1)画出上表的散点图;(2)求出回归直线并且画出图形

相关主题
文本预览
相关文档 最新文档