2018届高中数学必修(人教版)独立性检验的基本思想及其初步应用(第一课时)(1)课件
- 格式:ppt
- 大小:746.50 KB
- 文档页数:19
独立性检验的基本思想及其初步应用(第一课时)。
教学目标:1理解独立性检验的基本思想2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。
3、了解随机变量K 2的含义。
教学重点:理解独立性检验的基本思想。
教学难点;1、理解独立性检验的基本思想、2、了解随机变量K 2的含义。
教学过程:一、引入:从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。
但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表:不患肺癌 患肺癌 合计不吸烟 a b a+b吸烟 c d c+d合计 a+c b+d a+b+c+d样本容量 n=a+b+c+d假设H 0 : 吸烟与患肺癌没有关系。
则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a c a c d c a b ad bc a b c dad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++--=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱.构造随机变量 其中()()2781721489874916.635⨯⨯≈⨯⨯⨯≥≈≥f 2020220202若H 成立,则K 应该很小. 把表中数据代入公式9965777549-422099K =56.632在H 成立的情况下.统计学家估算出如下概率P K 0.01即在H 成立的情况下,K 的值大于6.635的概率非常小.如果K 6.635,就断定H 不成立,出错的可能性有多大?出现K =56.632 6.635 的概率不超过1% .因此,我们有99%的把握认为"吸烟与患肺癌有关系."三、作业:预习17页。
1. 2 獨立性檢驗的基本思想及其初步應用課前預習學案一、預習目標:能用所學的知識對實際問題進行回歸分析,體會回歸分析的實際價值與基本思想;瞭解判斷刻畫回歸模型擬合好壞的方法――相關指數和殘差分析。
二、預習內容1. 給出例3:一隻紅鈴蟲的產卵數y 和溫度x 有關,現收集了7組觀測資料列於下表中,試建立y 與x 之間的回歸方程.溫度/x C21 23 25 27 29 3235 產卵數/y 個 7 1121 24 66 115325(學生描述步驟,教師演示)2. 討論:觀察右圖中的散點圖,發現樣本點並沒有分佈在某個帶狀區域內,即兩個變數不呈線性相關關係,所以不能直接用線性回歸方程來建立兩個變數之間的關係. 課內探究學案一、學習要求:通過對典型案例的探究,瞭解獨立性檢驗的基本思想、方法及初步應用學習重點:對獨立性檢驗的基本思想的理解.學習難點:獨立性檢驗的基本思想的應用.二、學習過程:知識點詳解知識點一:分類變數對於性別變數,其取值為男和女兩種.這種變數的不同“值”表示個體所屬的不同類別,像這樣的變數稱為分類變數.知識點二:列聯表 為調查吸煙是否對患肺癌有影響,某腫瘤研究所隨機調查了9965人,得到如下結果(單位:人):吸煙與患肺癌列聯表不患肺癌 患肺癌 總計 不吸煙 7775 42 7817 吸煙 2099492148 總計9874 919965像上表這樣列出的兩個分類變數的頻數表,稱為列聯表. 知識點三:獨立性檢驗這種利用隨機變數K 2來確定在多大程度上可以認為“兩個分類變數有關係”的方法稱為兩個分類變數的獨立性檢驗.知識點四:判斷結論成立的可能性的步驟一般地,假設有兩個分類變數X 和Y ,它們的值域分別為{x 1,x 2}和{y 1,y 2},其樣5010015020025030035010203040温度产卵数本頻數列聯表(稱為2×2列聯表)為:2×2列聯表H1:“X與Y有關係”,可以按如下步驟判斷結論H1成立的可能性:(1)通過立體直條圖和二維橫條圖,可以粗略地判斷兩個分類變數是否有關係,但是這種判斷無法精確地給出所得結論的可靠程度.①在立體直條圖中,主對角線上兩個柱形高度的乘積xd與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大.②在二維橫條圖中,可以估計滿足條件X=x1的個體中具有Y=y1的個體所占的比例a a+b ,也可以估計滿足條件X=x2的個體中具有Y=y1的個體所占的比例cc+d.兩個比例的值相差越大,H1成立的可能性就越大.(2)可以利用獨立性檢驗來考察兩個分類變數是否有關係,並且能較精確地給出這種判斷的可靠程度.具體做法是:根據觀測資料計算由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)給出的檢驗隨機變數K2的值k,其值越大,說明“X 與Y有關係”成立的可能性越大.當得到的觀測資料x,b,c,d都不小於5時,可以通過查說明:當觀測資料,,,中有小於5時,需採用很複雜的精確的檢驗方法.五、幾個典型例題:例1立體直條圖中柱的高度表示的是(A)A.各分類變數的頻數B.分類變數的百分比C.分類變數的樣本數D.分類變數的具體值例2則下列說法正確的是()X.xd-bc越小,說明X和Y關係越弱B.xd-bc越大,說明X和Y關係越強C.(xd-bc)2越大,說明X和Y關係越強D.(xd-bc)2越接近於0 ,說明X和Y關係越強例3研究人員選取170名青年男女大學生的樣本,對他們進行一種心理測驗,發現有60名女生對該心理測驗中的最後一個題目的反應是:作肯定的18名,不定的42名;男生110名在相同的項目上作肯定的有22名,否定的有88名.問:性別與態度之間是否存在某種關係?分別用圖形和獨立性檢驗的方法判斷.解:根據題目所給資料建立如下列聯表根據列聯表中的資料得到K 2=170×(22×42-18×88)110×60×40×130≈2.158<2.706因此沒有充分的證據顯示“性別與態度有關”.例4 打鼾不僅影響別人休息,而且可能與患某種病症有關.下表是一次調查所得的資K 2=1633×(30×1355-224×24)21379×254×54×1579=68.033.因為68.033>6.635,所以有99%的把握說,每一晚都打鼾與患心臟病有關課後練習與提高(1(2)試求出預報變數對解釋變數的回歸方程.(答案:所求非線性回歸方程為0.69 1.112ˆy =e x .)。