高二数学1-2独立性检验
高二数学人选择性必修件独立性检验

系。
02
社会学领域
研究两个社会现象是否独立, 如研究教育程度与职业选择的
关系。
03
经济学领域
研究两个经济指标是否独立, 如研究通货膨胀率与失业率的
关系。
03
独立性检验方法
卡方检验法
01
02
03
卡方统计量
用于衡量实际观测值与理 论期望值之间的差异,其 值越大,表明差异越显著 。
Spearman等级相关系数
同样用于衡量两个有序分类变量之间的关联程度,与Kendall's tau-b类似,但计算方 法略有不同。
04
数据处理与结果分析
数据收集与整理
数据来源
明确数据的来源,确保数据的真实性 和可靠性。
数据整理
将数据按照一定的格式进行整理,便 于后续的计算和分析。
数据筛选
根据研究目的,筛选与研究问题相关 的数据。
将计算得到的统计量与临界值进 行比较,判断假设是否成立。
意义探讨
根据假设检验的结果,探讨数据背 后的实际意义,如两个变量之间是 否存在关联等。
注意事项
在讨论结果时,需要注意结果的可 靠性、可重复性以及可能存在的误 差来源。
05
实际应用案例解析
医学领域案例:疾病与基因关系研究
01
研究目的
探究某种疾病与特定基因之间 的关联程度。
02
数据收集
收集患者的基因数据和疾病信 息。
03
独立性检验
通过卡方检验等方法,判断疾 病与基因之间是否存在统计学
上的独立性。
04
结果解读
若检验结果拒绝原假设,则认 为疾病与基因之间存在关联, 这为疾病的预防、诊断和治疗
易学通·重难点一本过高二数学(人教版选修1-2):答案与解析 Word版

第一章 独立性检验【趁热打铁】 1.【答案】C【解析】∵a +21=73,∴a =52,又a +22=b ,∴b =74. 2.【答案】③【解析】由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,①、②错误.根据列联表中的数据,得到()()()()()22n ad bc K a b c d a c b d -=++++2105(10302045) 6.6 3.84155503075⨯⨯-⨯≈>⨯⨯⨯, 因此有95%的把握认为“成绩与班级有关系”.4. 【答案】没有90%的把握认为“测评结果为优秀与性别有关”. 【解析】设从高一年级男生中抽出m 人,则45,m 25500500400m ==+, ∴25205,20182x y =-==-=而()24515510159 1.125 2.706301525208k ⨯⨯-⨯===<⨯⨯⨯,所以没有90%的把握认为“测评结果为优秀与性别有关”.5.【答案】(1)14m =;(2)有99.9%的的把握认为支持网络购物与年龄有关. 【解析】(1)由题意,得8009008002001003009m++++=, 所以14m =.............................5分(2)根据题意得22⨯列联表如下,.......................................................8分所以()21400800300100200376.44410.8289005001000400k⨯⨯-⨯=≈>⨯⨯⨯..................10分所以有99.9%的把握认为是否支持网络购物与年龄有关.....................12分6.【答案】(1)有99.5%的把握认为喜欢“应用统计”课程与性别有关.(2)8 15.7.【答案】(1)抽到参加社团活动的学生的概率是1125;抽到不参加社团活动且学习积极性一般的学生的概率是25.(2)大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.【解析】(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2211 5025=;抽到不参加社团活动且学习积极性一般的学生的概率是202 505=.(2)因为()()()()()22n ad bcKa b c d a c b d-=++++=250(172058)11.68810.828 25252228⨯⨯-⨯≈>⨯⨯⨯,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.8.【答案】(1)240名. (2)(3)能在犯错误的概率不超过1%的前提下,认为“性别”与“工作是否满意”有关.(2)由题意可得下列表格:(3)假设H 0:“性别”与“工作是否满意”无关, 根据表中数据,求得K 2的观测值()()()()()22n ad bc K a b c d a c b d -=++++230(121134)8.571 6.63515151614⨯⨯-⨯≈>⨯⨯⨯,查表得P (K 2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为“性别”与“工作是否满意”有关.9.【答案】(1)6;(2)815. 【解析】(1)设常喝碳酸饮料肥胖的学生有x 人,243015x +=,解得x =6.(2)()()()()()22n ad bc K a b c d a c b d -=++++230(61824)8.5237.8791020822⨯⨯-⨯≈>⨯⨯⨯.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815. 10.【答案】(1)应收集90位女生的样本数据.(2)该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. (3)有95%的把握认为“该校学生的每周平均体育运动时间与性别有关” 【解析】(1) 45003009015000⨯=,所以应收集90位女生的样本数据.每周平均体育运动时间与性别列联表()()()()()22n ad bc K a b c d a c b d -=++++=2300(456016530) 4.762 3.8417522521090⨯⨯-⨯≈>⨯⨯⨯.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”第二章 回归分析【趁热打铁】 1.【答案】A【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .选A. 2.【答案】D【解析】由回归方程y ^=b ^x +a ^知当b ^>0时,y 与x 正相关,当b ^<0时,y 与x 负相关,∴①④一定错误. 3.【答案】A【解析】由表格,得5x =,7y =,代入线性回归方程,得ˆ752b=+,解得ˆ1b =,故选A .5.【答案】A .【解析】因为变量x 和y 满足关系0.11y x =-+,其中0.10-<,所以x 与y 成负相关;又因为变量y 与z 正相关,不妨设z ky b =+(0)k >,则将0.11y x =-+代入即可得到:(0.11)0.1()z k x b kx k b =-++=-++,所以0.10k -<,所以x 与z 负相关,综上可知,应选A .6.【答案】(Ⅰ)^y =-1.45x +18.7;(Ⅱ)以预测当x =3时,销售利润z 取得最大值. 【解析】(Ⅰ)由已知:x -=6,y -=10,5i =1∑x i y i =242,5i =1∑x 2i =220,^b =ni =1∑x i y i -nx -y-ni =1∑x 2i -nx-2=-1.45,a ˆ=y --^bx-=18.7;所以回归直线的方程为^y =-1.45x +18.7 (Ⅱ)z =-1.45x +18.7-(0.05x 2-1.75x +17.2) =-0.05x 2+0.3x +1.5 =-0.05(x -3)2+1.95,所以预测当x =3时,销售利润z 取得最大值.7.【答案】(1)53;(2)325-=∧x y ;(3)可靠.【解析】(1)设抽到不相邻两组数据为事件A ,因此从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,所以531041)(=-=A P ,故选取的2组数据恰好是不相邻2天数据的概率是53.(2)由数据,求得972,27)263025(31,12)121311(31==++==++=y x y x ,4323,434121311,97726123013251122223121==++==⨯+⨯+⨯=∑∑==x x y x i i n i i i ,由公式求得3,2543243497297733231231-=-==--=--=∧∧==∧∑∑x b y a xxyx y x b i ii ii , 所以y 关于x 的线性回归方程为325-=∧x y . (3)当10=x 时,22322,22325<-=-=∧x y ,同样地,当8=x 时,21617,173825<-=-⨯=∧y , 所以该研究所得到的线性回归方程式可靠的.)(2因为25.46,4x ==y ,9424112=∑=-i i x ,945124112=-=-∑i i i y x 所以 83.6449425.464494534ˆ2412212411212≈⨯-⨯⨯-=-⋅-=∑∑=-=--i i i i i xx yx y xb.93.18483.625.46ˆaˆ=⨯-=-=x b y , 即93.18ˆ,83.6ˆ==a b,5.17,5.6==a b . %5ˆ≈-b b b,%8ˆ≈-a a a ,均不超过%10,因此使用位置最接近的已有旧井)24,1(6;………………8分)(3易知原有的出油量不低于L 50的井中,653、、这3口井是优质井,42、这2口井为非优质井,由题意从这5口井中随机选取3口井的可能情况有:)),(,),(,(6,3,25,324.3,2,)),(,(6,4,25,42,)),(,(5,4,36,52,)),(),(,(6,5,46,5,36,43共10种,其中恰有2口是优质井的有6中,所以所求概率是53106==P .………………12分∴c y dw =-=563-68×6.8=100.6.∴y 关于w 的线性回归方程为100.668y w =+,∴y 关于x 的回归方程为100.6y =+……6分 (Ⅲ)(ⅰ)由(Ⅱ)知,当x =49时,年销售量y 的预报值100.6y =+,10.【答案】(Ⅰ)ˆ 1.2 3.6y t =+,(Ⅱ)10.8千亿元.【解析】 (1)列表计算如下这里111151365,3,7.2.55n n i i i i n t t y y n n=========邋 又2211l 555310,120537.212.nn nt iny i i i i t nt l t y nt y ===-=-?=-=-创=邋从而12ˆˆˆ1.2,7.2 1.23 3.610ny nt l b a y bt l ====-=-?. 故所求回归方程为ˆ 1.2 3.6yt =+. (2)将6t =代入回归方程可预测该地区2015年的人民币储蓄存款为ˆ 1.26 3.610.8().y=?=千亿元第三章 合情推理与演绎推理【趁热打铁】 1.【答案】C【解析】由题意,知所得新数列为1111,,,,222322n n n nn ⨯⨯⨯⨯,所以1223341n n a a a a a a a a -++++=21111[]4122334(1)n n n++++⨯⨯⨯-⨯=21111111[(1)()()()]4223341n n n -+-+-++--=21(1)4n n -=(1)4n n -,故选C . 2.【答案】A【解析】“指数函数y =a x是增函数”是本推理的大前提,它是错误的,因为实数a 的取值范围没有确定,所以导致结论是错误的. 3.【答案】A【解析】()m x x x f +-=232是[]a 2,0上的“双中值函数”,()()220822f a f a a a-∴=-,()22262,6282f x x x x x a a '=-∴-=-在[]a 2,0上有两个根,令()226282g x x x a a =--+()()()2424820,00,20,a a g g a ∴∆=+->>>解得4181<<a ,故选A.6.【答案】mm 02047【解析】观察上图可知,法=实际标注100.2-⨯,故30号的童鞋对应的脚的长度为mm 020,当脚长为为mm 282,对应的法4.46102.0282=-⨯,应穿47码的鞋,故答案为mm 020,47.7.【答案】1111111 (234212)n n +++++++>-【解析】观察不等式左边最后一项的分母3,7,15,…,通项为121n +-,不等式右边为首项为1,公差为12的等差数列,故猜想第n 个不等式为1111111.....234212n n +++++++>-, 答案:1111111 (234212)n n +++++++>-10.【答案】猜想f(x)+f(1-x)=33. 【解析】f(0)+f(1)=130+3+131+3=11+3+13(1+3)=33(1+3)+13(1+3)=33, 同理可得f(-1)+f(2)=33,f(-2)+f(3)=33. 由此猜想f(x)+f(1-x)=33. 证明f(x)+f(1-x)=13x +3+131-x +3=13x +3+3x 3+3·3x =13x +3+3x3(3+3x) =3+3x 3(3+3x)=33.第四章 直接证明与间接证明【趁热打铁】 1.【答案】D【解析】log log 1>=a a b a ,当1>a 时,1>>b a ,10,0∴->->a b a ,(1)()0∴-->a b a ;当01<<a 时,01∴<<<b a ,10,0∴-<-<a b a ,(1)()0∴-->a b a .故选D .3.【答案】A【解析】因为“方程x 3+ax +b =0至少有一个实根”等价于“方程x 3+ax +b =0的实根的个数大于或等于1”,所以要做的假设是“方程x 3+ax +b =0没有实根”.4.【答案】B【解析】在B 中,∵a 2+b 2-2(a -b -1)=(a 2-2a +1)+(b 2+2b +1)=(a -1)2+(b +1)2≥0,∴a 2+b 2≥2(a -b -1)恒成立.5.【答案】B 【解析】∵a=m +1-m =1m +1+m , b =m -m -1=1m +m -1. 而m +1+m>m +m -1>0(m >1), ∴1m +1+m <1m +m -1,即a<b.6.【答案】C【解析】由题意知b 2-ac <3a ⇐b 2-ac <3a 2⇐(a +c)2-ac <3a 2⇐a 2+2ac +c 2-ac -3a 2<0⇐-2a 2+ac +c 2<0⇐2a 2-ac -c 2>0⇐(a -c)(2a +c)>0⇐(a -c)(a -b)>0.7.【答案】D【解析】反证法的实质是否定结论,对于①,其结论的反面是p +q >2,所以①不正确;对于②,其假设正确.8.【答案】 ①③④【解析】要使b a +a b ≥2,只需b a >0成立,即a ,b 不为0且同号即可,故①③④能使b a +a b≥2成立. 9.【答案】见解析.【解析】假设a 1,a 2,a 3,a 4均不大于25,即a 1≤25,a 2≤25,a 3≤25,a 4≤25,则a 1+a 2+a 3+a 4≤25+25+25+25=100,这与已知a 1+a 2+a 3+a 4>100矛盾,故假设错误.所以a 1,a 2,a 3,a 4中至少有一个数大于25.10.【答案】(1)a n =2n -1+2,S n =n(n +2).(2)证明:见解析.第五章 复数【趁热打铁】1.【答案】D 【解析】因为243i i(43i)34i i i z --===--,故选D . 2.【答案】C【解析】z=212(12)()2i i i i i i ++-==--,对应点为(2,-1),故选C. 3.【答案】C【解析】由3z i i +=-得,32z i =-,所以32z i =+,故选C.4.【答案】D 【解析】43i ||55z z ==-,故选D . 5.【答案】C【解析】由题意,22(1)122i i i i +=++=,故选C.6.【答案】A 【解析】12(12)(2)2422(2)(2)5i i i i i i i i i +++++-===--+,故选A. 10.【答案】i 2141+ 【解析】设),(R ∈+=b a bi a z ,则bi a -=,因为i z z +=+13,所以i bi a bi a +=-++1)(3,即i bi a +=+124,所以⎩⎨⎧==1214b a ,即⎪⎪⎩⎪⎪⎨⎧==2141b a , 所以i z 2141+=.第六章 框图【趁热打铁】1.【答案】B【解析】由结构图可知设总经理一个,副总经理两个,直接对总经理负责,下设有6个部门,其中副总经理A 管理生产部、安全部和质量部,副总经理B 管理销售部、财务部和保卫部,其中①、 ②处应分别填安全部,保卫部,选B.2.【答案】C【解析】程序运行如下3,21,201224,10n x v i v i ==→==≥→=⨯+==≥4219,0092018,10,v i v i →=⨯+==≥→=⨯+==-<结束循环,输出18v =,故选C.3.【答案】B【解析】由程序框图,,n S 值依次为:6, 2.59808n S ==;12,3n S ==;24, 3.10583n S ==,此时满足 3.10S ≥,输出24n =,故选B.4.【答案】D【解析】由程序框图可知,该程序框图所表示的算法功能为2345671log 3log 4log 5log 6log 7log 83S =⨯⨯⨯⨯⨯⨯=,故选D.5.【答案】C 【解析】2x =,执行程序,0y =,不满足||1y x -<,0;x =执行程序,1y =-,不满足||1y x -<,2;x =-执行程序,2y =-,满足||1y x -<,输出2;- 故选C .7.【答案】C【解析】由已知,1,0k s ==,1,2s s k k =+==,3,4s k ==,7,8s k ==,15,16s k ==,31,32s k ==,符合条件输出,故选C.8.【答案】C【解析】0,2S n ==,判断是,1,42S n ==,判断是,113,6244S n =+==,判断是,11111,824612S n =++==,判断否,输出S ,故填6n ≤.10.【答案】1【解析】按程序运行的过程,运行一遍程序:3,1,0n i S ===,1S =,循环,2,1i S ==,循环,3,11i S ===,退出循环,输出1S =.。
苏教版选修1-2高中数学1.1《独立性检验》

甲厂 乙厂 合计 优质品 非优质品 合计
2 n ad - bc 附:χ2= , a+bb+ca+cb+d
P(χ2≥x0) x0
0.05
0.01
3.841 6.635
课前探究学习
课堂讲练互动
解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 360 的优质品率估计为500=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为500=64%. (2) 甲厂 乙厂 合计 优质品 360 320 680
课前探究学习 课堂讲练互动
【题后反思】 统计的基本思维模式是归纳,通过部分数据的性质 来推测全部数据的性质,从数据上体现的只是统计关系,而不是 因果关系.
课前探究学习
课堂讲练互动
【训练3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单 位: mm) 的值落在 [29.94,30.06) 的零件为优质品.从两个分 厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关 系.
课前探究学习
课堂讲练互动
题型一 利用χ2判定两个变量间的关系 【例1】 某电视台联合相关报社对“男女同龄退休”这一公众关
注的问题进行了民意调查,数据如下表所示:
赞同 男 女 合计 198 476 674
可能性为1%.
课前探究学习 课堂讲练互动
名师点睛 1.独立性检验
2 n ad - bc (1)利用随机变量 χ2= ,(其中 n=a+b a+bc+da+cb+d
+c+d 为样本容量),来确定在多大程度上可以认为“两个分 类变量有关系”的方法称为两个分类变量的独立性检验.
独立性检验-高二数学课件(人教B版2019选择性必修第二册)

(1)事件 (2)事件
A B
发生的概率可估计为P( A) 发生的概率可估计为P(B)
a a
c n b
(3)事件 AB 发生的概率可估计为
P(
n AB)
a
n
如果 A 与 B 独立,那么上述 P( AB)与 P( A )P( B )的估计值
相差不会太大,注意到总数为 n,因此利用后者可以估计出,理论上
非优秀 45 30
总计 55 50
总计
30
75
105
题型二:独立性检验解决实际问题
例5:有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分
以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机 抽取1人为优秀的概率为 2 .
7
(2)根据列联表的数据,若按照95%的可靠性要求,能否认为“成绩与班
既是 A 又是 B 的数据有n P( A )P( B )个,注意到实际的数据为 a
(即n P( AB ))个,因此
[nP( AB) nP( A)P(B)]2 [na n(a c)(a b)]2
nP( A)P(B)
na c(a b)
不会太大.
类似地,考虑 A 与 B ,A 与 B ,A 与 B ,可知
3
33
合计 3x x 4x 11.20 x 14.65 33.60 3x 43.96
题型二:独立性检验解决实际问题
例4:某年调查某桑场采桑人员和不采桑人员的桑毛虫皮炎发病情 况,结果如表所示,利用列联表的独立性检验估计“患桑毛虫皮 炎病与采桑”是否有关?认为两者有关系犯错误的概率是多少?
采桑 不采桑 合计
由于12.981>6.635,所以在犯错误的概率不超过1%的前提下,
人教B版高二数学选修 独立性检验(2)-1教案牛老师

教案满招损,谦受益。
《尚书》
大地二中张清泉
【素材积累】
1、一个房产经纪人死后和上帝的对话一个房产经纪人死后,和上帝喝茶。
上帝认为他太能说了,会打扰天堂的幽静,于是旧把他打入了地狱。
刚过了一个星期,阎王旧满头大汗找上门来说:上帝呀,赶紧把他弄走吧!上帝问:怎么回事?
阎王说:地狱的小。
2、机会往往伪装成困难美国名校芝加哥大学的一位教授到访北大时曾提到:芝加哥大学对学生的基本要求是做困难的事。
因为一个人要想有所成旧,旧必须做那些困难的事。
只有做困难的事,才能推动社会发展进步。
【素材积累】
每个人对未来都有所希望和计划,立志是成功的起点,有了壮志和不懈的努力,就能向成功迈进。
1、立志多在少年,但宋朝学家苏洵27岁开始发愤,立志就读,昼夜不息,结果大器晚成,终于成为唐宋八大家之一。
2、我国明代画家王冕,少年放牛时,立志要把荷花佳景惟妙惟肖地画出来。
他不分昼夜地绘画,立志不移,后来成为当时著名的画家。
3、越王勾践被吴国军队打败,忍受奇耻大辱,给吴王夫差当奴仆。
三年后,他被释放回国,立志洗雪国耻。
他卧薪尝胆,发愤图强,终于打败了吴国。
4、有志者事竟成,百二秦关终归楚;苦心人天不负,三千越甲可吞吴。
——蒲松龄。
1.2独立性检验的基本思想及其初步应用

试用图形判断服用药和患病之间是否有关系?
解析:相应的等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于 没有服用药的样本中患病的比例,因此可以认为:服用药和 患病之间有关系.
独立性检验方法——K2公式
在调查的480名男士中有38名患有色盲,520名女 士中有6名患有色盲,能否在犯错误的概率不超过0.001的前 提下认为性别与患色盲有关系? 分析:
4.下面是一个2×2列联表: x1 x2 总计 y1 a 2 b y2 21 25 46 总计 73 27 100
则表中a、b的值分别为( C ) A.94、96 C.52、54 B.52、50 D.54、52
5.性别与身高列联表如下: 男 女 总计 高(165 cm以上) 37 6 43 矮(165 cm以下) 4 13 17 总计 41 19 60
作出2×2列联表 → 计算随机变量K2的值 → 对照临界值作出结论 解析:根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计
男
女 总计
38
6 44
442
514 956
480
520 1 000
根据列联表中所给的数据可以得: a=38,b=442,c=6,d=514,a+b=480,c+d= 520,a+c=44,b+d=956,n=1 000.
3.独立性检验. 利用随机变量K2来判断“两个分类变量有关系”的方法 定义 称为独立性检验.
nad-bc2 公式 K2=_____________________ a+bc+da+cb+d ,其中n=______________. a+b+c+d
①根据实际问题的需要确定容许推断“两个分类变量有 临界值 k0 .② 关系”犯错误概率的上界α,然后查表确定 ________ k________ ≥k0 利用公式计算随机变量K2的 ________ , 观测值 k .③如果 具体 就推断“X与Y有关系”,这种推断犯错误的概率不超过 步骤 α;否则,就认为在犯错误的概率不超过α的前提下不能 推断“X与Y有关系”,或者在样本数据中没有发现足够 证据支持结论“X与Y有关系”.
2020最新人教版高二数学选修1-2电子课本课件【全册】

பைடு நூலகம்
实习作业
2020最新人教版高二数学选修1-2 电子课本课件【全册】
2020最新人教版高二数学选修1 -2电子课本课件【全册】目录
0002页 0084页 0113页 0202页 0241页 0276页 0352页 0389页 0466页 0513页 0576页 0587页
第一章 统计案例 1.2 独立性检验的基本思想及其初步应用 小结 第二章 推理与证明 阅读与思考 科学发现中的推理 小结 第三章 数系的扩充与复数的引入 3.2 复数代数形式的四则运算 复习参考题 4.1 流程图 信息技术应用 用word2002绘制流程图 复习参考题
第一章 统计案例
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.1 回归分析的基本思想及其 初步应用
2020最新人教版高二数学选修1-2 电子课本课件【全册】
1.2 独立性检验的基本思想及 其初步应用
高二数学1-2 独立性检验

独立性检验教学重点、独立性检验的基本方法,独立性检验的步骤难点:.基本思想的领会及方法应用.知识点一、独立性检验的基本概念和原理独立性检验是研究相关关系的方法。
1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。
2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个3.条形图为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?4.独立性检验的步骤为了回答下面问题,我们先假设H:吸烟与患肺癌没有关系,看看能够得到什么样的结论。
不患肺癌患肺癌合计不吸烟 a b a+b吸烟 c d c+d合计a+c b+d a+b+c+d样本容量 n=a+b+c+d如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a ca c d c ab ad bc a b c dad bc ad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++---=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中为样本容量若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2)(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈,即有99%的把握认为H 0不成立.假设检验 备择假设H 1在H 1不成立的条件下,即H 0成立的条件下进行推理 推出有利于H 1成立的小概率事件(概率不超过α的事件)发生,意味着H 1成立的可能性(可能性为(1-α))很大推出有利于H 成立的小概率事件不发生,接受原假设上例的解决步骤第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系↔ H 1:吸烟与患肺癌有关系第二步:选择检验的指标 22()K ()()()()n ad bc a b c d a c b d -=++++(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论注意:1观测值是2K 的值2.假设没有关系,如果2K 大,则H 0不成立,即两个量有关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
独立性检验教学重点、独立性检验的基本方法,独立性检验的步骤难点:.基本思想的领会及方法应用.知识点一、独立性检验的基本概念和原理独立性检验是研究相关关系的方法。
1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。
2 列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个患病未患病合计吸烟37 183 220不吸烟21 274 295合计58 457 5153.条形图为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢4.独立性检验的步骤:吸烟与患肺癌没有关系,看看能够得到什么样为了回答下面问题,我们先假设H的结论。
不患肺癌患肺癌合计不吸烟a b a+b吸烟c d c+d合计a+c b+d a+b+c+d样本容量n=a+b+c+d如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a ca c d c ab ad bc a b c dad bc ad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++---=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中为样本容量若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2)(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈ ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈,即有99%的把握认为H 0不成立.你觉得和反证法有没有什么共同点反证法 假设检验 要证明结论A备择假设H 1在A 不成立的前提下进行推理 在H 1不成立的条件下,即H 0成立的条件下进行推理 推出矛盾,意味着结论A 成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发生,意味着H 1成立的可能性(可能性为(1-α))很大 没有找到矛盾,不能对A 下任何结论,即反证法不成功推出有利于H 1成立的小概率事件不发生,接受原假设上例的解决步骤第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系↔ H 1:吸烟与患肺癌有关系第二步:选择检验的指标 22()K ()()()()n ad bc a b c d a c b d -=++++(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论注意:1观测值是2K 的值2.假设没有关系,如果2K 大,则H 0不成立,即两个量有关系。
如果2K 小,说明没有足够证据证明H 0不成立,即两个量没有关系 3.查表后,大于某个值0k 的可能性很小,如果大于0k ,则得出两个量有关系 4得到两个量有(没有)关系的结论是在概率基础上决定的,存在犯错误的概率5有99%的把握(相当于正确概率99%)认为 有关 在犯错误的概率不超过1%的前提下,认为“ 有关”说明:95%就是概率,可以说成有95%的把握,这种事件出现的可能性极大 5%当然也是概率,这种事件出现的可能性极小,在新闻中播报的水灾20年一遇,就是概率5%事件发生了 题型一概念辨析例题 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若K 2的观测值为k =,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误D .以上三种说法都不正确A 变式1下列关于独立性检验的说法中,错误的是( ) A .独立性检验得到的结论一定正确B .独立性检验依赖小概率原理C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判定两事物是否相关的唯一方法考点:独立性检验的基本思想.分析:对选项进行判断,独立性检验取决于样本、独立性检验是依据小概率原理,用样本计算统计量的、样本不同,观测值统计量也不同、对于检验两个事件是否相关除了统计量外,还可以根据两个分类变量之间频率大小差异进行粗略判断,即可得出结论.解答:解:因为独立性检验取决于样本,故结论不一定正确,即A不正确独立性检验是依据小概率原理,用样本计算统计量的,故正确;样本不同,观测值统计量也不同,故正确;对于检验两个事件是否相关除了统计量外,还可以根据两个分类变量之间频率大小差异进行粗略判断,故正确.故选:A.点评:本题主要考查了独立性检验的定义和检验步骤,独立性检验的意义,属基础题A变式2 对于独立性检验,下列说法正确的是()A.K2独立性检验的统计假设是各事件之间相互独立B.K2可以为负值C.K2独立性检验显示“患慢性气管炎和吸烟习惯有关”,这就是指“有吸烟习惯的人必定会患慢性气管炎”D.2×2列联表中的4个数据可以是任意正数分析:利用独立性检验的定义和解题步骤逐一筛选四个选项即可解答:解:由独立性检验的检验步骤可知A正确;∵2×2列联表中的数据均为正整数,故k2不可能为负值,排除B;∵K2独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指有一定的把握说他们相关,或者说有一定的出错率,故排除C;∵2×2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系,故排除D故选A点评:本题主要考查了独立性检验的定义和检验步骤,独立性检验的意义,属基础题A.变式3独立性检验中,假设H0:变量X与变量Y没有关系.则在H0成立的情况下,估算概率P(K2≥)≈表示的意义是()A.变量X与变量Y有关系的概率为1%B.变量X与变量Y没有关系的概率为99%C.变量X与变量Y有关系的概率为99%D.变量X与变量Y没有关系的概率为%考点:实际推断原理和假设检验的应用.分析:根据所给的估算概率,得到两个变量有关系的可信度是,即两个变量有关系的概率是99%,这里不用计算,只要理解概率的意义即可.解答:解:∵概率P(K2≥)≈,∴两个变量有关系的可信度是=99%,即两个变量有关系的概率是99%,故选C.点评:本题考查实际推断原理和假设检验的应用,本题解题的关键是理解所求出的概率的意义,本题是一个基础题.B变式1 在独立性检验中,统计量Χ2有两个临界值:和.当Χ2>时,有95%的把握说明两个事件有关,当Χ2>时,有99%的把握说明两个事件有关,当Χ2≤时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算Χ2=.根据这一数据分析,认为打鼾与患心脏病之间()A.有95%的把握认为两者有关B.约有95%的打鼾者患心脏病C.有99%的把握认为两者有关D.约有99%的打鼾者患心脏病考点:独立性检验的应用.分析:这是一个独立性检验理论分析题,根据K2的值,同所给的临界值表中进行比较,可以得到有99%的把握认为打鼾与心脏病有关.解答:解:∵计算Χ2=.有>,∵当Χ2>时,有99%的把握说明两个事件有关,故选C.点评:考查独立性检验的应用,是一个典型的问题,注意解题时数字运算要认真,不要出错,本题不需要运算直接考查临界值对应的概率的意义二.独立性检验的应用题型二、独立性检验的应用 例2.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课程列联表由表中数据计算得2K 的观测值 4.514k .能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗请详细阐明得出结论的依据. 解:在假设“性别与喜欢数学课之间没有关系”的前提下,事件A ={2K ≥3. 841}的概率为P (2K≥3. 841) ≈因此事件 A 是一个小概率事件.而由样本数据计算得2K 的观测值k=,即小概率事件 A 发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %.所以,约有95%的把握认为“性别与喜欢数学课之间有关系”.A .变式1 某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有______的把握认为糖尿病患者与遗传有关系.( )A .%B .%C .99%D .%[解析] 可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表k =366×(16×240-17×93)2109×257×33×333≈>.故我们有%的把握认为糖尿病患者与遗传有关系.A .变式2 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用分析:在使用该种血清的人中,有24248.4%500=的人患过感冒;在没有使用该种血清的人中,有28456.8%500=的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.解:提出假设0H :感冒与是否使用该种血清没有关系.由列联表中的数据,求得221000(258284242216)7.075474526500500χ⨯⨯-⨯=≈⨯⨯⨯∵当0H 成立时,26.635χ≥的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.A 变式 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表: 男 女 总计 走天桥 40 20 60 走斑马线 20 30 50 总计 60 50 110由,算得参照独立性检验附表,得到的正确结论是()A.有99%的把握认为“选择过马路的方式与性别有关”B.有99%的把握认为“选择过马路的方式与性别无关”C.在犯错误的概率不超过%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过%的前提下,认为“选择过马路的方式与性别无关”B变式1 媒体为调查喜欢娱乐节目A是否与性格外向有关,随机抽取了500名性格外向的和500名性格内向的居民,抽查结果用等高条形图表示如下:(1)作出2×2列联表;(2)试用独立性检验的方法分析,能否在犯错的概率不超过的前提下说明喜欢娱乐节目A 与性格外向有关考点:独立性检验的应用.分析:(1)由等高条形图可知,性格外向、性格内向的人中喜欢节目A的人数,可得2×2列联表;(2)计算K2,与临界值比较,即可得出结论.解答:解:(1)由等高条形图可知,性格外向的人中喜欢节目A的有500×=400人,性格内向的人中喜欢节目A的有500×=250人,作2×2列联表如下喜欢节目A喜欢节目B合计性格外向?????400?????1005001000×(400×250?100×250)500×500×650×350 ≈>,∴能在犯错的概率不超过的前提下说明喜欢娱乐节目A 与性格外向有关.点评:本题考查独立性检验的应用,本题解题的关键是正确理解观测值对应的概率的意义.B 变式2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作分析:在口服的病人中,有5859%98≈的人有效;在注射的病人中,有6467%95≈的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢下面用独立性检验的方法加以说明. 解:提出假设0H :药的效果与给药方式没有关系.由列联表中的数据,求得 22193(58314064) 1.3896 2.072122719895χ⨯⨯-⨯=≈<⨯⨯⨯当0H 成立时,21.3896χ≥的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设0H ,即不能作出药的效果与给药方式有关的结论B.变式3 某中学采取分层抽样的方法从应届高三学生中按照性别抽取20名学生,其中8名女生中有3名报考理科,男生中有2名报考文科. (1)是根据以上信息,写出2×2列联表(2)用独立性检验的方法分析,能否在犯错误的概率不超过的前提下认为该中学的高三学生选报文理科与性别有关考点:独立性检验的应用.分析:(1)根据抽取20名学生,其中8名女生中有3名报考理科,男生中有2名报考文科,即可得到列联表;(2)根据所给的表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,得到有95%以上的把握认为学生选报文理科与性别有关.解答:解:(1)2×2列联表男生女生总计报考理科10313报考文科257总计12820(2)假设H0:报考文理科与性别无关.则K2的估计值K2=20×(10×5?2×3)12×8×13×7≈.因为p(K2>)=,所以我们有95%把握认为该中学的高三学生选报文理科与性别有关.点评:本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题题型三、已知可信度,求观测值k2例题4. 确定结论“X与Y有关系”的可信度为%时,则随即变量k2的观测值k必须()A.小于B.大于C.小于D.大于A变式用的方法,我们得到能有99%的把握认为变量X与Y有关系,则()A.K2≥B.K2≥C.K2<D.K2<A 变式 随机调查某校110名学生是否喜欢跳舞,由列联表和公式K 2=计算出K 2,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则K 2可以为( )附表:P (K 2≥k 0)k 0A .B .C .D .总结:第一步:提出假设检验问题 H 0: 与 没有关系↔ H 1: 与 有关系第二步:选择检验的指标 22()K ()()()()n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大.第三步:查表得出结论1.观测值是2K 的值 2.假设没有关系,如果2K 大,则H 0不成立,即两个量有关系。