2018_2019学年高中数学第一章统计案例1.1独立性检验同步学案新人教B版
2018_2019学年高中数学第一章统计案例章末复习同步课件新人教B版选修1_2

卷调查得到了如下的2×2列联表:
喜爱打篮球 男生 女生 合计 10 48 不喜爱打篮球 6 合计
2 已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为 . 3 (1)请将上面的2×2列联表补充完整;(不用写计算过程)
解答
(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?
解答
(2)请根据上表提供的数据,求出 y 关于 x 的回归直线方程y=bx+a;
解
5
^
^
^
0+1+2+3+4 5+7+8+11+19 因为 x = =2, y = =10, 5 5
i=1
xiyi=0×5+1×7+2×8+3×11+4×19=132,
5
2 2 2 2 2 2 xi =0 +1 +2 +3 +4 =30, i=1
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变
量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然
后写出回归方程.
(3)实际应用.依据求得的回归方程解决实际问题.
跟踪训练2 某运动员训练次数与运动成绩之间的数据关系如下:
次数x 成绩y 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51
(1)作出散点图;
解 作出该运动员训练次数 x与成绩 y之间的散点图,如图所示,由 散点图可知,它们之间具有线性相关关系.
解答
(2)求出回归直线方程; 次数x 成绩y 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51
解答
(3)计算相关系数并进行相关性检验; 解 计算相关系数r=0.992 7,因此运动员的成绩和训练次数两个变量
2018_2019学年高中数学第一章统计案例章末复习学案北师大版选修1_2

第一章 统计案例章末复习学习目标 1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤.一、线性回归分析 1.线性回归方程在线性回归方程y =a +bx 中,b =∑n i =1(x i -x )(y i -y )∑ni =1 (x i -x )2=∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .其中x =1n ∑n i =1x i ,y =1n∑ni =1y i . 2.相关系数(1)相关系数r 的计算公式r =∑n i =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高. (3)当r >0时,b >0,称两个变量正相关; 当r <0时,b <0,称两个变量负相关; 当r =0时,称两个变量线性不相关. 二、条件概率 1.条件概率的概念设A ,B 为两个事件,已知B 发生的条件下,A 发生的概率,称为B 发生时A 发生的条件概率,记为P (A |B ). 2.计算公式P (B |A )=P (AB )P (A )=n (AB )n (A ).三、独立事件 1.独立事件的概念设A,B为两个事件,若P(AB)=P(A)P(B),则称事件A与事件B相互独立.2.相互独立事件与互斥事件的对比四、独立性检验1.2×2列联表设A,B为两个变量,每一变量都可以取两个值,得到表格其中,a表示变量A取A1,且变量B取B1时的数据,b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.上表在统计中称为2×2列联表.2.统计量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的.当χ2>2.706时,有90%的把握判定变量A,B有关联.当χ2>3.841时,有95%的把握判定变量A,B有关联.当χ2>6.635时,有99%的把握判定变量A,B有关联.类型一回归分析例1 如图所示的是某企业2011年至2017年污水净化量(单位:吨)的折线图.。
高中数学1.1独立性检验教案(1)(新人教B版选修1-2)

独立性检验(一)教学目标1. 通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;2. 利用统计量2χ来分析两个分类变量是否有关系;3. 利用独立性检验来准确反映两个分类变量有关系的可信程度。
教学重点独立性检验的基本方法教学难点领会独立性检验的基本思想教学过程一、问题情境问题:呼吸道疾病与吸烟是否有关?某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中有37人患呼吸道疾病,183人未患呼吸道疾病;不吸烟的295人中有21人患病,274人未患病。
根据这些数据能否断定:患呼吸道疾病与吸烟有关?二、学生活动组织学生分小组讨论,要求每个小组给出一套方案并说明理由。
三、建构数学1.2在吸烟的人中,有22037≈16.82%的人患病 在不吸烟的人中,有29521≈7.12%的人患病 从直观上可得出结论:吸烟者与不吸烟者患病的可能性存在差异。
反思:能有多大把握认为“患病与吸烟有关”呢?分析:相反的判断:“患病与吸烟没有关系”,即提出如下假设:0H :患病与吸烟没有关系用字母表示2×2列联表如果0H 成立,那么在吸烟的人中患病的比例应该与不吸烟的人中相应比例差不多,有dc c b a a +≈+ 即 ()()b a cd c a +≈+故 0≈-bc ad∴ bc ad -越小,患病与吸烟之间的关系就越弱;bc ad -越大,患病与吸烟之间的关系就越强。
2.卡方统计量()()()()()d b c a d c b a bc ad n ++++-=22χ (1) 其中d c b a n +++=为样本量若0H 成立,即“患病与吸烟没有关系”,则2χ的值应该很小。
利用(1),2χ=11.8634>6.635,而统计学明确的结论,在0H 成立的情况下,随机事件“2χ635.6≥”发生的概率约为0.01,即P (2χ635.6≥)01.0≈∴有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”。
2019最新高中数学 第1章 统计案例 1.1 独立性检验(1)学案 苏教版选修1-2

1.1 独立性检验[学习目标] 1.理解列联表的意义,会根据列联表中数据大致判断两个变量是否独立.2.理解统计量χ2的意义和独立性检验的基本思想.[知识链接]1.什么是列联表?怎样从列联表判断两个分类变量有无关系?答一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},列出两个变量的频数表,称为列联表(如下图):|ad-bc||ad-bc|越大,说明两个分类变量x、y之间的关系越强.2.统计量χ2有什么作用?答χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),用χ2的大小可判断事件A、B是否有关联.[预习导引]1.2×2列联表:一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A和类B,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:2.统计量χ2χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H 0:Ⅰ与Ⅱ没有关系; (2)根据2×2列联表计算χ2]的值; (3)查对临界值,作出判断.要点一 2×2列联表和χ2统计量 例1 根据下表计算:χ2≈________.(结果保留3答案 4.514解析 χ2=300×(37×143-85×35)2122×178×72×228≈4.514.规律方法 利用χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),准确代数与计算,求出χ2的值.跟踪演练1 已知列联表:药物效果与动物试验列联表则χ2≈________.(答案 6.109解析 χ2=105×(10×30-20×45)230×75×55×50≈6.109.要点二 独立性检验例2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.001的前提下认为人的性别与患色盲有关系吗? 解 由题意列出2×2列联表:由公式得χ2的观测值x 0=1000×(39×514-441×6)2480×520×45×955≈28.225.因为P (χ2≥10.828)≈0.001,且28.225>10.828,所以在犯错误的概率不超过0.001的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多.规律方法 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断. 跟踪演练2 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:解 假设H 0:海上航行和性别没有关系,χ2=71×(12×24-25×10)222×49×37×34≈0.08.因为χ2<2.706,所以我们没有理由认为男人比女人更容易晕船. 要点三 独立性检验的应用例3 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂(2)由以上统计数据填下面2×2列联表,并计算是否有99%的把握认为“两个分厂生产的零件的质量有差异”.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1000×(360×180-500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.规律方法 (1)解答此类题目的关键在于正确利用χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算χ2的值,再用它与临界值的大小作比较来判断假设检验是否成立,从而使问题得到解决. (2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.跟踪演练3 下表是某地区的一种传染病与饮用水的调查表:(1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异. 解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:χ2=830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以假设H 0不成立.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:此时,χ2=86×(5×2214×72×55×31≈5.785.由于5.785>5.024所以我们有97.5%的把握认为该种疾病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定结论的正确性.1.下面是一个2×2列联表:则表中a =________.b =答案 52 60解析 ∵a +21=73,∴a =52,b =a +8=52+8=60.2.为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如表所示的列联表,试根据表格中已有数据填空.③________;④________. 答案 86 180 229 301解析 最右侧的合计是对应行上的两个数据的和,由此可求出①和②;而最下面的合计是相应列上的两个数据的和,由刚才的结果可求得③④.3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号) ①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 答案 ③解析 对于①,99%的把握是通过大量的试验得出的结论,这100个吸烟的人中可能全患肺病也可能都不患,是随机的,所以①错;对于②,某人吸烟只能说其患病的可能性较大,并不一定患病;③的解释是正确的.4.为研究学生的数学成绩与学生学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:解 由公式得:χ2=189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握认为,学生学习数学的兴趣与数学成绩是有关的.1.独立性检验的思想:先假设两个事件无关,计算统计量χ2的值.若χ2值较大,则假设不成立,认为两个事件有关.2.独立性检验的步骤:(1)作出假设H 0:Ⅰ与Ⅱ没有关系;(2)计算χ2的值;(3)查对临界值,作出判断.一、基础达标1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”. 答案 90%2.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:则随机变量χ2的观测值约为________. 答案 0.600解析 根据列联表中的数据,可得随机变量χ2的观测值x 0=90×(11×37-34×8)245×45×19×71≈0.600.3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)①ad -bc 越小,说明X ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 答案 ③4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 答案 ③解析 根据独立性检验的定义,由χ2≈7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:则有________答案99.9%解析利用题中列联表,代入公式计算χ2=100×(50×25-10×15)265×35×60×40≈22.16>10.828,所以我们有99.9%的把握确定吸烟量与年龄有关.6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=-10×7)2 23×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.答案5%解析因为4.844>3.841,则有95%的把握认为两事件有关系,因此判断出错的可能性为5%. 7.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:(2)解(1)根据题表中数据可以得到列联表如下:(2)计算可知,午休的考生及格率为P1=180=9,不午休的考生的及格率为P2=65200=1340,则P1>P2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.二、能力提升8.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.答案 2解析由公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)中所有值变为原来的2倍,得(χ2)′=2n(2a·2d-2b·2c)2(2a+2b)(2c+2d)(2a+2c)(2b+2d)=2χ2,故χ2也变为原来的2倍.9.下列说法正确的是________.(填序号)①对事件A与B的检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B一定发生.答案②解析对于①,事件A与B的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错.②是正确的.对于③,判断A与B是否相关的方式很多,可以用列联表,也可以借助于概率运算,故③错.对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B一定发生,故④错.10.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H 0,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 答案 4.882 5%解析 由公式计算得χ2≈4.882>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.11.下表是关于男婴与女婴出生时间调查的列联表:那么,A =________,B =E =________. 答案 47 92 88 82 53解析 由列联表知识得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.12.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系.由表中数据得a =39,b =157,c =29,d =167,a +b =196,c +d =196,a +c =68,b +d =324,n =392,由公式得χ2=392×(39×167-157×29)2196×196×68×324≈1.779.因为χ2≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别. 三、探究与创新13.在某校高三年级一次全年级的大型考试的数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?解 列出数学成绩与物理成绩的2×2列联表如下:1x 1=1240×(228×737-132×143)2360×880×371×869≈270.1>10.828.列出数学成绩与化学成绩的2×2列联表如下:2x 2=1240×(225×724-156×135)2360×880×381×859≈240.6>10.828.列出数学成绩与总分成绩的2×2列联表如下:3x 3=1240×(267×781-93×99)2360×880×366×874≈486.1>10.828.由上面的分析知,χ2的观测值都大于10.828,说明在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系.。
(新)高中数学第一章统计案例1_1独立性检验概率论与数理统计公式整理素材新人教B版选修1-21

当 A=Ω时,P( B )=1- P(B)
定义 设 A、B 是两个事件,且 P(A)>0,则称 P( AB) 为事件 A 发生条件下,事 P( A)
件 B 发生的条件概率,记为 P(B / A) P( AB) 。 P( A)
条件概率是概率的一种,所有概率的性质都适合于条件概率。
其中
则称随机变量 X 服从参数为 n ,p 的二项分布。记为 X ~ B(n, p) 。
当 n 1时, P( X k) p k q1k , k 0.1,这就是(0-1)分布,
所以(0-1)分布是二项分布的特例。
泊松分布
设随机变量 X 的分布律为 k 0,1,2,
P(X k) k e , 0 , k!
3° F() lim F(x) 0, F() lim F(x) 1;
x
x
4° F(x 0) F(x) ,即 F(x) 是右连续的;
5° P(X x) F(x) F(x 0) 。
对 于 离 散 型 随 机 变 量 , F(x) pk ; 对 于 连 续 型 随 机 变 量 , xk x
的事件。互斥未必对立。 ②运算:
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C 分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)
(7)概率
Ai Ai
德摩根率: i1
i 1
AB AB,AB AB
设 为样本空间, A 为事件,对每一个事件 A 都有一个实数 P(A),若满
1° B1, B2 ,…, Bn 两两互不相容, P(Bi) >0, i 1,2,…, n ,
(16)贝叶 斯公式
人教版2019学年高中数学第一章统计案例章末复习同步学案新人教B版选修1_2

第一章统计案例章末复学目 1. 理解独立性的基本思想及施步.2. 会求回直方程,并用回直行.1.2× 2 列表2× 2 列表如表所示:B B合A n n n+11121A n21n22n2+合n+1n+2n其中+ 1=11+21,+2= 12+22,n n n n n nn 1+11122+2122= n + n, n= n +n,n=n11+ n21+ n12+ n22. 2.最小二乘法于一数据 ( x i,y i ) ,i= 1,2,⋯, n,若是它性有关,回直方程^ ^y= b x+^^=!,!=!-!! .a,其中 b=!3.独立性常用量χ2= ! 来两个量可否有关系.型一独立性例 1认识某班学生喜打球可否与性有关,本班48 人行了卷获取了以下的2× 2 列联表:喜爱打篮球不喜爱打篮球共计男生6女生10共计482.已知在全班48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为3(1)请将上面的 2× 2 列联表补充完满; ( 不用写计算过程 )(2)可否在出错误的概率不高出 0.05 的前提下认为喜爱打篮球与性别有关?说明你的原因.考点独立性查验及其基本思想题点独立性查验的综合应用解(1) 列联表补充以下:喜爱打篮球不喜爱打篮球共计男生22628女生101020共计321648(2) 由χ2=错误 ! ≈ 4.286.由于 4.286>3.841 ,因此能在出错误的概率不高出0.05 的前提下认为喜爱打篮球与性别有关.反省与感悟经过公式χ 2=错误!计算出χ 2的值,再与临界值作比较,最后得出结论.追踪训练 1 奥运会期间,为检查某高校学生可否愿意供应志愿者服务,用简单随机抽样方法从该校检查了 60 人,结果以下:可否愿意供应志愿者服务愿意不愿意性别男生2010女生1020(1) 用分层抽样的方法在愿意供应志愿者服务的学生中抽取 6 人,其中男生抽取多少人?(2) 你可否在出错误的概率不高出的前提下认为该高校学生可否愿意供应志愿者服务与性别有关?下面的临界值表供参照:20P(χ ≥ x )x0考点独立性查验思想的应用题点独立性查验在分类变量中的应用20解(1) 由题意,可知男生抽取6×20+10=4( 人).(2) χ2=错误 ! ≈ 6.667 ,由于 6.667 > 6.635 ,因此能在出错误的概率不高出0.01 的前提下认为该高校学生可否愿意供应志愿者服务与性别有关.种类二线性回归剖析例 2某城市理论展望2010 年到 2014年人口总数与年份的关系如表所示:年份 201x( 年)01234人口数 y(十万)5781119(1)请画出上表数据的散点图;^^^(2) 请依照上表供应的数据,求出y 对于 x 的回归直线方程y=b x+a;(3) 据此估计2019 年该城市人口总数.考点回归剖析思想的应用题点回归剖析思想的应用解 (1) 散点图如图:(2) 由于x=0+ 1+2+3+4= 2,5y =5+ 7+ 8+11+ 19= 10,55i i=0× 5+1× 7+2× 8+3×11+4×19= 132,x yi = 15x2i = 02+ 12+ 22+ 32+ 42= 30,i = 1^132-5×2×10=3.2 ,因此 b=30-5×22^^x =3.6.a=y- b^因此回归直线方程为y= x+3.6.^(3) 令x= 9,则 y=3.2 × 9+ 3.6 = 32.4 ,故估计 2019 年该城市人口总数为32.4( 十万 ) .反省与感悟解决回归剖析问题的一般步骤(1)画散点图.依照已知数据画出散点图.(2)判断变量的有关性并求回归方程.经过察看散点图,直观感知两个变量可否拥有有关关系;在此基础上,利用最小二乘法求回归系数,尔后写出回归方程.(3)本质应用.依照求得的回归方程解决实责问题.追踪训练2某运动员训练次数与运动成绩之间的数据关系以下:次数 x3033353739444650成绩 y3034373942464851(1)作出散点图;(2)求出回归直线方程;(3)计算有关系数并进行有关性查验;(4) 试展望该运动员训练47 次及 55 次的成绩.解(1) 作出该运动员训练次数x 与成绩 y 之间的散点图,以以下列图,由散点图可知,它们之间拥有线性有关关系.(2)列表计算:次数 x i成绩 y i x i2y i2x i y i30309009009003334 1 089 1 156 1 1223537 1 225 1 369 1 2953739 1 369 1 521 1 4433942 1 521 1 764 1 6384446 1 936 2 116 2 0244648 2 116 2 304 2 2085051 2 500 2 601 2 550由上表可求得8x = 39.25 , y =40.875 ,∑x i2= 12 656 ,i= 188x i y i=13 180,∑y i2=13 731,∑i = 1i = 18xiyi- 8x y^∑^^i = 1,∴ b=≈ 1.041 5 , a = y- b x =- 0.003 88 82∑ x2i - 8 xi = 1∴回归直线方程为y =1.041 5 - 0.003 88.x(3)计算有关系数 r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的有关关系.(4) 由上述剖析可知,我们可用回归直线方程y=1.041 5 x-0.003 88作为该运动员成绩的预告值.将 x=47和 x=55分别代入该方程可得y≈49和 y≈57.故展望该运动员训练47 次和 55次的成绩分别为49 和 57.1.从某地域老人中随机抽取500 人,其生活可否自理的情况以下表所示,则()性别人数男女生活可否自理能178278不能够2321A. 有 95%的掌握认为老人生活可否自理与性别有关B.有 99%的掌握认为老人生活可否自理与性别有关C.没有充足原因认为老人生活可否自理与性别有关D.以上都不对考点独立性查验及其基本思想题点独立性查验的思想答案C剖析经计算,得χ 2=错误 !≈2.925<3.841 ,故我们没有充足的原因认为老人生活可否自理与性别有关.2.“回归”一词是在研究子女的身高与父亲母亲的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.依照他的结论,在儿子的身高y 与父亲的^ ^ ^^)身高 x 的回归直线方程 y=b x+a中,b的值(A.在 ( - 1,0) 内B.等于 0C.在 (0,1) 内D.在 [1 ,+∞ ) 内考点线性回归剖析题点回归直线方程的应用答案C剖析子代平均身高向中心回归,^b应为正的真分数,应选 C.3.四名同学依照各自的样本数据研究变量x, y 之间的有关关系,并求得回归方程,分别获取以下四个结论:^① y 与 x 负有关且y= x-;^② y 与 x 负有关且y=- x+;③ y 与 x ^;正有关且 y = 5.437 x +④ y 与 x^x -4.578.正有关且 y =-其中必然不正确的结论的序号是()A .①②B .②③C .③④D .①④考点 线性回归剖析题点 回归直线方程的应用答案 D剖析①中,回归方程中 x 的系数为正,不是负有关;④中,回归方程中x 的系数为负,不是正有关,因此①④必然不正确.^ ^^时,对应的 y 的估计值是 17,当 x = 8 时,对应 4.对于回归直线方程 y = b x + a ,当 x = 3 的 y 的估计值是 22,那么,该回归直线方程是 ________,依照回归直线方程判断当x =________时, y 的估计值是 38. 考点 线性回归剖析题点 回归直线方程的应用答案 ^y = x +14 24剖析第一把两组值代入回归直线方程,得^^^3b + a = 17,b = 1,^ 解得^^8b + a = 22, a = 14.^因此回归直线方程是y = x + 14.令 x + 14= 38,可得 x = 24,即当 x = 24 时, y 的估计值是 38.1.成立回归模型的基本步骤(1) 确定研究对象,明确哪个变量是自变量,哪个变量是因变量. (2) 画出散点图,察看它们之间的关系. (3) 由经验确定回归方程的种类.(4) 依照必然的规则估计回归方程中的参数.2.独立性查验是对两个分类变量间可否存在有关关系的一种案例剖析方法 .一、选择题1.当χ2>3.841 时,认为事件A与事件 B()A.有 95%的掌握有关B.有 99%的掌握有关C.没有原因说它们有关D.不确定答案 A2.下表显示出样本中变量y 随变量 x 变化的一组数据,由此判断它最可能是() x45678910y14181920232528A. 线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型考点回归剖析题点成立回归模型的基本步骤答案A剖析画出散点图 ( 图略 ) 能够获取这些样本点在某一条直线上或在该直线周边,故最可能是线性函数模型.3.下表是某厂1~ 4 月份用水量 ( 单位:百吨 ) 的一组数据:月份 x1234用水量 y43由散点图可知,用水量y 与月份 x 之间有较好的线性有关关系,其回归直线方程是^y=-^^)0.7 x+ a,则 a等于 (A.10.5 B.5.15 C. 5.2 D .考点回归直线方程题点样本中心点的应用答案D^剖析样本点的中心为(2.5,3.5),将其代入回归直线方程可解得a=5.25.4.据统计,用于数学学习的时间( 单位:小时 ) 与成绩 ( 单位:分 ) 近似于线性有关关系,对某小组每周用于数学学习时间x 与数学成绩y 进行数据收集如表:x1516181922y10298115115120由表中样本数据求回归直线方程^ ^ ^^ ^y=110的地址关系y= bx+a,则点(a,b)与直线 x+18为 ()A.点在直线左侧B.点在直线右侧C.点在直线上D.无法确定考点回归直线方程题点样本点中心的性质答案C剖析由题意知 x =18, y =110,样本点中心为^ (18,110) 在回归直线上,故 110= 18b+^^ ^a,即点( a, b)在直线上.5.某察看团对全国 10 大城市进行员工人均薪水水平x(单位:千元)与居民人均花销水平y(单位:千元)统计检查, y 与 x 拥有线性有关关系,回归直线方程为^y= 0.66 x+ 1.562.若某城市居民人均花销水平为7.675 千元,估计该城市人均花销额占人均薪水收入的百分比约为 ()A.83% B . 72% C.67% D .66%考点线性回归剖析题点回归直线方程的应用答案A剖析将 y=代入回归直线方程,可计算得x≈9.26 ,因此该城市人均花销额占人均薪水收入的百分比约为7.675 ÷9.2 6≈0.83 ,即约为83%.6.已知变量x和y知足关系y=- 0.1 x+1,变量y与z正有关.以下结论中正确的选项是() A.x与y正有关,x与z负有关B.x与y正有关,x与z正有关C.x与y负有关,x与z负有关D.x与y负有关,x与z正有关考点线性回归剖析题点回归直线方程的应用答案C剖析由于y =-+ 1,- 0.1<0 ,因此x与y负有关.又y与z正有关,故可设z=xay+ b( a>0),因此 z=- ax+a+ b,- a<0,因此 x 与 z 负有关.应选 C.二、填空题7.已知x与y之间的一组数据:x0246y a353a已求得对于 y 与 x 的回归直线方程为考点线性回归剖析题点回归直线方程的应用答案^y = x+,则 a=________.剖析x =3, y = a+2,将(3, a+2)代入方程,得a+2=+,解得 a=2.15. 8.某工厂为了新研发的一种产品进行合理订价,将该产品按起初拟订的价钱进行试销,获取以下数据:单位 x(元)456789销量 y(件)908483807568由表中数据,求得回归直线方程为^^y=- 4x+a,若在这些样本点中任取一点,则它在回归直线左下方的概率为________.考点线性回归剖析题点回归直线方程的应用答案1 3剖析由表中数据得 x = 6.5 , y =^^^ 80,由点 ( x , y ) 在直线y=- 4x+a上,得a=106,即回归直线方程为^x+106,经过计算只有点(9,68)和(5,84)在直线的左下y =-42 1方,故所求概率为= .6 39.某工厂为了检查工人文化程度与月收入之间的关系,随机检查了部分工人,获取以下表所示的 2× 2 列联表 ( 单位:人 ) :月收入 2 000 元以下月收入 2 000元及以上总计高中文化以上104555高中文化及以下203050总计3075105由 2× 2 列联表计算可知,我们有 ________以上的掌握认为“文化程度与月收入有关系”.P(χ2≥ x0)x0考点独立性查验及其基本思想题点独立性查验的方法答案97.5%2剖析由表中的数据可得χ =错误!≈ ,因此我们有97.5%以上的掌握认为“文化程度与月收入有关系”.10.某医疗研究所为了查验某种血清预防感冒的作用,把500 名使用血清的人与其他500名未使用血清的人一年中的感冒记录作比较,提出假定H0:“这种血清不能够起到预防感22冒的作用”,利用 2× 2 列联表计算得χ ≈ ,经查临界值表知P(χ ≥3.841)≈0.05.①在出错误的概率不高出5%的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%.考点独立性查验及其基本思想题点独立性查验的方法答案①剖析查临界值表知P(χ2≥3.841)≈,故有95%的掌握认为“这种血清能起到预防感冒的作用” .95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100 个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.三、解答题11.某城区为研究城镇居民家庭月人均生活费支出和月人均收入的有关关系,随机抽取10户进行检查,其结果以下:月人均收入x(元)300390420520570月人均生活费y(元)255324335360450月人均收入x(元)700760800850 1 080月人均生活费y(元)520580*********(1)作出散点图;(2)求出回归直线方程;(3) 试展望月人均收入为 1 100 元和月人均收入为 1 200 元的两个家庭的月人均生活费.考点题点解 (1) 作出散点图以以下列图,由图可知月人均生活费与月人均收入之间拥有较强的线性有关关系.(2) 经过计算可知x =639, y =480.4 ,10∑ x i2=4 610 300i =110,∑ x y =3 417 560,i = 1 i i10xiyi- 10 x y^∑^^i = 1,∴ b =≈ 0.659 9 , a= y - b x =58.723 9 10x2∑ x2i - 10i = 1∴回归直线方程为^=0.659 9 x+ 58.723 9. y(3)由以上剖析可知,我们能够利用线性回归方程^y = 0.659 9 x+ 58.723 9来计算月人均生活费的展望值.将 x=1 100代入,得 y≈,将 x=1 200代入,得 y≈850.60.故展望月人均收入分别为 1 100 元和 1 200 元的两个家庭的月人均生活费分别为元和 850.60 元.12.某公司有两个分厂生产某种零件,按规定内径尺寸( 单位:mm)的值落在 [29.94,30.06)的零件为优秀品.从两个分厂生产的零件中各抽出了500 件,量其内径尺寸,得结果如下表:甲厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数12638618292614乙厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数297185159766218(1)试分别估计两个分厂生产的零件的优秀品率;(2) 由以上统计数据填写下面的2× 2 列联表,并问可否在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别”?甲厂乙厂共计优秀品非优秀品共计考点独立性查验及其基本思想题点独立性查验的方法360解(1) 甲厂抽查的产品中有360 件优秀品,进而甲厂生产的零件的优秀品率估计为=500 72%;乙厂抽查的产品中有'320 件优秀品,进而乙厂生产的零件的优秀品率估计为320= 64%. 500(2)2 × 2 列联表以下:甲厂乙厂共计优秀品360320680非优秀品140180320共计5005001 000χ2=错误 ! ≈ 7.353>6.635 ,因此在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别.”四、研究与拓展13.某校高一年级理科有 8 个班,在一次数学考试中成绩情况剖析以下:班级12345678大于 145 分的人数66735337不大于 145 分的人数3939384240424238附:88∑x i y i=171,∑ x i2=204.i = 1i = 1求 145 分以上人数y 对班级序号x 的回归直线方程.( 精准到 0.000 1)考点独立性查验思想的应用题点独立性查验与回归直线方程、希望的综合应用解x = 4.5 , y =88i2= 204,5,∑i i =171,∑i=1x y i =1x8- 8 x y^∑ xiyi171-8×4.5 ×5i = 1=b=8204-8×x2i-8 x 2∑i = 13=-14≈- 0.214 3 ,^^×4.5≈ 5.964 4 ,a= y -b x =5- ( -0.214 3)^∴回归直线方程为y=- 0.214 3 x+ 5.964 4.。
高中数学第1章统计案例1.1独立性检验学案新人教B版选修1_2

1.1 独立性检验一、独立事件 1.独立事件的定义一般地,对于两个事件A ,B ,如果有P (AB )=P (A )P (B ),则称事件A 与B 相互独立,简称A 与B 独立.2.如果事件A ,B 相互独立,则A 与B ,A 与B ,A 与B 也相互独立. 二、2×2列联表与χ2统计量的计算公式 1.对于两个事件A ,B ,用下表表示抽样数据表中:n +1=n 11+n 21,+2=n 12+n 22,1+=n 11+n 12,2+=n 21+n 22,=n 11+n 21+n 12+n 22. 形如此表的表格为2×2列联表.2.统计量χ2的计算公式χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.三、独立性检验思想1.用H 0表示事件A 与B 独立的判定式,即H 0:P (AB )=P (A )P (B ),称H 0为统计假设.2.用χ2与其临界值3.841与6.635的大小关系来决定是否拒绝统计假设H 0,如下表:1.判断(正确的打“√”,错误的打“×”)(1)甲、乙两人分别对一目标射击一次,记“甲射击一次击中目标”为事件A ,“乙射击一次击中目标”为事件B ,则事件A 与事件B 是相互独立事件.(2)在使用χ2统计量作2×2列联表的独立性检验时,要求表中的4个数据可以是任意的.( ) (3)当χ2>3.841认为两事件有99%的关系.( )[解析] (1)根据题意,“甲的射击”与“乙的射击”没有关系,是相互独立. (2)由2×2列联表知,每表中的4个数据大于等于5.(3)由临界值知,当χ2>3.841时有95%的把握认为两事件有关. [答案] (1)√ (2)× (3)× 2.下面是一个2×2列联表:A .94,96B .52,50C .52,60D .54,52[解析] ∵a +21=73,∴a =52. 又b =a +8=52+8=60. [答案] C3.甲、乙两人分别独立地解一道题,甲做对的概率是12,甲、乙都做错的概率是16,则乙做对的概率是_______________.[解析] 设“甲、乙做对”分别为事件A ,B ,则P (A )=12,P (A B )=16,由P (A B )=(1-P (A ))·(1-P (B )), 得⎝ ⎛⎭⎪⎫1-12·()1-P (B )=16,解得P (B )=23. [答案] 23一粒,求:(1)两粒都能发芽的概率; (2)至少有一粒种子能发芽的概率; (3)恰好有一粒种子能发芽的概率.[思路探究] 甲(或乙)中的种子是否发芽对乙(或甲)中的种子是否发芽的概率是没有影响的,故“甲批种子中某粒种子发芽”与“乙批种子中某粒种子发芽”是相互独立事件.因此可以求出这两个事件同时发生的概率.对于(2)(3)应把符合条件的事件列举出来或考虑其对立面.[解] 设以A ,B 分别表示“取自甲、乙两批种子中的某粒种子发芽”这一事件,A -,B -则表示“取自甲、乙两批种子中的某粒种子不发芽”这一事件,则P (A )=0.8,P (B )=0.7,且A ,B 相互独立,故有(1)P (AB )=P (A )P (B )=0.8×0.7=0.56, 故两粒都能发芽的概率为0.56. (2)法一:P (A ∪B )=P (A )+P (B )-P (AB ) =0.8+0.7-0.56=0.94.法二:至少有一粒种子能发芽的对立事件为两粒种子都不发芽,即P (A ∪B )=1-P (A - B -)=1-P (A -)P (B -) =1-(1-0.8)×(1-0.7)=0.94. 故至少有一粒种子能发芽的概率为0.94. (3)P (A B -∪A -B )=P (A B -)+P (A -B ) =0.8×(1-0.7)+(1-0.8)×0.7=0.38. 故恰好有一粒种子能发芽的概率为0.38.1.求解简单事件概率的思路:(1)确定事件间的关系,即两事件是互斥事件还是对立事件; (2)判断事件发生的情况并列出所有事件;(3)确定是利用和事件的概率公式还是用积事件的概率公式计算. 2.求解复杂事件概率的思路:(1)正向思考:通过“分类”或“分步”将较复杂事件进行分解,转化为简单的互斥事件的和事件或相互独立的积事件;(2)反向思考:对于含有“至少”“至多”等事件的概率问题,可转化为求其对立事件的概率.1.甲、乙、丙三位学生用计算机联网学习数学,每天独立完成6道数学题,已知甲及格的概率是810,乙及格的概率是610,丙及格的概率是710,三人各答一次,求三人中只有一人答题及格的概率是多少?[解] 设“甲、乙、丙三人答题及格”分别为事件A ,B ,C ,则P (A )=810,P (B )=610,P (C )=710,设“三人各答题一次只有一人及格”为事件D ,则D 的情况为A B C ,A -B C -,A-B -C ,所以P (D )=P (A B -C -)+P (A -B C -)+P (A B C )=P (A )P (B -)P (C -)+P (A -)P (B )P (C -)+P (A -)P (B -)·P (C )=810×⎝ ⎛⎭⎪⎫1-610⎝ ⎛⎭⎪⎫1-710+⎝ ⎛⎭⎪⎫1-810×610×⎝ ⎛⎭⎪⎫1-710+⎝ ⎛⎭⎪⎫1-810⎝ ⎛⎭⎪⎫1-610×710=47250.六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用n 11n 1+与n 21n 2+判断二者是否有关系. [思路探究] 对变量进行分类→求出分类变量的不同取值 →作出2×2列联表→计算n 11n 1+与n 21n 2+的值作出判断 [解] 饮食习惯与年龄2×2列联表如下:n11 n1+=4364≈0.67.n21 n2+=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.1.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?[提示]利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?[提示]两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.【例3】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.[思路探究] 题中给出了2×2列联表,从而可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.[解] (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)χ2=500×(40×270-30×160)270×430×200×300≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法进行抽样,这比采用简单随机抽样方法更好.1.检验两个变量是否相互独立,主要依据是利用χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2公式计算χ2的值,再利用该值与3.841,6.635两个值进行比较作出判断.2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.2.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:面有差异”.[解] 将2×2列联表中的数据代入公式计算,得χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2=100×(60×10-20×10)280×20×70×30=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.1.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2≈8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )A .0.1%B .1%C .99%D .99.9%[解析] 因为χ2≈8.01>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.[答案] C2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有[解析] 独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.[答案] D3.有两个分类变量X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为“X 与Y 有关系”犯错误的概率为( )A .95%B .90%C .5%D .10%[解析] P (χ2≥3.841)≈0.05,而χ2≈4.523>3.841.这表明认为“X 与Y 有关系”是错误的可能性约为0.05,即认为“X 与Y 有关系”犯错误的概率为5%.[答案] C4.甲、乙两人分别对一目标射击一次,记“甲射击一次,击中目标”为事件A ,“乙射击一次,击中目标”为事件B ,则在A 与B ,A 与B ,A 与B ,A 与B 中,满足相互独立的有________对.[解析]由已知:A与B相互独立,则A与B,A与B,A与B均相互独立,故有4对.[答案] 45.已知甲、乙两袋中分别装有编号为1,2,3,4的四个小球,现从两袋中各取一球,设事件A=“两球的编号都是偶数”,B=“两球的编号之和大于6”.判断事件A,B是否相互独立.[解]P(A)=416=14,P(B)=316.又AB=“两球的编号都为4”,P(AB)=116. 显然P(AB)≠P(A)P(B),所以事件A,B不相互独立.。
高中数学1.1独立性检验教案(2)(新人教B版选修1-2)

独立性检验(二)
教学目标
进一步掌握利用独立性检验来定量分析两个分类变量是否有关系,并能利用随机变量2χ来确定日常生活中有关问题。
教学重点
一、复习回顾,(师生互动)
1.2×2列联表
2.2χ统计量的含义及作用
3.独立性检验的步骤
二、数学运用
1.例题
例1.(课本P 8例2)
例2.(课本P 9例3)
2.练习
(1)课本P 9练1第1.2.3题。
(2)某班主任对全班20名学生进行了喜欢玩电脑游戏与认为作业量多少的调查,发现喜欢玩电脑游戏的学生中认为作业多的有8人,认为作业不多的4人,在不喜欢玩电脑游戏的学生中认为作业多的有2人,认为作业不多的有6人,试判断喜欢玩电脑游戏与认为作业多是否有关系?
解:假设0H :喜欢玩电脑游戏与认为作业量多没有关系:
2χ706.2333.310
10812)2468(202
>≈⨯⨯⨯⨯-⨯⨯= ∴当0H 成立时,333.32≥χ的概率小于10%
∴有90%的把握认为“喜欢玩电脑游戏与认为作业多”有关系。
三、回顾小结
四、作业
课本P 9习题1.1 第3.4题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§1.1 独立性检验学习目标 1.理解2×2列联表的意义,会依据列联表中数据判断两个变量是否独立.2.掌握统计量χ2的意义和独立性检验的基本思想.知识点一 2×2列联表和统计量χ21.2×2列联表一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值类A 和类B ,Ⅱ也有两类取值类1和类2,得到如下列联表所示的抽样数据:上述表格称为2×2列联表. 2.统计量χ2χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2,其中n =n 11+n 12+n 21+n 22.知识点二 独立性检验 独立性检验要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行: (1)作2×2列联表;(2)根据2×2列联表计算χ2的值; (3)查对临界值,作出判断.1.事件A 与B 的独立性检验无关,即两个事件互不影响.( × ) 2.χ2的大小是判断事件A 与B 是否相关的统计量.( √ )3.列联表中的数据是两个分类变量的频数.( √)类型一2×2列联表和χ2统计量命题角度1 2×2列联表及应用例1 为了解人们对于国家新颁布的“生育二孩放开”政策的热度,现在某市进行调查,随机抽调了50人,他们年龄的频数分布及支持“生育二孩放开”人数如下表:由以上统计数据填下面2×2列联表:考点分类变量与列联表题点求列联表中的数据解2×2列联表如下:反思与感悟准确理解给定信息,找准分类变量,然后依次填入相应空格内数据.跟踪训练1 某校高二年级共有1 600名学生,其中男生960名,女生640名,该校组织了一次满分为100分的数学学业水平模拟考试.根据研究,在正式的学业水平考试中,本次成绩在[80,100)的学生可取得A等(优秀),在[60,80)的学生可取得B等(良好),在[40,60)的学生可取得C等(合格),不到40分的学生只能取得D等(不合格).为研究这次考试成绩优秀是否与性别有关,现按性别采用分层抽样的方法抽取100名学生,将他们的成绩按从低到高分成[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),七组加以统计,绘制成如图所示的频率分布直方图.(1)估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数;(2)请你根据已知条件将下列2×2列联表补充完整.考点分类变量与列联表题点求列联表中的数据解(1)设抽取的100名学生中,本次考试成绩不合格的有x人,根据题意得x=100×[1-10×(0.006+0.012×2+0.018+0.024+0.026)]=2.据此估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数为2100×1 600=32.(2)根据已知条件得2×2列联表如下:命题角度2 χ2统计量及计算 例2 根据下表计算:则χ2≈________.(保留3位小数) 考点 定性分析的两类方法 题点 利用列联表定性分析 答案 4.514解析 χ2=300×(37×143-85×35)2122×178×72×228≈4.514.反思与感悟 列联表中的数据信息与χ2统计量之间的关系要对应,其次,需对“卡方”公式的结构有清醒的认识. 跟踪训练2 已知列联表:药物效果与动物试验列联表则χ2≈________.(结果保留3位小数) 考点 定性分析的两类方法 题点 利用列联表定性分析 答案 6.109解析 χ2=105×(10×30-20×45)230×75×55×50≈6.109.类型二 独立性检验例3 某班主任对班级50名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的26人中,有20人认为作业多,6人认为作业不多;在不喜欢玩电脑游戏的24人中,有7人认为作业多,17人认为作业不多. (1)根据以上数据建立一个2×2列联表;(2)试问喜欢玩电脑游戏与认为作业多少是否有关系? 考点 独立性检验及其基本思想 题点 独立性检验的思想解 (1)根据题中所给数据,得到如下列联表:(2)由公式得χ2=50×(20×17-7×6)226×24×27×23≈11.458.∵11.458>6.635,∴有99%的把握认为喜欢玩电脑游戏与认为作业多少有关.反思与感悟 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断. 跟踪训练3 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:根据此资料,你是否认为在2~3级风的海上航行中男人比女人更容易晕船? 考点 独立性检验及其基本思想 题点 独立性检验的思想解 由公式得χ2=71×(12×24-25×10)222×49×37×34≈0.08.因为χ2<3.841,所以我们没有理由认为男人比女人更容易晕船.1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A .94,96 B .52,50 C .52,59D .59,52考点 分类变量与列联表 题点 求列联表中的数据 答案 C解析 ∵a +21=73,∴a =52,b =a +7=52+7=59.2.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:根据表中数据得到χ2=775×(20×445-10×300)230×745×320×455≈8.290,因为χ2>6.635,则断定秃发与患心脏病有关系,那么这种判断出错的可能性为( ) A .0.1 B .0.05 C .0.025 D .0.01 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D解析 因为χ2>6.635,所以有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性为1-0.99=0.01.3.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有考点独立性检验及其基本思想题点独立性检验的方法答案 D解析独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据包括________________________________________________________________________________________________________________________________________________.考点独立性检验及其基本思想题点独立性检验的方法答案女正教授人数、男正教授人数、女副教授人数、男副教授人数5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.(1)计算a,b,c的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?考点独立性检验及其基本思想题点独立性检验的方法解 (1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)根据表中数据计算得χ2=913×(478×24-399×12)2490×423×877×36≈6.233>3.841,所以有95%的把握认为文科学生总成绩不好与数学成绩不好有关系.1.利用χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2求出χ2的值,再利用临界值的大小来判断假设是否成立.2.解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.一、选择题1.在2×2列联表中,四个变量的取值n 11,n 12,n 21,n 22应是( ) A .任意实数 B .正整数 C .大于5的整数 D .非负整数考点 分类变量与列联表 题点 求列联表中的数据 答案 C2.如果有99%的把握认为“x 与y 有关系”,那么χ2满足( ) A .χ2>6.635 B .χ2≥5.024 C .χ2≥7.879D .χ2>3.841考点 独立性检验思想的应用 题点 独立性检验在分类变量中的应用 答案 A3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A .若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 C4.根据下面的列联表得到如下四个判断:①有95%的把握认为“患肝病与嗜酒有关”;②有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.其中正确命题的个数为( ) A .0 B .1 C .2 D .3 考点 分类变量与列联表 题点 求观测值 答案 C解析 由列联表中数据可求得χ2=992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即有99%的把握认为“患肝病与嗜酒有关系”.因此②③正确,故选C.5.在2×2列联表中,两个分类变量有关系的可能性越大,相差越大的两个比值为( ) A.n 11n 11+n 12与n 21n 21+n 22 B.n 11n 21+n 22与n 21n 11+n 12 C.n 11n 11+n 22与n 21n 12+n 21D.n 11n 12+n 22与n 21n 11+n 21考点 分类变量与列联表 题点 求列联表中的数据 答案 A解析 以表格为例,事件B 发生与A 相关性越强,则两个频率n 11n 1+与n 21n 2+相差越大. 6.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:则统计量χ2约为( )A .0.600B .0.828C .2.712D .6.004 考点 分类变量与列联表 题点 求观测值 答案 A解析 根据列联表中的数据,可得χ2=90×(11×37-34×8)245×45×19×71≈0.600.故选A.二、填空题7.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________.(填序号)①若统计量χ2=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.考点独立性检验及其基本思想题点独立性检验的方法答案③解析统计量χ2是支持确定有多大的把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.8.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:设H0:服用此药的效果与患者的性别无关,则统计量χ2≈________(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.考点独立性检验及其基本思想题点独立性检验的方法答案 4.882 5%解析由公式计算得统计量χ2≈4.882,∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性判断出错.9.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有________的把握认为年龄与西班牙队的被喜欢程度有关. 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙的人”为事件A , 由已知得P (A )=q +35100=35, 所以p =25,q =25,a =40,b =60.χ2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841.故有95%的把握认为年龄与西班牙队的被喜欢程度有关.10.某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为 4.844>3.841.所以选修统计专业与性别有关系,那么这种判断出错的可能性为________.考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 5% 三、解答题11.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)判断性别与休闲方式是否有关系. 考点 定性分析的两类方法 题点 利用列联表定性分析 解 (1)列联表如下:(2)χ2=124×(43×33-27×21)270×54×64×60≈6.201,∵χ2>3.841,∴有95%的把握认为性别与休闲方式有关. 四、探究与拓展12.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:进行统计分析时的统计假设是________. 考点 独立性检验及其基本思想 题点 独立性检验答案 小白鼠的死亡与剂量无关解析 根据独立性检验的基本思想可知,类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关”.13.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到9号或10号的概率. 考点 题点解 (1)由题意知,优秀的概率P =311,故优秀人数为30,故2×2列联表如下:(2)根据列联表中的数据,得到χ2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.(3)设“抽到9或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),所有的基本事件有(1,1),(1,2),(1, 3),…,(6,6),共36个.事件A包含的基本事件有(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4),共7个.所以P(A)=736,即抽到9号或10号的概率为736.。