统计案例之独立性检验
【高二统计案例(2)】独立性检验

独立性检验1. 在2013年某大学生运动会期间,某网站针对是否观看大学生运动会的情况进行了一项问卷调查,得出如下表格:(附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d) 则K 2=( )A. 700B. 750C. 800D. 8502. 春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是( )A. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”3.附表:由K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),计算得K 2=____________ 参照附表,得到的正确结论为( )A. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C. 有97.5%以上的把握认为“是否爱吃零食与性别有关”D. 有97.5%以上的把握认为“是否爱吃零食与性别无关”第2页,共7页4.由表中数据计算得到K 的观测值k ≈5.059,于是(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.5. 101目的110名观众,得到如下列联表:则有 的把握认为“喜爱该节目与性别有关”.6. 如图是一个2×2列联表,则m+n 的值为 .7. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得则有 的把握认为“喜爱该节目与性别有关”.8. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).在犯错误的概率不超过______的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.独立性检验一、选择题(本大题共3小题,共15.0分)9.在2013年某大学生运动会期间,某网站针对是否观看大学生运动会的情况进行了一项问卷调查,得出如下表格:)(附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)则K2=()A. 700B. 750C. 800D. 850【答案】B【解析】【分析】即可求解;本题考查独立性检验,属于基础题型,代入K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)【解答】解:由题意得K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=750.=12000×(6000×2000−2000×2000)28000×4000×8000×4000故选B.10.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K2=n(ad−bc)2参照附表,得到的正确结论是()(a+b)(c+d)(a+c)(b+d)A. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B. 在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D. 有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【答案】C第4页,共7页【解析】【分析】本题考查独立性检验,基础题由公式可计算K 2的观测值k ,与临界值表中的临界值进行比较,即可得答案.【解答】解:由公式可计算K 2的观测值 k =n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100(45×15−30×10)255×45×75×25≈3.03>2.706,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”, 故选C .11.附表:由K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),计算得K 2=100(10×30−20×40)250×50×30×70≈4.762.参照附表,得到的正确结论为( )A. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B. 在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C. 有97.5%以上的把握认为“是否爱吃零食与性别有关”D. 有97.5%以上的把握认为“是否爱吃零食与性别无关” 【答案】A【解析】【分析】本题主要考查独立性检验知识,属于基础题.独立性检验是在犯错的概率不超过多少时认为“是否爱吃零食与性别有关” K 2≈4.762>3.841而P(K 2≥3.841)=0.05,即可得到答案. 【解答】解:因为K 2≈4.762>3.841,P(K 2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”, 故选A .二、填空题(本大题共8小题,共40.0分)12. 公元五世纪张丘建所著《张丘建算经》卷中第22题为:“今有女善织,日益功疾,初日织五尺,今一月日织九匹三丈,问日益几何”.题目的意思是:有个女子善于织布,一天比一天织得快(每天增加的数量相同),已知第一天织布5尺,一个月(30天)共织布9匹3丈,则该女子每天织布的增加量为 尺.(1匹=4丈,1丈=10尺) 【答案】1629【解析】【分析】本题考查了等差数列的求和.设每天织布的尺数成等差数列{a n },公差为d ,利用等差数列的求和公式即可得出.【解答】解:设每天织布的尺数成等差数列{a n},公差为d,d=390,则5×30+30×292解得d=16.29.故答案为162913.在平面直角坐标系xOy中,抛物线y2=8x的焦点坐标为________.【答案】(2,0)【解析】【分析】本题考查抛物线的几何性质,是容易题.=2即可得解.根据题意,确定抛物线的对称轴和开口方向,求出p2【解答】解:在y2=8x中,2p=8,即p=4,=2.所以,p2又抛物线的焦点在x轴上,且开口向右,故抛物线的焦点坐标为(2,0).答案为(2,0).14.设向量a⃗=(1,−4),b⃗ =(−1,x),c⃗=a⃗+3b⃗ .若a⃗//c⃗,则实数x的值是.【答案】4【解析】【分析】本题考查了平面向量共线的充要条件和平面向量的坐标运算.先计算c→的坐标,根据a→//c→,利用向量平行的条件列出关于x的方程,即可求得x.【解答】解:向量a→=(1,−4),c→=a→+3b→=(−2,−4+3x),因为a⃗//c⃗,所以(−4+3x)−(−4)×(−2)=0,解得x=4.故答案为4.15.第6页,共7页由表中数据计算得到K 的观测值k ≈5.059,于是(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.【答案】不能【解析】【分析】本题考查独立性检验,属于基础题.查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k ≈5.059<6.635,由此即可得到答案. 【解答】解:查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k 0=6.635.本题中,k ≈5.059<6.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.16. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得到如下列联表:则有 的把握认为“喜爱该节目与性别有关”. 【答案】99%【解析】【分析】本题主要考查独立性检验,属于基础题. 代入独立性检验公式即可求解.【解答】解:由列联表中数据,可得: χ2=110×(40×30−20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与性别有关”.17. 的值为 .【答案】【解析】【分析】本题主要考查了2×2列联表的数据关系,属于基础题.由a +35=45,可求得a ,则m =a +7,再由b +35=73可得b ,则7+b =n ,即可求解.【解答】解:根据2×2列联表可知a +35=45,解得a =10,则m =a +7=17, 又由35+b =73,解得b =38,则n =7+b =45, 则m +n =62.18. 某新闻媒体为了解观众对《创造101》节目的喜爱与性别是否有关,随机调查了观看该节目的110名观众,得则有 的把握认为“喜爱该节目与性别有关”.【答案】99% 【解析】【分析】本题考查了独立性检验,考查了运算能力,属于基础题.由列联表中数据,代入计算公式可得K 2的值,再判断是否有99%的把握认为“喜爱该节目与性别有关”. 【解答】解:由列联表中数据,可得K 2=110×(40×30−20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与性别有关”.19. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).在犯错误的概率不超过______的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.【答案】0.05【解析】【分析】本题考查独立性检验的应用,属于基础题.计算观测值,与题目中的观测值表进行比较,即可得出预测结论. 【解答】解:由题意算得,K 2= 100(10×30−20×40)250×50×30×70 ≈4.762>3.841,参照附表,可得:在犯错误的概率不超过5%的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 故答案为0.05.。
2022高中数学第1章统计案例2

第一章DIYIZHANG统计案例§2独立性检验2.1条件概率与独立事件课后篇巩固提升A组1.从1,2,3,4,5中任取2个不同的数,事件A:“取到的2个数之和为偶数”,事件B:“取到的2个数均为偶数”,则P(B|A)=()A. B. C. D.(A)=,P(AB)=,由条件概率计算公式,得P(B|A)=.2.某单位组织开展党史知识竞赛活动,以支部为单位参加比赛,某支部在5道党史题中(有3道选择题和2道填空题),不放回地依次随机抽取2道题作答,设事件A为“第1次抽到选择题”,事件B为“第2次抽到选择题”,则下列结论中不正确的是()A.P(A)=B.P(AB)=C.P(B|A)=D.P(B|)=(A)=,故A正确;P(AB)=,故B正确;P(B|A)=,故C正确;P()=1-P(A)=1-,P(B)=,P(B|)=,故D错误.故选D.3.某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是()A.0.8B.0.75C.0.6D.0.45,则随后一天空气质量也优良的概率为p,则得0.6=0.75·p,解得p=0.8,故选A.4.某中学开展主题为“学习宪法知识,弘扬宪法精神”的知识竞赛活动,甲同学答对第一道题的概率为,连续答对两道题的概率为.用事件A表示“甲同学答对第一道题”,事件B表示“甲同学答对第二道题”,则P(B|A)=()A. B. C. D.P(AB)=,P(A)=,∴P(B|A)=.故选D.5.如图,用K,A1,A2三类不同的元件连接成一个系统.当K正常工作且A1,A2至少有一个正常工作时,系统正常工作.已知K,A1,A2正常工作的概率依次为0.9,0.8,0.8,则系统正常工作的概率为()A.0.960B.0.864C.0.720D.0.576:由题意知K,A1,A2正常工作的概率分别为P(K)=0.9,P(A1)=0.8,P(A2)=0.8, ∵K,A1,A2相互独立,∴A1,A2至少有一个正常工作的概率为P(A2)+P(A1)+P(A1A2)=(1-0.8)×0.8+0.8×(1-0.8)+0.8×0.8=0.96.∴系统正常工作的概率为P(K)[P(A2)+P(A1)+P(A1A2)]=0.9×0.96=0.864.方法二:A1,A2至少有一个正常工作的概率为1-P()=1-(1-0.8)(1-0.8)=0.96,∴系统正常工作的概率为P(K)[1-P()]=0.9×0.96=0.864.6.某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率都是0.8,且每个问题的回答结果相互独立,则该选手恰好回答了4个问题就晋级下一轮的概率为..128,该选手的第二个问题必答错,第三、四个问题必答对,故该选手恰好回答了4个问题就晋级下一轮的概率P=1×0.2×0.8×0.8=0.128.7.已知随机事件A和B相互独立,若P(AB)=0.36,P()=0.6(表示事件A的对立事件),则P(B)=..9P(A)=1-P()=0.4,由独立事件的概率乘法公式可得P(AB)=P(A)P(B),因此,P(B)==0.9.8.盒中装有10只乒乓球,其中6只新球,4只旧球,不放回地依次取出2个球使用,在第一次取出新球的条件下,第二次也取到新球的概率为.,则袋中还有9个球,其中5个新球,所以第二次取出新球的概率为.9.集合A={1,2,3,4,5,6},甲、乙两人各从A中任取一个数,若甲先取,乙后取,在甲抽到奇数的条件下,求乙抽到的数比甲抽到的数大的概率.1:将甲抽到数字a,乙抽到数字b,记作(a,b),则所有可能的抽取结果为:(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),( 4,6),(5,1),(5,2),(5,3),(5,4),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),共30个.其中甲抽到奇数的情形有15个,在这15个中,乙抽到的数比甲抽到的数大的有9个,所求概率P=.解法2:设甲抽到奇数的事件为A,甲抽到奇数,且乙抽到的数比甲大为事件B,则P(A)=.P(AB)=,故P(B|A)=.10.某班有两个课外活动小组,其中第一小组有足球票6张,排球票4张;第二小组有足球票4张,排球票6张.甲从第一小组的10张票中任抽1张,乙从第二小组的10张票中任抽1张.(1)两人都抽到足球票的概率是多少?(2)两人中至少有1人抽到足球票的概率是多少?“甲从第一小组的10张票中任抽1张,抽到足球票”为事件A,“乙从第二小组的10张票中任抽1张,抽到足球票”为事件B,则“甲从第一小组的10张票中任抽1张,抽到排球票”为事件,“乙从第二小组的10张票中任抽1张,抽到排球票”为事件,于是P(A)=,P()=;P(B)=,P()=.由于甲(或乙)是否抽到排球票,对乙(或甲)是否抽到足球票没有影响,因此A与B是相互独立事件.(1)两人都抽到足球票的概率为P=P(A)·P(B)=.(2)两人都抽到排球票的概率为P=P()·P()=.故两人至少有1人抽到足球票的概率为P=1-.B组1.已知某产品的次品率为4%,其合格品中75%为一级品,则任选一件为一级品的概率为()A.75%B.96%C.72%D.78.125%“任选一件产品是合格品”为事件A,则P(A)=1-P()=1-4%=96%.记“任选一件产品是一级品”为事件B.由于一级品必是合格品,所以事件A包含事件B,故P(AB)=P(B).由合格品中75%为一级品知P(B|A)=75%;故P(B)=P(AB)=P(A)·P(B|A)=96%×75%=72%.2.从甲袋中摸出一个红球的概率是,从乙袋中摸出一个红球的概率是,从两袋各摸出一个球,下列结论不正确的是()A.2个球都是红球的概率为B.2个球不都是红球的概率为C.至少有1个红球的概率为D.2个球中恰有1个红球的概率为A选项,2个球都是红球的概率为,A选项正确;对于B选项,2个球不都是红球的概率为1-,B 选项错误;对于C选项,至少有1个红球的概率为1-,C选项正确;对于D选项,2个球中恰有1个红球的概率为,D选项正确.故选B.3.已知P(AB)=P(A)P(B),且P()=,P(A)=P(B),则事件A发生的概率是()A. B. C. D.P(AB)=P(A)P(B),知A与B相互独立,故A与与B,都是相互独立的,由P(A)=P(B),得P(A)P()=P(B)P(),即P(A)[1-P(B)]=P(B)[1-P(A)],得P(A)=P(B).∵P()=,∴P()=P()=,∴P(A)=.4.某农业科技站对一批新水稻种子进行试验,已知这批水稻种子的发芽率为0.8,出芽后的幼苗成活率为0.9.在这批水稻种子中,随机地取出一粒,则这粒水稻种子发芽并能成长为幼苗的概率为() A.0.02 B.0.08 C.0.18 D.0.72“这粒水稻种子发芽”为事件A,“这粒水稻种子发芽并成长为幼苗”为事件AB,“这粒水稻种子在发芽的前提下能成长为幼苗”为事件B|A,则P(A)=0.8,P(B|A)=0.9,由条件概率公式,得P(AB)=P(B|A)·P(A)=0.9×0.8=0.72.5.市场上供应的灯泡中,甲厂占70%,乙厂占30%,甲厂产品的合格率是95%,乙厂产品的合格率是80%,则市场上灯泡的合格率是..5%A={甲厂产品},B={乙厂产品},C={合格产品},则C=AC+BC,所以P(C)=P(AC)+P(BC)=P(A)·P(C|A)+P(B)·P(C|B)=70%×95%+30%×80%=0.905=90.5%.6.设甲乘汽车、火车前往目的地的概率分别为0.6,0.4,汽车和火车正点到达目的地的概率分别为0.9,0.8,则甲正点到达目的地的概率为..86P=0.6×0.9=0.54,当甲乘火车时正点到达目的地的概率为P=0.4×0.8=0.32,所以甲正点到达目的地的概率为P=0.54+0.32=0.86.7.从一副不含大小王的52张扑克牌中不放回地抽取2次,每次抽1张,已知第1次抽到A,则第2次也抽到A的概率为多少?1次抽到A为事件M,第2次也抽到A为事件N,则MN表示两次都抽到A, P(M)=,P(MN)=,P(N|M)=.8.制造一机器零件,甲机床生产的废品率是0.04,乙机床生产的废品率是0.05,从它们生产的产品中各任取1件,求:(1)两件都是废品的概率;(2)其中没有废品的概率;(3)其中恰有1件废品的概率;(4)其中至少有1件废品的概率;(5)其中至多有1件废品的概率.“从甲机床生产的产品中抽得1件是废品”为事件A,“从乙机床生产的产品中抽得1件是废品”为事件B.则P(A)=0.04,P(B)=0.05.(1)P(AB)=P(A)P(B)=0.04×0.05=0.002.(2)P()=P()P()=0.96×0.95=0.912.(3)P(B+A)=P()P(B)+P(A)P()=0.96×0.05+0.04×0.95=0.086.(4)至少有一件是废品的对应事件为B+A+AB,易知B,A,AB是彼此互斥的三件事件.故所求概率为P=P(B+A+AB)=P(B+A)+P(AB)=0.086+0.002=0.088.(利用(1),(3)小题的结果)或考虑其对应事件“没有废品”,故P=1-P()=1-0.912=0.088.(5)“至多有一件是废品”即为事件B+A;其对立事件为“两件都是废品”:AB.故所求概率P=P(B+A)=1-P(AB)=1-0.002=0.998.。
统计案例(精讲)(提升版)(原卷版)

8.5 统计案例(精讲)(提升版)思维导图考点一独立性检验【例1】(2022·吉林·梅河口市第五中学高三开学考试)某中学准备组建“文科”兴趣特长社团,由课外活动小组对高一学生进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了100名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科方向”学生,低于60分的称为“理科方向”学生.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99.5%的把握认为“文科方向”与性别有关?理科方向文科方向总计男40女45考点呈现例题剖析总计 1001人,共抽取4次,记被抽取的4人中“文科方向”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.参考公式:()()()()22()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.参考临界值:()2P k αχ=0.10 0.05 0.025 0.010 0.005 0.001k2.7063.841 5.024 6.635 7.879 10.828【一隅三反】1.(2022·白山模拟)十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产,在试产初期,生产一件该款芯片有三道工序,每道工序的生产互不影响,这三道工序的次品率分别为118,119,120.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.0500.0100.0050.001 k 3.841 6.6357.87910.828(①P①100X(2)某手机生产厂商将该款芯片投入到某新款手机上使用,并对部分芯片做了技术改良,推出了两种型号的手机,甲型号手机采用没有改良的芯片,乙型号手机采用改良了的芯片,现对使用这两种型号的手机用户进行回访,就他们对开机速度进行满意度调查.据统计,回访的100名用户中,使用甲型号手机的有30人,其中对开机速度满意的有15人;使用乙型号手机的有70人,其中对开机速度满意的有55人.完成下列22⨯列联表,并判断是否有99.5%的把握认为该项技术改良与用户对开机速度的满意度有关.甲型号乙型号合计满意不满意合计2.(2022·陕西咸阳·三模(理))2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占35,统计后得到如下22⨯列联表:销售额不少于30万元销售额不足30万元合计线上销售时间不少于8小时 17 20 线上销售时间不足8小时合计45售时间有关?(2)按销售额在上述赞助企业中采用分层抽样方法抽取5家企业.在销售额不足30万元的企业中抽取时,记“抽到线上销售时间不少于8小时的企业数”为X ,求X 的分布列和数学期望. 附: ()20P K k ≥0.050 0.010 0.001 0k3.841 6.635 10.828参考公式:()()()()2 n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.考点二 线性回归方程【例2-1】(2022·齐齐哈尔模拟)某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y (单位:千度)进行了统计分析,得出下表数据:月份(x )5 6 7 8 日平均用电量(y )1.93.4t7.11.7877ˆ.0y x =-t 的值为( )A .5.8B .5.6C .5.4D .5.2【例2-2】(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iii ii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X ,求随机变量X 的分布列和数学期望.(视频率为相应事件发生的概率)【一隅三反】1.(2022·安徽三模)对某位同学5次体育测试的成绩(单位:分)进行统计得到如下表格:第x 次 1 2 3 4 5 测试成绩y3940484850根据上表,可得关于的线性回归方程为ˆ3ˆy x a =+,下列结论不正确的是( )A .ˆ36a= B .这5次测试成绩的方差为20.8 C .y 与x 的线性相关系数0r < D .预测第6次体育测试的成绩约为542.(2022·安徽模拟)新冠疫情期间,口罩的消耗量日益增加,某药店出于口罩进货量的考虑,连续9天统计了第i (i 1239)x =,,,,天的口罩的销售量i y (百件),得到的数据如下:99i i i=1i=145171x y ==∑∑,,()99922ii i i i=1i=1i=1312528510953x x y y y ==-=∑∑∑,,. 参考公式:相关系数()()()()iii=122iii=1i=1nnnx x y y r x x y y --=--∑∑∑数据()i i ()i 123x y n =,,,,,,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计分别为()()()iii i1222i i11ˆˆˆnn i inni i x x y y x y nxybay bx x x xnx ===---===---∑∑∑∑, (1)若用线性回归模型ˆˆˆybx a =+拟合y 与x 之间的关系,求该回归直线的方程; (2)统计学家甲认为用(1)中的线性回归模型(下面简称模型1)进行拟合,不够精确,于是尝试使用非线性模型(下面简称模型2)得到i x 与i y 之间的关系,且模型2的相关系数20989r =.,试通过计算说明模型1,2中,哪一个模型的拟合效果更好. 3.(2022·湖南模拟)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴.为助力乡村振兴,某电商平台为某地的农副特色产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价x (元/件) 8 8.2 8.4 8.6 8.8 9 销量y (万件)908483807568附:参考公式:回归方程ˆˆˆybx a =+,其中()()()iiiii 1i 1222iii 1i 1ˆnnx x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 参考数据:614066i ii x y==∑,621434.2i i x ==∑.(1)(i )根据以上数据,求y 关于x 的线性回归方程;(ii )若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润.(2)为了解该产品的价格是否合理,在试销平台上购买了该产品的顾客中随机抽了400人,阅读“购买后的评价”得知:对价格满意的有300人,基本满意的有50人,不满意的有50人.为进一步了解顾客对该产品价格满意度形成的原因,在购买该产品的顾客中随机抽取4人进行电话回访,记抽取的4人中对价格满意的人数为随机变量X,求随机变量X的分布列和数学期望.(视频率为相应事件发生的概率)考点三非线性回归方程【例3】(2022·福建·三明一中模拟预测)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近5年区块链企业总数量相关数据,如下表年份20172018201920202021编号x12345企业总数量y(单位:千个) 2.156 3.7278.30524.27936.224(1)根据表中数据判断,y a bx=+与e dxy c=(其中 2.71828e=…为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由),并根据你的判断结果求y关于x的回归方程;(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;①每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;①在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.参考数据:5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =). 附:样本(),(1,2,,)i i x y i n =的最小二乘法估计公式为1221ˆni ii nii x y nx ybxnx==-=-∑∑,ˆa y bx=-.【一隅三反】1.(2022·山西二模)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.年份代码x 1 2 3 4 5 市场规模y3.984.565.045.866.36参考数据: 5.16y =, 1.68v =,145.10i ii v y==∑,其中i i v x =.参考公式:对于一组数据()11v y ,,()22v y ,,…,()n n v y ,,其回归直线ˆˆˆybv a =+的斜率和截距的最小二乘估计公式分别为1221ˆni ii ni i v y nvybv nv ==-=-∑∑,ˆˆay bv =-. (1)由上表数据可知,可用函数模型ˆˆyx a =拟合y 与x 的关系,请建立y 关于x 的回归方程(ˆa ,ˆb 的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p ,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X ,若()()34P X P X ===,求X 的分布列与期望.2.(2022·广东广州·一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表. 月份x1 2 3 4 5 销售量y (万件)4.95.86.88.310.2该公司为了预测未来几个月的销售量,建立了y 关于x 的回归模型:ˆv . (1)根据所给数据与回归模型,求y 关于x 的回归方程(ˆu 的值精确到0.1);(2)已知该公司的月利润z (单位:万元)与x ,y 的关系为z x x=,根据(1)的结果,问该公司哪一个月的月利润预报值最大? 参考公式:对于一组数据()()()1122,,,,,,n n x y x y x y ,其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-.11 / 113.(2022·广东肇庆·二模)下表是我国从2016年到2020年能源消费总量近似值y (单位:千万吨标准煤)的数据表格: 年份2016 2017 2018 2019 2020 年份代号x1 2 3 4 5 能源消费总量近似值y (单位:千万吨标准煤) 442 456 472 488 498以x 为解释变量,y 为预报变量,若以11为回归方程,则相关指数210.9946R ≈,若以22ˆln ya b x =+为回归方程,则相关指数220.9568R ≈. (1)判断11ˆyb x a =+与22ˆln y a b x =+哪一个更适宜作为能源消费总量近似值y 关于年份代号x 的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y 关于年份代号x 的回归方程.参考数据:512356i i y ==∑,517212i i i x y ==∑.参考公式:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211ˆn ni i i ii i n n ii i i x x y y x y nxy b x x x nx ====---==--∑∑∑∑,ˆˆa y bx =-.。
第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验
步
骤
③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.
1.2独立性检验的基本思想及其初步应用课件人教新课标

类型二 由K2进行独立性检验 例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病 人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下 表所示.
心脏搭桥手术 血管清障手术
总计
又发作过心脏病 39 29 68
未发作过心脏病 总计
157
196
167
196
324
392
试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别. 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没 有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c +d=196,a+c=68,b+d=324,n=392, 由公式得K2的观测值
解答
达标检测
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下列
联表:
喜欢程度
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
nad-bc2 由 K2=a+bc+da+cb+d算得,
110×40×30-20×202 k= 60×50×60×50 ≈7.8,
12345
附表:
12345
解析 答案
5.“全国文明城市”称号是最有价值的城市品牌,某市为创建第五届“全 国文明城市”,开展了“创建文明城市人人有责”活动.为了了解哪些人 更关注“创城”活动,随机抽取了年龄在10~70岁之间的100人进行调 查,并按年龄绘制如下频数散布表.
年龄(岁) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
高中数学 第三章 统计案例 3.1 独立性检验 假设检验(h

假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
独立性检验

99.9%把握认 为A与B有关
2 6.635
1%把握认为 A与B无关
99%把握认 为A与B有关
2 2.706 10%把握认为 90%把握认
A与B无关
为A与B有关
2 2.706
没有充分的依据显示A与B有关, 但也不能显示A与B无关
独立性检验
解:
吸烟 不吸烟
总计
患病 49 42 91
不患病 2099 7775 9874
P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如
2 10.828
0.1%把握认 为A与B无关
2
n(ad bc)2
(a c)(b d)(a b)(c d)
独立性检验
用χ2统计量研究 这类问题的方法
步骤
通过数据和图表分析,得到 结论是:吸烟与患病有关
结论的可靠 程度如何?
第一步:列出2×2列联表
吸烟 不吸烟
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调 查了515个成年人,其中吸烟者220人,不 吸烟者295人,调查结果是:吸烟的220人 中37人患病, 183人不患病;不吸烟的 295人中21人患病, 274人不患病。
根据这些数据能否断定:患肺癌与 吸烟有关吗?
列2×2联 表
独立性检验的基本思想及其初步应用参考模板范本

反证法原理与独立性检验原理
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
独立性检验原理:
在一个已知假设下, 如果一个与该假设 矛盾的小概率事件 发生,就推断这个 假设不成立。
患肺癌 42 0.54% 49 2.28% 91
总计 7817 2148 9965
100%
90%
等
80%
高
70%
条
60%
形
50%
图
40%
30%
20%10%0%源自不吸烟吸烟患肺癌 不患肺癌
不吸烟
吸烟 总计
不患肺癌 a
c a+c
患肺癌 b
d b+d
总计 a+b
c+d a+b+c+d
问3:a、b、c、d应该满足怎样的关系?
高二数学 选修 2-3
第三章 统计案例
3.2
独立性检验的
基本思想及其初步应用
视频
问题1 心脏病、肺癌、脑血管病等都与吸烟有关, 吸烟已成为继高血压之后的第二号全球杀手。 这些疾病与吸烟有关的结论是怎样得出的呢?
案 例:某肿瘤研究所为了研究吸烟是否对患肺癌 有影响,进行了一次随机抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者7817人。 调查结果如下表所示:
解:列出吸烟与是否患肺癌的2x2列联表如下
不吸烟 吸烟 总计
不患病 7775 2099 9874
患病 42 49 91
总计 7817 2148 9965
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计案例之独立性检验
班级姓名学号
参考公式:,其中.
1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生
互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响,
采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下:
表一:男生表二:女生
(1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率;
(2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.
2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北
京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动.
(1)根据以上数据完成以下2×2列联表:
喜爱运动不喜爱运动总计
男10 16
女 6 14
总计30
(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?
(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?
3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关,
现从高一学生中抽取人做调查,得到如下列联表:
已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为,
(Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关?
并说明你的理由;
(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取
人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率,
4.某学校高三年级有学生 1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:
身高达标身高不达标总计
经常参加体育锻炼40
不经常参加体育锻炼15
总计100
(1)完成上表;
5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.
(Ⅰ)根据数学成绩的频率分布表,求理科数学成绩的中位数的估计值;
(Ⅱ)请填写下面的列联表,并根据列联表判断是否有90%的把握认为数学成绩与文理科有关:
(Ⅲ)设文理科数学成绩相互独立,记表示事件“文科、理科数学成绩都大于等于120分”,估计的概率.
答案:
1.(1)设从高一年级男生中抽出人,则,,则从女生中抽取20人,
所以,.
表二中非优秀学生共5人,记测评等级为合格的3人为,,,尚待改进的2人为,,则从这5人中任选2人的所有可能结果为,,,,,,,,,,共10种,
设事件表示“从表二的非优秀学生中随机选取2人,恰有1人测评等级为合格”,则的结果为,,,,,,共6种,所以,即所求概率为.
(2)列联表如下:
因为,,
而,所以没有90%的把握认为“测评结果优秀与性别有关”.
2. (1)
喜爱运动不喜爱运动总计
男10 6 16
女 6 8 14
总计16 14 30
(2)根据已知数据可求得:
K2=≈1.157 5<2.706,
因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
(3)喜欢运动的女志愿者有6人,设喜欢运动的女志愿者分别为A,B,C,D,E,F,其中A,B,C,D会外语,则从这6人中任取2人,共15种取法.其中两人都不会外语的只有EF
一种取法.故抽出的志愿者之中至少有1人能胜任翻译工作的概率是P=1-=.
3.
5.。