[构建·体系]
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中
高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102
假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验
2020_2021学年高中数学课时素养评价三1.2.2~1.2.4独立性检验独立性检验的基本思想独立
课时素养评价三独立性检验独立性检验的基本思想独立性检验 的应用 (20分钟·50分) 一、选择题(每小题5分,共20分) 1.经过对χ2的研究,得到了若干个临界值,当χ2≤ 2.706时,我们认为事件A与B ( ) A.有95%的把握认为A与B有关系 B.有99%的把握认为A与B有关系 C.没有充分理由说明事件A与B有关系 D.不能确定 【解析】选C.当χ2>2.706时,有90%以上的把握说明A与B有关系,但当χ2≤2.706时,只能说明A与B是否有关系的理由不够充分. 2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是( ) P(χ2≥x0) 0.01 0.05 0.025 0.010 0.005 0.001 x0 2.706 3.841 5.024 6.635 7.879 10.828 A.有99%以上的把握认为“爱好该项运动与性别无关” B.有99%以上的把握认为“爱好该项运动与性别有关” C.有95%的把握认为“爱好该项运动与性别有关” D.有95%的把握认为“爱好该项运动与性别无关” 【解析】选B.由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”. 3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的
有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系( ) A.95% B.99% C.没有充分的证据显示有关 D.1% 【解析】选C. χ2=错误!未找到引用源。=1.92<2.706,所以没有充分的证据显示有关. 4.以下关于独立性检验的说法错误的是( ) A.独立性检验依赖小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两事物是否相关的唯一方法 【解析】选B.受样本选取的影响,独立性检验得到的结论不一定正确. 二、填空题(每小题5分,共10分) 5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2, y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i, y i)(i=1,2,…,n)都在直线y=-错误!未找到引用源。x+1上,则这组样本数
高中数学 专题 统计与统计案例
一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D
高中数学第三章统计案例2独立性检验教学案北师大版选修2_3
§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]
[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:
(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21
假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为
{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:
2018版高中数学第一章统计1.3统计图表学案
1.3 统计图表 1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图和茎叶图)的功能及其特点.(重点) 2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.(难点) 3.能从统计图表中获取有价值的信息.(难点、易错点) [基础·初探] 教材整理1 统计图表 阅读教材P16~P20“练习1”以上部分,完成下列问题. 1.条形统计图 条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比. 2.折线统计图 建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况. 3.扇形统计图 扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.优点:扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点:会丢失部分数据信息且不适合总体中部分较多的情况. 判断(正确的打“√”,错误的打“×”) (1)扇形统计图比其他统计图更优越.( )
(2)统计图和统计表相比,用直线、折线来说理比用数据说理来的形象一些,数量关系也更明显.( ) (3)要反映台州市某一周每天的最高气温的变化趋势,宜采用条形统计图.( ) 【解析】(1)×,扇形统计图与其他统计图各有优缺点. (2)√,统计图比统计表表达的更明确. (3)×,适合用折线统计图. 【答案】(1)×(2)√(3)× 教材整理2 茎叶图 阅读教材P21第三自然段到P22“信息技术应用”以上部分,完成下列问题. 1.茎叶图 茎叶图的制作:茎相同的共用一个茎,茎按从小到大的顺序从上到下列出,共茎的叶一般按从大到小或从小到大的顺序同时列出. 2.用茎叶图表示数据有两个突出特点 第一,统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到; 第二,茎叶图可以随时记录,方便表示与比较. 但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了. 判断(正确的打“√”,错误的打“×”) (1)制作茎叶图时,茎叶图的茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.( ) (2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.( ) (3)茎叶图对重复出现的数据不可以重复记录.( ) 【解析】(1)√,结合茎叶图的做法,茎按从小到大的顺序从上向下列出,叶无规定的顺序. (2)√,结合茎叶图的特点可知,用茎叶图表达两组数据很方便,但若是多组数据,却不是那么方便,直观、清晰了. (3)×,茎叶图中的数据应当全部记录,不可以遗漏,包括重复数据. 【答案】(1)√(2)√(3)× [小组合作型]
高中数学第三章统计案例章末小结知识整合与阶段检测教学案北师大版选修2_334.doc
第三章统计案例 知识整合与阶段检测 [ 对应学生用书P42] 一、回归分析 1.线性回归分析 对于一组具有线性相关关系的数据( x1,y1) , ( x2,y2) ,, ( x n,y n) ,其线性回归直线方程为 y= a+bx, n n x i- xy i- y x i y i- n x · y i = 1 i =1 其中 b==, n n x i- x 2 2 2 x i- n x i = 1 i = 1 a= y - b x . 2.相关系数 n x i- x y i- y i = 1 r = n n x i- x 2·y i- y 2 i = 1 i =1 n x i y i- n x · y i = 1 =, n n 2 2 2 - n y 2 x i- n x ·y i i =1 i = 1 | r | 值越大,相关性越高,| r | 值越接近0,线性相关程度越低. 二、独立性检验
独立性检验的一般步骤(1)列出 2×2列联表; (2) 代入公式计算 2 n ad- bc 2 χ =a+c a+ b b+d c+d ; (3)根据χ2的值的大小作出判断. 对应阶段质量检测三 见 8开试卷 ( 时间 90 分钟,满分120 分 ) 一、选择题 ( 本大题共10 小题,每小题 5 分,共50 分.在每小题给出的四个选项中, 只有一项是符合题目要求的) 1. ( 全国新课标 ) 在一组样本数据 ( x1,y1) , ( x2,y2) ,, ( x n,y n)( n≥2,x1,x2,, x 不全相等 ) 的散点图中,若所有样本点( x,y )( i=1,2 ,,n) 都在直线y=2x+ 1 上,则n i i 1 这组样本数据的样本相关系数为( ) A.- 1 B. 0 1 C. 2 D. 1 解析:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为 1. 答案: D 2.已知x与y之间的一组数据: x 0 1 2 3 y 1 3 5 7 则 y 与 x 的线性回归方程y= a+ bx 必过点( ) A. (2,2) B. (1.5,0) C. (1,2) D. (1.5,4) 解析:线性回归方程y=a+ bx 必过点--( x,y ) . 答案: D 3.下列现象的相关程度最高的是( ) A.某商店的职工人数与商品销售额之间的相关系数为0.87 B.流通费用率与商业利润之间的相关系数为-0.94 C.商品销售额与商业利润之间的相关系数为0.51 D.商品销售额与流通费用率之间的相关系数为-0.81
统计案例一_----独立性检验
统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22
高二数学1-2 独立性检验
独立性检验 教学重点、独立性检验的基本方法,独立性检验的步骤 难点:.基本思想的领会及方法应用. 知识点 一、独立性检验的基本概念和原理 独立性检验是研究相关关系的方法。 1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。 2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个 3.条形图 为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比. 通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢? 4.独立性检验的步骤 为了回答下面问题,我们先假设H :吸烟与患肺癌没有关系,看看能够得到什么样 的结论。 不患肺癌患肺癌合计不吸烟 a b a+b 吸烟 c d c+d 合计a+c b+d a+b+c+d 样本容量 n=a+b+c+d 如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:
()()() ()()()() 2 2 0a c a c d c a b ad b c a b c d ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈?+≈+?-≈++---= ++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中 为样本容量 若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为 ()2 2 996577754942209956.63278172148987491 K ?-?=≈???, 这个值到底能告诉我们什么呢? 统计学家经过研究后发现,在 H 0成立的情况下, 2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2 K 的观测值超过 6. 635 的概率非常小,近似为0 . 01, 是一个小概率事件.现在2 K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量2 K 的观测值k 建立了一个判断H 0是否成立的规则: 如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系. 在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过 2( 6.635)0.01P K ≥≈, 即有99%的把握认为H 0不成立. 假设检验 备择假设H 1 不成立的前提下进行推理 10成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发 生,意味着H 1成立的可能性(可能性为(1-α))很大 下任上例的解决步骤 第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系? H 1:吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 ()K ()()()() n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论
高中数学统计案例分析及知识点归纳总结
统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。
数学:第三章《统计案例》测试(2)(新人教A版选修2-3)
高中数学精品资料 2020.8 高中新课标选修(2-3) 第三章统计案例综合测试题 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841 K< K>B.2 3.841 C.2 6.635 K< K>D.2 6.635 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4 组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 不患肺病患肺病合计 不吸烟7775 42 7817 吸烟2099 49 2148 合计9874 91 9965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90%B.95%C.99%D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴24 31 55 女婴8 26 34
合计 32 57 89 A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 答案:C 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度 5- 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54 如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143 C.200 D.243 答案:B 10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表: 优秀 不优秀 合计
高中数学统计案例--独立性检验 同步练习
统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?
8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?
高中数学教学案例分析(独立性检验)
高中数学人教A版选修2-3第三章3.2独立性检验的基本思 想及其初步应用教学设计 一、教材分析 本节课是人教A版(选修)2—3第三章第二单元第二节第一课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节,也是高考的重要考点。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。在大数据时代,我们每天都会接触到影响生活的统计方面的信息,因此具备一些统计知识已经成为现代人已具备的一种数学素养。 二、学情分析 授课对象:高二理科15班(重二班)。 知识上:学生已经学习过统计、变量回归分析等知识,这为本节课的学习提供了知识基础。但本节课的内容独立性检验对学生来说是新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个规则解决问题。 能力方面:学生具备了一定的认知、分析、归纳能力;能够进行小组活动。 但学生缺少深入探究问题的方法;运算能力和语言表达能力有待提高。针对这个问题,课堂上我通过适时引导学生探究,鼓励学生积极展示来解决。
高中数学 1.3 统计图表课后作业 北师大版必修3
§3统计图表 一、非标准 1.某支股票近10个交易日的价格如下: 下列几种统计图中,表示上面的数据较合适的是( ) A.条形统计图 B.扇形统计图 C.折线统计图 D.茎叶图 解析:对于股票,我们最关心它的涨跌情况,即价格的增减变化情况,因此用折线统计图较合适. 答案:C 2.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的数据,结果用条形统计图(如下图)表示.根据条形统计图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6时 B.0.9时 C.1.0时 D.1.5时 解析:这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(时). 答案:B 3.如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图的情况可以知道丙、丁两组人数和为( ) A.250 B.150 C.400 D.300 解析:甲组人数是120,占30%,则总人数是=400.则乙组人数是400×7.5%=30,则丙、丁两组人数和为400-120-30=250. 答案:A 4.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得
的最高分分别为( ) A.51,83 B.41,47 C.51,47 D.41,83 答案:B 5.甲、乙两班学生的体育成绩的条形统计图如图所示,不用计算,体育成绩好的班级是( ) A.甲班 B.乙班 C.甲、乙一样 D.无法确定 解析:由两个条形统计图中各部分的人数可知乙班学生的体育成绩好一些. 答案:B 6.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委对参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( ) A.1 B.2 C.4 D.6 解析:若x≤4,因为平均分为91,所以总分应为637,即637=89+89+92+93+92+91+90+x,所以x=1.若x>4,637≠89+89+92+93+92+91+94=640,不合题意. 答案:A 7.某班学生在课外活动中参加文娱、美术、体育小组的人数之比为3∶1∶6,则在扇形统计图中表示参加体育小组人数的扇形对应的圆心角的度数是. 解析:所求圆心角的度数是×100%×360°=216°. 答案:216° 8.如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是,最大日温差等于℃. 解析:逐一计算发现,5月5日的日温差最大,最大日温差为24.5-12=12.5(℃). 答案:5月5日12.5
高中数学:统计与统计案例练习
高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21
解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关
高中数学选修2-3第三章《统计案例》测试题
高中数学选修2-3第三章《统计案例》测试题 姓名___________学号______(满分100分,时间90分钟) 一、选择题:(每题5分,共50分,请将准确答案填在答题卡内) 1.已知一个线性回归方程为?y =1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.5 2.对有线性相关关系的两个变量建立的回归直线方程 ???y a bx =+中,回归系数? b ( ) A .能等于0 B .小于0 C .可以小于0 D .只能等于0 3.能表示n 个点与相应直线在整体上的接近程度的是( ) A.1 ()n i i y i =-∑ B 1 ()n i i i y =-∑ C. 2 1 () n i i y i =-∑ D. 21 ()n i i y y =-∑ 4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2 = ()()()()() n ad bc a b c d a c b d -++++算得K 2 =2 110(40302030)7.860506050 ??-?≈???附表: P (K 2≥k ) 0.10 0.05 0.025 0.01 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^ =-3+bx ,若∑i =1 10x i =17,∑i =1 10 y i =4,则b 的值为( ) A .2 B .1 C .-2 D .-1 6.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( ) A. y ^ =x +1 B. y ^=x +2 C. y ^=2x +1 D . y ^ =x -1 7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3
2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算