独立性检验(十三)讲解

合集下载

独立性检验

独立性检验

独立性检验§1.2独立性检验的基本思想及其初步应用课前热身1.2×2列联表(1)分类变量的定义变量的不同“值”表示__________,像这样的变量称作分类变量.(2)2×2列联表的定义一般地取两个分类变量X和Y,它们的值域分别为__________和__________,其样本频数列联表(也称2×2列联表)为下表:2.二维条形图在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占比例__________,也可以估计满足X=x2的个体中具有Y=y1的个体所占比例为__________,两个比例的值相差越大,则两分类变量有关系的可靠程度越大.3.K2统计量为了消除样本量|ad-bc|的影响,统计学中引入下面的量K2=_____________________________________________________,其中n=__________为样本容量.4.独立性检验的定义及实施步骤(1)独立性检验的定义利用随机变量K2来确定是否能以给定把握认为“________________”的方法,称为两个分类变量的独立性检验.(2)判断“__________________________”的方法有列联表法、__________及K2公式的计算.名师讲解一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表:若要推断的论述为H1:“X与Y有关系”.可以按如下步骤判断H1成立的可能性.(1)通过二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占比例为aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例为cc+d,两个比例的值相差越大,H1成立的可能性就越大.(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体的做法是:根据数据代入公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)求出随机变量K2的观测值k,其值越大,说明X与Y有关系的可能性越大,当得到的观测数据a、b、c、d都不小于5时,可以得到以下结论用于确定X与Y的可信程度:①如果k>10.828,有99.9%的把握认为X与Y有关系.②如果k>7.879,就有99.5%的把握认为X与Y有关系.③如果k>6.635,就有99%的把握认为X与Y有关系.④如果k>5.024,就有97.5%的把握认为X与Y有关系.⑤如果k>3.841,就有95%的把握认为X与Y有关系.⑥如果k>2.706,就有90%的把握认为X与Y有关系.⑦如果k≤2.706,就认为没有充分的证据显示X与Y有关系.典例剖析题型一概念辨析例1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.如果K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误D.以上三种说法都不正确误区警示题中所说的“有99%的把握认为吸烟与患肺病有关”是指统计上的关系,而不是因果关系,也不能认为99%是指某人患有肺病的概率.变式训练1下列说法正确的个数为()①对事件A与B的检验无关,说明两事件互不影响;②事件A与事件B关系越密切,K2的值就越大;③K2的大小是判断事件A与B是否相关的唯一数据;④若判断两事件A与B相关,则A发生B一定发生.A.1B.2C.3D.4例2打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据,试问:每晚都打鼾与患心脏病有关吗?用图表分析.变式训练2在500人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血清的人作比较,结果如下:题型三利用K2公式进行独立性检验例3在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:试问新措施对防治猪白痢是否有效果?分析对于新措施对防治猪白痢是否有效果?可以计算K2的值与临界值进行比较,作出判断.规律技巧虽然二维条形图也能判断新措施对防治猪白痢是否有效果,但不能给出它们关系这一结论的可靠程度,因而我们常用K2公式解答问题.变式训练3调查者询问了72名大学生在购买食品时是否观看营养说明得到下表所示的数据,从表中数据分析看不看说明书与大学生的性别之间有没有关系.题型四独立性检验的应用例4下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.变式训练4现有两种治疗运动员膝关节损伤的药方,为了比较两药方的疗效收集的数据如下表:(2)哪种药方疗效好?技能演练基础强化1.下列关于K2的说法正确的是()A.K2在任何相互独立问题中都可以用来检验有关还是无关B.K2的值越大,两个事件的相关性越大C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K2的观测值的计算公式为K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)2.下面是一个2×2列联表则表中aA.94、96B.52、50 C.52、54 D.54、52 3.观察下列各图,其中两个分类变量x,y之间关系最强的是()4.考察棉花种子经过处理跟生病之间的关系得到如下表数据:A .种子经过处理跟是否生病有关B .种子经过处理跟是否生病无关C .种子是否经过处理决定是否生病D .以上都是错误的 5.分类变量x 和y 的列联表如下,则( )A.ad -bc C .(ad -bc )2越大,说明x 与y 的关系越强 D .(ad -bc )2越小,说明x 与y 的关系越强 6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:A .99%B .95%C .90%D .无充分依据7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:k =50(13×20-10×7)220×30×23×27≈4.844,因为k >3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为__________.8.某大学在研究性别与职称(分正教授,副教授)之间是否有关系,你认为应该收集的数据是__________.能力提升9.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X 和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为__________.1011.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,你能否判断性别与休闲方式是否有关系?品味高考12.(2010·新课标)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关;(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )。

人教版数学选择性必修三8.3.2独立性检验课件

人教版数学选择性必修三8.3.2独立性检验课件
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
每周平均体育运动时间
不超过4小时
每周平均体育运动时间
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
零假设为H0:该校学生的每周平均体育运动时间与性别无关.
结合列联表可算得
300× 45×60−30×165 2
(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成
每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周
平均体育运动时间与性别有关”.
附:
α
0.100
0.050
0.010
0.005

2.706
3.841
≈1.871×10-4.
∵1.871×10-4<2.706=x0.1,
根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,
即选报文、理科与对外语的兴趣无关.
总结提升
独立性检验的关注点
在2×2列联表中,如果两个分类变量没有关系,
则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;
合计
数学优秀
267
93
360
数学非优秀
99
781
880
合计
366
将表中数据代入公式,得
874
1240
32

独立性检验原理

独立性检验原理

独立性检验原理独立性检验是统计学中一项非常重要的工具,它用于检验样本数据是否来自于一个符合特定分布的总体,或者来自于不同总体。

在实际应用中,独立性检验可以帮助我们判断数据之间是否存在相关性,以及是否可以进行进一步的统计分析。

本文将介绍独立性检验的原理及其常见的应用。

首先,我们来了解一下独立性检验的原理。

独立性检验通常基于两个变量之间的关系展开,其中一个变量被认为是自变量,另一个变量被认为是因变量。

我们的目标是通过收集样本数据来判断这两个变量之间是否存在某种关联。

在进行独立性检验时,我们通常会使用卡方检验、t检验、F检验等方法来进行统计分析,从而得出样本数据是否具有独立性的结论。

在实际应用中,独立性检验可以被广泛用于不同领域。

例如,在医学研究中,我们可以利用独立性检验来判断某种治疗方法是否对疾病的治疗效果产生影响;在市场调研中,我们可以利用独立性检验来判断不同产品的销售情况是否存在相关性;在质量控制中,我们可以利用独立性检验来判断生产线上的不良品率是否受到某些因素的影响。

除了上述的应用外,独立性检验还可以帮助我们进行决策分析。

通过对样本数据进行独立性检验,我们可以更好地理解数据之间的关系,从而为决策提供科学依据。

例如,在制定营销策略时,我们可以利用独立性检验来判断不同市场营销手段对销售业绩是否产生影响,从而选择最有效的营销方式。

在进行独立性检验时,我们需要注意一些问题。

首先,样本数据的收集需要具有代表性,以确保独立性检验的结果具有统计学意义。

其次,我们需要选择合适的检验方法,以确保能够得出准确的结论。

最后,我们需要对检验结果进行合理解释,避免盲目地进行数据分析。

总的来说,独立性检验是统计学中一项非常重要的工具,它可以帮助我们判断数据之间是否存在相关性,从而为决策提供科学依据。

在实际应用中,独立性检验具有广泛的应用价值,可以帮助我们更好地理解数据之间的关系,为实际问题的解决提供支持。

希望本文对独立性检验的原理及其应用有所帮助,谢谢阅读!。

独立性检验 列联表与独立性检验 教学PPT课件

独立性检验 列联表与独立性检验 教学PPT课件

38
7
45
合计
71
17
88
所以







数学成绩
学校
=
(×−×)
×××
≈ . < . =x0.1
根据小概率值=0.1的 独立性检验,没有充分证据推断H0不成立,因此可以
认为H0成立,即认为两校的数学成绩优秀率没有差异。
12
思考例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其
中间的四个格中的数是表
格的核心部分,给出了事件
{X=x,Y=y}(x,y=0,1)中样本
点的个数;右下角格中的数
是样本空间中样本点的总
数。







X
Y
X=0
X=1
Y=0
a
c
Y=1
b
d
合计
a+c
b+d
合计
a+b
c+d
n=a+b+c+d
2
复习回顾
两个分类变量之间关联关系的定性分析的方法:
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大
中的原因吗?
例1只是根据一个样本的两个频率间存在差异得出两校学生数学成绩优秀率
有差异的结论,并没有考虑由样本随机性可能导致的错误,所以那里的推断依据不
太充分,在本例中,我们用 独立性检验对零假设H0进行了检验,通过计算,发现
≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所
分别考虑③中的四个差的绝对值很困难,我们需要找到一个既合理又能够计算分布的统

高中数学选修课件第三章§独立性检验

高中数学选修课件第三章§独立性检验

针对性解决策略和建议
深入理解独立性概念
明确事件独立与随机变量独立的区别,熟练掌握 相关公式和定理的适用条件。
正确选择统计性检验。
ABCD
重视样本容量的选择
在进行独立性检验时,应根据实际情况选择合适 的样本容量,以保证结果的准确性。
明确显著性水平的意义
结果分析与讨论
结果描述
详细阐述检验结果,包 括统计量、显著性水平
等信息。
结果解释
结合研究问题和假设, 对检验结果进行合理解
释。
结果比较
将本研究结果与已有研 究进行比较,分析异同
点。
结果推广与应用
探讨本研究结果的推广 价值和应用前景。
06
独立性检验常见问题及解决方法
常见错误类型及原因剖析
错误理解独立性概念
在判断两个分类变量是否独立时,需 要结合实际情况和专业知识进行综合 判断,避免盲目依赖统计结果。
在计算卡方统计量时,需要注意期望 频数的计算方法,避免出现计算错误 。
需要注意独立性检验只能判断两个分 类变量之间是否存在关联,但不能确 定它们之间的因果关系。
03
独立性检验在统计学中应用
统计分析中作用
实际操作流程演示
确定研究问题和假设
明确研究目的,提出假设并确定检验标准 。
结果解释与报告
对检验结果进行解释,得出结论并撰写报 告。
收集数据
根据研究问题和假设,选择合适的方法收 集数据。
进行独立性检验
根据所选用的检验方法,对数据进行计算 和分析。
数据整理与预处理
对收集到的数据进行整理、清洗和转换, 以便于后续分析。
独立性检验可以帮助我们更好 地理解概率论中的基本概念, 如条件概率、联合概率等。

高中数学选修课件第一章:独立性检验

高中数学选修课件第一章:独立性检验

注意事项与误区提示
在进行独立性检验前,需要确保样本 的随机性和代表性,以避免因样本偏 差导致结果失真。
需要注意的是,独立性检验只能判断 两个变量之间是否存在统计上的独立 性,并不能说明它们之间是否存在因 果关系或其他形式的关联。
在解读结果时,需要注意概率值(p 值)或临界值表的具体含义和适用条 件,避免误用或滥用。
高中数学选修课件第一 章:独立性检验
汇报人:XX 20XX-01-30
contents
目录
• 独立性检验基本概念 • 独立性检验基本思想解读 • 独立性检验方法介绍及应用场景分析 • 独立性检验结果解读与注意事项 • 独立性检验在统计学中地位和作用 • 高中数学选修课程中其他相关知识点回
顾与拓展
01
在实际应用中,还需要结合其他统计 方法和专业知识进行综合分析和判断 。
05
独立性检验在统计学中地位和作用
独立性检验在统计学中地位
独立性检验是统计学 中一种重要的假设检 验方法。
在数据分析、市场调 研、医学研究等领域 具有广泛应用。
它用于判断两个或多 个分类变量之间是否 相互独立。
独立性检验对后续统计分析影响
高中数学选修课程中其他相关知识点梳理
排列组合与二项式定理
回顾排列组合的基本概念、计算公式及应用,掌握二项式定理的展开式及通项公式的应 用。
概率与统计的综合应用
梳理概率与统计在高中数学选修课程中的综合应用,如概率与统计在解决实际问题中的 结合,以及概率与统计在其他数学知识点中的交叉应用等。
数学建模与数学探究
独立性检验的基本思想
通过抽样调查获取数据,根据样本数据来判断两个分类变量 是否独立。
独立性检验的方法
通常采用列联表的形式整理数据,然后计算相关统计量的值 (如χ²值),并根据统计量的值及给定的显著性水平作出判 断。

1.2《独立性检验》ppt-北师大版选修PPT课件

1.2《独立性检验》ppt-北师大版选修PPT课件
问题: 数学家庞加莱每天都从一家
面包店买一块1000g 的面包,并记录 下买回的面包的实际质量。一年后, 这位数学家发现,所记录数据的均 值为950g。于是庞加莱推断这家面 包店的面包分量不足。
• 假设“面包分量足”,则一年购买面包的质量 数据的平均值应该不少于1000g ;
• “这个平均值不大于950g”是一个与假设“面包 分量足”矛盾的小概率事件;
这种变量的不同取“值”表示个体所属的不 同类别,这类变量称为分类变量
分类变量在现实生活中是大量存在的,如是否 吸烟,是否患肺癌,宗教信仰,国别,年龄, 出生月份等等。
利用随机变量K2来确定在多大程度上可以认为” 两个分类变量有关系”的方法称为两个分类变 量的独立性检验.(为假设检验的特例)
问题:
列联表
0
不吸烟
吸烟
二维条 形图
患肺癌 不患肺癌
3)通过图形直观判断两个分类变量是否相关:
患肺癌
100% 90%
比例
80%
70%
60% 50% 40%
患肺癌 不患肺癌
30%
20%
不患肺癌
10% 0%
比例
不吸烟
吸烟
独立性检验
通过数据和图表分析,得到
H0: 吸烟和患肺癌之间没结论有是关:系吸烟与患肺癌有关
←→ H1: 吸烟和患
• 这个小概率事件的发生使庞加莱得出推断结果。
一:假设检验问题的原理
假设检验问题由两个互斥的假设构成,其中一个 叫做原假设,用H0表示;另一个叫做备择假设, 用H1表示。
例如,在前面的例子中, 原假设为: H0:面包分量足, 备择假设为 H1:面包分量不足。 这个假设检验问题可以表达为: H0:面包分量足 ←→ H1:面包分量不足

独立性检验(课件)高二数学(人教A版2019选修第三册)

独立性检验(课件)高二数学(人教A版2019选修第三册)

|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

沂水四中期末复习十二 独立性检验一、选择题(本题共9道小题1.以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②对于两个相关随机变量x ,y 而言,点P (,)在其回归直线上; ③在回归直线方程=0.2x+12中,当解释变量x 每增加一个单位时,预报变量平均增加0.2个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题为( ) A .①④B .②④C .①③D .②③2.给出下列四个结论:①已知X 服从正态分布2(0,)N σ,且P(-2≤X ≤2)=0.6,则P(X>2)=0.2;②若命题2000:[1,),10p x x x ∃∈+∞--<,则2:(,1),10p x x x ⌝∀∈-∞--≥;③已知直线1:310l ax y +-=,2:10l x by ++=,则12l l ⊥的充要条件是/3a b =-;④设回归直线方程ˆ2 2.5yx =-,当变量x 增加一个单位时,y 平均增加两个单位. 其中正确的结论的个数为() A.1 B.2 C. 3 D. 4 3.如表是一位母亲给儿子作的成长记录:x (周岁)的线性回归方程为=7.19x+73.93,给出下列结论: ①y 与x 具有正的线性相关关系;②回归直线过样本的中心点(6,117.1); ③儿子10岁时的身高是145.83cm ;④儿子年龄增加1周岁,身高约增加7.19cm . 其中,正确结论的个数是( ) A .1 B .2 C .3 D .44.表中提供了某厂节能降耗技术改造后生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.根据下表提供的数据,求出y 关于x 的线性回归方程为=0.7x+0.35,那么表中t 的值为( )5.某产品的广告费x (万元)与销售额y (万元)的统计数据如表:由最小二乘法可得回归方程=7x+a ( )A .56万元B .58万元C .68万元D .70万元6.为了考察两个变量x 和y 之间的线性相关性,甲、乙两同学各自独立地做100次和150次试验,并且利用线性回归方法,求得回归直线分别为1t 和2t ,已知两个人在试验中发现对变量x 的观测值的平均值都是s ,对变量y 的观测值的平均值都是t ,那么下列说法正确的是()A .1t 和2t 有交点(),s tB .1t 和2t 相交,但交点不是(),s tC .1t 和2t 必定重合D .1t 和2t 必定不重合7.如表是一位母亲给儿子作的成长记录:x (周岁)的线性回归方程为=7.19x+73.93,给出下列结论: ①y 与x 具有正的线性相关关系;②回归直线过样本的中心点(6,117.1); ③儿子10岁时的身高是145.83cm ;④儿子年龄增加1周岁,身高约增加7.19cm . 其中,正确结论的个数是( ) A .1 B .2 C .3 D .48.设有一个直线回归方程为=2﹣1.5,则变量x 增加一个单位时( )A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位9.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学A. 6 B. 7 C. 8 D. 9第II 卷(非选择题)二、填空题(本题共1道小题 10已知x 与y 之间的一组数据:必过点__________.三、解答题(本题共4道小题11.某单位共有10名员工,他们某年的收入如下表:(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正相关关系,某员工工作第一年至第四年的年薪分别为3万元、5.4万元、6.5万元、2.7万元,预测该员工第五年的年薪为多少?附:线性回归方程a x b yˆˆˆ+=中系数计算公式分别为: 121()()()niii nii x x y y b x x ==--=-∑∑,x b y aˆˆ-=,其中x 、y 为样本均值. 12.心理学家分析发现视觉和空间能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如右表:(单位:人)(2)经过多次测试后,甲每次解答一道几何题所用的时间在5~7分钟,乙每次解答一道几何题所用的时间在6~8分钟,现甲、乙各解同一道几何题,求乙比甲先解答完的概率. (3)现从选择做几何题的8名女生中任意抽取两人对她们的答题情况进行全程研究,记甲、乙两女生被抽到的人数为 X ,求 X 的分布列及数学期望 EX . 附表及公式K2=.13.连锁经营公司所属5个零售店某月的销售额利润资料如表:(2)若销售额和利润额具有相关关系,试计算利润额y对销售额x的回归直线方程.(3)估计要达到1000万元的利润额,销售额约为多少万元.(参考公式:==,=﹣x)14.为了普及环保知识,增强环保意识,某校从理科甲班抽取60人,从文科乙班抽取50人参加环保知识测试.(Ⅰ)根据题目条件完成下面2×2列联表,并据此判断是否有99%的把握认为环保知识成绩优秀与学生的文理分类有关.(Ⅱ)现已知A,B,C三人获得优秀的概率分别为,设随机变量X表示A,B,C三人中获得优秀的人数,求X的分布列及期望E(X).附:,n=a+b+c+d试卷答案1.D解:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,故①不正确,②对于两个相关随机变量x,y而言,点P(,)在其回归直线上,正确;③在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位,正确.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故不正确.故选:D.2.A仅①正确②存在量词的否定③必要不充分,反例为a=b=0④考查线性回归的意义3.B解;线性回归方程为=7.19x+73.93,①7.19>0,即y随x的增大而增大,y与x具有正的线性相关关系,①正确;②回归直线过样本的中心点为(6,117.1),②错误;③当x=10时, =145.83,此为估计值,所以儿子10岁时的身高的估计值是145.83cm而不一定是实际值,③错误;④回归方程的斜率为7.19,则儿子年龄增加1周岁,身高约增加7.19cm,④正确,故应选:B4.A解:∵由回归方程知=得t=3,故选A.5.A解: ==4, ==35.∴35=4×7+,解得=7.∴回归方程为=7x+7.∴当x=7时,y=7×7+7=56.故选:A.6.A7.B解;线性回归方程为=7.19x+73.93,①7.19>0,即y随x的增大而增大,y与x具有正的线性相关关系,①正确;②回归直线过样本的中心点为(6,117.1),②错误;③当x=10时, =145.83,此为估计值,所以儿子10岁时的身高的估计值是145.83cm而不一定是实际值,③错误;④回归方程的斜率为7.19,则儿子年龄增加1周岁,身高约增加7.19cm ,④正确, 故应选:B察回归分析的基本概念,属于基础题,容易忽略估计值和实际值的区别. 8.C 解:∵直线回归方程为=2﹣ 1.5,① ∴y=2﹣1.5(x+1)② ∴②﹣①=﹣1.5即y 平均减少1.5个单位, 故选:C .9.D 解:根据题意,得; c=120﹣73﹣25=22, a=74﹣22=52, b=73﹣52=21,∴a﹣b ﹣c=52﹣21﹣22=9. 故选:D . 10.(1.5,4)11.(1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人;ξ取值为0,1,2.152)0(21024===C C P ξ,158)1(2101614===C C C P ξ,31)2(21026===C C P ξ, ∴ξ的分布列为∴()012151535E ξ=⨯+⨯+⨯=. (3)设)4,3,2,1(,=i y x i i 分别表示工作年限及相应年薪,则5,5.2==y x ,21()2.250.250.25 2.255nii x x =-=+++=∑,41()() 1.5(2)(0.5)(0.8)0.50.6 1.5 2.27iii x x y y =--=-⨯-+-⨯-+⨯+⨯=∑,121()()7 1.45()niii nii x x y y b x x ==--===-∑∑,ˆˆ5 1.4 2.5 1.5a y b x =-=-⨯=,由线性回归方程为 1.4 1.5y x =+.可预测该员工年后的年薪收入为8.5万元.12.解:(1)由表中数据得K 2的观测值,所以根据统计有97.5%的把握认为视觉和空间能力与性别有关;(2)设甲、乙解答一道几何题的时间分别为x 、y 分钟,则基本事件满足的区域为(如图所示)设事件A 为“乙比甲先做完此道题”则满足的区域为x >y, ∴由几何概型即乙比甲先解答完的概率为;(3)由题可知在选择做几何题的8名女生中任意抽取两人,抽取方法有种,其中甲、乙两人没有一个人被抽到有种;恰有一人被抽到有种;两人都被抽到有种,∴X 可能取值为0,1,2,,,X 的分布列为:∴.13.解:(1)根据表中所给的五对数对,在平面直角坐标系中画出散点图,如图所示;(2)∵==6,=,∴n=5×6×=102,x i y i=3×2+5×3+6×3+7×4+9×5=112,=32+52+62+72+92=200,n=5×62=180,===0.5,=﹣=﹣0.5×6==0.4,∴利润额y对销售额x的回归直线方程是=0.5x+0.4(3)根据题意,令=0.5x+0.4=10,解得x=19.2(千万元),∴销售额约为19.2千万元.14.解:(Ⅰ)2×2列联表如下由算得,,所以有99%的把握认为学生的环保知识成绩与文理分科有关…5分(Ⅱ)设A,B,C成绩优秀分别记为事件M,N,R,则∴随机变量X的取值为0,1,2,3…6分,…10分所以随机变量X的分布列为:E(X)=0×+1×+2×+3×=…12分.。

相关文档
最新文档