高考知识点变量间的相关关系与统计案例

高考知识点变量间的相关关系与统计案例
高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例

最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.

知识梳理

1.相关关系与回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.

(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.

(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.

2.线性回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则

^是回归方程的斜率,a^是在y轴上的截距.

其中,b

回归直线一定过样本点的中心(x,y).

3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数

当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.

r 的绝对值越接近于1,表明两个变量的线性相关性越强.

r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.

(4)相关指数:

其中21()n

i i i y y =-∑是残差平方和,其值越小,

则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验

(1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为

则随机变量K 2

=n (ad -bc )2

(a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样

本容量.

[常用结论与微点提醒]

1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点

(x ,y ).

2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

量有关的把握越大.

3.根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.

诊断自测

1.思考辨析(在括号内打“√”或“×”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()

(2)通过回归直线方程y^=b^x+a^可以估计预报变量的取值和变化趋势.()

(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()

(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()

答案(1)√(2)√(3)×(4)√

2.(必修3P90例题改编)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:

则y对x的线性回归直线方程为()

A.y^=2.3x-0.7

B.y^=2.3x+0.7

C.y^=0.7x-2.3

D.y^=0.7x+2.3

解析易求x=9,y=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.

答案 C

3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()

A.模型1的相关指数R2为0.98

B.模型2的相关指数R2为0.80

C.模型3的相关指数R2为0.50

D.模型4的相关指数R2为0.25

解析在两个变量y与x的回归模型中,它们的相关指数R2越近于1,模拟效果

越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.

答案 A

4.(2015·全国Ⅱ卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效

C.2006年以来我国二氧化硫年排放量呈减少趋势

D.2006年以来我国二氧化硫年排放量与年份正相关

解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,D不正确.

答案 D

5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:

已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值

k=50×(13×20-10×7)2

23×27×20×30

≈4.844.则认为选修文科与性别有关系出错的可能

性为________.

解析K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.

答案5%

考点一相关关系的判断

【例1】(1)已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()

A.x与y正相关,x与z负相关

B.x与y正相关,x与z正相关

C.x与y负相关,x与z负相关

D.x与y负相关,x与z正相关

(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:

则哪位同学的试验结果体现A,B两变量有更强的线性相关性()

A.甲

B.乙

C.丙

D.丁

解析(1)由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z 正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x 与z负相关.

(2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的

线性相关性.

答案(1)C(2)D

规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.

2.利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.

3.线性回归直线方程中:b^>0时,正相关;b^<0时,负相关.

【训练1】(1)某公司在2018年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:

根据统计资料,则()

A.月收入的中位数是15,x与y有正线性相关关系

B.月收入的中位数是17,x与y有负线性相关关系

C.月收入的中位数是16,x与y有正线性相关关系

D.月收入的中位数是16,x与y有负线性相关关系

(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.

①x,y是负相关关系;

②在该相关关系中,若用y=c1e c2x拟合时的相关指数为R21,用y^=b^x+a^拟合时的相关指数为R22,则R21>R22;

③x,y之间不能建立线性回归方程.

解析(1)从统计图表中看出,月收入的中位数是1

2(15+17)=16,收入增加,则

支出也增加,x与y正线性相关.

(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1e c2x拟合比用y^=b^x+a^拟合效果要好,则R21>R22,故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③错误.

答案(1)C(2)①②

考点二线性回归方程及应用

【例2】(2015·全国Ⅰ卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由)?

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:

解(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.

(2)令w=x,先建立y关于w的线性回归方程,由于

所以y关于w的线性回归方程为y

^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.

(3)①由(2)知,当x=49时,年销售量y的预报值

y^=100.6+6849=576.6,

年利润z的预报值z

^=576.6×0.2-49=66.32.

②根据(2)的结果知,年利润z的预报值

z^=0.2(100.6+68x)-x=-x+13.6x+20.12.

所以当x=13.6

2=6.8,即x=46.24时,z

^取得最大值.

故年宣传费为46.24千元时,年利润的预报值最大.

规律方法 1.(1)正确理解计算b

^,a^的公式和准确的计算是求线性回归方程的关键.

(2)回归直线方程y^=b^x+a^必过样本点中心(x,y).

2.(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.

(2)本例中y 与x 不具有线性相关,先作变换,转化为y 与w 具有线性相关,求出y 关于w 的线性回归方程,然后进一步求解.

【训练2】 (2018·日照调研)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:

表1

为了研究计算的方便,工作人员将上表的数据进行了处理,t =x -2 012,z =y -5得到下表2:

表2

(1)求z 关于t 的线性回归方程;

(2)通过(1)中的方程,求出y 关于x 的回归方程;

(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?

b ^=45-5×3×2.255-5×9=1.2,

a ^=z -

b ^t -=2.2-3×1.2=-1.4, 所以z ^=1.2t -1.4.

(2)将t=x-2 012,z=y-5,代入z^=1.2t-1.4,

得y-5=1.2(x-2 012)-1.4,即y

^=1.2x-2 410.8.

(3)因为y^=1.2×2 022-2 410.8=15.6,

所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.

考点三独立性检验

【例3】某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集了300位学生每周平均体育运动时间的样本数据(单位:小时).

(1)应收集多少位女生的样本数据?

(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;

(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.

附:K2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

解(1)利用分层抽样,300×4 500

15 000=90,所以应收集90位女生的样本数据.

(2)由频率分布直方图得1-2×(0.100+0.025)=0.75.所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.

(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

变量之间的关系测试题及答案

第六章《变量之间的关系》测试题 一、填空题(每空2 分,共46分) 1、一个弹簧,不挂物体时长10 厘米,挂上物体以后弹簧会变长,每挂上一千克物体,弹 簧就会伸长1.5厘米,如果所挂物体总质量为X (千克),那么弹簧伸长的长度y (CM可以表示为 ________ ,在这个问题中自变量是_____ ,因变量是_____ ;如果所挂物体总质量 为X(千克)那么弹簧的总长度Y(CM可以表示为_______ ,在这个问题中自变量是_______ ,因变量是 ____ 。 2、为了美化校园,学校共划出84米 2 的土地修建4 个完全相同的长方形花坛,如果每个 花坛的一条边为X (米),那么另一条边y (米)可以表示为______ o 3、一辆汽车正常行驶时每小时耗油8 升,油箱内现有52 升汽油,如果汽车行驶时间为t (时),那么油箱中所存油量Q (升)可以表示为___ ,行驶3小时后,油箱中还剩余汽油 _____ 升,油箱中的油总共可供汽车行驶 ____________ 小时。___________ 4.一圆锥的底面半径是5cm,当圆锥的高由2cm变到10cm时,圆锥的体积由cm3变到 _______ cm3. 5.梯形上底长16,下底长X,高是10,梯形的面积s与下底长x间的关系式是 ____________ .当x = 0时,表示的图形是_______ ,其面积_________ . 4、如图6—1,甲、乙二人沿相同的路线前进,横轴表示时间,纵轴表示路程。 (1)刚出发时乙在甲前面____ 千米。(2)两人各用了_____ 小时走完路程。 (3)甲共走了___ 千米,乙共走了______ 千米。 5、如图6—2 是我国某城市春季某一天气温随时间变化的图象,根据图象回答,在这一天 中,最低气温出现在_____ 时,温度为_____ °C,在______ 时到 ____ 时的时段内,温度持续上升,这一天的温差是_____ ° C o 图6—1 图6—2 图6—3 6、如图6—3,a//b,直线c与a、b分别交于A、B两点,当直线b绕B点旋转时,/ 1 的大小会发生变化。直线a为保证与b平行,相应的/ 2的大小也会发生变化,如果 / 1度数为x度,那么/ 2的度数y可以表示为 _______ ,在这个问题中自变量是____

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

变量之间的关系单元测试题

一、选一选,看完四个选项后再做决定呀!(每小题3分,共30分) 1.李老师骑车外出办事,离校不久便接到学校到他返校的紧急电话,李老师急忙赶回学校.下面四个图象中,描述李老师与学校距离的图象是( ) 2.已知变量x ,y 满足下面的关系 则x ,y 之间用关系式表示为( ) A.y =x 3 B.y =-3 x C.y =-x 3 D.y =3 x 3.某同学从学校走回家,在路上遇到两个同学,一块儿去文化宫玩了会儿,然后回家,下列象能刻画这位同学所剩路程与时间的变化关 A. B. C. D.

系的是() 4.地表以下的岩层温度y随着所处深度x的变化而变化,在某个地点y与x的关系可以由公式20 y来表示,则y随x的增大而 35+ =x () A、增大 B、减小 C、不变 D、以上答案都不对 5.某校办工厂今年前5个月生产某种产品总量(件)与时间(月)的关系如图1所示,则对于该厂生产这种产品的说法正确的是()A.1月至3月生产总量逐月增加,4,5两月生产总量逐月减少B.1月至3月生产总量逐月增加,4,5两月均产总量与3月持平 C.1月至3月生产总量逐月增加,4,5两月均停止生产 D.1月至3月生产总量不变,4,5两月均停止生产 图2 6.如图2是反映两个变量关系的图,下列的四个情境比较合适该图的是()

A.一杯热水放在桌子上,它的水温与时间的关系 B.一辆汽车从起动到匀速行驶,速度与时间的关系 C.一架飞机从起飞到降落的速度与时晨的关系 D.踢出的足球的速度与时间的关系 7.如图3,射线l 甲 ,l 乙 分别表示甲、乙两名运动员在自行车比赛中所走路程与时间的关系,则图中显示的他们行进的速度关系是( ) A.甲比乙快 B.乙比甲快 C.甲、乙同速 D.不 一定 8.在利用太阳能热水器来加热水的过程中,热水器里的水温随所晒时间的长短而变化,这个问题中因变量是( ) A.太阳光强弱 B.水的温度 C.所晒时间 D.热水器 9.长方形的周长为24厘米,其中一边为x (其中0>x ),面积为y 平方厘米,则这样的长方形中y 与x 的关系可以写为( ) A 、2x y = B 、()212x y -= C 、()x x y ?-=12 D 、()x y -=122 10如果没盒圆珠笔有12支,售价18元,用y (元)表示圆珠笔的售价,x 表示圆珠笔的支数,那么y 与x 之间的关系应该是( ) (A )y=12x (B )y=18x (C )y=2 3 x (D )y=32 x 二、填一填,要相信自己的能力!(每小题3分,共30分) 1.某种储蓄的月利率是0.2%,存入100元本金后,则本息和y (元)

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

(完整)七年级数学下册-变量之间的关系测试题

变量之间的关系 1.如果一盒圆珠笔有12支,售价18元,用y(元)表示圆珠笔的售价x,表示圆珠笔的支数,那么y与x之间的关系应该是( ) A.x y12 = B.x y18 = C.x y 3 2 = D.x y 2 3 = 2.在一定条件下,若物体运动的路程(s米)与时间(t秒)的关系式为1 2 32+ + =t t s,则当4 t=时,该物体所经过的路程为( ) A.28米B.48米C.57米D.88米 3.在某次试验中,测得两个变量m和v之间的4组对应数据如下表: m 1 2 3 4 v0.01 2.9 8.03 15.1 则m与v之间的关系最接近于下列各关系式中的( ) A.22 v m =-B.21 v m =-C. 33 v m =-D.1 v m =+ 4.“龟兔赛跑”讲述了这样的故事:领先的兔子看着缓慢爬行的乌龟,骄傲起来,睡了一觉.当它醒来时,发现乌龟快到终点了,于是急忙追赶,但为时已晚,乌龟还是先到达了终点….用S1,S2分别表示乌龟和兔子所行的路程,t为时间,则下列图象中与故事情节相吻合的是( ) 5.正常人的体温一般在C0 37左右,但一天中的不同时刻不尽相同,如图1反 映了一天24小时内小红的体温变化情况,下列说法错误的是( ) A.清晨5时体温最低B.下午5时体温最高 C.这一天小红体温T C0的范围是36.5≤T≤37.5 D.从5时至24时,小红体温一直是升高的 6.小王利用计算机设计一个程序,输入和输出的数据如下表: 输入… 1 2 3 4 5 … 输出 (1) 2 2 5 3 10 4 17 5 26 … 那么,当输入数据8时,输出的数据是( ) A. 8 61 B. 8 63 C. 8 65 D. 8 67 7.如图2,图象(折线OEFPMN)描述了某汽车在行驶过程中速度与时间的关系,下列说法中错误的是( ) A.第3分时汽车的速度是40千米/时B.第12分时汽车的速度是0千米/时 C.从第3分到第6分,汽车行驶了120千米 D.从第9分到第12分,汽车的速度从60千米/时减少到0千米/时 8.向高为10厘米的容器中注水,注满为止,若注水量) (3 cm V与水深 36.5 17 12 5 T/()C0 t/h 24 37.5 图1 图2 图3 图4

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

变量之间的关系测试题及答案

《变量之间的关系》单元测试题 一、填空题(每空2分,共46分) 1、一个弹簧,不挂物体时长10厘米,挂上物体以后弹簧会变长,每挂上一千克物体,弹簧就会伸长厘米,如果所挂物体总质量为X(千克),那么弹簧伸长的长度y(CM)可以表示为___,在这个问题中自变量是___,因变量是___;如果所挂物体总质量为X(千克)那么弹簧的总长度Y(CM)可以表示为___,在这个问题中自变量是___,因变量是___。 2、为了美化校园,学校共划出84米2的土地修建4个完全相同的长方形花坛,如果每个花坛的一条边为X(米),那么另一条边y(米)可以表示为___。 3、一辆汽车正常行驶时每小时耗油8升,油箱内现有52升汽油,如果汽车行驶时间为t (时),那么油箱中所存油量Q(升)可以表示为___,行驶3小时后,油箱中还剩余汽油___升,油箱中的油总共可供汽车行驶___小时。4.一圆锥的底面半径是5cm,当圆锥的高由2cm变到10cm时,圆锥的体积由________变到_________. 5.梯形上底长16,下底长x,高是10,梯形的面积s与下底长x间的关系式是_______.当x =0时,表示的图形是_______,其面积________. 4.如图6—1,甲、乙二人沿相同的路线前进,横轴表示时间,纵轴表示路程。 (1)刚出发时乙在甲前面___千米。(2)两人各用了___小时走完路程。 (3)甲共走了___千米,乙共走了___千米。 5、如图6—2是我国某城市春季某一天气温随时间变化的图象,根据图象回答,在这一天中, 最低气温出现在___时,温度为___°C,在___时到___时的时段内,温度持续上升,这一天的温差是___°C。 10121416182022 1 2 B A c b a 图6—1 图6—2 图6—3 6、如图6—3,ay=100+ B. y=100+ C. y=1+136x D. Y=1+ 2、某次实验中,测得两个变量v和m的对应数据如下表,则v和m之间的关系最接近于下列 关系中的()。

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

初一下变量之间的关系练习题

第四章 《变量之间的关系》复习题(B 卷) 1、某产品生产流水线每小时生产100件产品,生产前无产品积压,生产3小时后,安排工人装箱,若每小时装150件,则未装箱产品数量y 与时间t 关系图为( ) B C D . 2、小明一出校门先加速行驶,然后匀速行驶一段后,在距家门不远的地方开始减速,最后停止,下面的图( )可以近似地刻画出他在这一过程中的时间与速度的变化情况. (A ) (B ) (C ) (D ) 3、“健康重庆”就是要让孩子长得壮,老人寿命更长,全民生活得更健康.为了响应“健康重庆”的号召,小明的爷爷经常坚持饭后走一走.某天晚饭后他慢步到附近的融侨公园,在湖边亭子里休息了一会后,因家中有事,快步赶回家.下面能反映当天小明的爷爷所走的路程y 与时间x 的关系的大致图象是( ) 4、柿子熟了从树上自然掉落下来,下面哪一幅图可以大致刻画出柿子下落过程中(即落地前)的速度变化情况( ) . 时间 时间 时间 时间 (C ) (D ) 时间 (B ) 时间 时间 (A )

5、如图,一只蚂蚁以均匀的速度沿台阶12345A A A A A →→→→爬行,那么蚂蚁爬行的高度..h 随时间t 变化的图象大致是( ) 5、百舸竞渡,激情飞扬. 为纪念爱国诗人屈原,长寿区在长寿湖举行了龙舟赛. 如图是甲、乙两支龙舟队在比赛时的路程s (米)与时间t (分钟)之间关系的图象,请你根据图象回答下列问题: (1)1.8分钟时,哪支龙舟队处于领先地位? (2)在这次龙舟比赛中,哪支龙舟队先到达终点? (3)比赛开始多少时间后,先到达终点的龙舟队就开始领先? 6.为了鼓励小强勤做家务,培养劳动意识,小强每月的总费用等于基本生活费加上奖 励(奖励由上个月他的家务劳动时间确定).已知小强4月份的家务劳动时间为20小时, 他5月份获得了400元的总费用.小强每月可获得的总费用与他上月的家务劳动时间之 间的关系如图所示,请根据图象回答下列问题. (1)上述变化过程中,自变量是_______, 因变量是_______; (2)小强每月的基本生活费为________元. (3)若小强6月份获得了450元的总费用, 则他5月份做了_______小时的家务. (4)若小强希望下个月能得到120元奖励, 则他这个月需做家务________小时. 3.4 1A 2A 3A 4A 5A A . B . C . D .

相关文档
最新文档