第三章 统计案例(A)

第三章 统计案例(A)
第三章 统计案例(A)

第三章统计案例(A)

一、选择题

1、某卫生机构抽查了366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病患者与遗传有关系,这种判断犯错误的概率不超过()

A.0.001 B.0.005

C.0.01 D.0.025

2、已知线性回归方程=x+,其中=3且样本点中心为(1,2),则线性回归方程为()

A. =x+3

B. =-2x+3

C. =-x+3

D. =x-3

3、如图所示,图中有5组数据,去掉哪组数据后,剩下的4组数据的线性相关性最大()

A.E B.C

C.D D.A

4、如下图所示是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()

A.性别与喜欢理科无关

B.女生中喜欢理科的比例为80%

C.男生比女生喜欢理科的可能性大些

D.男生中不喜欢理科的比例为60%

5、某工厂某产品产量y(千件)与单位成本x(元)满足线性回归方程=75.7-2.13x,则以下说法中正确的是()

A.产量每增加1 000件,单位成本下降2.13元

B.产量每减少1 000件,单位成本下降2.13元

C.产量每增加1 000件,单位成本上升2 130元

D.产量每减少1 000件,单位成本上升2 130元

6、甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关指数R2与残差平方和m如下表:

则试验结果体现A 、B A .甲 B .乙 C .丙 D .丁

7、相关指数R 2、残差平方和与模型拟合效果之间的关系是( )

A .R 2的值越大,残差平方和越大,拟合效果越好

B .R 2的值越小,残差平方和越大,拟合效果越好

C .R 2的值越大,残差平方和越小,拟合效果越好

D .以上说法都不正确

8、在2×2列联表中,下列两个比值相差越大,两个分类变量有关系的可能性就越大的是( )

A.a a +b 与c c +d

B.a c +d 与c a +b

C.a a +d 与c b +c

D.a b +d 与c a +c

9、当K 2>3.841时,认为事件A 与事件B ( )

A .有95%的把握有关

B .有99%的把握有关

C .没有理由说它们有关

D .不确定

10、下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家

庭的支出与收入.

其中不是函数关系的有( ) A .0个 B .1个 C .2个 D .3个

11、为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果(单位:

人)

A .95%

B .99%

C .99.9%

D .100%

12、某化工厂为了预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取

了8

对观测数据,计算得∑8

i =1x i =52,∑8

i =1y i =228,∑8

i =1x 2

i =478,∑8

i =1

x i y i =1 849,则

y 对x 的回归方程为( )

A. =11.47+2.62x

B. =-11.47+2.62x

C. =2.62+11.47x

D. =11.47-2.62x

二、填空题

13、对于线性回归方程=4.75x+257,当x=28时,y的估计值为________.

14、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则K2的观测值k=________.

15、从某地区老人中随机抽取500人,其生活能否自理的情况如下表所示:

16、许多因素都会影响贫穷,教育也许是其中的一个.在研究这两个因素的关系时,收集了某国50个地区的成年人至多受过9年教育的百分比(x)和收入低于官方规定的贫困线的人数占本地区人数的百分比(y)的数据,建立的线性回归方程是=4.6+0.8x.这里,斜率的估计等于0.8说明

________________________________________________________________________

________________________________________________________________________

________________________________________________________________________.

三、解答题

17、在钢中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:

求y与x

18、调查了90名不同男、女大学生对于外出租房的态度,各种态度人数分布见下表,试判断学生性别与其态度间有、无关系?

19、为了了解某地母亲身高x与女儿身高y的相关关系,随机测得10对母女的身高如表所示:

试求x与y

20、调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:

根据此资料,你是否认为在

21、一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).

(1)假定y与x之间有线性相关关系,求y对x的线性回归方程.

(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)

22、有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:

其中a,15-a 均为大于5的整数,0.1的前提下认为x 与y 之间有关系?

以下是答案 一、选择题

1、D

2、C [回归直线过样本点中心(1,2),代入验证即可.]

3、A

4、C

5、A [在线性回归方程 = x + 中, =-2.13是斜率的估计值,说明产量每增加1 000件,单位成

本下降2.13元.]

6、D [根据线性相关的检验方法对比得出.]

7、C [R 2越大,残差平方和越小,而残差平方和越小说明模型偏离实际数据的程度越小,从而模型

的拟合效果也就越好.]

8、A [当ad 与bc 相差越大,两个分类变量有关系的可能性越大,此时

a a +

b 与

c c +d

相差越大.]

9、A

10、D [给出的三个关系具有不确定性,应是相关关系.]

11、C

数学选修2-3第三章-统计案例阶段测试3(含详

数学选修2-3第三章-统计案例阶段测试3(含详细答案)

阶段测试三 (第三章统计案例) (时间:120分钟,满分:150分) 一、选择题(每小题5分,共60分) 1.下列关系中是相关关系的是() ①路程与时间、速度的关系; ②加速度与力的关系; ③产品成本与产量的关系; ④圆周长与面积的关系; ⑤广告费支出与销售额的关系. A.①②④B.①③⑤ C.③⑤D.③④⑤ 2.下列说法中表述恰当的个数为() ①相关指数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好; ②在线性回归模型中,R2表示解释变量对预报变量的贡献率,R2越接近于1,表示解释变量

和预报变量的线性相关关系越强; ③若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当. A.0 B.1 C.2 D.3 3.(2016·重庆南开中学期末)巧克力很甜、很好吃,数学很妙、很有趣,某中学统计了部分同学“爱吃巧克力”与“数学成绩好”的关系,得到下表: 经计算得k≈4.167,由此可以判断()

参考数据: A.至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”有关 B .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”有关 C . 至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”无关 D .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”无关 4.某车间为了规定工时定额,需要确定加 工零件所花费的时间,为此进行了5次试验,收集数据如下:

经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是() A.成正相关,其回归直线经过点(30,75) B.成正相关,其回归直线经过点(30,76) C.成负相关,其回归直线经过点(30,76) D.成负相关,其回归直线经过点(30,75) 5.下列关于等高条形图说法正确的是() A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 6.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()

数学第一章统计案例测试1新人教A版选修1 2

高中新课标选修(1-2)统计案例测试题1 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足() A.23.841K?B.23.841K? C.26.635K?D.26.635K? 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代),剩下的4组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结 果(单位:人) 不患肺癌患肺癌不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91

9 965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90% B.95% C.99% D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89 你认为婴儿的性别与出生时间有关系的把握为() A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为yabx??,方程中的回归系数b() A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y(元)与铸件废品率x%建立的回归方程568c yx??,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r?,则x增大时,y也相应增大;②若0r?,则x增

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

数学选修23第三章统计案例教案

第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.

计量经济学 案例分析

第二章 案例分析 研究目的:分析各地区城镇居民计算机拥有量与城镇居民收入水平的关系,对更多规律的研究具有指导意义. 一. 模型设定 2011年年底城镇居民家庭平均每百户计算机拥有量Y 与城镇居民平均每人全年家庭总收入X 的关系 图2.1 各地区城镇居民每百户计算机拥有量与人均总收入的散点图 由图可知,各地区城镇居民每百户计算机拥有量随着人均总收入水平的提高而增加,近似于线性关系,为分析其数量性变动规律,可建立如下简单线性回归模型: Y t =β1+β2X t +u t 50 60 708090100 110120130140 X Y

二.估计参数 假定所建模型及其随机扰动项u i满足各项古典假设,用普通最小二乘法(OLSE)估计模型参数.其结果如下: 表2.1 回归结果 Dependent Variable: Y Method: Least Squares Date: 11/13/17 Time: 12:50 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 11.95802 5.622841 2.126686 0.0421 X 0.002873 0.000240 11.98264 0.0000 R-squared 0.831966 Mean dependent var 77.08161 Adjusted R-squared 0.826171 S.D. dependent var 19.25503 S.E. of regression 8.027957 Akaike info criterion 7.066078 Sum squared resid 1868.995 Schwarz criterion 7.158593 Log likelihood -107.5242 Hannan-Quinn criter. 7.096236 F-statistic 143.5836 Durbin-Watson stat 1.656123 Prob(F-statistic) 0.000000 由表2.1可得, β1=11.9580,β2=0.0029 故简单线性回归模型可写为: ^ Y X t t=11.9580+0.0029 其中:SE(β1)=5.6228, SE(β2)=0.0002 R-squared=0.8320,F=143.5836,n=31

第一章《统计案例》练习

----------专业最好文档,专业为你服务,急你所急,供你所需------------- §1.1 独立性检验 1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”. 2.分类变量X 和Y .(填序号) ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 3.通过随机询问110 χ2=110×(40×30-20×20) 60×50×60×50 ≈7.8,得到的正确结论是________. ①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 4.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 则有________的把握确定吸烟量与年龄有关. 5.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响;

----------专业最好文档,专业为你服务,急你所急,供你所需------------- ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 6 设H 0:主修统计专业与性别无关,则 χ2的值约为________,从而得出结论有 把握认为主修统计专业与性别有关系,这种判断出错的可能性为________. 7.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的 零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: (1)分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

单元测试:选修2-3第三章《统计案例》

选修2-3第三章《统计案例》 (时间120分钟 满分150分) 一、选择题(共60分) 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相 同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1 次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A.310 B.29 C.78 D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100% 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89

2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3

§3.2 独立性检验的基本思想及其初步应用 学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2 的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法. 知识点一 分类变量及2×2列联表 思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表: 体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计 270 520 790 如何判定“喜欢体育还是文娱与性别是否有联系”? 答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表 一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表. y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a + b + c +d 知识点二 等高条形图 1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. 2.如果通过直接计算或等高条形图发现a a + b 和 c c +d 相差很大,就判断两个分类变量之间有关系. 知识点三 独立性检验

1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 2.K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d为样本容量. 3.独立性检验的具体做法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0. (2)利用公式计算随机变量K2的观测值k. (3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 1.列联表中的数据是两个分类变量的频数.( √) 2.事件A与B的独立性检验无关,即两个事件互不影响.( ×) 3.K2的大小是判断事件A与B是否相关的统计量.( √) 类型一等高条形图的应用 例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下: 组别阳性数阴性数总计 铅中毒病人29736 对照组92837 总计383573 试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 考点定性分析的两类方法 题点利用图形定性分析 解等高条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学第三章统计案例2独立性检验教学案北师大版选修2_3

§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]

[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:

第一章 统计案例 复习题

第一章 统计案例 复习题 一、选择题 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A.2 3.841K > B.2 3.841K < C.2 6.635K > D.2 6.635K < 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费; ③家庭的支出与收入.其中不是函数关系的有( ) A.0个 B.1个 C.2个 D.3个 4.当2 3.841K >时,认为事件A 与事件B ( ) A.有95%的把握有关 B.有99%的把握有关 C.没有理由说它们有关 D.不确定 5.已知回归直线方程 y bx a =+,其中3a =且样本点中心为(1 2),,则回归直线方程为( ) A.3y x =+ B.23y x =-+ C.3y x =-+ D.3y x =- 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表: 你认为性别与是否喜欢数学课程之间有关系的把握有( ) A.0 B.95% C.99% D.100% 7.在回归直线方程 y a bx =+中,回归系数b 表示( ) A.当0x =时,y 的平均值 B.x 变动一个单位时,y 的实际变动量 C.y 变动一个单位时,x 的平均变动量 D.x 变动一个单位时,y 的平均变动量 8.对于回归分析,下列说法错误的是( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 B.线性相关系数可以是正的,也可以是负的 C.回归分析中,如果21r =,说明x 与y 之间完全相关 D.样本相关系数(11) r ∈-, 9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上(D)选择两个变量中任意一个变量在y 轴上 10、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右. 11、两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.98 B.模型2的相关指数2R 为0.80 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.25 12、在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 2 13、工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为?6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资d 的90元 14、对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是( ) A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度 越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大 15、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

第一章统计案例单元检测题及答案

第一章统计案例 命题人:卧龙寺中学鲁向阳审题人:唐军宁 第I卷 说明:本试卷分第I卷(选择题)和第II卷(非选择题)两部分,共150分,时间90分钟 一、选择题:(每小题5分,共计60分) 1.下列结论正确的是() ①函数关系是一种确定性关系;②相关关系是一种非确定性关系; ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④ 2.年劳动生产率x(千元)和工人工资y(元)之间回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均() A.增加70元B.减少70元C.增加80元D.减少80元 3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则 回归直线方程为() A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23 4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到班级与成绩列联表如下: 则随机变量2K的观测值约为() A.0.60 B.0.828 C.2.712 D.6.004 5.下列属于相关现象的是() A.利息与利率C.电视机产量与苹果产量 B.居民收入与储蓄存款D.某种商品的销售额与销售价格 6.下列关系中是函数关系的是() A.等边三角形的边长和周长关系C.电脑的销售额和利润的关系B.玉米的产量和施肥量的关系 D.日光灯的产量和单位生产成本关系7. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93。用这个模型预测这个孩子10岁时的身高,则正确的叙述是() A.身高一定是145.83cm C.身高在145.83cm以下 B.身高在145.83cm以上D.身高在145.83cm左右 8. 变量y与x之间的回归方程表示() A. y与x之间的函数关系 B. y与x之间的不确定性关系 C. y与x之间的真实关系 D. y与x之间的真实关系达到最大限度的吻合

高中数学选修1-2第一章统计案例测试题带详细解答

选修1-2第一章、统计案例测试 一、选择题 1.已知x与y之间的一组数据: x0123 y1357 则y与x的线性回归方程为必过点( ) A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2) 【答案】B 【解析】 试题分析:由数据可知,,∴线性回归方程为必过点(1.5,4) 考点:本题考查了线性回归直线方程的性质 点评:解决此类问题常常用到线性回归直线方程恒过定点这一结论,属基础题 2.年劳动生产率(千元)和工人工资(元)之间回归方程为,这意味着年劳动生产率每提高1千元时,工人工资平均 A.增加70元B.减少70元C.增加80元D.减少80元 【答案】A 【解析】 试题分析:由题意,年劳动生产率(千元)和工人工资(元)之间回归方程为, 故当增加1时,要增加70元, ∴劳动生产率每提高1千元时,工资平均提高70元, 故A正确. 考点:线性回归方程. 点评: 本题考查线性回归方程的运用,正确理解线性回归方程是关键.3.已知某回归方程为:,则当解释变量增加1个单位时,预报变量平均:()

A、增加3个单位 B、增加个单位 C、减少3个单位 D、减少个单位 【答案】C 【解析】 解释变量即回归方程里的自变量,由回归方程知预报变量减少3个单位4.变量与相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量与相对应的一组数据为(10,5), (11.3, 4), (11.8, 3), (12.5, 2), (13, 1),表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则 A. B. C. D. 【答案】C 【解析】解:∵变量X与Y相对应的一组数据为(10,1),(11.3,2), (11.8,3),(12.5,4),(13,5), . X =(10+11.3+11.8+12.5+13) 5 =11.72 . Y =(1+2+3+4+5) 5 =3 ∴这组数据的相关系数是r=7.2 19.172 =0.3755, 变量U与V相对应的一组数据为(10,5),(11.3,4), (11.8,3),(12.5,2),(13,1) . U =(5+4+3+2+1) 5 =3, ∴这组数据的相关系数是-0.3755, ∴第一组数据的相关系数大于零,第二组数据的相关系数小于零, 故选C. 5.统计中有一个非常有用的统计量 ,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A老师教, 乙班B老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

高中数学选修2-3第三章《统计案例》测试题

高中数学选修2-3第三章《统计案例》测试题 姓名___________学号______(满分100分,时间90分钟) 一、选择题:(每题5分,共50分,请将准确答案填在答题卡内) 1.已知一个线性回归方程为?y =1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.5 2.对有线性相关关系的两个变量建立的回归直线方程 ???y a bx =+中,回归系数? b ( ) A .能等于0 B .小于0 C .可以小于0 D .只能等于0 3.能表示n 个点与相应直线在整体上的接近程度的是( ) A.1 ()n i i y i =-∑ B 1 ()n i i i y =-∑ C. 2 1 () n i i y i =-∑ D. 21 ()n i i y y =-∑ 4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2 = ()()()()() n ad bc a b c d a c b d -++++算得K 2 =2 110(40302030)7.860506050 ??-?≈???附表: P (K 2≥k ) 0.10 0.05 0.025 0.01 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^ =-3+bx ,若∑i =1 10x i =17,∑i =1 10 y i =4,则b 的值为( ) A .2 B .1 C .-2 D .-1 6.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( ) A. y ^ =x +1 B. y ^=x +2 C. y ^=2x +1 D . y ^ =x -1 7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

高中数学选修1-2第一章统计案例测试题带详细解答

选修1-2第一章、统计案例测试 一、选择题 1.已知x 与y 之间的一组数据: 则y 与x 的线性回归方程为∧ ∧ ∧ +=a x b y 必过点( ) A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2) 【答案】B 【解析】 为∧ ∧ ∧ +=a x b y 必过点(1.5,4) 考点:本题考查了线性回归直线方程的性质 2.年劳动生产率x (千元)和工人工资y (元)之间回归方程为1070y x =+,这意味着年劳动生产率每提高1千元时,工人工资平均 A.增加70元 B.减少70元 C.增加80元 D.减少80元 【答案】A 【解析】 试题分析:由题意,年劳动生产率x (千元)和工人工资y (元)之间回归方程为 1070y x =+, 故当x 增加1时,y 要增加70元, ∴劳动生产率每提高1千元时,工资平均提高70元, 故A正确. 考点:线性回归方程. 点评: 本题考查线性回归方程的运用,正确理解线性回归方程是关键. 3.已知某回归方程为:??23y x =-,则当解释变量增加1个单位时,预报变量平均:( ) A 、增加3个单位 B C 、减少3个单位 D 、 【答案】C 【解析】 解释变量即回归方程里的自变量x ?,由回归方程知预报变量y ?减少3个单位 4.变量X 与Y 相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量U 与 V 相对应的一组数据为(10,5), (11.3, 4), (11.8, 3), (12.5, 2), (13, 1),1r 表示变量Y 与X 之 间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 A .012<

相关文档
最新文档