高二数学统计案例练习题

高二数学统计案例练习题
高二数学统计案例练习题

广东省阳山中学选修1-2第一章《统计案例》单元检测

独立性检测中,随机变量()()()()

2

2

()n ad bc k a b c d a c b d -=++++

参考公式

求线性回归方程系数公式:11

22

2

1

1

()()?()

i i

i

i

i i n

n

i

i

i i x y nx y x x y y b

x

nx x x ====-?--==

--∑∑∑∑,

?a

y bx =-. 一、选择题

1.在画两个变量的散点图时,下面哪个叙述是正确的() A 预报变量在x 轴上,解释变量在y 轴上 B 解释变量在x 轴上,预报变量在y 轴上 C 可以选择两个变量中任意一个变量在x 轴上 D 可以选择两个变量中任意一个变量在y 轴上

2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=+,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()

A.身高一定是.身高在145.83cm 以上

C.身高在145.83cm 以下

D.身高在145.83cm 左右

3.设有一个直线回归方程为^

^

2 1.5y x =-,则变量x 增加一个单位时() 平均增加个单位平均增加2个单位

平均减少个单位平均减少2个单位

4.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )

A .模型1的相关指数R 2为.模型2的相关指数R 2为 C .模型3的相关指数R 2为.模型4的相关指数R 2为

5.通过残差图我们发现在采集样本点过程中,第____个样本点数据不准确( )

A.第四个B.第五个C.第六个D.第八个

6.若由一个2×2列联表中的数据计算得K2=,那么确认两个变量有关系的把握性有( )

A.90%B.95%C.99%D.%

7.如果有95%的把握说事件A和B有关,那么具体算出的数据满足

()

A.2 3.841

K<

K>D.2 6.635 K>B.2 3.841

K<C.2 6.635

8.已知x与y之间的一组数据:

x0123

y1357

则y必过()

A.(2,2)点

B.(,0)点

C.(1,2)点

D.(,4)点

9.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v,有观测数据(u i,v i)(i=1,2,…,10),得散点图(2),由这两个散点图可以判断( )

A.变量x与y正相关,u与v正相关B.变量x与y正相关,u 与v负相关

C.变量x与y负相关,u与v正相关D.变量x与y负相关,u

与v负相关

10、若两个分类变量x和y的列联表为:

( )

A.%B.%C.%D.%

二、填空题

11.在两个变量的回归分析中,作散点图的目的是

_________________________________

12.已知回归直线的斜率的估计值是,样本点的中心为(4,5),则回

归直线的方程是

_________________________

13.若由一个2*2列联表中的数据计算得k2=,那么有把握认为两个变量有关系

14.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上

的人,调查结果如下表

根据列联表数据,求得2K=

三、解答题

15.假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:

若由资料知,y对x

(Ⅰ)请画出上表数据的散点图;

(Ⅱ)请根据上表提供的数据,求出y关于x的线性回归方程=+;

y bx a

(Ⅲ)估计使用年限为10年时,维修费用约是多少

(2 2.23 3.84 5.55 6.567.0112.3

?+?+?+?+?=)

16.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下

对应数据:

(1)画出散点图;(2)求回归直线方程;

(3)试预测广告费支出为10百万元时,销售额多大

(参考数据2*2+4*4+5*5+6*6+8*8=145,2*30+4*40+5*60+6*50+8*70=1380)

17.在7块面积相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg)

(1)试求y 对x 的线性回归方程;(2)当施化肥量28x kg 时,预测水稻产量。

(参考数据:15×330+20×345+…+45×45=87175;15×15+20×20+…+45×45=7000)

18.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:

(1) 用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;

(2) 描述解释变量与预报变量之间的关系;(3)计算残差、相关指数R

2。

(参考数据:ln6=,ln12=,ln25=,ln49=,ln95=,ln190=; 1×+2×+…+6×=,1×1+2×2+…+6×6=91)

19.在对人们休闲方式的一次调查中,共调查120人,其中女性70

人、男性50人,女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动。 (I )根据以上数据建立一个2×2的列联表:

性别

女性

男性

总计

(II)休闲方式与性别是否有关

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

(完整word版)高二数学典型统计案例习题及答案

典型案例作业 1.某商场经理根据以往经验知道,有40%的客户在结账时会使用信用卡,则连续三位顾客都使用信用卡的概率为( ) 2.三个同学同时作一电学实验,成功的概率分别为1P ,2P ,3P ,则此实验在三人中三人都不成功的概率是( ) 3.甲、乙两人同时应聘一个工作岗位,若甲、乙被应聘的概率分别为0.5、0.6 两人被聘用是相互独立的,则甲乙两人中没有一人被聘用的概率( ) 4.甲射击运动员分别对一目标射击三次,甲射中的概率为0.4,则至少有一次射中的概率是________ 5.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 比较这两种手术对病人又发作心脏病的影响有没有差别.________. 6. 回答能否有99.9% 的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”

7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表: 推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y与工作年限x之间的相关系数; (2)求年推销金额y关于工作年限x的线性回归方程; (3)若第6名推销员的工作年限为11年,试估计他的年推销金额. (参考数据: 1.04≈1.02;由检验水平0.01及n-2=3,查表得=0.959)

8.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2010年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下表: 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验. (1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12 ^=bx+a; 月4日的数据,求出y关于x的线性回归方程y (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?

应用统计学案例统计调查方案设计

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其它内容

包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面能够灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。

高三数学概率统计知识点归纳

高三数学概率统计知识 点归纳 内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

概率统计知识点归纳 平均数、众数和中位数 平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明. 一、正确理解平均数、众数和中位数的概念 平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势. 3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的. 二、注意区别平均数、众数和中位数三者之间的关系 平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题 由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.

极差、方差、标准差 极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 极差 一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差 方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x1、x2、x3、…、xn 的平均数为x ,则该组数据方差的计算公式为: ])()()[(1222212x x x x x x n S n -++-+-= . 三、标准差 在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差. 即标准差=方差. 四、极差、方差、标准差的关系 方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

高三数学《统计》知识总结

高三数学《统计》知识总结 一、相关性检验(检验两个变量之间是否具有相关关系) 1.相关关系的分类 相关关系包括正相关和负相关。 2.线性相关关系 从散点图上看,如果两个变量对应的点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程 两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为?y =?b x +?a ,则,,其中,?b 是回归方程的回归系数,?a 是在y 轴上的截距,(x ,y )是样本点的中心. 4.样本相关系数 ,用它来衡量两个变量间的线性相关关系. (1)由于相关系数r 的分子与线性回归方程中的斜率?b 的分子一样,因此,当时,两个变量正相关; 当时两个变量负相关. (3) 1r ≤, 当r 越接近1,表明两个变量的线性相关性越强;当r 越接近0,表明两个变量的线性相关性越弱. 二、独立性检验 1.2×2列联表 2.K 2统计量 K 2=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量) 。规定:,,,a b c d 都要大于5 3.两个临界值: 在独立性检验中,统计量K 2有两个临界值:3.841和6.635.当K 2>3.841时,有95%的把握说明两个 事件有关,当K 2>6.635时,有99%的把握说明两个事件有关,当K 2≤3.841时,认为两个事件无关. 注:有95%(或99%)的把握说事件A 与B 有关,也可说推断犯错误的可能性为5%(或1%). 12 1()()()n i i i n i i x x y y b x x ==--=-∑∑$1221n i i i n i i x y nx y x nx ==-=-∑∑$a y bx =-$()()n i i x x y y r --=∑0r >0r <

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

高二数学《统计案例》教案

选修1-2第一章、统计案例 1、1回归分析的基本思想及其初步应用。(第1课时) 教学目标:通过典型案例,掌握回归分析的基本步骤。 教学重点:熟练掌握回归分析的步骤。 教学难点:求回归系数 a , b 教学方法:讲练。 教学过程: 一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 二、新课: 1、回归分析的基本步骤:(1) 画出两个变量的散点图。(2) 求回归直线方程。 (3) 用回归直线方程进行预报。 2、举例:例1、题(略) 用小黑板给出。 解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。体重为因变量 y ,作散点图(如图) (2)列表求 ,?0.849?85.712x y b a ≈≈- 回归直线方程 y=0.849x-85.712 对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。316kg 问题:身高为172cm 的女大学生的体重一定是60。316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业) 研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下: 水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1)求y 对x 的回归直线方程; (2)预测水深为1。95m 时水的流速是多少? 解:(略) 三、小结 四、作业: 例2、 预习。

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

高考数学统计及统计案例

§10.2统计及统计案例 考纲解读 分析解读

从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.

(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400× =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60× =30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 五年高考 考点一 抽样方法 1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )

高中数学统计案例综合检测试题及答案-word文档

高中数学统计案例综合检测试题及答案 选修2-3第三章统计案例综合检测 时间120分钟,满分150分。 一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y 4.5 4 3 2.5 由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15 C.5.2 D.5.25 [答案] D [解析] x=2.5,y=3.5, ∵回归直线方程过定点(x,y), 3.5=-0.72.5+a,a=5.25.故选D. 2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有() A.b与r的符号相同 B.a与r的符号相同

C.b与r的符号相反 D.a与r的符号相反 [答案] A [解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0. 3.有下列说法: ①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高; ③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系. 其中真命题的个数是() A.0 B.1 C.2 D.3 [答案] D 4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲 X 110 120 125 130 135 P 0.1 0.2 0.4 0.1 0.2 乙 X 100 115 125 130 145 P 0.1 0.2 0.4 0.1 0.2

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高考数学复习专题:统计与概率(经典)

11 12 13 3 5 7 2 2 4 6 9 1 5 5 7 图1 统计与概率专题 一、知识点 1、随机抽样:系统抽样、简单随机抽样、分层抽样 1、用简单随机抽样从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的概率是( ) A . 1001 B .251 C .5 1 D . 5 1 2、为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为( ) A .40 B .30 C .20 D .12 3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A .3人 B .4人 C .7人 D .12人 2、古典概型与几何概型 1、一枚硬币连掷3次,只有一次出现正面的概率是( ) A .83 B .32 C .31 D .4 1 2、如图所示,在正方形区域任意投掷一枚钉子,假设区域内每一点被投中的可能性相等,那么钉子投进阴影区域的概率为____________. 3、线性回归方程 用最小二乘法求线性回归方程系数公式1 2 211 ???n i i i n i x y nx y b a y bx x nx ==-==--∑∑,. 二、巩固练习 1、随机抽取某中学12位高三同学,调查他们春节期间购书费用(单位:元),获得数据的茎叶图如图1, 这12位同学购书的平均费用是( ) A.125元 B.5.125元 C.126元 D.5.126元 2、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,时速在[50,60) 的汽车大约有( ) A .30辆 B . 40辆 C .60辆 D .80辆 3、某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师 的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其 他教师中共抽取了16人,则该校共有教师 ______人. 4、执行下边的程序框图,若0.8p =,则输出的n = . 0.04 0.030.020.01频率 组距时速8070605040开始 10n S ==, S p

高二数学统计测试题(完整资料)

统计 1、 某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他 们中抽取一个容量为36的样本,最适合抽取样本的方法是( ) A .简单随机抽样 B .系统抽样 C .分层抽样 D .先从老年人中剔除一人,然后分层抽样 2、下列说法中,正确的是( ) (1)数据4、6、6、7、9、4的众数是4。 (2)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势。 (3)平均数是频率分布直方图的“重心”。 (4)频率分布直方图中各小长方形的面积等于相应各组的频数。 A .(1)(2)(3) B.(2)(3) C.(2)(4) D.(1)(3)(4) 3、某地区共有10万户居民,该地区城市住户与农村住户之比为4:6,根据分层抽样方法,调查了该地区1000户居民冰箱拥有情况,调查结果如表所示,那么可以估计该地区农村住户 A .1.6万户 B .4.4万户 C .1.76万户 D .0.24万户 4、下列正确的个数是( ) (1) 在频率分布直方图中,中位数左边和右边的直方图的面积相等。 (2) 如果一组数中每个数减去同一个非零常数,则这一组数的平均数改变,方差不改变。 (3)一个样本的方差是_s 2 =1/20[(x 1一3)2 +-(X 2—3) 2 +…+( X n 一3) 2 ],则这组数据等总和等于60. (4) 数据123,,,...,n a a a a 的方差为2 σ,则数据1232,2,2,...,2n a a a a 的方差为24σ A . 4 B. 3 C .2 D . 1 5、 为了解某校高三学生的视力情况, 随机地抽查了该校200名高三学生 的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最多一组学生数为a ,视力在4.6到5.0 之间的频率为b ,则a , b 的值分别为( ) A .0.27, 78 B .54 , 0.78 C .27, 0.78 D .54, 78 6、在调查高一年级1500名学生的身高的过程中,抽取了一个样本并将其分组画成频率颁直方图,[160cm ,165cm]组的小矩形的高为a ,[165cm ,170cm]组小矩形的高为b,试估计该高一年集学生身高在[160cm ,170cm]范围内的人数 7、从某鱼池中捕得120条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得100条鱼,计算其中有记号的鱼为10条,试估计鱼池中共有鱼的条数为

高二文科数学统计案例专项练习

高二文科数学统计案例专项练习 1.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分 层抽样抽取容量为30的样本,则抽高级职称的人数为 A .2 B .3 C .5 D .10 2.为了判断高一学生是否选修文科与性别的关系,现随机抽取 50名学生,得到右侧2×2列联表:则认为选修文科与性别有 关系出错的可能性不超过 A .0.005 B .0.05 C .0.95 D .0.095 3.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相 关关系,得到回归直线方程?0.5 1.5y x =+.若该地区的人均消费水平为3.5千元,估计该地区的人均消费额占人均工资收入的百分比约为 A .80% B .82.5% C .87.5% D .92.3% 4.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系.现取 8对观测值,计算得8 1 40i i x ==∑,8 1 240i i y ==∑,8 1 1800i i i x y ==∑,8 21 400i i x ==∑,则其线性回归方 程为 . 5.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm )与年龄x (岁)的回归模型为 ?8.2560.13y x =+. ①该地区一个10岁儿童的身高为142.63 cm ;②该地区2~9岁的儿童每年身高约增加8.25 cm ; ③该地区9岁儿童的平均身高是134.38 cm ;④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高. 上述叙述正确的有. 6.某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关 系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (°C )与该奶茶店 ( (2)请根据所给五组数据,求出y 关于x 的线性回归方程???y bx a =+. (参考公式:()() () 1 2 1 ???n i i i n i i x x y y b a y bx x x ==--==--∑∑,.)

通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

专题突破练20 统计与统计案例 1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就 是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表: (1)根据列联表,能否有99%的把握认为满意程度与年龄有关? (2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案 乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率. 附:K2=-,其中n=a+b+c+d. 参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

相关文档
最新文档