必修三数学第二章统计
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
高中数学人教A版必修3--第二章 统计本章教材分析教案

第二章统计
本章教材分析
现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料,然后通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问题.本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学目标随着学段的升高逐渐提高.在义务教育阶段的统计与概率知识的基础上,《课程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异.。
高中数学必修3 第二章《统计》

A. 抽 签 法 B . 随 机 数 表 法 D.分层抽样法
C.系统抽样法
3.某校高中生共有900人,其中高一年级300人,高二
年级200人,高三年级400人,现采取分层抽样抽取容量
为45的样本,那么高一、高二、高三各年级抽取的人数
分别为( )
D
A.15,5,25 B.15,15,15
C, 系统抽样法, 分层抽样法;
D, 简单随机抽样法, 分层抽样法;
5.某中学有学生2000名,高一、高二、高三的学生人数之比 为5:3:2,现要抽取一个容量为200的样本,则学生甲被抽
到的概率是___1_/_1_0________。若高一学生抽取50人,则样本
的容量为____1_0_0_____.
06 16 26 36 46 56
3.分层抽样
当已知总体由差异明显的几部分组成时,为了使样本 充分地反映总体的情况,常将总体分成几部分,然后按照各 部分所占的比例进行抽样。这种抽样叫做分层抽样。
说明:1、分层抽样适用于总体由差异明显的几个部分组成。
2、在每一层进行抽样时,采用简单随机抽样或系统 抽样; 3、分层抽样也是等概率抽样。 4、每一层的个数不同,则抽取的个数也应不同。
150个销售点, 公司为了调查产品销售情况,需从这600个
销售点中抽取容量为100的样本,记这项调查为①; 在C
地区有20个特大型销售点,现从中抽取7个调查它的销售
收入和销后服务情况,记这项调查为②;则完成①,②这两
ห้องสมุดไป่ตู้
项调查应采取的抽样方法依次为( A, 分层抽样法, 系统抽样法;
B)
B, 分层抽样法, 简单随机抽样法;
用系统抽样方法,从某校高二(19)班60人中抽取6人 参加初中招生服务队。
高中数学必修三第二章 统计 本章整合(共35张PPT)课件

定义:散点图中的点分布在一条直线附近
相关关系→线性相关
回归方程
求法:最小二乘法求回归方程系数 应用:已知一个变量值预测另一个变量值
专题一 三种抽样方法的比较
简单随机抽样、系统抽样、分层抽样的比较如下表:
类别 共同点
各自特点
联系
适用范围
简单
总体中个
随
从总体中逐个
体无差异
机抽 样
系统 抽样
分层 抽样
答案:0.02 600
专题三 用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律,我们还可以通过样本数 据的众数、中位数、平均数和标准差等数字特征对总体的数字特征
作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是 把样本数据按照由小到大(或由大到小)的顺序排列,若数据的个数 是奇数,就是处于中间位置的数;若数据的个数是偶数,就是中间两个 数据的平均数.平均数就是所有样本数据的平均值,用������表示;标准差 是反映样本数据分散程度大小的最常用统计量,其计算公式如下:
提示:分层抽样时,在各层所抽取的样本个数与该层个体数的比 值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码 与前一个号码的差都等于分段间隔.
解析:按分层抽样时,在一年级抽取 108×21700=4(人),在二年级、 三年级各抽取 81×21700=3(人),则在号码段 1,2,…,108 中抽取 4 个号码, 在号码段 109,110,…,189 中抽取 3 个号码,在号码段 190,191,…,270 中抽取 3 个号码,①②③符合,所以①②③可能是分层抽样,④不符合, 所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是 “等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④ 都不能为系统抽样.
人教版高一数学必修三第二章统计全部教案和测试题

人教版高一数学必修三第二章统计目录2.1.1 简单随机抽样(新授课)2.1.2 系统抽样(新授课)2.1.3 分层抽样(新授课)2.2.1用样本的频率分布估计总体分布(2课时)(新授课) 2.2.2用样本的数字特征估计总体的数字特征(2课时)(新授课) 2.3.1变量之间的相关关系(新授课)2.3.2两个变量的线性相关(第一课时)(新授课)2.3.2两个变量的线性相关(第二课时)(新授课)2.3.2生活中线性相关实例(第三课时)(新授课)第二章统计单元检测题(一)第二章统计单元检测题(一)参考答案第二章统计单元检测题(二)第二章统计单元检测题(二)参考答案第二章统计单元检测题(三)第二章统计单元检测题(三)参考答案第二章统计一、课程目标:本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。
本章通过实际问题,进一步介绍随机抽样、样本估计总体、线性回归的基本方法。
二、学习目标:1、随机抽样(1)能从现实生活或其他学科中提出具有一定价值的统计问题。
(2)结合具体的实际问题情境,理解随机抽样的必要性和重要性。
(3)在参与解决统计问题的过程中,学会用简单随机抽样从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。
(4)通过试验、查阅资料、设计调查问卷等方法收集数据。
2、用样本估计总体(1)通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布彪、花频率分布直方图、频率折线图、茎叶土,体会它们各自的特点。
(2)通过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释。
(4)进一步体会用样本估计总体的思想。
(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
(6)形成对数据处理过程进行初步评价的意识。
人教版高中数学必修三第二章统计课件PPT2.3

数学 必修3
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
解析:
(1)由题意,可得
x
=12.5,
y
=8.25,
4
xiyi=
438,
4
x2i =660,则
∧
b
i=1
i=1
=4386-604-×41×2.152×.582.25≈0.728 6,a∧= y -b∧ x =-0.857 5. 所以回归直线的方程为∧y=0.728 6x-0.857 5. (2)要使 y≤10,则 0.728 6x-0.857 5≤10, 解得 x≤14.90.所以机器的转速应该控制在 15 转/秒以下.
学案·新知自解 教案·课堂探究 练案·学业达标
转速 x(转/秒)(x∈N*)
16 14 12 8
每小时生产有缺点的零件数 y(件) 11 9 8 5
(1)如果 y 与 x 具有线性相关关系,求回归方程;
(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为 10 个,那么
机器的转速应该控制在什么范围内?
答案: D
数学 必修3
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
3.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归 方程为∧y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在______kg 左右.
解析: 当 x=178 时,∧y=0.72×178-58.2=69.96(kg). 答案: 69.96
第二章 统计
学案·新知自解 教案·课堂探究 练案·学业达标
n
xiyi-n x y
i=1
高中数学第2章统计2.1抽样方法2.1.2系统抽样教案苏教版必修3

2.1.2 系统抽样整体设计教材分析当总体中个体比拟多,抽签法与随机数表法用于选取样本就比拟烦琐,而且也不能保证样本代表性,所以本节课将要学习又一种新抽样方法——系统抽样.在教学时教师不仅要让学生了解系统抽样概念,而且还要让学生掌握如何进展系统抽样,以及在进展系统抽样时所要注意一些事项,如怎样进展分段,应该分成多少段,分段时如总体个数不能被样本容量整除怎么办等等.在教学中要教会学生会比拟各种方法适用范围与各自优缺点,并会根据实际情况选择恰当抽样方法,且在讲解系统抽样时必须紧扣“每个个体被抽取概率是相等〞理论依据.黑格尔说:“教师是学生心目中‘权威人物’,是儿童心目中最神圣偶像.〞因此,我们教师在教学中要建立民主师生关系,要有意突破常规,让学生敢于在课堂上表现自己,教师也要善于表扬他们.教学时,教师要让学生充分发挥自己潜能,培养他们会对现有知识独立钻研创新精神,并培养他们会用现有知识合理辐射数学思维,得出一些具有个人特色正确结论.三维目标了解系统抽样概念及抽样步骤,会用系统抽样从总体中抽取样本,能运用所学知识判断、分析与选择抽取样本方法.能从现实生活或其他学科提出有价值数学问题,并能加以解决,培养学生运用统计思想表达思考与解决现实世界中问题能力,让学生感受数学美学价值在于鲜活实际应用,立志于学习与研究数学,最大限度地用数学知识效劳于社会,同时自身也能获得最正确生存环境.重点难点教学重点:系统抽样应用.教学难点:对系统抽样中“系统〞思想理解;对样本随机性理解.课时安排1课时教学过程导入新课当总体中个体数比拟多时,采用抽签法或随机数表法那么比拟烦琐,那么该如何抽样?如:某校高一年级共有20个班,每班有50名学生.为了了解高一学生视力状况,从这1 000人中抽取一个容量为100样本进展检查,应该怎样抽取?学生思考,交流讨论,然后代表发言,教师修改总结.推进新课新知探究1.将总体平均分成几个局部,然后按照一定规那么,从每个局部中抽取一个个体作为样本,这样抽样方法称为系统抽样〔systematic sampling〕.2.假设要沉着量为N总体中抽取容量为n样本,系统抽样步骤为:〔1〕采用随机方式将总体中N 个个体编号;〔2〕将编号按间隔k 分段,当n N 是整数时,取k=n N ;当n N 不是整数时,从总体中剔除一些个体,使剩下总体中个体个数N′能被n 整除,这时取k=nN ,并将剩下总体重新编号; 系统抽样与简单随机抽样联系:将总体均分后每一局部进展抽样时,采用是简单随机抽样.系统抽样优点是简便易行,当对总体构造有一定了解时,充分利用已有信息对总体中个体进展排队再抽样,可提高抽样效率;当总体中个体存在一种自然编号时,便于施行系统抽样法.系统抽样缺点是在不了解样本总体情况下,所抽出样本具有一定偏差.〔3〕在第一段中用简单随机抽样确定起始个体编号l ;〔4〕按照一定规那么抽取样本,通常将编号为l,l+k,l+2k,…,l+(n-1)k 个体抽出.应用例如〔多媒体出示题目,学生思考〕例1 一条流水线生产某种产品,每天都可生产128件这种产品,我们要对一周内生产这种产品作抽样检验,方法是抽取这一周内每天下午2点到2点半之间下线8件产品作检验.这里采用了哪种抽取样本方法分析:此抽样选用了“等时〞抽样,与“等间距〞类似而作出判断.解:系统抽样.点评:解决此题要弄清楚目前所学两种抽样概念与特点.例2 某校为了了解全校住校生对学校食堂意见,打算从全校1 000名住校生中抽取50名进展调查,用系统抽样法进展抽取,并写出过程.分析:根据系统抽样步骤可解此题.解:首先将这1 000名学生从1开场进展编号,然后按号码顺1000=20,再从号码1~20第一段中序均分成50段,每段个体数为50用简单随机抽样抽取一个号码,假设抽到是9号,然后从9 开场,每隔20个号码抽取一个,这样就得到容量为50样本编号:9、29、49、…、989,这样,我们就得到一个容量为50样本,这种抽样方法就是系统抽样.N是整数.点评:此题“分段〞比拟方便,因为分段间隔k=n例3 某单位在岗职工共624人,为了调查工人用于上班途中所用时间,决定抽取10%工人进展调查,如何采用系统抽样方法完成这一抽样?分析:总体中每一个个体,都必须等可能地入样.为了实现“等距〞入样,且又等概率,应先剔除,再“分段〞,后定起始数.解:抽样过程如下:〔1〕先将在岗工人624人,用随机方式编号〔如按出生年月日编号〕:000,001,002, (623)〔2〕由题知应抽取62人作为样本,因为624不能被62整除,所以应从总体中剔除4个,将余下620人按编号顺序补齐000,001,002,…,619,并分成62个段,每段10人.〔3〕在第一段000,001,002,…,009这十个编号中,随机定一个起始号l 〔如006〕.〔4〕最后编号为006,016,026,…,59610名工人就为所要抽取样本.点评:1.系统抽样步骤可概括为:〔1〕编号〔采用随机方式将总体中个体编号,为简便起见,有时可直接利用个体所带号码,如考生准考证号、街道上各户门牌号,等等〕.n N 〔N 为总体中个体数,n 为样本容量〕是整数时, k=n N ;当n N 不是整数时,通过从总体中剔除一些个体,使剩下个体数N′能被n 整除,这时k=nN 〕. 〔3〕确定起始个体编号l 〔在第一段用简单随机抽样确定起始个体编号l 〕.〔4〕按照事先确定规那么.......抽取样本〔通常是将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕.“事先确定规那么〞说明不一定按“通常〞方法〔即将l 加上间隔k ,得第二个编号l+k ,再将〔l+k 〕加上k ,得第三个编号l+2k ,这样继续下去,直至获取整个样本〕来抽取样本.2.学生解答,归纳步骤后由学生修改整理,教师巡视点拨,对整理较好同学进展及时表扬或鼓励,激发学生自信.思考:在用系统抽样方法抽样过程中,会用怎样“规那么〞来取除起始号以外其他编号呢?看例4.例4 一个总体中有100个个体,随机编号为0、1、2、 (99)依编号顺序平均分成10个小组,组号依次为1、2、3、…、10,现用系统抽样方法抽取一个容量为10样本,规定如果在第1组随机抽取号码为m,那么在第k(k≥2)组中抽取号码个位数字与m+k个位数字一样.假设m=6,那么第7组中抽取号码为__________________.分析:此题与课本中总结“通常〞方法〔即每隔10抽出一个号码〕有所不同,挖掘点在于条件“第一个号码m之后,在第k组中抽取号码个位数字与m+k个位数字一样〞.解:因为,第1组号码0~9;第2组号码10~19;第3组号码20~29;依次下去第7组中抽取号码十位数字是6.此题要求“在抽取了第一个号码m之后,在第k组中抽取号码个位数字与m+k 个位数字一样〞限制了各组抽出号码个位数.利用m及k值,求出m+k个位数字,即此题中由m=6,k=7得m+k=13,显然,m+k=13个位数字是3,故从第7组中抽取号码是63.所有被抽出号码依次为:6,18,29,30,41,52,63,74,85,96.它们“不等距〞.点评:此题是福建2004年高考卷第15〔文〕题,如果按照系统抽样经历做法“等间距〞做此题话,那么不达.一位教育专家曾指出:学习如果过分地依赖学习者经历或感情世界,即通过纯粹经历积累,而不是通过认知活动对经历进展加工,那么学习将会出现危机,因此必须重视人思维教育.所以,我们在教学时要留足够时间给学生探究,充分暴露学生思维,让学生自己打破思维中过多“经历〞束缚,展示学生创造性学习思维活动过程.知能训练课本本节练习.解答:1.系统抽样中总体与样本比必须是整数,而1 252被50整除余2,因此必须随机剔除2人.应选A.2.具体步骤为:第一步,将1 003名学生,用随机方式编号〔如按出生年月日编号〕:0000,0001,0002,…,1 002.第二步,由题知:应抽取20名学生作为样本,因为1 003不能被20整除,所以应从总体中随机剔除3名学生,将余下1 000名学生按编号顺序补齐为0000,0001,0002,…,0999,并分成20个段,每段50名学生.第三步,在第一段0000,0001,0002,…,0049这50个编号中,随机定一个起始号l〔如0006〕.第四步,编号为0006,0056,0106,…,095620名学生就是所要抽取样本.3.可选择在某个年级进展,如选择高一年级.先将所有学生随机地进展编号;然后将他们分成m段,每段n人〔如总人数不能被均分,可随机地剔除几个人再分〕;再从第一段随机抽取一个号码〔如l〕;那么编号为l,l+n,l+2n,…,l+(m-1)n学生就是需要.最后测量这些学生两臂平展长度及身高,再分别计算两组数据平均数.课堂小结〔先让一位同学总结,其他同学补充,教师完善,并用多媒体展示出来〕(1)系统抽样适用于总体中个数较多情况,因为这时采用简单随机抽样显得不方便.(2)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中个体均分后每一段进展抽样时,采用是简单随机抽样.(3)与简单随机抽样一样,系统抽样也属于等概率抽样.作业为了了解某地参加英语口语水平测试5 027名学生成绩,从中抽取了200名学生成绩进展统计分析,请写出运用系统抽样抽取样本步骤.解:具体步骤为:第一步,将参加计算机水平测试5 027名学生用随机方式编号〔如按准考证编号〕0000,0001, (5026)第二步,由题知:应抽取200人作为样本,因为5 027不能被200整除,所以应从总体中剔除27个,将余下5 000人按编号顺序补齐0000,0001,…,4999,分成200个段,每段25人.第三步,在第一段0000,0001,…,0024这25个编号中,随机定一个起始号l〔如0022〕.第四步,编号为0022,0047,…,4997工人就为所要抽取样本.设计感想由于这局部内容比拟简单,所以整节课以学生为主,尤其是根底在中下游学生,要激发他们学习积极性,从而活泼课堂气氛,使每个学生都全身心投入,动脑、举例.。
最新人教版高中数学必修3第二章统计

“统计”……周计划.下面通过以下几点对本章内容作一简要说明.1.与旧知识的联系.这一章是在初中“统计初步”和高中“概率”的基础上学习的.它所介绍的抽样方法不仅在内容上比初中更为系统和详细,而且运用了刚刚学过的概率知识和观念来表述和解释抽样的有关问题,这样就可以使同学们对抽样问题的理解更加深入.2.内容编排.本章共分4小节.由于抽样是运用统计方法解决问题的第一步,所以第1小节介绍了抽样方法.第2小节与第3小节从两个侧面介绍用样本估计总体的问题,前者介绍如何对总体的分布进行估计,后者介绍如何对总体的特征数进行估计.第4小节是实习作业,它通过综合运用前面知识解决一个简单的实际问题,使同学们初步体会统计知识的实用价值,并使大家的应用能力和动手能力得到锻炼. 3.重点难点.简单随机抽样和用样本的某种特征去估计总体的相应特征,在本章中既是重点又是难点.4.注意事项.本章内容总的来看,所介绍的仍属于统计中的一些极其初步的知识,同学们在学习中应重其所重,轻其所轻,对有关理论不要追根寻底,把握好学习的深浅度.5.学习要求.通过本周的学习大家应达到以下要求:①会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本;②③会用样本频率分布去估计总体分布;④了解累积频率分布的意义,会根据样本的频率分布求得其累积频率分布;⑤通过生产过程中的质量控制图了解假设检验的基本思想.[重点分析和讲解]一、抽样方法1.简单随机抽样(1)概念:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等.就称这样的抽样为简单随机抽样.(2)具体实施方法:①抽签法先将总体中的所有个体编号,并把号码写在大小形状相同的号签上,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本.②随机数表法利用随机数表来抽取样本的方法称为随机数表法.(ⅰ)随机数表:若一数表满足下列性质:(a)表中共随机出现0,1,2,……,9这十个数字;(b)表中每个位置上出现各个数字的概率都是相等的,则称此表为随机数表.表中各位置上的数(字)称为随机随机数(字).(ⅱ)随机数表法抽样的步骤从开始数字算起,向左或右、或上或下等方向读取数字,从而获得样本号码(在这应注意,样本号码不应超过总体中的个体号码,否则舍去;样本号码不得重复,否则舍去,直到选够号码).(3)注意事项在简单随机抽样中,不但每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等(可以证明,如果用简单随机抽样2.系统抽样(1)概念:当总体中的个体数较多时,可将总体成分成均衡的几部分,然后按照预先给定的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(2)步骤:第一步:采用随机的方式将总体中的个体编号.第三步:从第一段中用简单随机抽样确定超始的个体编号L第四步:按照事先的规则从各段内各抽取一个个体,从而获得整个样本.3.分层抽样(1)概念:当已知总体由差异明显的几部分组成时,为了使样本能更充分地反映总体的情况,将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样.其中所分成的各部分叫做层.(2)步骤:第一步:先确定各层及需抽取的个体数(按比例).第二步:在各层中采用简单随机抽样或系统抽样的方法抽取所需的个体.第三步:将各层抽取的个体合在一起,就得到所要抽取的样本. 4.三种抽样方法的联系与区别在三种抽样方法中,简单随机抽样是最简单、最基本的抽样方法,其他两种方法都是建立在它的基础上的;三种抽样方法的共同点是,它们都是等概率抽样,体现了抽样的公平性,三种方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.二、总体分布的估计(一)总体分布的估计通常,我们不易知道一个总体的分布情况,在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.1.当总体中的个体所取的不同数值较少时,总体的频率分布表可由所取样本的不同数值及相应的频率来表示,其几何表示为相应的条形图.2.当总体中的个体所取数值较多,甚至无限时,对其频率分布的研究,要用到初中学过的整理数据的知识,得出其频率分布的步骤如下:(1)计算样本数据中最大值与最小值的差;(2)决定组距与组数;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.(4)列出频率分布表(5)画出频率分布直方图.3.总体分布与频率分布的关系.(二)累积频率分布1.累积频率:样本数据小于某一数值的频率.2.频率分布和累积频率分布,从不同角度反映了一组数据的分布情况,起着相互补充的作用.3.由于累积频率分布图是一条折线,利用它可以近似得到样本数据任意两端点值之间的频率(它等于这两个端点值的累积频率之差).在累积分布曲线上任意一点P(a , b)的纵坐标b表示总体取小于a 的值概率.(三)生产过程中的质量控制图1.正态总体①什么是正态总体是在连续型总体中,应用最为广泛的一种呈正态分布的总体.②正态总体的概率密度函数式中的μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,正态总体常记作N(μ,σ).③正态总体概率密度函数的图象特征ⅰ)曲线在X轴上方,并且关于直线X=μ对称.ⅱ)曲线在X=μ时于最高点,由这一点向左、右两边延伸时,曲线逐渐降低.ⅲ)曲线的对称轴位置由μ确定,曲线的形状由σ确定.总体分布为标准正态分布.2.小概率事件①什么是小概率事件通常指发生的概率小于5%的事件②小概率事件在一次试验中几乎不可能发生.3.假设检验①基本思想:根据小概率事件在一次试验中几乎不可能发生的原性和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:②假设检验的步骤;ⅰ)提出统计假设ⅱ)确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ)ⅲ)作出推断三、总体特征数的估计对于总体情况的估计,除用样本的频率分布估计,还需用样本的一些特征数来估计.1.平均数对于总体的平均水平,可用总体平均数来反映,而总体的平均数μ,可用样本平均数估计.2.方差对于总体中数据的波动情况,可用总体方差σ2来反映,而总体方差σ2可用样本方差另外,还可用样本的偏估方差3.标准差对于总体标准差,也可用[典型应用]例1 采用简单随机抽样从含有6个个体的总体中抽取一个容量为3的样本,个体a前两次未被抽到,第三次被抽到的概率是多少?分析此题可视为分步抽取问题也可视为一个定位排列问题,所以可用两种方法来解.解法2 事件“a前两次未被抽到而第三次被抽到”包含的结果:从6个元素中选出例2 某校高中三年级的195名学生已编号为1 ,2 ,3 , (195)为了了解学生的某种情况,要按1:5的比例抽取一个样本.用系统抽样方法进行抽取,并写出过程.解由题意知学生已编号,下面先将整体进行分段.因为按1:5的比例抽取样本,所在第一段用简单随机抽样确定起始的个体编号L,再加上间隔5,依次得到各段的抽取号,所以抽取的样本号依次为:L,L+5,L+10,… ,L+190.例3 一个单位有职工160人,其中业务人员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本.用分层抽样方法抽取样本,并写出过程.解由题意有:样本容量与总体的个数的比为20:160=1:8接下来用系统抽样方法分别抽取业务人员15人,管理人员2人,后勤人员3人,从而获得容量为20的样本.例4 举例说明三种常用抽样方法中,无论使用哪一种抽样方法,总体的每个个体被抽到的概率都相等.解:在100个零件中,一级品20个,二级品30个,三级品50个,从中抽取一个容量为20的样本,下面分别用三种抽样方法来计算总体中每个个体被抽取的概率.(2)系统抽样法:将100个零件分成20组,每组5个零件,每组取出1个,显然例5.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少?解:(1)样本频率分布表:(2)条形图:(3)此产品为二级品或三级品的概率为:0.27+0.43=0.7 例6.某产品规定尺寸的偏差统计如下表:(1)完成上面的频率分布表;(2)根据上表,画出频率分布直方图和累积频率分布图;(3)根据上面的表和图,估计数据落在[10.95,11.35)范围内的概率约是多少?数据小于11.20的概率约是多少?解:(1)频率分布表:(2)频率分布直方图:累积频率分布图:(3)数据落在[10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75,故落在[10.95,11.35)的概率约为0.75;由累积频率分布图可知数据小于11.20的频率约为0.54,因此数据小于11.20的概率约为0.54.例7.假设某自动车床生产的弹簧的自由长度ξ服从N(1.5,0.022),且已知P(|ξ<1.5|<3×0.02)=99.7%,质检员抽检的5件弹簧的自由长度为1.47,1.53,1.49,1.57,1.41,据此可判定生产情况是否正常?(本题类型是否要求请注意新教材及考试说明要求)解:在假设自由长度ξ服从N(1.5,0.022)的前提下,ξ的值落在(1.5-3×0.02,1.5+3×0.02)以内的概率为99.7%,则ξ在(1.5-3×0.02,1.5+3×0.02)以外取值的概率只有0.3%,这是一个小概率事件,因此在一次试验中ξ的值落在(1.5-3×0.02,1.5+3×0.02)以外是几乎不可能发生的,如这种事件发生,即ξ的值满足|ξ-1.5|≥3×0.02,这时我们就有理由认为生产过程出现了异常情况.区间(1.5-3×0.02,1.5+3×0.02)即区间(1.44,1.56),∵ξ的值1.41∈(1.44,1.56),故小概率事件发生,故可判定生产情况异常.例8.从总体x中抽取一容量为7的样本,其样本值为(88,85,93,93,64,71,77),分别例9.为了了解高三年级一、二班的数学学习情况,从两个班各抽出10名学生进行数学水平测试,成绩如下(单位:分)一班:76 90 84 86 81 87 86 82 85 83二班:82 83 85 89 79 80 91 88 79 74比较两组数据的方差,并估计一、二两个班哪个班的数学成绩比较整齐分析:此题应先利用公式求方差,由方差反映两个班数学成绩的波动情况由S12<S22表明,从高三年级一班抽取的10名学生的数学成绩比二班的10名学生的数学成绩波动小,从而估计出一班学生数学成绩比二班的数学成绩整齐.例10.某贫困山区居民家庭收入可认为服从正态分布,调查10户,得各户的人均收出(单位:元/户):97.89,102.14,143.20,151.30,103.43,88.90,144.20,120.34,123.50,131.64.试以95%以上的可靠性估计该地区居民家庭人均收入平均值的所在范围.解:在正态总体中,μ为总体平均数,σ为总体标准差,在这里可以用样本来估计总体.总体的标准差σ可以用S*来估计=7.815由于正态分布在(μ-2σ,μ+2σ)内取值概率为95.4%,故以(120.65-2×7.815,120.65+2×7.815)=(105.02,136.28)来估计该地区居民人均收入的范围,可靠性在95%以上.[练习题]A题一、选择题:1.简单随机抽样、系统抽样、分层抽样之间的共同点是()(A)都是从总体中逐个抽取(B)将总体分成几部分,按事先确定的规则在各部分抽取(C)抽样过程中每个个体被抽到的概率相等(D)将总体分成几层,然后分层按比例抽取2.简单随机抽样中,某个个体被抽到的可能性是()(A)与第n次抽样有关,第一次抽到的可能性小(B)与第n次抽样无关,每次抽中的可能性相等(C)与第n次抽样有关,最后一次抽中的可能性大(D)与第n次抽样无关,每次都是等可能的概率,但各次抽取的可能性不一样(A)简单随机抽象(B)系统抽样(C)分层抽样(D)分类抽样二、填空题:4.为了了解某地参加计算机水平测试的5008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为__________.5.观察新生婴儿的体重,其频率分布的直方图如图所示,则新生婴儿体重在[2700,3000)的频率为________.6.某种电池使用寿命的累积频率分布曲线如右图所示,则该种电池使用寿命在[10,15)的概率为________________.7.下列一组数据的标准差为_______________.(9.9,10.3,9.7,10.1,10.4,10.1,9.8,9.7)8.从甲、乙两种棉花苗中各抽10株,测得它们的株高分别如下(单位:cm)甲:25,41,40,37,22,14,19,39,21,42乙:27,16,44,27,44,16,40,40,16,40估计两种棉花苗总体的长势,_____种棉花的苗长得高一些.B组一、选择题:1.某人从湖中打了一网鱼,共m条.做上记号再放入湖中,数日后又打了一网鱼共n条,其中k条有记号,估计湖中有鱼()条.2.在抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是()(A)简单随机抽样(B)系统抽样(C)分层抽样(D)有放回抽样3.将容量为100的样本数据,按由小到大排列分成8个组如表第3组的频率和累积频率为:4.某中学高考数学成绩近似地服从正态分布N(100,10),则此校数学成绩在120分以上的考生占总人数的百分比为()(A)10% (B)23% (C)2.3% (D)以上均不对二、填空题5.公共汽车门的高度是按照保证成年男子与车门顶部碰头的概率在1%以下设计的,如果某地成年男子的身高η~N(175,6)(单位:cm),则车门应设计为 _____高.6.设有一个样本x1,x2,…,x n,其标准差为S x,另有一个样本y1,y2,…,y n,其中y k=3x k+5(k=1,2,…,n),其标准差为S y.则S x与S y的关系式是____________.三、解答题:7.在自动精密旋床的加工过程中,任抽取200个轴,测得轴的直径与规定尺寸偏差统计如下表:(1)完成表格(2)画出频率分布直方图和累积频率分布图(3)求出偏差在(-10,5]之间的概率8.某农场为了从三种不同的西红柿品种中选取高产稳定的西红柿品种,分别是在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下:问:哪一品种的西红柿既高产又稳定?[练习题答案及提示]A组一、选择题1.C 2.B 3.C二、填空题4.25 5.0.3 6.0.25 7.0.71 8.乙B组1.B 2.D 3.A4.C(提示:设ξ表示此中学数学高考成绩,依题意P(ξ>120)即为所求.二、填空题:5.183cm.(提示:设公共汽车门设计为xcm高,由题意P(η≥x)<1%,∵η~N(175,6.S y=3S x7.解(3)由上表可知,偏差在(-10,15]之间的概率为P(-10<ξ≤15)=P(ξ≤15)-P(ξ≤-10)=0.865-0.165=0.7因此第一个西红柿品种既高产又稳定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
必修三 第二章统计考试时间:120分钟;满分150分第I 卷(选择题)一、选择题(每题5分,总分60分)为:96, 112, 97, 108, 99, 104, 86, 98,则他们的中位数是( ) A .100 B .99 C .98.5 D .982.用样本频率分布估计总体频率分布的过程中,下列说法准确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确3.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图(如图所示),则 ( )A 、甲篮球运动员比赛得分更稳定,中位数为26B 、甲篮球运动员比赛得分更稳定,中位数为27C 、乙篮球运动员比赛得分更稳定,中位数为31D 、乙篮球运动员比赛得分更稳定,中位数为364.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人, 30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人 5第三组的频数和频率分别是 ( ) A .14和0.14 B .0.14和14 C .141和0.14 D . 31和1416.完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买水平的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况,宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样C .①系统抽样,②分层抽样D .①②都用分层抽样7.已知随机变量,x y 的值如下表所示,如果x 与y 线性相关且回归直线方程为7ˆ2ybx =+,则实数b =( ) 6 7463452yx A.12-B. 12C. 110-D. 1108.某班有50名同学,将其编为1、2、3、…、50号,并按编号从小到大平均分成5组.现用系统抽样方法,从该班抽取5名同学实行某项调查,若第1组抽取的学生编号为3,第2组抽取的学生编号为13,则第4组抽取的学生编号为 A .14 B .23 C .33 D .43 9.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x ∧=-,变量x 增加一个单位时,y 平均增加5个单位; ③相关系数r 越接近1,说明模型的拟和效果越好; 其中错误的个数是( )A.1B.2C.3D.0 10.设有一个回归方程为2 2.5y x =-,变量x 增加一个单位时,则 A.y 平均增加2.5个单位B.y 平均增加2个单位 C.y 平均减少2.5个单位 D .y 平均减少2个单位11.已知数据12,,...,n a a a 的平均数为a ,方差为2S ,则数据122,2,...,2n a a a 的平均数和方差为 ( )A .2,a SB .22,a SC .22,4a SD . 22,2a S12.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取个 容量为50的样本,且在第一段中随机抽得的号码是003.这600名学生分别住在三个营区,从001到300在第一营区,从301到495在第二营区,从496到600在第三营区.则三个营区被抽到的人数分别为A .25,17,8B .25,16,9C .26,16,8D .24,17,9二、填空题(每题6分,总分36分)13.从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________。
14.样本数据18,16,15,16,20的方差2s = .15.为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样考虑用系统抽样,则分段的间隔k 为_______________16.将容量为n 的样本中数据分成6个组,制成一个频率分布表,若第一组至第六组的数据频率之比为2:3:4:6:4:1,且前三组数据的频数之和为27,则n = 。
x 的线性回归方程y=bx+a 必过点______袋实行检验,将它们编号为001,002,…800,利用随机数表抽取样本,从第..7.行.第1个数8开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋...牛奶的标号是_____(为了便于说明,下面摘取了随机数表的第.6.行.至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 9643 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 5025 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 7358 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0013 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 8477 27 08 02 73 43 28三、解答题(三题分别为16、18、20分,总分为54分)19.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5这个组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)20.我校高三年级实行了一次水平测试.用系统抽样的方法抽取了50名学生的数学成绩,准备实行分析和研究.经统计成绩的分组及各组的频数如下:[40,50), 2; [50,60), 3; [60,70), 10; [70,80), 15; [80,90), 12;[90,100], 8.(Ⅰ)完成样本的频率分布表;画出频率分布直方图.(Ⅱ)估计成绩在85分以下的学生比例;(Ⅲ)请你根据以上信息去估计样本的众数、中位数、平均数.(精确到0.01)频率分布表频率分布直方图21.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据: x 2 4 5 6 8 y3040605070其中 ∑∑==--=ni ini ii xn xyx n yx 1221b(1)画出散点图; (2)求回归直线方程;(3)试预测广告支出为10百万元时,销售额多大?参考答案1.C【解析】试题分析:根据题意,某种轮胎的性能,随机抽取了8个实行测试,那么其结果分别是86,96, 97, 98, 99, 104, 108, 112,从小到大排列,那么中位数是最中间的两数的平均值,即为98+99=197,其平均值为98.5,故可知答案为C.考点:中位数点评:主要是考查了数据中中位数的求解和简单的使用,属于基础题。
2.C【解析】试题分析:根据用样本估计总体的原则可知,样本容量越大,估计越精确,总体容量越小,估计越不精确,故选C。
考点:样本估计总体点评:主要是考查了样本频率分布估计总体频率分布的使用,属于基础题。
3.D【解析】因为乙篮球运动员比赛得分比较集中在31—39之间,所以乙篮球运动员比赛得分更稳定,按从小到大的顺序排列可知中位数为364.B【解析】试题分析:根据题意,因为分层抽样的方法适合与差异比较明显的个体,而甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,并且死等比例性质,即可知90:10800=1:120,则可知应在这三校分别抽取学生111360030,540045,180015,⨯=⨯=⨯=故答案为B.120120120考点:分层抽样点评:主要是考查了分层抽样方法的使用,属于基础题。
5.A【解析】试题分析:根据表格可知,第三组的频数为x,那么因为题目中是容量100为的样本数据,那么可知10+13+x+14+15+13+12+9=100,x=14,同时根据频数比上容量100,即为频率,那么可知为0.14,故答案为A.考点:频数与频率点评:主要是考查了频数与频率概念的使用,属于基础题。
6.B【解析】试题分析:根据题意,因为①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买水平的某项指标;个体差异比较大,故选择分层抽样,对于从某中学的15名艺术特长生中选出3名调查学习负担情况,因为总体较少,则可知抽样方法为简单随机抽样,故答案为B考点:抽样方法点评:主要是考查了抽样方法的基本运算,属于基础题。
7.B【解析】试题分析:2345463,5,33x y ++++==== 所以10122433514916392b ++-⨯⨯==++-⨯考点:线性相关的随机变量的回归直线方程8.C 【解析】试题分析:∵第1组抽取的学生编号为3,第2组抽取的学生编号为13,∴各组间隔为10,∴第4组抽取的学生编号为3+30=33.故选C 考点:本题考查了系统抽样的使用点评:熟练掌握系统抽样的步骤是解决此类问题的关键,属基础题 9.A 【解析】试题分析:根据方程的的运算性质知①准确;根据回归方程35y x ∧=-可知,变量x 增加一个单位时,y 平均减少5个单位,所以②准确;相关系数r 越接近0,说明模型的拟和效果越好,所以③准确.考点:本小题主要考查统计中的概念。
点评:统计中的概念性问题也比较多,要仔细思考,准确区分应用. 10.C 【解析】试题分析:根据题意,对于回归方程为2 2.5y x =-,当x 增加一个单位时,则y 的平均变化为y-2.5(x+1)-(y-2.5x)=-2.5,故可知y 平均减少2.5个单位,选C.考点:线性回归方程点评:本题考查线性回归方程的应用,考查线性回归方程自变量变化一个单位,对应的预报值是一个平均变化,这是容易出错的知识点. 11.C 【解析】 试题分析:数据12,,...,n a a a 的平均数为a ,方差为S2,则另一组数据122,2, (2)a a a 的平均数为x 2x 2a '==,方差是22s 4s '=,∵222222212n 1211S [2x 2x 2x 2x 2x 2][4()4()......4()]n n x x x x x x x n'=-+-+⋯+-=-+-++-()()(),故选D .考点:本题主要考查平均数、方差的计算公式及其性质。