专题六 第二讲 统计与统计案例

合集下载

第2讲 统计、统计案例

第2讲 统计、统计案例

第2讲 统计、统计案例统计的研究对象是数据,核心是数据分析,高考中统计考题常常与概率相联系,并具有鲜明的时代和文化背景,试题难度逐渐加大,重点提升数据分析、数学建模、逻辑推理和数学运算素养。

基础知识回顾 : 1.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等。

(2)作频率分布直方图的步骤①求极差;②决定组距与组数;③将数据分组,列频率分布表;⑤画频率分布直方图。

2.样本数字特征(1)平均数:()n x x x nx +++= (1)21。

(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)。

(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)。

(4)方差和标准差①方差:()21221211∑∑==--=n i i n i i x x n x x n s 或。

②标准差:()211∑=-=n i i x x n s 。

3.相关关系的强弱(1)样本相关系数:现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里用()()()()∑∑∑∑∑∑======---=----=ni i ni i ni ii ni in i ini iiyn y xn x yx n yx yyx x yyx x r 122122121211来衡量y 与x 的线性相关性强弱,我们称r 为变量x 和变量y 的样本相关系数。

(2)相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系。

②样本相关系数r 的取值范围为[-1,1];当|r |越接近1时,成对样本数据的线性相关程度越强;当|r |越接近0时,成对样本数据的线性相关程度越弱。

4.一元线性回归模型参数的最小二乘法:回归直线方程过样本点的中心()y x ,,是回归直线方程最常用的一个特征,我们将∧∧∧+=a x b y 称为Y 关于x 的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线 ,这种求经验回归方程的方法叫做最小二乘法,求得的∧∧a b ,,叫做b ,a 的最小二乘估计,其中∧b 称为回归系数,它实际上也就是经验回归直线的斜率,∧a 为截距。

知识讲解-高考总复习:统计与统计案例

知识讲解-高考总复习:统计与统计案例

高考总复习:统计与统计案例【考纲要求】〔1〕理解随机抽样的必要性和重要性;〔2〕会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体〔1〕了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.〔2〕理解样本数据标准差的意义和作用,会计算数据标准差.〔3〕能从样本数据中提取基本的数字特征〔如平均数、标准差〕,并作出合理的解释.〔4〕会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.〔5〕会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性〔1〕会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;〔2〕了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程〔线性回归方程系数公式不要求记忆〕. 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:〔1〕各种抽样的个体被抽到的概率相等;〔2〕抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s =(2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关〔1〕相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y 的回归方程,期中,a b 是待定参数.1122211()()()nni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y 中回归方程的截距和斜率的最小二乘估计公式分别为:121()(),=-()nii i nii xx y y b a y bx xx ==--=-∑∑其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,说明两个变量正相关; 当<0r 时,说明两个变量负相关.r r 大于0.75时,认为两个变量有很强的线性相关性.(1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异2()i i y y -是随机误差的效应,称=i i i e y y -为残差. (3)残差平方和21()nii i yy =-∑.(4)相关指数22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的奉献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1xa b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?〔2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d 〕取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:〔抽签法〕将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:〔随机数表法〕将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 此题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.假设m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生〔 〕A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:〔1〕将3万人分为5层,其中一个乡镇为一层. 〔2〕按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60〔人〕,300×2/15=40〔人〕,300×5/15=100〔人〕,300×2/15=40〔人〕,300×3/15=60〔人〕,因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.〔3〕将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定〔Ⅰ〕游泳组中,青年人、中年人、老年人分别所占的比例; 〔Ⅱ〕游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】〔Ⅰ〕设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. 〔Ⅱ〕游泳组中,抽取的青年人数为320040%604⨯⨯=〔人〕; 抽取的中年人数为32004⨯⨯50%=75〔人〕; 抽取的老年人数为32004⨯⨯10%=15〔人〕.类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些? 【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎 乙 674 9 9 7 6 65 4 3 2 1 80 2 4 5 9 9 091由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如下图,则他们在这次测验中成绩较好的是 组.【答案】甲小组【变式2】甲、乙两名运发动的5次测试成绩如以下图所示,设12,s s 分别表示甲、乙两名运发动测试成绩的标准差,12,x x 分别表示甲、乙两名运发动测试成绩的平均数,则有〔 〕A .12x x =,12s s <B .12x x =, 12s s >C .12x x >, 12s s >D .12x x =, 12s s = 【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X 表示. 甲组 乙组 6 X8 74 1 9 0 0 3甲 茎 乙 5 7 1 6 8 8 8 223 6 7〔Ⅰ〕如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;〔Ⅱ〕如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.〔注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数〕【思路点拨】〔Ⅰ〕利用平均数的基本概念加以求解。

统计教学案例

统计教学案例

统计教学案例(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作报告、合同协议、演讲致辞、条据文书、策划方案、规章制度、心得体会、教学资料、作文大全、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample essays, such as work reports, contract agreements, speeches, policy documents, planning plans, rules and regulations, insights, teaching materials, complete essays, and other sample essays. If you want to learn about different sample formats and writing methods, please stay tuned!统计教学案例统计教学案例统计教学案例1作为义务教育阶段学习的继续,初中阶段的数学学习将巩固,加深学生已形成的对数裾分析方法的理解,扩展学生已经获得的对不确定性和概率的经验。

小学六年级数学下册《统计》优秀教学案例

小学六年级数学下册《统计》优秀教学案例
在教学过程中,教师应关注学生的个体差异,充分调动学生的积极性,引导他们主动参与课堂活动。通过本章节的学习,使学生在知识与技能、过程与方法、情感态度与价值观等方面得到全面提高,为他们的终身学习和全面发展奠定基础。
三、教学策略
(一)情景创设
在本章节的教学中,我将运用情境教学法,创设贴近学生生活的教学情境,让学生在具体的情境中感受统计的意义和价值。例如,通过设计“学校运动会成绩统计”、“班级学生身高调查”等实际案例,引导学生运用所学统计知识解决现实问题。这种情境创设能激发学生的学习兴趣,提高他们对统计知识点的关注度,使学生在轻松愉快的绍统计的基本概念,如总体、个体、样本、样本容量等,通过实例让学生理解这些概念的含义。
2.统计量:讲解平均数、中位数、众数等统计量的定义和计算方法,结合实际案例,让学生掌握这些统计量的应用。
3.数据的表示:介绍条形图、折线图、饼图等常见的数据表示方法,并通过实例演示如何制作和解读这些图表。
4.反思与评价机制的建立
本案例强调反思与评价在统计学习中的重要性。教师引导学生及时总结学习过程中的经验与不足,通过自评、互评和教师评价,全面客观地评价学生的学习成果。这种评价机制有助于提高学生的自我认知,激发他们的学习动力。
5.教学内容与过程的系统设计
本案例对教学内容与过程进行了系统设计,从导入新课、讲授新知、小组讨论、总结归纳到作业小结,每个环节都紧密相连,层层递进。这种设计使学生在教师的引导下,逐步深入地掌握统计知识,提高数据分析能力。同时,教师关注学生的情感态度与价值观的培养,使他们在学习统计的过程中,形成尊重事实、用数据说话的科学态度。
4.针对学生的个体差异,给予有针对性的指导和建议,帮助他们克服困难,提高统计能力。
四、教学内容与过程

(完整版)高中数学统计、统计案例知识点总结和典例

(完整版)高中数学统计、统计案例知识点总结和典例

统计一.简单随机抽样:抽签法和随机数法1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。

2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。

抽签法的一般步骤:a、将总体的个体编号。

b、连续抽签获取样本号码。

3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。

随机数表法的步骤:a、将总体的个体编号。

b、在随机数表中选择开始数字。

c、读数获取样本号码。

4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。

二.系统抽样:1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。

(2)将整体按编号进行分段,确定分段间隔k=N/n。

(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。

(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。

在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。

三.分层抽样:1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。

第2讲统计与统计案例

第2讲统计与统计案例

第2讲统计与统计案例【选题明细表】知识点、方法题号抽样方法1、2、7 统计图表与数字特征的计算3、6、8、9、10 回归分析与独立性检验4、5统计中的综合问题11、12、13、14重点把关1.(2014高考四川卷)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( A )(A)总体 (B)个体(C)样本的容量(D)从总体中抽取的一个样本解析:5000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200名居民的阅读时间是样本,故选A.2.(2014潍坊市三模)高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( C )(A)13 (B)17 (C)19 (D)21解析:因为47-33=14,由系统抽样的定义可知样本中的另一个学生的编号为5+14=19.故选C.3.(2013高考四川卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( A )解析:[0,5)有1个,[5,10)有1个,频数相等,故也相等,比较选项知A正确,故选A.4.(2014深圳市一模)相关变量x、y的样本数据如下表:x 1 2 3 4 5y 2 2 3 5 6经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为=1.1x+,则等于( C )(A)0.1 (B)0.2 (C)0.3 (D)0.4解析:∵回归直线经过样本中心点(,),且由题意得(,)为(3,3.6),∴3.6=1.1×3+,∴=0.3.故选C.5.(2014高考江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( D )表1成绩不及格及格总计性别男 6 14 20女10 22 32总计16 36 52表2视力好差总计性别男 4 16 20女12 20 32总计16 36 52表3智商偏高正常总计性别男8 12 20女8 24 32总计16 36 52表4阅读量丰富不丰富总计性别男14 6 20女 2 30 32总计16 36 52 (A)成绩 (B)视力(C)智商(D)阅读量解析:因为==,==,==,==,则>>>,所以阅读量与性别有关联的可能性最大.故选D.6. 甲、乙两名选手参加歌手大赛时,5名评委打的分数用茎叶图表示如图所示,s1,s2分别表示甲、乙选手分数的标准差,则s1与s2的关系是( C )(A)s1>s2(B)s1=s2(C)s1<s2(D)不确定解析:由茎叶图可得==84,==84,所以==22,==62,显然有s1<s2.故选C.7.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.解析:因为高二年级学生人数占总数的,样本容量为50,所以50×=15.答案:158.(2014济南模拟)某学校举行课外综合知识比赛,随机抽取400名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成五组.第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……;第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则400名同学中成绩优秀(大于等于80分)的学生有名.解析:成绩优秀的频率为1-(0.005+0.025+0.045)×10=0.25,所以成绩优秀的学生有0.25×400=100(名).答案:1009.(2014武汉调研)为了普及环保知识,增强环保意识,某高中随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m,众数为n,平均数为,则这三个数的大小关系为< < .解析:由题图可知,得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分、9分、10分的各有2人,所以其中位数应为=5.5,即m=5.5.众数为5,即n=5,平均数=(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈5.967,所以n<m<.答案:n m10.(2013高考湖北卷)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4,则(1)平均命中环数为;(2)命中环数的标准差为.解析:(1)平均命中的环数为=7;(2)由平均命中的环数为7,可知命中环数的标准差为=2.答案:(1)7 (2)211.(2014高考北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1 [0,2) 62 [2,4) 83 [4,6) 174 [6,8) 225 [8,10) 256 [10,12) 127 [12,14) 68 [14,16) 29 [16,18) 2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解:(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1-=0.9.从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)的有17人,频率为0.17,所以a===0.085.课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b===0.125.(3)样本中的100名学生课外阅读时间的平均数在第4组.能力拔高12. (2014南昌一模)在一次演讲比赛中,6位评委对一名选手打分的茎叶图如图所示,若去掉一个最高分和一个最低分,得到一组数据x i(1≤i≤4),在如图所示的程序框图中,是这4个数据的平均数,则输出的v的值为.解析:根据题意得到的数据为78,80,82,84,则=81.程序框图的功能是求以上数据的方差,故输出的v的值为=5.答案:513. (2014肇庆一模)已知某山区小学有100名四年级学生,将全体四年级学生随机按00~99编号,并且按编号顺序平均分成10组.现要从中抽取10名学生,各组内抽取的编号按依次增加10进行系统抽样.(1)若抽出的一个号码为22,则此号码所在的组数是多少?据此写出所有被抽出学生的号码;(2)分别统计这10名学生的数学成绩,获得成绩数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名学生中随机抽取两名成绩不低于73分的学生,求被抽取到的两名学生的成绩之和不小于154分的概率. 解:(1)由题意,得抽出号码为22的组数为3.因为2+10×(3-1)=22,所以第1组抽出的号码应该为02,抽出的10名学生的号码依次分别为02,12,22,32,42,52,62,72,82,92.(2)这10名学生的平均成绩为=×(81+70+73+76+78+79+62+65+67+59)=71,故样本方差为s2=×(102+12+22+52+72+82+92+62+42+122)=52.(3)从这10名学生中随机抽取两名成绩不低于73分的学生,共有如下10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81), (78,79),(78,81),(79,81).其中成绩之和不小于154分的有如下7种:(73,81),(76,78), (76,79),(76,81),(78,79),(78,81),(79,81).故被抽取到的两名学生的成绩之和不小于154分的概率为P=. 14.(2014哈师大附中、东北师大附中、辽宁实验中学一模)某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下:AQI [0,50](50,100] (100,150](150,200](200,250](250,300]>300空气质量优良轻微污染轻度污染中度污染中度重污染重度污染天数 4 13 18 30 9 11 15 (1)若某企业每天由空气污染造成的经济损失S(单位:元)与空气质量指数AQI(记为w)的关系式为S=试估计在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?非重度污染重度污染合计供暖季非供暖季合计100 附:** ** ** ** ** ** ** ** P(K2≥k0)** ** ** ** ** ** ** ** k0K2=解:(1)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A,由200<S≤600,得150<w≤250,频数为39,P(A)=.(2)根据题中数据得到如下列联表:非重度污染重度污染合计供暖季22 8 30 非供暖季63 7 70 合计85 15 100K2=≈4.575>3.841,所以有95%的把握认为该市本年空气重度污染与供暖有关.。

第2讲 统计与统计案例


的利润.
︱高中总复习︱二轮·理数
(1)将T表示为X的函数; (2)根据直方图估计利润T不少于57 000元的概率;
解:(1)当 X∈[100,130)时 , T=500X-300(130-X)=800X-39 000, 当 X∈ [130,150]时, T=500×130=65 000,
800 X 39000,100 X 130, 所以 T= 65000,130 X 150.
︱高中总复习︱二轮·理数
(1)根据散点图判断,y=a+bx与y=c+d x 哪一个适宜作为年销售量y关于年宣传 费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
解:(1)由散点图可以判断 ,y=c+d x 适宜作为年销售量 y 关于年宣传费 x 的回归方程类型.
解析:由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的 平均温差约为10 ℃,而一月的平均温差约为4 ℃,故B正确;三月和十 一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温 高于20 ℃的月份只有2个,D错误.
︱高中总复习︱二轮·理数
2.(2013· 全国Ⅰ卷,理3)为了解某地区的中小学生的视力情况,拟从该地区的 中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中
x
y
w

8 i 1
xi x

2

8 i 1
wi w

2
x x y y
8 i 1 i i
w w y y
8 i 1 i i
46.6
563
6.8
289.8

(全国通用)高考数学二轮复习 专题六 第2讲 统计与统计案例名师课件 文


[微题型2] 对独立性检验的考查 【例 2-2】 某新闻媒体为了了解观众对央视《开门大吉》节目的
喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名, 得到如下的列联表:
喜爱 不喜爱
总计


总计
40
20
60
20
30
50
60
50
110
试根据样本估计总体的思想,估计约有________的把握认为“喜 爱该节目与否和性别有关”. 参考附表:
中,青年教师有 320 人,则该样本的老年教师人数为( )
类别
老年教师 中年教师 青年教师
合计
人数
900 1 800 1 600 4 300
A.90 B.100 C.180 D.300
解析 由题意抽样比为1362000=15,∴该样本的老年教师人数为 900×15=180(人). 答案 C 探究提高 系统抽样又称“等距”抽样,被抽到的各个号码间 隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总 体容量中的比例.
(3)在月平均用电量为[220,240),[240,260),[260,280),[280, 300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均 用电量在[220,240)的用户中应抽取多少户? 解 (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20 =1 得:x=0.007 5,所以直方图中 x 的值是 0.007 5. (2)月平均用电量的众数是220+2 240=230. 因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中 位数在[220,240)内,设中位数为 a,由(0.002+0.009 5+0.011)×20 +0.012 5×(a-220)=0.5 得:a=224,所以月平均用电量的中位数 是 224.

六年级数学下册《统计》优秀教学案例

在教学过程中,我将注重引导学生进行反思与评价,帮助他们总结经验、发现不足,从而实现自我提高。具体做法如下:
1.教学结束后,组织学生进行自我反思,思考自己在统计学习过程中的优点和不足,以及如何改进。
2.开展小组内、小组间的互评活动,让学生从他人的优点中学习,发现自己的不足,形成良好的学习氛围。
3.教师对学生的学习过程和成果进行全面、客观的评价,既要关注学生的知识掌握程度,也要关注他们的能力、情感态度等方面的发展。
4.及时给予学生反馈,鼓励他们发挥优势,改进不足,不断提高统计素养。
四、教学内容与过程
(一)导入新课
在导入新课环节,我首先会提出一个与学生生活息息相关的问题:“同学们,你们知道我们班同学的身高分布情况吗?”通过这个问题,激发学生的好奇心,引导他们思考如何获取、整理和分析这些数据。接着,我会简要回顾之前学过的数据收集和整理方法,为新课的学习做好铺垫。
3.小组合作,提升团队协作能力
本案例注重小组合作,让学生在合作中学习、成长。通过合理分组,确保每个学生都能在小组中发挥自己的优势。在小组合作中,学生共同完成数据收集、整理、分析等任务,培养他们的团队协作能力和沟通能力。此外,小组间的交流、分享,也有助于促进学生之间的相互学习。
4.实践操作,提高动手能力
(五)作业小结
为了巩固所学知识,我设计了以下作业:
1.完成课本上的练习题,进一步熟悉统计量的计算和统计图表的绘制。
2.结合生活实际,选择一个主题进行数据收集、整理和分析,撰写一篇统计小报告。
3.家长参与,与孩子一起完成一个家庭统计项目,培养孩子将所学知识应用于生活的能力。
五、案例亮点
1.生活化情境,激发学习兴趣
本案例的最大亮点是将生活情境融入教学过程中,让学生在熟悉的环境中感受统计的意义。通过设计贴近学生生活的调查主题,如班级身高分布、课外阅读情况等,激发学生的好奇心和求知欲。这种生活化的情境使得学生在轻松愉快的氛围中学习,有效提高了他们的学习兴趣和积极性。

高考数学二轮复习专题六统计与统计案例-教学课件


[例 3] 有甲、乙两个班级进行数学考试,按照大于等于 85 分
为优秀,85 分以下为非优秀统计成绩后,得到如表所示的列联表.
优秀
非优秀
总计
甲班
10
乙班
30
合计
105
已知在全部 105 人中随机抽取 1 人为优秀的概率为27.
(1)请完成上面的列联表;
(2)根据列联表中的数据,若按 95%的可靠性要求,能否认为
[例1] (2012·山东高考)采用系统抽样方法从960人中抽
取32人做问卷调查,为此将他们随机编号为1,2,…,960,
分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽
到的32人中,编号落入区间[1,450]的人做问卷A,编号落入
区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人
(3)平均数:样本数据的算术平均数,即 x =n1(x1+x2+…+xn). (4)方差与标准差 方差:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2]. 标准差:
s=
n1[x1- x 2+x2- x 2+…+xn- x 2].
[考情分析] 从近两年的高考试题来看,分层抽样 是高考的热点,题型既有选择题也有填空题,分值占5 分左右,属容易题.命题时多以现实生活为背景,主要 考查基本概念及简单计算.
[冲关集训]
5.(2011·湖南高考)通过随机询问 110 名性别不同的大学生是否爱
好某项运动,得到如下的列联表:


总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由 K2(χ2)=a+bcn+add- ab+cc2b+d算得,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[限时规范训练]单独成册
一、选择题
1.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是() A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z负相关.
答案:C
2.一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数为()
A.19B.17
C.16 D.15
解析:由题意得样本数据在[20,60)内的频数为30×0.8=24,则样本在[40,50)和[50,60)内的数据个数之和为24-4-5=15,故选D.
答案:D
3.某校为了研究“学生的性别”和“对待某一活动的支持态度”是否有关,运用2×2列联表进行独立性检验,经计算K2=7.069,则认为“学生性别与支持活动有关”的犯错误的概率不超过()
A.0.1% B.1%
C.99% D.99.9%
附:
解析:
持活动有关系”,即认为“学生性别与支持活动有关系”出错的概率不超过1%,故选B. 答案:B
4.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()
A .45
B .50
C .55
D .60
解析:由频率分布直方图可知,低于60分的频率为(0.005+0.01)×20=0.3,所以该班的学生人数为15
0.3=50.
答案:B
5.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
A.90 C .180
D .300
解析:设该样本中的老年教师人数为x ,由题意及分层抽样的特点得x 900=320
1 600,故x =180.
答案:C
6.由观测的样本数据算得变量x 与y 满足线性回归方程y ^
=0.6x -0.5,已知样本平均数x =5,则样本平均数y 的值为( ) A .0.5 B .1.5 C .2.5
D .3.5
解析:回归直线必经过样本中心点,于是有y =0.6×x -0.5=0.6×5-0.5=2.5,故选C. 答案:C
7.某商场在今年元宵节的促销活动中,对3月5日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为5万元,则11时至12时的销售额为( )
A .10万元
B .15万元
C .20万元
D .25万元
解析:由频率分布直方图得0.4÷0.1=4,∴11时至12时的销售额为5×4=20,故选C. 答案:C
8.某单位招聘员工,有200名应聘者参加笔试,随机抽查了其中20名应聘者笔试试卷,统计他们的成绩如下表:
A .70分
B .75分
C .80分
D .85分
解析:∵40
200×20=4,∴按笔试成绩择优录取40名参加面试,由此可预测参加面试的分数
线为80分. 答案:C 二、填空题
9.如图,茎叶图记录了甲、乙两组各3名同学在期末考试中的数学成绩,则方差较小的那组同学成绩的方差为________.
解析:由题中茎叶图可得甲、乙两组同学成绩的平均数都是92,方差分别是323,14
3,所以
方差较小的那组同学成绩的方差是14
3.
答案:143
10.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为________.
解析:系统抽样的抽取间隔为24
4=6,若抽到的最小编号为3,则抽取到的最大编号为6×3
+3=21. 答案:21
11.某校对高三年级1 600名男女学生的视力状况进行调查,现用分层抽样的方法抽取一个容量是200的样本,已知样本中女生比男生少10人,则该校高三年级的女生人数是________. 解析:设样本中女生x 人,则男生x +10人,所以x +x +10=200,得x =95,设该校高三年级的女生有y 人.由分层抽样的定义可知2001 600=95y ,解得y =760.
答案:760
12.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,得到频率分布直方图如图所示,其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100],则频率分布直方图中a 的值为________.
解析:∵(0.004+a +0.018+0.022×2+0.028)×10=1,∴a =0.006. 答案:0.006 三、解答题
13.某制造商3月生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据进行分组,得到如下频率分布表:
(1)将频率分布表补充完整(结果保留两位小数),并画出频率分布直方图;
(2)将频率作为概率,已知标准乒乓球的直径为40.00 mm,试求这批乒乓球的直径误差不超过0.03 mm的概率;
(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40. 00)作为代表,据此估计这批乒乓球直径的平均值(结果保留两位小数).
解析:(1)频率分布表如下:
(2)误差不超过0.03 mm,即直径落在[39.97,40.03]内,其概率为0.2+0.5+0.2=0.9.
(3)这批乒乓球直径的平均值大约为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20≈40.00(mm).
14.在中学生综合素质评价某个维度的测评中,分“优秀、合格、尚待改进”三个等级进行学生互评,某校高二年级有男生500人,女生400人,为了了解性别对维度测评结果的影响,采用分层抽样方法从高二年级抽取了45名学生的测评结果,并作出频率统计表如下:
表一:
表二:
(1)计算x,y的值;
(2)由表一、表二中统计数据完成2×2列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.
解析:(1)设从高二年级男生中抽出m 人,则m 500=45
500+400,m =25,从高二年级女生中应
抽出的人数为45-25=20,故表一为男生数据,表二为女生数据,所以x =25-15-5=5,y =20-15-3=2. (2)2×2列联表如下:
因为K 2
=45×(15×5-15×10)30×15×25×20=45×1530×15×25×20=9
8=1.125<2.706,
所以没有90%的把握认为“测评结果优秀与性别有关”.
15.下表是近几届奥运会中国代表团获得的金牌数之和y (从26届算起,不包括之前已获得的金牌数)随时间x 变化的数据.
由图可以看出,金牌数之和y 与时间x 之间存在线性相关关系. (1)求y 关于x 的线性回归方程;
(2)预测第32届中国代表团获得的金牌数之和为多少? (3)现已知第31届中国代表团实际所获的金牌数为26,求残差e ^
.
参考数据:x =28,y =85.6,∑i =1
n
(x i -x )(y i -y )=381,∑i =1
n
(x i -x )2=10.
附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^
的斜率和截距的最
小二乘估计分别为:b ^

∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2
,a ^=y -b ^x .
解析:(1)b ^

∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2

381
10
=38.1, a ^=y -b ^
x =85.6-38.1×28=-981.2,
所以金牌数之和y 关于时间x 的线性回归方程为y ^
=38.1x -981.2.
(2)由(1)知,当x =32时,中国代表团获得的金牌数之和的预测值y ^
=38.1×32-981.2=238, 故预测第32届中国代表团获得的金牌数之和为238枚. (3)当x =31时,中国代表团获得的金牌数之和的预测值为 y ^
=38.1×31-981.2=199.9,
第31届中国代表团获得的金牌数之和的真实值为165+26=191, 所以残差e ^
=191-199.9=-8.9.。

相关文档
最新文档