高中数学必修3复习统计的讲义与习题含答案及详细解答过程

合集下载

(完整)高一数学必修三《统计》知识点+练习+答案,推荐文档

(完整)高一数学必修三《统计》知识点+练习+答案,推荐文档

必修三统计知识点二、统计初步有关概念和公式:1、频数——落在各个小组的数据的个数叫~。

2、频率——每一个小组频数与数据的比值叫做这一组的~。

3、总体——所要考察对象的全体叫做~。

4、个体——每一个考察对象~。

5、样本——从总体中所抽取的一部分个体叫做总体的一个样本。

6、样本容量——样本中个体的数目叫做~。

7、众数——在一组数据中,出现次数最多的数据叫做这组数据的众数。

8、中位数——将一组数据按从小到大排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。

9、总体分布——总体取值的概率分布规律通常称为~。

10、连续型总体——可以在实数区间取值的总体叫~。

11、累积频率——样本数据小于某一数值的频率,叫做~。

计算最大值与最小值的差决定组距与数据列法决定分点列表12、频率分布表试验结果频数频率表的行式分组个数累计频数频率累积频率(有时可省略)(有时可省略)横轴——实验结果纵轴频率条形图用高度表示各取值的频率适用于个体取不同值较少横轴——产品尺寸纵轴——频率/组距13、直方图用图形面积的大小表示在各个区间内取值的概率适用于个体在区间内取值横轴——产品尺寸累积频率分布图纵轴——累计频率反映一组数据的分布情况14、总体分布曲线——当样本容量无限增大、分组的组距无缩限小时、频率分布直方图就会无限趋近于一条光滑曲线,这条曲线叫总体密度曲线。

以这条曲线为图象的函数叫做总体的概率密度函数。

总体密度函数反映了总体分布,即反映总体在各个范围内取值的概率。

P(a<ξ<b)的值等于直线 x=a,x=b 与曲线、x 轴围成的图形面积。

15、累积分布曲线——当样本容量无限增大、分组的组距无缩限小时,累积频率分布图就会无限趋近于一条光滑曲线,这条曲线叫累积分布曲线。

它反映了总体的累积分布规律,即曲线上任意一点 P(a,b)纵坐标 b,表示总体取小于 a 的值的概率。

1①正态总体的概率密度函数f(x)-(x - )22 2, ∈R(其中 总体的平均数, 总体的标准差,N(μ,σ2)—正态总体,有时记作 N(μ,σ2)1)曲线在轴上方,并且关于直线 x=对称:②正态曲线的性质2)曲线在x=μ时处于最高点,由这一点向左、右两边延伸时,曲线逐渐下降:3)曲线的对称轴位置由μ确定:直线的形状由σ确定,σ越大,曲线的形状越“矮胖”反过来曲线越“高瘦”③正态曲线在几个区间上的取值:区间取值概率(μ-σ,μ+σ)68.3%(μ-2σ,μ+2σ)95.44%(μ-3σ,μ+3σ)99.7%16、质控图④小概率事件——通常指发生的概率小于5%的事件。

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

【知识梳理】知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.【解析】由题意可得1011910,5x y ++++=22222(10)(10)(1010)(1110)(910)25x y -+-+-+-+-=,解得12,8.||4x y x y ==-=,故选D .例3. 对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300300~400400~500500~600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.【思路点拨】 通过本题可掌握总体分布估计的各种方法和步骤. 【解析】(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义.举一反三:【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6)分数段[100,110)[110,120 [120,130)人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_______、_______(精确到0.01). 【答案】0.18 0.47【解析】由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件 (1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 【解析】(1)样本的频率分布表为产品频数频率 一级品 5 0.17 二级品 8 0.27 三级品 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组类型三:变量的相关性和回归分析例5.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元)12 28 42 56(1) 画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【解析】(1)作出的散点图如下图所示(2)观测散点图可知各点大致分布在一条直线附近,由此可知散点图大致表现为线性相关.列出下表:序号 x y X 2xy 1 1 12 1 12 2 2 28 4 56 3 3 42 9 126 44 56 16 224 ∑1013830418易得569,22x y ==所以 414222156944184732255304()42i ii ii x y xyb xx ==--⨯⨯===-⨯-∑∑ 697352252a y bx =-=-⨯=- 故y 对x 的回归直线方程为73ˆ25yx =- (3)当x=9时, 73ˆ92129.45y=⨯-= 012 3 4x(万元)Y(万元)1020 30 40 50 60 .. . .08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.【变式2】一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75 x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程. 【解析】(1)画出散点图:(2)设回归直线方程a bx y+=ˆ, 利用计算a ,b ,得b ≈1.215, 974.0ˆ≈-=+=x b y a bx y,从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6 h B.0.9 h C.1.0 h D.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,458.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( ) A .48米B .49米C .50米D .51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数1231031则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 . 12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下甲 6 8 9 9 8乙 10 7 7 7 9则两人射击成绩的稳定程度是__________________.13.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M Nm n M N所表示的数分别是多少?(1)求出表中,,,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?14.从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?16.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格.【答案与解析】1.【答案】B 【解析】∵n40=0.125,∴n=320.故选B. 2. 【答案】C 3. 【答案】C 【解析】剔除零头 4. 【答案】B【解析】平均数不大于最大值,不小于最小值 5. 【答案】B 【解析】60106=,间隔应为10 6. 【答案】B 【解析】505.020)5.11(1025⨯++⨯+⨯=0.9.7.【答案】A【解析】由图知,成绩小于17秒的学生人数占全班总人数的频率为0.020.180.360.340.9+++=, 所以0.9x =;成绩大于等于15秒且小于17秒的的频率为0.360.340.7+=,104416461451222222=++++=)(甲s 5627313751222222=++++=)(乙s ∵ 22乙甲乙甲,s s x x >>∴ 甲的平均成绩较好,乙的各门功课发展较平衡16.【解析】(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y )(万元)。

数学北师大版必修3教案:第一章统计 Word版含解析

数学北师大版必修3教案:第一章统计 Word版含解析

本章复习整体设计教学分析本节是对第一章知识和方法的归纳和总结,从总体上把握本章,使学生的基本知识系统化和网络化,基本方法条理化,本章内容是相互独立的,随机抽样是基础,在此基础上学习了用样本估计总体和变量间的相关关系,要注意它们的联系.本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.三维目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.重点难点教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.课时安排1课时教学过程导入新课为了系统地掌握本章知识,我们复习本章内容,教师直接点出课题.推进新课新知探究提出问题1.随机抽样的内容包括几部分?2.用样本估计总体包括几部分?3.变量间的相关关系包括几部分?活动:学生思考或交流,回顾所学,教师指导学生复习的思路和方法,及时总结提炼.讨论结果:1.随机抽样的内容包括三部分:(1)简单随机抽样抽签法:一般地,用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为:将总体中的所有个体编号(号码可以从1到N);将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).将号签放在同一箱中,并搅拌均匀;从箱中每次抽出1个号签,并记录其编号,连续抽取k次;从总体中将与抽到的签的编号相一致的个体取出.抽样具有公平性原则:等概率、随机性;抽签法适用于总体中个数N不大的情形.随机数表法:将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表.当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:对总体中的个体进行编号(每个号码位数一致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,得到数码.若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;根据选定的号码抽取样本.(2)系统抽样系统抽样的步骤为:采用随机的方式将总体中的个体编号;将整个的编号按一定的间隔(设为k )分段,当N n (N 为总体中的个体数,n 为样本容量)是整数时,k = N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时k = N ′n,并将剩下的总体重新编号;在第一段中用简单随机抽样确定起始的个体编号1 ;将编号为1,1+k ,1+2k ,…,1+(n -1)k 的个体抽出.(3)分层抽样例:某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥.解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000=4872 400,应取60×4872 400≈12人; “喜爱”占4 56712 000,应取60×4 56712 000≈23人; “一般”占3 92612 000,应取60×3 92512 000≈20人; “不喜爱”占1 07212 000,应取60×1 07212 000≈5人. 因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,其中所分成的各个部分称为“层”.分层抽样的步骤是:将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样).适用于总体中个体有明显的层次差异,层次分明的特点;总体中个体数 N 较大时,系统抽样、分层抽样二者选其一.2.用样本估计总体包括:(1)用样本的频率分布估计总体分布.频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.频率分布直方图的特征:通过频率分布直方图可以清楚地看出数据分布的总体趋势;通过频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.茎叶图.画茎叶图的步骤如下:①将每个数据分为茎(高位)和叶(低位)两部分;②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;③将各个数据的叶按大小次序写在其茎右(左)侧.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.(2)用样本的数字特征估计总体的数字特征.①众数、中位数、平均数以及利用频率分布直方图来估计众数、中位数、平均数. 利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点). 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.②标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示. 所谓“平均距离”,其含义可作如下理解: 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数,x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是s =|x 1-x |+|x 2-x |+…+|x n -x |n. 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差s =1n[x 1-x 2+x 2-x 2+…+x n -x 2]. ③方差从数学的角度考虑,人们有时用标准差的平方s 2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.3.变量间的相关关系包括:(1)变量之间的相关关系相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫作相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.(2)两个变量的线性相关①散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.②正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)③线性相关关系:像能用直线方程y =a +bx 近似表示的相关关系叫作线性相关关系.④线性回归方程:1122n n =a +bx 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于a ,b 的二次多项式,应用配方法,可求出使Q 为最小值时的a ,b 的值,即⎩⎪⎨⎪⎧ b =x 1y 1+x 2y 2+…+x n y n -n x y x 21+x 22+…+x 2n -n x 2,a =y -b x .其中,x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n. 应用示例思路11 为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查.如何抽取呢?解法一:通常使用抽签法,方法是:将50名学生从1到50进行编号,再制作1到50的50个号签,把50个号签集中在一起并充分搅匀,最后随机地从中抽10个号签.对编号与抽中的号签的号码相一致的学生进行视力检查.解法二:下面我们用随机数表法求解上面的问题.对50个同学进行编号,编号分别为01,02,03,…,50;在随机数表中随机地确定一个数作为开始,如从下表第3行第29列的数7开始.16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42,这10个号码,就是所要抽取的10个样本个体的号码.变式训练某学校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10∶1,行政人员有24人.①现采取分层抽样抽取容量为50的样本,那么行政人员中应抽取的人数为( ).A .3B .4C .6D .8②教学人员和教辅人员中应抽取的人数分别为________和________.答案:①C ②40 4例2 下列问题中,采用怎样的抽样方法较为合理?(1)从10台冰箱中抽取3台进行质量检查.(2)某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈.(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.解:(1)总体容量比较小,用抽签法或随机数表法都很方便.(2)总体容量比较大,用抽签法或随机数表法比较麻烦,由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样法.(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样法.变式训练要从已编号(1~60)的60枚最新研制的某种导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( ).A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,8,14,20,26,32答案:B例3 某单位在岗职工共624人,为了调查职工用于上班途中的时间,决定抽取10%的职工进行调查.如何采用系统抽样方法完成这一抽样?解:第一步:将624名职工用随机方式进行编号;第二步:从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;第三步:在第一段000,001,002,…,009这十个编号中用简单随机抽样确定起始号码i0;第四步:将编号为i0,i0+10,i0+20, …,i0+610的个体抽出,组成样本.变式训练现有以下两项调查:①某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共1 500家,三者数量之比为1∶5∶9.为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成①②这两项调查宜采用的抽样方法依次是( ).A.简单随机抽样法,分层抽样法B.分层抽样法,简单随机抽样法C.分层抽样法,系统抽样法D.系统抽样法,分层抽样法答案:D思路2例1 为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图1),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.图1(1)求第四小组的频率和参加这次测试的学生人数.(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)若参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?解:(1)由于各小组频率的和是1,因此第四小组的频率为1-0.1-0.3-0.4=0.2;由于第一小组的频数是5,频率为0.1,因此总人数为5÷0.1=50.(2)由于第三小组的频率最大,因此学生跳绳次数的中位数落在第三小组内.(3)由第三小组的频率和第四小组的频率和为0.6,可知该校此年级跳绳成绩的优秀率是0.6.例2 下面是关于世界20个地区受教育的人口的百分比与人均收入的散点图.图2(1)图中两个变量有什么样的相关关系?(2)若利用散点图中的数据建立的回归方程为y =3.193x +88.193,且受教育的人口的百分比相差10%,其人均收入相差多少?解:(1)散点图中的样本点基本集中在一个条型区域中,因此两个变量呈线性相关关系.(2)回归方程的自变量系数为3.193,因此当受教育的人口的百分比相差10%时,其人均收入相差3.193×10=31.93.变式训练1.数据70,71,72,73的标准差是( ).A .2B .54C . 2D .52答案:D2.已知k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:123.已知回归方程y =0.5x -0.81,则x =25时,y 的估计值为________.答案:11.69知能训练答案:乙品种 甲品种2.在一次文艺比赛中,12名专业人员和12名观众代表各组成一个评判小组,给参赛选手打分,下面是两个评判组对同一名选手的打分:小组A :42,45,48,46,52,47,49,55,42,51,47,45;小组B :55,36,70,66,75,49,46,68,42,62,58,47.通过计算说明小组A ,B 哪个更像是由专业人士组成的评判小组?答案:小组A .解:作出的茎叶图如图3.图3从这个茎叶图中可以看出乙班的数学成绩更好一些.拓展提升1.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第18列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号.84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 7973 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54…解:从第2行第18列的数7开始向右读,每次读三位,凡是小于或等于799的数就为1个,即719,050,717,512,358是最先检测的5袋牛奶的编号.2.想象一下一个人从出生到死亡,在每个生日都测量其身高,并作出这些数据的散点图.这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分(2)求出这些数据的回归方程.(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.解:(1)作出的数据的散点图如图4.图4(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984.(3)在该例中,回归系数6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略.3~16岁的身高年均增长约为6.323 cm.(5)回归系数与每年平均增长的身高之间近似相等.课堂小结本节介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.作业复习题一任选3题.设计感想本节复习了最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.本节对第一章知识和方法进行了归纳和总结,使学生的基本知识系统化和网络化,基本方法条理化,有利于学生更好地用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.备课资料备选习题1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是 ( ).A.总体B.个体C.总体的一个样本D.样本容量答案:C2.用简单随机抽样方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个体a“第一次被抽到的概率”“第二次被抽到的概率”“在整个抽样过程中被抽到的概率”分别是( ).A.16,16,16B.16,15,16C.16,16,13D.16,13,13答案:C3.在一个个体数目为1 003的总体中,要利用系统抽样抽取一个容量为50的样本,那么总体中每个个体被抽到的概率是( ).A.120B.150C.25D.501 003答案:D4.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为( ).A.40 B.30 C.20 D.12答案:B5.一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样法从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是( ).A.甲厂9台,乙厂5台B.甲厂8台,乙厂6台C.甲厂10台,乙厂4台D.甲厂7台,乙厂7台答案:B6.下列叙述中正确的是( ).A.通过频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距答案:C7.某工厂生产产品,用传送带将产品送至下一个工序,质检人员每隔10分钟在传送带某一位置取一件检验,则这种抽样的方法为( ).A.简单随机抽样B.系统抽样C.分层抽样D.非上述情况答案:B8.频率分布直方图中,小长方形的面积等于( ).A.组距B.频率C.组数D.频数答案:B9.一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,则所得到的这组新数据的方差是( ).A.1 B.27 C.9 D.3答案:B10.有两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( ).A.甲、乙波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较答案:C11.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,则个体a前两次未被抽到,第三次被抽到的概率为________.答案:11012.观察新生婴儿的体重,其频率分布直方图如图5:图5则新生婴儿体重在(2 700,3 000)的频率为________.答案:0.313.已知样本99,100,101,x ,y 的平均数是100,方差是2,则xy =________. 答案:9 99614.某中学高一年级有x 个学生,高二年级有900个学生,高三年级有y 个学生,现从这些学生中采用分层抽样抽取一个容量为370人的样本,若高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少学生?解:由题意得x 120=y 100=900370-120-100,解得 x =720,y =600. 故该学校高中部共有学生2 220人.15.下图是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案).图6注:每组可含最低值,不含最高值.(1)该单位职工共有多少人?(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?解:(1)该单位有职工50人.(2)38~44岁之间的职工人数占职工总人数的60%.(3)年龄在42岁以上的职工有15人.解:x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73, s 2甲=15(142+62+42+162+42)=104,s 2乙=15(72+132+32+72+22)=56. ∵x 甲>x 乙,s 2甲>s 2乙,∴ 甲的平均成绩较好,乙的各门功课发展较平衡.17.下面是一个病人从4月7日起的体温记录折线图,观察图形回答下列问题:图7(1)护士每隔几小时给病人量一次体温?(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?(3)这个病人在4月8日12时的体温是多少摄氏度?(4)这个病人的体温在哪段时间里下降得最快?在哪段时间里比较稳定?(5)图7中的横虚线表示什么?(6)从体温看,这个病人的病情是在恶化还是在好转?解:(1)6小时;(2)最高温度是39.5 ℃,最低温度是36.8 ℃;(3)4月8日12时的体温是37.5 ℃;(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点体温比较稳定;(5)虚线表示标准体温;(6)好转.18.从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图8所示.观察图形,回答下列问题:图8(1)79.5~89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格).解:(1)频率为0.025×10=0.25,频数为60×0.25=15;(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75.(设计者:方诚心)。

高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案

高中数学必修3(人教B版)第二章统计2.3知识点总结含同步练习题及答案

描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。

必修3第6章统计(含单元测试)参考答案

必修3第6章统计(含单元测试)参考答案

实用文档必修3 第6章 统计 参考答案6.1.1 简单随机抽样1.C 2.C 3.A 4.抽签法,随机数表法,向上、向下、向左、向右5.21 6.60,30 7.相等,Nn 8.略 9.(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的。

(2)不是简单随机抽样,由于它是放回抽样10.选法二不是抽签法,因为抽签法要求所有的签编号互不相同,而选法二中39个白球无法相互区分。

这两种选法相同之处在于每名学生被选中的概率都相等,等于401。

6.1.2 系统抽样1.A 2.B 3.B 4.B 5.A 、B 、D 6. 200450 7.(一)简单随机抽样(1) 将每一个人编一个号由0001至1003;(2) 制作大小相同的号签并写上号码;(3) 放入一个大容器,均匀搅拌;(4)依次抽取10个号签具有这十个编号的人组成一个样本。

(二)系统抽样(1)将每一个人编一个号由0001至1003;(2)选用随机数表法找3个号,将这3个人排除;(3)重新编号0001至1000;(4)在编号为0001至0100中用简单随机抽样法抽得一个号L;(5)按编号将:L,100+L,…,900+L共10个号选出。

这10个号所对应的人组成样本。

8.系统抽样适用于总体中的个体数较多的情况;系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样相同的是,系统抽样也属于等可能抽样。

9.是用系统抽样的方法确定的三等奖号码的,共有100个。

10.略(参考第7小题)6.1.3 分层抽样实用文档Nm1.B 2.B 3.104 4.n5.70,80 6.系统抽样,100个7.总体中的个体个数较多,差异不明显;总体由差异明显的几部分组成中年:200人;青年:120人;老年:80人8.分层抽样,简单随机抽样9.因为总体共有彩电3000台,数量较大,所以不宜采用简单随机抽样,又由于三种彩电的进货数量差异较大,故也不宜用系统方法,而以分层抽样为妥。

新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析

新版高中数学北师大版必修3习题第一章统计1.2.2.2含解析

第2课时系统抽样课时过关·能力提升1.从N个编号中抽取n个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为()AC答案:C2.有40件产品,编号为1~40,现在从中抽取4件检验,用系统抽样的方法确定所抽取的编号可能为()A.5,10,15,20B.2,12,22,32C.2,14,26,38D.5,8,31,36解析:由系统抽样的定义知抽样距为可以在第一组1~10号样本中取k号,1≤k≤10,则抽取到的样本编号为k,k+10,k+20,k+30.答案:B3.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A.480B.481C.482D.483解析:由样本中编号最小的两个编号分别为007,032,得抽样距为32-7=25,则样本容量为每组中应抽取的号码数x=7+25(n-1)(1≤n≤20,n∈Z),当n=20时,x取得最大值为x=7+25×19=482.答案:C4.总体容量为524,采用系统抽样法抽样,若想不剔除个体,则抽样间隔可以为()A.3B.4C.5D.6解析:因为系统抽样的间隔需要能整除总体个数.故选B.答案:B5.某初级中学有学生270人,其中七年级108人,八年级、九年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按七年级、八年级、九年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.那么关于上述样本的下列结论,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样解析:由定义可知,①③可能为分层抽样也可能为系统抽样;②可能为分层抽样;④可能为简单随机抽样.故选D.答案:D6.将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是.答案:157.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,……,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽取人.解析:由题意可知,系统抽样时共分成40组,抽样间隔为5,第5组的号码为22,则第8组的号码为22+5×3=37.在分层抽样时,由于40岁以下年龄段人数占总数的50%,故40岁以下年龄段应抽取40×50%=20(人).答案:37208.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.解析:由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中的编号依次为60,61,62,63,…,69.故在第7组中抽取的号码是63.答案:639.某学校有学生3 000人,现在要抽取100人组成夏令营,应该怎样抽取样本?分析:因为总体中个体数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤如下.第一步:把这些学生分成100个组,因为所以每个组30名学生,这时,抽样距就是30.第二步:将3 000名学生随机编号为1,2, (3000)第三步:在第1组用简单随机抽样确定起始个体的编号l(0<l≤30).第四步:按照一定的规则抽取样本,通常是将起始编号l加上分段间隔30得到第2个个体编号l+30,再加上30得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l=15,则抽取的编号为15,45,75,105,…,2985.这些号码对应的学生组成样本.10.为了考察某校的教学水平,将抽取这个学校本学年高三年级部分学生的考试成绩,为了全面地反映实际情况,采取以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班的学生都已经按随机方式编好了学号,假定该校每个班的学生人数都相同).①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共有150人,良好生共有600人,普通生共有250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式所抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种方法抽取样本?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.解:(1)在这三种抽取方式中,其总体都是该校本学年高三全体学生的考试成绩,个体都是本学年高三年级每个学生的考试成绩.其中第一种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的本学年20名学生的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的本学年100名学生的考试成绩,样本容量为100.(2)在上面三种抽取方式中,第一种方式采用的是简单随机抽样;第二种方式采用的是系统抽样和简单随机抽样;第三种方式采用的是分层抽样和简单随机抽样.(3)第一种方式抽取样本的步骤如下:首先在这20个班中用抽签法任意抽取一个班,然后从这个班中按学号用随机数法或抽签法抽取20个学生,考察其考试成绩.第二种方式抽取样本的步骤如下:首先在第一个班中,用简单随机抽样法任意抽取一个学生,记其学号为a.然后在其余的19个班中,选取学号为a的学生,共计20人.第三种方式抽取样本的步骤如下:首先分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三层.然后确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1 000=1∶10,所以在每层抽取的个体数依次为即15,60,25.最后按层分别抽取.在优秀生中用简单随机抽样抽取15人,在良好生中用简单随机抽样抽取60人,在普通生中用简单随机抽样抽取25人.。

高一数学 (人教版必修3):第三章 统计 Word版含解析

高一数学 (人教版必修3):第三章 统计 Word版含解析

重点列表:重点 名称重要指数 重点1 频率分布直方图 ★★★★ 重点2 茎叶图 ★★★ 重点3抛物线★★★★重点详解:用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________________,它能够更加精细地反映出____________________________________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.【参考答案】(1)频率分布 分布 数字特征 数字特征 (2)频率组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录重点1:频率分布表、频率分布直方图及其应用 【要点解读】用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【考向1】根据数据画出频率分布直方图【例题】某市2013年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成下列频率分布表、频率分布直方图;频率分布表分组频数频率41,51)51,61)61,71)71,81)81,91)91,101)101,111)频率分布直方图(2)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:(1)如图所示:频率分布表分组频数频率41,51) 2 230 51,61) 1 130 61,71) 4 430 71,81) 6 630 81,91) 10 1030 91,101) 5 530 101,111)2230(2)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115,有26天处于良的水平,占当月天数的1315,处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115,污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数;对于开放性问题的解答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.本题主要考查运用统计知识解决简单实际问题的能力、数据处理能力和应用意识. 【考向2】频率分布直方图的逆用【例题】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60, [)60,70,[)70,80,[)80,90,[]90,100.(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生的语文成绩在某些分数段的人数(x )与数学成绩在相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数.分数段[)50,60 [)60,70 [)70,80 [)80,90x ∶y1∶12∶13∶44∶5解:(1)由()2a +×10=1, 解得a =0.005.(2)=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段 50,60) 60,70) 70,80) 80,90)x 5 40 30 20 x ∶y 1∶1 2∶1 3∶4 4∶5 y5204025于是数学成绩在50重点2:茎叶图 【要点解读】茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 【考向1】根据茎叶图求方差【例题】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.如果X =8,求乙组同学植树棵数的平均数和方差;注:方差s2=1n(x1-)2+(x2-)2+…+(x n-)2],其中x为x1,x2,…,x n的平均数.解:当X=8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为=8+8+9+104=354;方差为s2=14⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫9-3542+⎝⎛⎭⎪⎫10-3542]=1116.【考向2】根据茎叶图求平均数【例题】某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201 530(1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?难点列表:难点名称难度指数难点1 用样本的数字特征估计总体的数字特征★★★★难点2导数与函数的极值、最值★★★难点详解:用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数众数:在一组数据中,出现次数________的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=_______.在频率分布直方图中,中位数左边和右边的直方图的面积应该________. (2)样本方差,样本标准差 标准差s =])()()[(122221x x x x x x nn -+⋯+-+-,其中x n 是__________________,n 是________,是________.标准差是反映总体__________的特征数,________是样本标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.【答案】 (1)最多 平均数 1n(x 1+x 2+…+x n ) 相等(2)样本数据的第n 项 样本容量 平均数 波动大小 样本方差难点1:用样本的数字特征估计总体的数字特征 【要点解读】能从一组数据中求出中位数、平均数和众数 【考向1】平均数、中位数【例题】某汽车制造厂分别从A ,B 两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1000 km): 轮胎A 96 11297108100103 86 98轮胎B 108 101 94 105 9693 97 106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数、中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?(2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为:s =8)2()14(308)3(12)4(22222222-+-++++-++-=2212≈7.43; B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为:s =86)3()7()4(5)6(1822222222+-+-+-++-++=1182≈5.43. (3)虽然A 轮胎和B 轮胎的最远行驶里程的平均数相同,但B 轮胎行驶的最远里程的极差和标准差相对于A 轮胎较小,所以B 轮胎性能更加稳定.【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情况下,不难作出解答. 【考向2】平均数、标准差【例题】某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则(1)平均命中环数为____________; (2)命中环数的标准差为____________.难点2:根据频率分布直方图计算样本的数字特征【要点解读】会从频率分布直方图中求出中位数、平均数和众数【考向1】中位数【例题】如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5 B.13C.13.5 D.14【答案】 B【考向2】平均数【例题】某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.组别月用电量频数统计频数频率①0,20)②20,40)正正③40,60)正正正正④60,80)正正正正正⑤80,100)正正正正⑥100,120](1)完成频率分布表并绘制频率分布直方图;(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a. 解] (1)组别月用电量频数统计频数频率①0,20)40.04②20,40)正正120.12③40,60)正正正正240.24④60,80)正正正正正正300.30⑤80,100)正正正正正250.25⑥100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:分组0,20)20,40)40,60)60,80)80,100)100,120] 频率0.040.120.240.300.250.05累计频率0.040.160.400.700.95 1.00由此可知临界值a应在区间80,100)内,且频率分布直方图中,在临界值a左侧小矩形的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.【趁热打铁】1.容量为20的样本数据,分组后的频数如下表:分组10,20)20,30) 30,40) 40,50) 50,60) 60,70)频数2 3 4 5 4 2A.0.35 B.0.45C.0.55 D.0.652.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则( )A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<3.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数4.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定5.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m 甲,m 乙,则( )甲乙8 6 5 0 8 8 4 0 0 1 0 2 87 5 2 2 0 2 3 3 7 8 0 0 3 1 2 4 4 8 3 1 4 2 3 8A.甲<乙,m 甲>m 乙 B .甲乙甲乙C .甲>乙,m 甲>m 乙 D .甲>乙,m 甲<m 乙6.样本(x 1,x 2,…,x n )的平均数为,样本(y 1,y 2,…,y m )的平均数为y (≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数=α+(1-α) y ,其中0<α<12,则n ,m 的大小关系为( ) A .n <mB .n >mC .n =mD .不能确定7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下.中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.甲乙9 8 1 9 7 10 1 3 2 0 2 1 4 2 41 1 5 3 02 08.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5],样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.9.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?第三章1解:由频率分布表可知:样本数据落在区间10,40)内的频数为2+3+4=9,样本总数为20,故样本数据落在区间10,40)的频率为920=0.45.故选B.2解:中位数为5.5,众数为5,平均值为17930.故选D.3解:这种抽样方法为简单随机抽样,该班这五名男生成绩的平均数为86+94+88+92+905=90,方差为15(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8;该班这五名女生成绩的平均数为 88+93+93+88+935=91,方差为15(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故选C.5解:易知甲=21.5625,乙=28.5625,m 甲=20,m 乙=29,∴甲<乙,m 甲<m 乙.故选B. 6解:∵x 1+x 2+…+x n =n ,y 1+y 2+…+y m =m y ,∴x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n ) =(m +n )α+(1-α)y ] =(m +n )α+(m +n )(1-α)y , ∴n +m y =(m +n )α+(m +n )(1-α)y .∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α). 故n -m =(m +n )α-(1-α)]=(m +n )(2α-1). ∵0<α<12,∴2α-1<0.∴n -m <0,即n <m .故选A.7解:设甲、乙在这10天中日加工零件的平均数分别为a ,b ,则a =20+-1-2+0+1+3+2+0+11+11+1510=24,b =20+-1-3-9+1+4+2+4+10+12+1010=23.故填24;23.8解:平均气温低于22.5℃的城市所占频率为最左边两个矩形面积之和,即0.10×1+0.12×1=0.22,又其频数为11,故总城市数为110.22=50,故样本中平均气温不低于25.5℃的城市共有50×0.18=9(个). 故填9.9解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.10解:(1)计算得A=2.3, B=1.6,从计算结果来看,A药的疗效更好.(2)从以上茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.。

数学同步新导学案人教B必修三讲义:第二章 统计 2.3 Word含答案

数学同步新导学案人教B必修三讲义:第二章 统计 2.3 Word含答案

2.3变量的相关性学习目标 1.了解变量间的相关关系,会画散点图.2.根据散点图,能判断两个变量是否具有相关关系.3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出回归直线方程吗?答案用最小二乘法求回归直线方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程是无意义的.梳理回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程:回归直线对应的方程叫做回归直线方程. (3)最小二乘法:求回归直线方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的离差平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y ∑i =1n x 2i-n x 2,a ^=y -b ^x ,其中,b ^是回归直线方程的斜率,a ^是回归直线方程在y 轴上的截距.1.人的身高与年龄之间的关系是相关关系.( × ) 2.农作物的产量与施肥量之间的关系是相关关系.( √ ) 3.回归直线过样本点中心(x ,y ).( √)题型一 变量间相关关系的判断例1 下列两个变量之间是相关关系的是( ) A .圆的面积与半径之间的关系 B .球的体积与半径之间的关系 C .角度与它的正弦值之间的关系D .降雪量与交通事故的发生率之间的关系 答案 D解析 由题意知A 表示圆的面积与半径之间的关系S =πr 2,B 表示球的体积与半径之间的关系V =4πr 33,C 表示角度与它的正弦值之间的关系y =sin α,都是确定的函数关系,只有D是相关关系,故选D.反思与感悟函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.跟踪训练1下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量答案 D解析函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项V=a3,B项y =tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.题型二散点图的应用例25名学生的数学和物理成绩(单位:分)如下:判断它们是否具有线性相关关系.解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.反思与感悟(1)判断两个变量x和y间具有哪种相关关系,最简便的方法是绘制散点图.变量之间可能是线性的,也可能是非线性的(如二次函数),还可能不相关.(2)画散点图时应注意合理选择单位长度,避免图形偏大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.跟踪训练2 下列图形中两个变量具有线性相关关系的是( )答案 C解析 A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 题型三 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求回归直线方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i . (5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .(6)写出回归直线方程y ^=b ^x +a ^.跟踪训练3 某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程. 解 (1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.于是可得,b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5.于是所求的回归直线方程是y ^=6.5x +17.5.1.设有一个回归直线方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.工人工资y (元)与劳动生产率x (千元)的相关关系的回归直线方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工人工资为130元B .劳动生产率提高1 000元时,工人工资平均提高80元C .劳动生产率提高1 000元时,工人工资平均提高130元D .当月工资为250元时,劳动生产率为2 000元 答案 B解析 因为回归直线的斜率为80,所以x 每增加1,y 平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归直线方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg.4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则回归直线方程是________.答案 y ^=1.23x +0.08解析 回归直线的斜率的估计值为1.23,即b ^=1.23,又回归直线过定点(4,5),∴a ^=5-1.23×4=0.08,∴y ^=1.23x +0.08.5.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求回归直线方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归直线方程,我们可以进行估计和预测.例如,若回归直线方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B ,D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以断定( )A .x 与y 正相关,u 与v 正相关B .x 与y 正相关,u 与v 负相关C .x 与y 负相关,u 与v 正相关D .x 与y 负相关,u 与v 负相关答案 C解析 由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x 与y 负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u 与v 正相关. 3.已知x 与y 之间的一组数据:已求得关于y 与x 的回归直线方程为y ^=2.2x +0.7,则m 的值为( ) A .1 B .0.85 C .0.7 D .0.5 答案 D解析 x =0+1+2+34=1.5,y =m +3+5.5+74,将其代入y ^=2.2x +0.7,可得m =0.5,故选D.4.根据如下样本数据得到的回归直线方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0答案 B解析 画出散点图,知a ^>0,b ^<0.5.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的回归直线方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C ,D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误. 故选A.6.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4) 答案 D解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴回归直线必过点(1.5,4).故选D. 7.已知x ,y 的取值如表所示:如果y 与x 线性相关,且回归直线方程为y ^=b ^x +132,则b ^等于( )A .-12 B.12 C .-110 D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5), ∴5=3b ^+132,∴b ^=-12,故选A.8.某产品的广告费用x (单位:万元)与销售额y (单位:万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元答案 B解析 x =4+2+3+54=3.5,y =49+26+39+544=42.因为回归直线过点(x ,y ),所以42=9.4×3.5+a ^,解得a ^=9.1.故回归方程为y ^=9.4x +9.1.所以当x =6时,y ^=6×9.4+9.1=65.5. 二、填空题9.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归直线方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6 解析x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归直线方程中得14+c5=0.85×5-0.25,解得c =6.10.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 11.在一次试验中测得(x ,y )的四组数据如下:根据上表可得回归直线方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5 解析x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39),∴39=-5×17.5+a ^,∴a ^=126.5, ∴当x =20时,y =-5×20+126.5=26.5.12.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的回归直线方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入回归直线方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题13.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归直线方程y =b x +a ;(2)利用(1)中所求出的回归直线方程预测该地第6年的粮食需求量. 解 (1)由所给数据得x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5,∴y ^=1.1x +2.5.故所求的回归直线方程为y ^=1.1x +2.5.(2)第6年的粮食需求量约为y ^=1.1×6+2.5=9.1(万吨).14.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭月储蓄y (千元)关于月收入x (千元)的回归直线方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4,故所求回归直线方程为y ^=0.3x -0.4.(2)将x =7代入回归直线方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【知识点:统计】一.简单随机抽样1.总体和样本总体:在统计学中 , 把研究对象的全体叫做总体.个体:把每个研究对象叫做个体.总体容量:把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本...其中个体的个数称为样本容量....。

2.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

d(抽样距离)=N(总体规模)/n(样本规模)三.分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

四.样本频率分布图1.作图步骤:(1)求极差(一组数据中最大值和最小值得差)(2)决定组距和组数; (3)将数据分组;(4)计算各小组的频率,列频率分布表;(5)画频率分布直方图2.特点:(1)以面积的形式反映数据落在各小组的频率大小;.13)2(总和等于)各小长方形的面积的(频率组距频率组距小长方形的面积=⨯=五.茎叶图适用范围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。

当样本数据较多时,茎叶图就不太方便了。

六.用样本的数字特征估计总体的数字特征 1、本均值:nx x x x n+++=Λ212、.样本标准差:nx x x x x x s s n 222212)()()(-++-+-==Λ3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。

在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k ,标准差变为原来的k 倍 五.两个变量的线性相关1、概念: (1)回归直线方程 a x b y))+=ˆ (2)回归系数 ∑∑∑∑====--=---=n i i ni ii ni i ni i ixn x yx n yx x x y y x xb 1221121)())(()x b y a ))-=2.最小二乘法 3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。

(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。

(4)回归直线一定经过样本的中心点(x ,y ),据此性质可以解决有关的计算问题. 【例题讲解】1. 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A 3.5 B 3- C 3 D 5.0-2. 设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( )A y 平均增加1.5个单位B y 平均增加2个单位C y 平均减少1.5个单位D y 平均减少2个单位3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取, 则分段间隔应为( )An N B n C ⎥⎦⎤⎢⎣⎡n N D 1+⎥⎦⎤⎢⎣⎡n N4.从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.5. 为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本; ④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等6. 数据70,71,72,73的标准差是______________7. 数据123,,,...,n a a a a 的方差为2σ,平均数为μ,则(1)数据123,,,...,,(0)n ka b ka b ka b ka b kb ++++≠的标准差为 ,平均数为(2)数据123(),(),(),...,(),(0)n k a b k a b k a b k a b kb ++++≠的标准差为 ,平均数为8. 用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A 总体容量越大,估计越精确B 总体容量越小,估计越精确C 样本容量越大,估计越精确D 样本容量越小,估计越精确9画出茎叶图并分析两个班学生的数学学习情况【课堂练习】1. 相关关系与函数关系的区别是2. 从10个篮球中任取一个,检验其质量,则应采用的抽样方法为_______________3. 下列说法错误的是 ( )A 在统计里,把所需考察对象的全体叫作总体B 一组数据的平均数一定大于这组数据中的每个数据C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D 一组数据的方差越大,说明这组数据的波动越大4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A 平均数B 方差C 众数D 频率分布5. 要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A 5,10,15,20,25,30B 3,13,23,33,43,53C 1,2,3,4,5,6D 2,4,8,16,32,486. 数据123,,,...,n a a a a 的方差为2σ,则数据1232,2,2,...,2n a a a a 的方差为( )A 22σB 2σC 22σD 24σ7. 已知样本9,10,11,,x y 的平均数是10xy8. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为( )A 5,10,15,20,25B 5,15,20,35,40C 5,11,17,23,29D 10,20,30,40,509.(2013·武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________. 10.(2012·江西)样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =αx +(1-α)y ,其中0<α<12,则n ,m 的大小关系为( ).A .n <mB .n >mC .n =mD .不能确定11.已知施化肥量x 与水稻产量y 的试验数据如下表,则变量x 与变量y 是________相关(填“正”或“负”).12.(2013·长春调研)已知x ,y 取值如下表:x0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且y ^=0.95x +a ,则a =( ). A .1.30B .1.45C .1.65D .1.8013.某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图; (2)求n ,a ,p 的值.14 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格15.(2012·揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:组数 分组 低碳族的人数占本组的频率第一组 [25,30) 120 0.6 第二组 [30,35) 195 p 第三组 [35,40) 100 0.5 第四组 [40,45) a 0.4 第五组 [45,50) 30 0.3 第六组[50,55]150.3(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.16.已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.【课后作业】1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为__________2.用随机数表法从100名学生(男生25人)中抽取20人进行评教,某男生被抽取的机率是___________________3.(2013·沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于________4. 一个容量为20的样本数据,分组后组距与频数如下表:组距[)20,10[)30,20 [)40,30 [)50,40 [)60,50 [)70,60 频数234542则样本在区间(),50-∞ 上的频率为__________________5. 某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个容量为36的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取 _________人、 人、 人6. 某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人 为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中在不到40岁的教师中应抽取的人数为多少人?7. 如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5:这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)统计答案【例题答案】 例1. B 少输入9090,3,30=平均数少3,求出的平均数减去实际的平均数等于3- 例2. 0.7140.720= 例3. C 剔除零头 4.[审题视点] 因为802不能整除80,为了保证“等距”分段,应先剔除2个个体. 解 由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k =80080=10个个体;第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.解决系统抽样问题的两个关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定 5.④,⑤,⑥ 2000名运动员的年龄情况是总体;每个运动员的年龄是个体; 6.5 7071727371.5,4X +++== 222215[(7071.5)(7171.5)(7271.5)(7371.5)]42s =-+-+-+-= 7 (1)kσ,k b μ+(2)k σ,k kb μ+(1)1212......n nka b ka b ka b a a a X k b k b n nμ+++++++++==⋅+=+22212222121[()()...()]1[()()...()]n n s ka b k b ka b k b ka b k b na a a k nμμμμμμσ=+--++--+++--=-+-++-=(2)1212()()...()...n nk a b k a b k a b a a a X k nb k nb n nμ+++++++++==⋅+=+s k σ===8. C 9. 解:甲班 乙班2 56 6 2 8 6 6 4 27 4 6 82 8 2 4 5 6 8 6 9 2乙班级总体成绩优于甲班 【课堂练习】1.函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性2. 简单随机抽样3. B 平均数不大于最大值,不小于最小值4 D5 B60106=,间隔应为10 6. D 22222111111(),(22)4()4,n nn i i i i i i X X X X X X n n n σσ====--=⋅-=∑∑∑7.96 9101150,20x y x y ++++=+=,2211(10)(10)10x y ++-+-=,22220()192,()220()192,96x y x y x y xy x y xy +-+=-+--+=-=-8.D 间隔为109. 6 解析 设第1组抽取的号码为b ,则第n 组抽取的号码为8(n -1)+b ,∴8×(16-1)+b =126,∴b =6,故第1组抽取的号码为6.10.解析 依题意得x 1+x 2+…+x n =n x ,y 1+y 2+…+y m =m y ,x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z =(m +n )αx +(m +n )(1-α)y , ∴n x +m y =(m +n )αx +(m +n )(1-α)y ,∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α),于是有n -m =(m +n )[α-(1-α)]=(m +n )(2α-1), ∵0<α<12,∴2α-1<0,∴n -m <0,即m >n . 答案 A11 .正12.解析 依题意得,x =16×(0+1+4+5+6+8)=4,y =16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线y ^=0.95x +a 必过样本中心点(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ,由此解得a =1.45,选B.13.[审题视点] (1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:频率组距×组距=频率,频数样本容量=频率求解. 解 (1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为0.35=0.06.频率分布直方图如图所示.(2)第一组的人数为1200.6=200,频率为0.04×5=0.2, 所以n =2000.2=1 000. 由(1)知,第二组的频率为0.3,所以第二组的人数为1 000×0.3=300,所以p =195300=0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为 1 000×0.15=150,所以a =150×0.4=60.(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是频率组距,而不是频率. (2)由频率分布直方图进行相关计算时,需掌握下列关系式:频率组距×组距=频率. 14. 解:(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a ,故所求回归直线方程为8166.11962.0+=x y ) (3)据(2),当2150x m =时,销售价格的估计值为:2466.318166.11501962.0=+⨯=y )(万元)15.解 (1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016. 16.解 (1)由题意,第5组抽出的号码为22.因为k +5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为 x =110(81+70+73+76+78+79+62+65+67+59)=71, 所以样本方差为:s 2=110(102+12+22+52+72+82+92+62+42+122)=52. (3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81). 记“体重为76公斤的职工被抽取”为事件A ,它包括的事件有(73,76),(76,78),(76,79),(76,81)共4个. 故所求概率为P (A )=410=25. 【课后作业】1. 5 =频数频率样本容量 2 15 每个个体被抽取的机率都是2011005= 3.解析 由n 600+500+550=11550,得n =33(人). 4. 0.7 140.720= 5 61218,, 总人数为36363628548116328654128118163163163++=⨯≈⨯≈⨯≈,,,, 6. 解:而抽取的比例为701,4907=,在不到40岁的教师中应抽取的人数为 1350507⨯=7.解:(1)频率为:0.025100.25⨯=,频数:600.2515⨯=(2)0.015100.025100.03100.005100.75⨯+⨯+⨯+⨯=。

相关文档
最新文档