(完整word版)高中数学必修3统计与概率.doc

合集下载

高中数学必修三:概率与统计()

高中数学必修三:概率与统计()

高中数学必修三:概率与统计1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ).A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,322.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克 B.360千克C.36千克D.30千克3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,84.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ).A .直线l1和l2一定有公共点(s ,t)B .直线l1和l2相交,但交点不一定是(s ,t)C .必有直线l1∥l2D .直线l1和l2必定重合5..设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是( ).A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重比为58.79kg 6.对于两个变量之间的相关系数,下列说法中正确的是( ) A .r 越大,相关程度越大 B .()0,r ∈+∞,r 越大,相关程度越小,r 越小,相关程度越大 C .1r ≤且r 越接近于1,相关程度越大;r 越接近于0,相关程度越小 D .以上说法都不对7、.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为sA 和sB,则( )(A) A x >B x ,sA >sB(B) A x <B x ,sA >sB (C) A x >B x ,sA <sB(D) A x <B x ,sA <sB8.山东采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,……,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C.则抽到的人中,做问卷B 的人数为(A )7 (B ) 9 (C ) 10 (D )19某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为( )(A )7 (B )15 (C )25 (D )3510..样本(12,,,n x x x )的平均数为x ,样本(12,,m y y y )的平均数为()y x y ≠,若样本(12,,,n x x x ,12,,m y y y )的平均数(1)z ax a y =+-,其中102α<<,则n ,m 的大小关系为( )A .n m < B .n m > C .n m = D .不能确定 11.某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显着差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( ) A .抽签法B .随机数法C .系统抽样法D .分层抽样法12 .总体有编号为01,02,…,19,20的20个个体组成。

高一数学必修3讲义__统计概率教师版 - 副本

高一数学必修3讲义__统计概率教师版 - 副本

数学必修3 统计与古典概率专题一、统计知识要点: 1、数据的收集:①总体与样本、样本容量 ②随机抽样:简单随机抽样、.系统抽样、.分层抽样 2、数据的处理:①根据数据的特征数:趋中程度:众数、中位数、均值 离散程度:方差、标准差 ②根据频率分布 频率分布直方图 频率分布折线图 茎叶图 3、变量的相关关系①变量间关系 ②相关关系的分析 ③两变量的线性关系 二、概率知识要点:1、古典概型 2、几何概型 三、基础练习1.某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。

为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为 (A )9(B )18(C )27(D) 362.一个容量100的样本,其数据的分组与各组的频数如下表则样本数据落在(10,40)上的频率为A. 0.13B. 0.39C. 0.52D. 0.643.设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。

黄金矩形常应用于工艺品设计中。

下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定4.对变量x, y 有观测数据理力争(1x ,1y )(i=1,2,…,10),得散点图1;对变量u ,v 有观测数据(1u ,1v )(i=1,2,…,10),得散点图2. 由这两个散点图可以判断。

(A)变量x 与y 正相关,u 与v 正相关(B)变量x 与y 正相关,u 与v 负相关(C)变量x 与y 负相关,u 与v 正相关(D)变量x 与y 负相关,u 与v 负相关5.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。

高中数学必修三:概率与统计

高中数学必修三:概率与统计

高中数学必修三:概率与统计1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A .5,10,15,20,25B .3,13,23,33,43C .1,2,3,4,5D .2,4,8,16,322.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A .300克 B .360千克 C .36千克 D .30千克3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为 ( )A .2,5B .5,5C .5,8D .8,84.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x 和y 的数据的平均值都分别相等,且值分别为s 与t ,那么下列说法正确的是( ). A .直线l1和l2一定有公共点(s ,t)B .直线l1和l2相交,但交点不一定是(s ,t) C .必有直线l1∥l2 D .直线l1和l2必定重合5..设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是( ).A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1cm ,则其体重约增加0.85kgD.若该大学某女生身高为170cm ,则可断定其体重比为58.79kg6.对于两个变量之间的相关系数,下列说法中正确的是( ) A .r 越大,相关程度越大 B .()0,r ∈+∞,r 越大,相关程度越小,r 越小,相关程度越大 C .1r ≤且r 越接近于1,相关程度越大;r 越接近于0,相关程度越小 D .以上说法都不对 7、.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为sA 和sB,则( )(A) A x >B x ,sA >sB(B) A x <B x ,sA >sB (C)A x >B x ,sA <sB(D) A x <B x ,sA <sB8.山东采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,……,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C.则抽到的人中,做问卷B 的人数为 (A )7 (B ) 9 (C ) 10 (D )19某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本 . 若样本中的青年职工为7人,则样本容量为( )(A )7 (B )15 (C )25 (D )35 10..样本(12,,,n x x x )的平均数为x ,样本(12,,m y y y )的平均数为()y x y ≠,若样本(12,,,n x x x ,12,,m y y y )的平均数(1)z ax a y =+-,其中102α<<,则n ,m 的大小关系为( )A .n m < B .n m > C .n m = D .不能确定11.某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( ) A .抽签法 B .随机数法 C .系统抽样法 D .分层抽样法12 .总体有编号为01,02,…,19,20的20个个体组成。

(完整版)(最全)高中数学概率统计知识点总结(可编辑修改word版)

(完整版)(最全)高中数学概率统计知识点总结(可编辑修改word版)

∑ (x - x ) ∑ ( y - y ) n2n2i =1i i =1i∑ (x - x ) ∑ ( y - y ) n 2n2i =1i i =1i1 2 n 1 2 n n i iiii一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。

概率与统计x + x + ⋅⋅⋅ + x x + x + ⋅⋅⋅ + x 2、平均数:①、常规平均数: x = 1 2 nn②、加权平均数: x = 1 1 2 2 n n+ + ⋅⋅⋅ + 1 2 n3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。

4、方差: s 2= 1[(x - x )2+ (x - x )2+ ⋅⋅⋅ + (x - x )2 ]n1 2 n二、频率直方分布图下的频率1、频率 =小长方形面积: f = S = y ⨯ d ;频率=频数/总数2、频率之和: f + f + ⋅⋅⋅ + f = 1;同时 S + S + ⋅⋅⋅ + S = 1 ;三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。

2、平均数: x = x f + x f + x f + ⋅⋅⋅ + x f x = x S + x S + x S + ⋅⋅⋅ + x S 1 12 23 3n n1 12 23 3n n3、中位数:从左到右或者从右到左累加,面积等于 0.5 时 x 的值。

4、方差: s 2 = (x - x )2 f + (x - x )2 f + ⋅⋅⋅ + (x - x )2 f1122nn四、线性回归直线方程: y ˆ = b ˆx + a ˆn n∑(x i - x )( y i - y ) ∑ x i y i - nxy 其中: b ˆ = i =1 = i =1 ,a ˆ = y -b ˆx∑n (x - x )2 ∑ x 2 - nx 2i =1iii =11、线性回归直线方程必过样本中心(x , y ) ;2、b ˆ > 0 : 正相关; b ˆ < 0 : 负相关。

必修3第二三章统计、概率.doc

必修3第二三章统计、概率.doc

高一数学必修三统计、概率例1.在生产过程中,测得纤维产品的纤度(表示纤维粗细种量)共有100个数据,将数据分组如右表:(1)画出频率分布表,并画出频率分布直方图;(2) 估计纤度落在[1.38,1.50)中的概率及纤度小于1.40概率是多少? (3) 均 数. 例2: 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运 转的速度而变化,下表为抽样试验结果:(1) 如果y 与x 有线性相关关系,求回归直线方程;(保留4位小数)(2) 若实际生产中,允许每小时的产品中有缺点的零件最多为10个。

那么,机器的运转 速度应控制在什么范围内?(保留4位小数) 例3:先后随机投掷2枚骰子,其中x 表示第1枚骰子出现的点数,y 表示第2枚骰子 出现的点数.(1)求点尸(x, *)在直线*=才一1上的概率;(2)求点户(x, *)满足./<4x 的概率.变形思考3: (2009 •湛江一模)有两个不透明的箱子,每个箱子都装有4个完全相同的 小球,球上分别标有数字1、2、3、4.(1) 甲从其中一个箱子中摸出一个球,乙从另一个箱子摸出一个球,谁摸出的球上标的 数字大谁就获胜(数字相同则为平局),求甲获胜的概率;(2) 摸球方法与(1)同,若规定:两人摸到的球上所标数字相同甲获胜,所标数字不相同 则乙获胜,这样规定公平吗? 例4:甲、乙两艘船驶向一个不能同时停泊两艘轮船的码头,它们在一昼夜内任何时刻 到达是等可能的.如果甲船和乙船的停泊时间都是4小时,求它们中的任何一条船不需 要等待码头空出的概率.变形思考4:甲、乙两艘船驶向一个不能同时停泊两艘轮船的码头,它们在一昼夜内任 何时刻到达是等可能的.如果甲船的停泊时间为4小时,乙船的停泊时间是2小时,求它们中的任何一条船不需要等待码头空出的概率.变形思考5:(2008 •惠州市第三次调研题)右图的矩形,长为5, 宽为2,在矩形内随机地撒300颗黄豆,数得落在阴影部分的黄豆数为138颗.则我们可以估计出阴影部分的面积为-4.作出区域()Wx<24, ()Wv<24,)一I > 4,或 y - X <-4.设“两船无需等待码头空出”为事件.4变形思考4,5:221 232 x-y x20x20(2)纤度落在[1. 38, 1.50)中的概率约为 0. 30+0. 29+0. 10=0. 69, 纤度小于1.40的概率约为0.04+0.25+为0.30=0.44 (III)总体数据的众数:1. 4 中位数:1.%08 平均数:1.4088 例 2: (l)y = 0.7286x-0.8575(2)要使宁 <10=> 0.7286X - 0.8575 < 10,所以x< 14.9019,所以机器的转速应控制在14.9019转/秒。

苏教版数学数学必修3《统计与概率》

苏教版数学数学必修3《统计与概率》
如均值(其中的阅读)、回归中的数据相关性与实 践是否相符—出生时间与智商)

实际结果:罗斯福以62:38胜兰登
学生活动:问题出在哪里?
问题1:如何科学合理地进行抽样? 更多的实例:
有厂家在火车站调查旅客(他们认为 车站有各色人),以了解公众对其生产的 奶粉的意见,合适吗?
一位心理咨询师根据他接触的病人 得出结论:每个人都有点精神病。可信 吗?
学生活动:独立思考、相互讨论 标准:等可能 问题2:为了了解高一(1)班50名学生的视力状 况,从中抽取10名学生进行检验,如何抽取? 问题3:运用抽签法抽取样本时,做签、抽签 都比较麻烦,能否“只抽一次,以后共用”?
3。以案例分析的形式经历统计分析的 过程,感受统计研究的思想,掌握统计 推断的方法
教参中的教学案例解说、教学设计的再创造
问题情境
情境1:某工厂生产一批灯泡,要了解这批 灯泡的使用寿命,怎么办?
情境2:保险公司为对人寿保险制定适当的 赔偿标准,需要了解人口的平均寿命,怎 样获得相关数据? 情境3:国际奥委会2003年6月29日决定, 2008年北京奥运会的举办日期将比原定日 期推迟2周,改在8月8日至8月24日举行, 原因是7月末8月初北京地区的气温高于8月 中下旬。这一结论是如何得到的?
生活中的实例与误解
(4)义务教育阶段对统计和概率已有认识 图表表示数据(表、比例图、饼图、 条形图等) 直观、描述性的数据分析(如频率、 样本平均数等) 高中必修部分:
还是以描述性的统计为主,但应适 当增强理性依据。内容也有所增加。
(5)教材定位与要求
定位:通过案例经历统计分析的过 程 ,体验统计学的基本思想。 以课标为标准,取较低要求:描述性 的统计学
(2)与统计学与概率论的思维方式有关:统计

高中数学选择性必修三 概率统计

高中数学选择性必修三 概率统计

概率统计通过上节课的学习,我们已经知道分布列实际是一种函数,确切的说是一种离散型的函数,所谓的分布列的表格就是列表法表示函数.比如我们可以类似于连续函数做出离散型函数的函数图象.如上一讲中的例6,我们知道它的分布列为:X0 1 2 3 4 5P136 112 19 13 19 13于是,我们可以根据分布列画出函数的图象.考点1:二点分布1.如果随机变量X 的分布列为X 1 0P p 1p -其中01p <<,则称离散型随机变量X 服从参数为p 的二点分布.二点分布又称01-分布,由于只有两个可能结果的随机试验叫做伯努利试验,所以这种分布又称为伯努利分布.【举例】两点分布的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等等,都可以用二点分布来研究.老师可以以下边的例子讲 解两点分布,让学生从直观上理解二点分布.屋子里关着一只鸟,这只鸟要从窗户飞出去,屋子里有三扇窗户,只有一个是开着的,剩下两个有玻璃,不过这只鸟的眼神不是特别好,看不清哪个是开着的.于是,他会随机的挑选一个撞过去,那么成功率就是13.随机变量X 为这只鸟从窗户飞出去的结果,成功定义为1,失败定义为0,则X 的分布列满足二点分布.X 1 0P1323知识点睛543210PX2.二点分布的期望与方差:若随机变量X 服从参数为p 的二点分布,则()()101E X p p p =⨯+⨯-=;()()()()()221011D X p p p p p p =-⋅+-⋅-=-【教师备案】二点分布严格定义是01-分布,不过实际上二点分布的模型可以应用于自然界所有“只有两种情况”的情况.比如:我们高考考北大,我们可以把考上定义为1,没考上定义为0,这样就可以写出一个二点分布的分布列.我们可以以这个分布列来估计考上北大的可能性,进而决定我们如何报考.这里会有一个比较有意思的问题:在什么情况下我们会比较纠结呢?直观的看,假设我们考上的概率是40%,考不上的概率是60%,我们就会侧重于不报考;如果考上的概率60%,考不上的概率是40%的话,我们就会考虑报考.但是如果我们发现考上的概率是50%的话,就彻底纠结了.这个时候其实我们最靠谱的办法是掷硬币……从数学的角度分析,这件事非常简单,我们知道二点分布的方差是()1p p -,由均值不等式很容易得出当12p =的时候,方差最大,也就是结果的波动性最大.此时我们是最没有办法估计结果的.【例1】 二点分布从装有6只白球和4只红球的口袋中任取1只球,用X 表示“取到的白球个数”,求随机变量X 的分布列及期望与方差.【解析】 由题意知()420645P X ===+,()631645P X ===+,故随机变量X 的分布列为()205P X ==,()315P X ==,概率分布表如下:X 0 1 P2535()35E X =,()2365525D X =⨯=.考点2:超几何分布1.超几何分布 一般地,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件()n N ≤,这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为C C ()C m n mM N Mn N P X m --==(01m l =,,,,l 为n 和M 中较小的一个 ).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N ,M ,n 的超几何分布.在超几何分布中,只要知道N ,M 和n ,就可以根据公式求出X 取不同值时的概率()P X m =,从而列出X 的分布列.2.超几何分布的期望与方差:若离散型随机变量X 服从参数为N M n ,,的超几何分布, 则()nME X N=;()11nM M N n D X N N N -⎛⎫=- ⎪-⎝⎭. 【举例】可以继续延续之前那个鸟的例子,假设现在屋子里有100扇窗户,其中有10扇窗户是打开的,现在鸟不傻知识点睛经典精讲了,不过眼神依然不好.他现在决定尝试20次(否则可能撞的次数太多给撞死了),并且撞过的窗户不再去撞了,记录结果,统计一下有多少次能出去.这就是超几何分布,从模型角度讲,超几何分布就是“无放回”的抽取.超几何分布的典型例子就是生物学上的标记重捕法.先标记种群内的一部分个体,放回后再次捕捉,统计含有标记的数量,来估计总数,这实际是利用了超几何分布的期望的直观意义.【教师备案】老师在讲完超几何分布后,就可以让学生做例2,例2主要是让学生写超几何分布的分布列,关键是让学生从题目上就可以看出是超几何分布,然后根据超几何分布的概率公式就可以很快写出分布列;然后老师就可以继续讲超几何分布的期望与方差,对于超几何的期望和方差,老师可以只介绍期望公式,方差的公式太麻烦了,所以不建议给学生讲解,而且期望的公式推导过程也不要求,只需让学生记住就行了.讲完期望公式后,就可以让学生做例3,例3主要是套公式,学生会发现,对于超几何分布求期望用公式也非常快.【例2】 求超几何分布的分布列一个口袋内有4个不同的红球,6个不同的白球,从中任取4个球, ⑴ 求其中红球个数的分布列 ⑵ 求其中白球个数的分布列.【追问】从红球的分布列和白球的分布列你能看出X 和Y 的取值之间有什么关系?【解析】 ⑴ 记X 表示“取出4个球中红球的个数”,则X 服从参数为1044,,的超几何分布.∴0446410C C 1(0)C 14P X ⋅===,1346410C C 8(1)C 21P X ⋅===,2246410C C 3(2)C 7P X ⋅===, 3146410C C 4(3)C 35P X ⋅===,4046410C C 1(4)C 210P X ⋅===. ∴X 的分布列为:X0 1 2 3 4 P114821 37 435 1210⑵ 记Y 表示“取出4个球中白球的个数”,则Y 服从参数为1064,,的超几何分布.∴4046410C C 1(0)C 210P Y ⋅===,3146410C C 4(1)C 35P Y ⋅===, 2246410C C 3(2)C 7P Y ⋅===,1346410C C 8(3)C 21P Y ⋅===,0446410C C 1(4)C 14P Y ⋅===, ∴Y 的分布列为: Y0 1 2 3 4 P1210435 37 821 114【追问】4X Y +=,故(0)(4)(1)(3)P X P Y P X P Y ======,,.提高班学案1【铺1】 某人参加一次英语口语考试,已知在备选的10道试题中,能答对其中的6题,规定每次考试经典精讲都从备选题中随机抽出5题进行测试,求他答对题数的期望.【解析】 设答对的试题数为ξ,则ξ服从参数为1065,,的超几何分布,因此由公式知他答对题数的期望为()56310E ξ⨯==.【例3】 求超几何分布的期望一个袋中装有大小相同的球,其中红球5个、黑球3个,现在从中随机摸出3个球. ⑴求摸到红球个数ξ的概率分布列和数学期望; ⑵求摸到黑球个数η的概率分布列和数学期望.【解析】 ⑴ 摸到红球的个数ξ为离散型随机变量,且ξ服从8N =,5M =,3n =的超几何分布,ξ可能取值为0123,,,.于是有()35338C C C m mP m ξ-==. ()035338C C 10C 56P ξ===,()125338C C 151C 56P ξ===, ()215338C C 152C 28P ξ===,()305338C C 53C 28P ξ===. 所以摸到红球个数的分布列为ξ 0 1 23 P156 **** **** 528 ∴()88E ξ==.⑵ 摸到黑球的个数η为离散型随机变量,且η服从8N =,3M =,3n =的超几何分布,η可能取值为0123,,,.于是有()33538C C C m m P m η-==. ()033538C C 50C 28P η===,()123538C C 151C 28P η===, ()213538C C 152C 56P η===,()303538C C 13C 56P η===. η 0 1 23 P528 1528 1556 156 ∴()88E η==.【点评】 解题的关键是能够判断所给问题属于超几何分布模型.尖子班学案1【拓2】 盒中有5个球,其中3个白球,2个黑球,从中任取两个球,求取出白球个数的期望和方差. 【解析】 设取出白球个数为ξ,则ξ服从参数为532,,的超几何分布,ξ的可能取值为012,,.因此,()32 1.25E ξ⨯==,()()()()2221330 1.21 1.22 1.20.3610510D ξ=-⨯+-⨯+-⨯=.目标班学案1【拓3】 某人可从一个内有2张100元,3张50元的袋子里任取2张,求他获得钱数的期望值. 【解析】 方法一:设他取得100元的张数为X ,则X 服从参数为522,,的超几何分布.021120232323222555C C C C C C 361(0)(1)(2)C 10C 10C 10P X P X P X =========,,. 012X =,,时他所获得的钱数分别为100150200,,.因此他获得钱数的期望值为:100(0)150(1)200(2)140P X P X P X ⨯=+⨯=+⨯==元.方法二:设他取得100元的张数为X ,则X 服从参数为522,,的超几何分布.由公式知()22455E X ⨯==.因此他获得钱数的期望值为:4410050214055⎛⎫⨯+⨯-= ⎪⎝⎭元.考点3:二项分布1.独立重复试验如果每次试验,只考虑有两个可能的结果A 及A ,并且事件A 发生的概率p 相同.在相同的条件下,重复地做n 次试验,各次试验的结果相互独立,那么一般就称它们为n 次独立重复试验.n 次独立重复试验中,事件A 恰好发生k 次的概率为()C (1)kk n k n n P k p p -=-(0,1,2,,)k n =. 2.二项分布若将事件A 发生的次数设为X ,事件A 不发生的概率为1q p =-,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率是()C k k n kn P X k p q-==,其中0,1,2,,k n =.于是得到X 的分布列X 01… k… nP00C nn p q111C n n p q- …C k k n kn p q- …C n n n p q称这样的离散型随机变量X 服从参数为n ,p 的二项分布,记作~(,)X B n p .3.二项分布的期望与方差:若离散型随机变量X 服从参数为n 和p 的二项分布,则 ()E X np =,()D X npq =(1)q p =-.【教师备案】学生没学过二项式定理,所以期望和方差的推导了解即可. 【教师备案】设离散型随机变量X 服从参数为n 和p 的二项分布,由X 的分布列()C k k n kn P X k p q-==,0k =,1,2,…,n 和数学期望的定义式得到 00111222()0C 1C 2C C C n n n k k n kn n n n n n n E X p q p q p qk p qn p q ---=⨯+⨯+⨯++⨯++⨯00111211(1)(1)1101111(C C C C )n n k k n k n n n n n n np p q p q p q pq -------------=⋅+++⋅++ 1()n np p q np -=+=,所以()E X np =. ∴()()220202C(1)C C (1)C nnnnii n ii in ii in ii i n i nnnn i i i i E Xi p qi i p qi p qi i p q E X ----======-+=-+∑∑∑∑()222(2)(2)22(1)Cni i n i n i n n pp qE X ------==-+∑()22(2)2(1)Cn j j n j n j n n pp q E X ----==-+∑()()2222(1)()(1)(1)n n n p p q E X n n p E X n n p np -=-++=-+=-+,知识点睛∴()()()22222()(1)()D X E X E X n n p np np np np npq =-=-+-=-=. 故()D X npq =.【举例】老师可以以二点分布知识点睛中的【举例】继续引申,从而让学生更直观的理解二项分布.现在假设这只鸟比较傻,每次都记不住上次的结果,那么这只鸟就可能需要不停的重复进行撞玻璃的操作,每次的成功率都是13.这种独立重复试验就可以用二项分布的模型来研究.从直观意义上来讲,二项分布可以看做是多个二点分布重复出现的结果.从模型角度讲,二项分布实际是“有放回”抽取的模型.对于二项分布的期望和方差,我们一样可以有直观意义.二项分布的期望指的是平均成功次数,而方差是随着次数的增多而增加,相比于二点分布,在同样的试验次数下,二项分布也是在12p =时方差最大,也就是结果最不稳定.【教师备案】老师在讲完二项分布后,就可以让学生做例4,例4主要是让学生写二项分布的分布列,关键是让学生从题目上就可以看出是二项分布,然后根据二项分布的概率公式就可以很快写出二项分布列;然后老师就可以继续讲二项分布的期望与方差,讲完期望与方差公式后,就可以让学生做例5,例5主要是套公式,学生会发现,对于二项分布求期望和方差用公式非常快,这时就不需要用上一讲讲的期望和方差最原始的公式了.提高班学案2【铺1】 某一学校心理咨询中心服务电话接通率为34,某班3名同学商定明天分别就同一问题询问 该服务中心.且每人只拨打一次,求他们中成功咨询的人数ξ的分布列. 【解析】 3个人各做一次试验,看成三次独立重复实验,拨通这一电话的人数即为事件的发生次数ξ,故符合二项分布.由题意可知:3~34B ξ⎛⎫ ⎪⎝⎭,,所以3331()C 44kkk P k ξ-⎛⎫⎛⎫==⋅ ⎪⎪⎝⎭⎝⎭,0k =,1,2,3.ξ的分布列为ξ 0 1 2 3 P16496427642764【例4】 求二项分布的分布列一名学生骑自行车上学,从他家到学校的途中有6个交通岗,假设他在各个交通岗遇到红灯的事件是相互独立的,并且概率都是13.设ξ为这名学生在途中遇到的红灯次数,求ξ的分布列.【解析】 将遇到每个交通岗看做一次试验,遇到红灯的概率都是13,且每次试验结果相互独立,故1~63B ξ⎛⎫ ⎪⎝⎭,.所以ξ的分布为6612()C (0126)33k kk P k k ξ-⎛⎫⎛⎫==⋅⋅= ⎪ ⎪⎝⎭⎝⎭,,,,. ξ0 1 2 3 4 5 6 P64729 64243 80243 160729 20243 4243 1729提高班学案3经典精讲【铺1】 设()~B n p ξ,且() 2.4E ξ=,() 1.44D ξ=,试求n p ,的值. 【解析】 因为()~B n p ξ,,所以()E np ξ=,()()1D npq np p ξ==-由题意可得方程组 ()2.41 1.44np np p =⎧⎪⎨-=⎪⎩,解得0.46.p n =⎧⎨=⎩,【例5】求二项分布的期望某地区为下岗人员免费提供财会和计算机培训,以提高下岗人员的再就业能力,每名下岗人员可以选择参加一项培训、参加两项培训或不参加培训,已知参加过财会培训的有60%,参加过计算机培训的有75%,假设每个人对培训项目的选择是相互独立的,且各人的选择相互之间没有影响. ⑴ 任选1名下岗人员,求该人参加过培训的概率;⑵ 任选3名下岗人员,记ξ为3人中参加过培训的人数,求ξ的分布列和期望.【解析】 ⑴ 任选1名下岗人员,记“该人参加过财会培训”为事件A ,“该人参加过计算机培训”为事件B ,由题设知,事件A 与B 相互独立,且()0.6P A =,()0.75P B =. 任选1名下岗人员,该人没有参加过培训的概率是: 1()()()0.40.250.1P P A B P A P B =⋅=⋅=⨯=.所以该人参加过培训的概率是21110.10.9P P =-=-=.⑵ 因为每个人的选择是相互独立的,所以3人中参加过培训的人数ξ服从二项分布(30.9)B ,.33()C 0.90.1k k k P k ξ-==⨯⨯,0123k =,,,.3(0)0.10.001P ξ===;2(1)30.90.10.027P ξ==⨯⨯=; 2(2)30.90.10.243P ξ==⨯⨯=;3(3)0.90.729P ξ===;ξ 012 3 P0.001 0.0270.243 0.729∴ξ的期望是30.9 2.7E ξ=⨯=.尖子班学案2【拓2】 某厂一批产品的合格率是98%,检验单位从中有放回地随机抽取10件,计算:⑴ 抽出的10件产品中平均有多少件正品;⑵ 计算抽出的10件产品中正品数的方差和标准差.【解析】 用X 表示抽得的正品数,由于是有放回地随机抽样,所以X 服从二项分布()100.98B ,. ⑴ 利用二项分布的期望公式得到()100.989.8E X =⨯=.平均有9.8件正品; ⑵ X 的方差()100.980.020.196D X =⨯⨯=,标准差()0.196D X σ.目标班学案2【拓3】 一份数学模拟试卷由25个选择题构成,每个选择题有4个选项,其中有且仅有一个选项是正确的,每题选得正确答案得4分,不做选择或选错不得分,满分100分.张强选对任一题的概率为0.8,求他在这次数学测验中的成绩的期望. 【解析】 张强在数学测验中选择了正确答案的选择题的个数服从二项分布()~250.8X B ,,其数学期望有简便算法.设张强做对选择题的个数为X ,则()~250.8X B ,, 所以()250.820E X np ==⨯=.因为答对每题得4分,所以张强在这次数学测验中的成绩为4X ,其成绩的期望值为()()4442080E X E X ==⨯=.【点评】 本题中,利用二项分布的均值公式()E X np =快速地求出所求的期望值,当n 的值越大时,这一公式更加显得威力无比,因此我们要熟练掌握这一公式,并能灵活地运用它,在运用时,需要注意的是,只有随机变量X 服从二项分布时,才能运用该公式来求均值.考点4:综合运用【教师备案】老师在讲完上一讲的离散型随机变量和本讲前边的典型分布以后,学生对离散型随机变量都有了很明确的认识,所以这时候就可以让学生做一下下边的综合题,让学生再巩固一下离散型随机变量的分布列、期望和方差.【例6】 综合运用甲、乙两人各进行3次射击,甲每次击中目标的概率为12,乙每次击中目标的概率为23. ⑴ 记甲击中目标的次数为ξ,求ξ的概率分布及数学期望()E ξ与方差()D ξ; ⑵ 求乙至多击中目标2次的概率;⑶ 求甲恰好比乙多击中目标2次的概率.【解析】 ⑴ ()303110C 28P ξ⎛⎫=== ⎪⎝⎭;()313131C 28P ξ⎛⎫=== ⎪⎝⎭;()323132C 28P ξ⎛⎫=== ⎪⎝⎭;()333113C 28P ξ⎛⎫=== ⎪⎝⎭.ξ的概率分布如下表:ξ 0 1 23 P18 38 38 18 ()13310123 1.58888E ξ=⨯+⨯+⨯+⨯=(或()13 1.52E ξ=⨯=)()1133224D ξ=⨯⨯=;⑵ 乙至多击中目标2次的概率为3332191C 327⎛⎫-= ⎪⎝⎭.⑶ 设甲恰好比乙多击中目标2次为事件A ,甲恰击中目标2次且乙恰击中目标0次为事件1B ,甲恰击中目标3次且乙恰击中目标1次为事件2B ,则12A B B =+,1B 、2B 为互斥事件.()()()12311218278924P A P B P B =+=⋅+⋅=.所以甲恰好比乙多击中目标2次的概率为124.尖子班学案3【拓2】 在甲、乙等6个单位参加的一次“唱读讲传”演出活动中,每个单位的节目集中安排在一起,若采用抽签的方式随机确定各单位的演出顺序(序号为1,2,……,6),求: ⑴ 甲、乙两单位的演出序号至少有一个为奇数的概率; ⑵ 甲、乙两单位之间的演出单位个数ξ的分布列与期望. 【解析】 只考虑甲、乙两单位的相对位置,故可用组合计算基本事件数.⑴ 设A 表示“甲、乙的演出序号至少有一个为奇数”,则A 表示“甲、乙的演出序号均为偶数”,由古典概经典精讲型的概率计算公式得()2326C 14()111C 55P A P A =-=-=-=.⑵ ξ的所有可能值为0,1,2,3,4,且()26510C 3P ξ===,()26441C 15P ξ===,()26312C 5P ξ===,()26223C 15P ξ===,()26114C 15P ξ===从而知ξ有分布列 ξ 0 12 3 4 P13 415 15215 115所以,()14121401234315515153E ξ=⨯+⨯+⨯+⨯+⨯=.目标班学案3【拓3】 甲、乙两名射击运动员,甲射击一次命中10环的概率为0.5,乙射击一次命中10环的概率为s ,若他们独立的射击两次,设甲、乙命中10环的次数分别为X 、Y ,则4()3E Y =.ξ为甲与乙命中10环的差的绝对值.求ξ的期望.【解析】 由已知可得~(20.5)~(2)X B Y B s ,,,,故4()23E Y s ==,所以23s =.||X Y ξ=-,ξ的取值可以是012,,.(0)()(0)(1)(2)P P X Y P X Y P X Y P X Y ξ======+==+==甲、乙两人命中10环的次数都是0次的概率是22111(0)2336P X Y ⎛⎫⎛⎫===⨯= ⎪ ⎪⎝⎭⎝⎭,甲、乙两人命中10环的次数都是1次的概率是112211122(1)C C 22339P X Y ⎛⎫⎛⎫===⋅⋅⋅⋅= ⎪⎪⎝⎭⎝⎭, 甲、乙两人命中10环的次数都是2次的概率是222222121(2)C C 239P X Y ⎛⎫⎛⎫===⋅⋅= ⎪ ⎪⎝⎭⎝⎭; 所以12113(0)369936P ξ==++=; (2)(||2)(02)(20)(0)(2)(2)(0)P P X Y P X Y P X Y P X P Y P X P Y ξ==-====+=====+==,,甲命中10环的次数是2且乙命中10环的次数是0次的概率是:222022111(2)(0)C C 2336P X P Y ⎛⎫⎛⎫===⋅=⎪ ⎪⎝⎭⎝⎭, 甲命中10环的次数是0且乙命中10环的次数是2次的概率是:220222121(0)(2)C C 239P X P Y ⎛⎫⎛⎫===⋅= ⎪ ⎪⎝⎭⎝⎭;所以115(2)36936P ξ==+=,因此1(1)1(0)(2)2P P P ξξξ==-=-==ξ的期望是157()22369E ξ=+⋅=.【例7】 综合运用袋中装着标有数字1,2,3,4的小球各3个,从袋中任取3个小球,每个小球被取出的可能性都相等. ⑴ 求取出的3个小球上的数字互不相同的概率;⑵ 用X 表示取出的3个小球上所标的最大数字,求随机变量X 的分布列和期望.【追问】用Y 表示取出的3个小球上所标的最小数字,Y 的分布列与期望是否可以直接看出来?【解析】 ⑴ “一次取出的3个小球上的数字互不相同”的事件记为A ,则31114333312C C C C 27()C 55P A ⋅⋅⋅==. ⑵ 由题意X 所有可能的取值为1,2,3,4.31211(1)C 220P X ===;1221333333312C C C C C 19(2)C 220P X ⋅+⋅+===; 2112363633312C C C C C 6416(3)C 22055P X ⋅+⋅+====; 2112393933312C C C C C 13634(4)C 22055P X ⋅+⋅+====. 所以随机变量X 的分布列为X1 2 3 4P1220 19220 1655 3455随机变量X 的期望为()11916341551234220220555544E X =⨯+⨯+⨯+⨯=. 【追问】(4)(1)(3)(2)(2)(3)(1)(4)P Y P X P Y P X P Y P X P Y P X ============,,,故Y 的概率分布与上述X 的分布正好有关系,如直接由X 的分布列得到:X 1 2 3 4P3455 1655 19220 1220且()()5E X E Y +=.从而15565()54444E Y =-=.设篮球队A 与B 进行比赛,每场比赛均有一胜队,若有一队胜4场,则比赛宣告结束,假定A 、B 在每场比赛中获胜的概率都是12,需要比赛场数的期望是__________.【解析】 5.8125 【思路】随机变量ξ表示比赛场数,根据题意:“有一队胜4场比赛才宣告结束”,故ξ的取值应是4,5,6,7,把一次比赛看作一次试验,故n 场(4567)n =,,,比赛视为n 次独立重复试验.4ξ=表示甲胜4场或乙胜4场,且两两互斥.所以44411(4)2C 28P ξ⎛⎫=== ⎪⎝⎭.5ξ=表示甲队第5场胜且前4场中胜3场,或乙队第5场胜且前4场中胜3场.所以44334411111(5)C C 22224P ξ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭.类似地,55335511115(6)C C 222216P ξ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭,66336611115(7)C C 222216P ξ⎛⎫⎛⎫==+= ⎪ ⎪⎝⎭⎝⎭.11比赛场数ξ的分布列为:ξ4 5 6 7 P18 14 516 516所以()11557593456713 5.812584161641616E ξ=⨯+⨯+⨯+⨯=+⨯==.这就是说,在比赛双方实力相当的情况下,平均进行6场比赛才能决出胜负.【错因分析】本题若审题不严,对比赛规则搞不清楚,弄不清随机变量的取值,则会出错.【演练1】从学校乘汽车到火车站的途中有3个交通岗,假设在各个交通岗遇到红灯的事件是相互独立的,并且概率都是25,设ξ为途中遇到红灯的次数,则随机变量ξ的方差为( )A .65B .1825C .625D .18125【解析】 B ;2~35B ξ⎛⎫ ⎪⎝⎭,,∴()231835525D ξ=⨯⨯=.【演练2】设有产品12件,其中有次品3件,正品9件,现从中随机抽取3件,求抽得次品件数ξ的分布列. 【解析】 从12件产品中随机抽取3件,抽得次品件数ξ是一个离散型的随机变量,它的取值可能是0、1、2、3.依题意,随机变量ξ(次品件数)服从超几何分布,所以,从12件产品中抽取3件,其中有k 件次品的概率为339312C C ()(0123)C k kP k k ξ-⋅===,,,. ∴0339312C C 21(0)C 55P ξ⋅===,1239312C C 27(1)C 55P ξ⋅===, ∴2139312C C 27(2)C 220P ξ⋅===,3039312C C 1(3)C 220P ξ⋅===, ∴ξ的分布列为ξ0 1 2 3 P2155 2755 27220 1220【演练3】设在15个同类型的零件中有两个是次品,每次任取1个,共取3次,并且每次取出不再放回,若以ξ表示取出次品的个数,求ξ的期望()E ξ和方差()D ξ.【解析】 ()313315C 220C 35P ξ===,()12213315C C 121C 35P ξ===,()21213315C C 12C 35P ξ===.故ξ的分布列是:ξ 01 2 P22351235 135实战演练12()2212120123535355E ξ=⨯+⨯+⨯=,(ξ满足参数为1523,,的超几何分布,故232()155E ξ⨯==)()2222222122152012535535535175D ξ⎛⎫⎛⎫⎛⎫=-⨯+-⨯+-⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭.【演练4】有一批数量很大的商品次品率为1%,从中任意地连续取出200件商品,设其中次品数为ξ,求()E ξ,()D ξ.【解析】 因为商品数量相当大,抽200件商品可以看做200次独立重复试验,所以()~2001%B ξ,,因为()E np ξ=,()D npq ξ=,这里200n =,1%p =,99%q =,所以,()2001%2E ξ=⨯=,()2001%99% 1.98D ξ=⨯⨯=.【演练5】甲、乙、丙3人投篮,投进的概率分别是13,25,12.⑴ 现3人各投篮1次,求3人都没有投进的概率;⑵ 用ξ表示乙投篮3次的进球数,求随机变量ξ的概率分布及数学期望()E ξ. 【解析】 ⑴ 设A 表示事件“3人各投篮1次,3人都没有投进”,1B 表示“甲投进”,2B 表示事件“乙投进”,3B 表示事件“丙投进”,则()()()()12312111113525P A P B P B P B ⎛⎫⎛⎫⎛⎫=⋅⋅=--⋅-= ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭.⑵ ξ的可能取值为0123,,,,则()332705125P ξ⎛⎫=== ⎪⎝⎭,()121323541C 55125P ξ⎛⎫⎛⎫==⋅= ⎪⎪⎝⎭⎝⎭; ()212323362C 55125P ξ⎛⎫⎛⎫==⋅⋅= ⎪⎪⎝⎭⎝⎭,()333283C 5125P ξ⎛⎫==⋅= ⎪⎝⎭. ξ分布列为ξ的数学期望为()0123 1.2125125125125E ξ=⨯+⨯+⨯+⨯=.(或26()355E ξ=⨯=)大千世界:排球单循环赛,南方球队比北方球队多9支,南方球队总得分是北方球队的9倍. 求证:冠军是一支南方球队.(注:每场比赛获胜队得1分,负队得0分) 【解析】 设北方球队共有x 支,则南方球队有9x +支,所有球队总得分为229(29)(28)C (29)(4)2x x x x x +++==++.由题意,南方球队总得分为9(29)(4)10x x ++,北方球队总得分为1(29)(4)10x x ++,南方球队内部比赛总得分29C x +,北方球队内部比赛总得分为2(1)C 2xx x -=, 由于北方球队总得分不少于北方球队内部比赛总得分,故 (29)(4)(1)02x x x x ++--≥.111693x +<=.13因为1(29)(4)10x x ++为整数,所以6x =或8x =. ①当6x =时,所有球队总得分为229C (29)(4)210x x x +=++=.南方球队内部比赛总得分9(29)(4)18910x x ++=,北方球队总得分为21018921-=.南方球队内部比赛总得分29C 105x +=,北方球队内部比赛总得分为26C 15=. 北方胜南方得分21156-=,北方球队最高得分5611+=,因为1115165189⨯=<,所以南方球队中至少有一支得分超过11分.故冠军在南方球队中.②当8x =时,所有球队总得分为229C (29)(4)300x x x +=++=,南方球队总得分为9(29)(4)27010x x ++=,北方球队总得分为30027030-=.南方球队内部比赛总得分29C 136x +=,北方球队内部比赛总得分28C 28=.北方胜南方得分30282-=,北方球队最高得分729+=,因为917153270⨯=<,所以南方球队中至少有一支得分超过9分,故冠军在南方球队中. 综上所述,冠军是一支南方球队.。

(完整word版)高中数学统计与概率知识点归纳(全)

(完整word版)高中数学统计与概率知识点归纳(全)

高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。

众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。

二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。

①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。

③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。

四、中位数与众数的特点。

⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。

五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。

六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x x x x x n-+-++-L 22212()()()n x x x x x x s n -+-++-=L抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计1:简单随机抽样(1)总体和样本①在统计学中 , 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

(4)抽签法 :①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K (抽样距离) =N(总体规模) /n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实施也比较简单。

更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来两种方法:①先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

②先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

(2)分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:①以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

③以那些有明显分层区分的变量作为分层变量。

样本容量各层样本容量(3)分层的比例问题:抽样比=个体容量各层个体容量①按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

②不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。

如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

类别共同点各自特点相互关系适用范围简单随机抽样过程中从总体中逐个抽取总体中的个体抽样每个个体被数较少系统抽样抽取的机会将总体均匀分成几部分,按事先再起时部分抽样时采用总体中的个数相等确定的规则在各部分抽取简单随机抽样较多分成抽样经总体分成几层,分层进行抽取各层抽样时采用简单随总体由差异明机抽样显的几部分组成4:用样本的数字特征估计总体的数字特征x1 x2 x n(1)样本均值:x n(2)样本标准差: s s2 ( x1 x) 2 ( x2 x) 2 (x n x) 2n用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。

在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

(3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。

(4)中位数:在样本数据中,累计频率为 1.5 时所对应的样本数据值(只有一个)。

注意:①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k 倍③一组数据中的最大值和最小值对标准差的影响,区间( x 3s, x 3s) 的应用;“去掉一个最高分,去掉一个最低分”中的科学道理5:用样本的频率分布估计总体分布1:频率分布表与频率分布直方图频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。

具体步骤如下:第一步:求极差,即计算最大值与最小值的差 .第二步:决定组距和组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.一般来说,容量不超过100 的组数在 5 至 12之间 .组距应最好“取整” ,它与极差有关 . 组距注意:组数的“取舍”不依据四舍五入,而是当极差极差]+1. 组距不是整数时,组数 =[组距②频率分布折线图:连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。

③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精细的信息。

2:茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。

例:例如:为了了解某地区高三学生的身体发育情况,抽查了地区内 100 名年龄为 17.5~18 岁的男生的体重情况,结果如下(单位: kg).56.5 69.5 65 61.5 64.5 76 71 66 63.5 5666.5 64 64.5 76 58.5 59.5 63.5 65 70 74.572 73.5 56 67 70 68.5 64 55.5 72.5 66.557.5 65.5 68 71 75 68 76 57.5 60 71.562 68.5 62.5 66 59.5 57 69.5 74 64.5 5963.5 64.5 67.5 73 68 61.5 67 68 63.5 5855 72 66.5 74 63 59 65.5 62.5 69.5 7260 55.5 70 64.5 58 64.5 75.5 68.5 64 6264 70.5 57 62.5 65 65.5 58.5 67.5 70.5 6569 71.5 73 62 58 66 66.5 70 63 59.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.解:按照下列值的差(1)求最大值与最小计 .在上述数据中,最大值是76,最小值是 55,极差是 76-55=21.(2)确定组距与组数 .如果将组距定为2,那么由 21÷ 2=10.5,组数为 11,这个组数适合的 .于是组距为2,数 11.(3)决定分点 .根据本例中数据的特点,第 1 小的起点可取54.5,第 1 小的点可取56.5,了避免一个数据既是起点,又是点从而造成重复算,我定分的区是“左右开”的.,所得到的分是[54.5,56.5),[56.5, 58.5),⋯,[74.5, 76.5).(4)列率分布表 .分数率累率[54.5,56.5) 2 0.02 0.02[56.5,58.5) 6 0.06 0.08[58.5,60.5)10 0.10 0.18[60.5,62.5)10 0.10 0.28[62.5,64.5)14 0.14 0.42[64.5,66.5)16 0.16 0.58[66.5,68.5)13 0.13 0.71[68.5,70.5)11 0.11 0.82[70.5,72.5)8 0.08 0.90[72.5,74.5)7 0.07 0.97[74.5,76.5) 3 0.03 1.00 合100 1.00(5)制率分布直方 .率分布直方如2-2-3 所示 .频率/ 组距0. 07 频率/ 组距频率/ 组距0. 060. 050. 040. 030. 020. 0154. 5 56. 55 8. 5 60. 56 2. 5 64. 5 66. 5 68. 57 0. 5 72. 5 74. 5 76. 5 体重0 54. 5 56. 55 8. 56 0. 56 2. 5 64. 5 66. 5 68. 5 70. 57 2. 5 74. 5体重接率直方中各小方形上端的中点,就得到率分布折.如 2-2-4 所示 .例 2:某季甲、乙两名球运每比得分情况如下甲的得分: 15,21,25, 31,36,39,31,45, 36,48,24, 50,37;乙的得分: 13,16,23, 25,28,33,38,14, 8, 39,51.上述的数据可以用下来表示,中数字表示得分的十位数,两数字分表示两个人各比得分的个位数 .甲乙0 85 1 36 44 5 1 2 3 5 87 6 9 1 6 1 3 3 8 98 5 40 5 12-2-5通常把的叫做茎叶 .根据上两名运的成行比.从个茎叶上可以看出,甲运的得分情况是大致称的,中位数是 36;乙运的得分情况除一个特殊得分外,也大致称,中位数是25.因此甲运比定,体得分情况比乙好.用茎叶图表示有两个突出的优点 :其一,从统计图上没有信息的损失, 所有的信息都可以从这个茎叶图中得到;其二,茎叶图可以在比赛时随时记录,方便记录与表示 .但茎叶图只能表示两位的整数,虽然可以表示两个人以上的比赛结果(或两个以上的记录) ,但没有两个记录表示得那么直观,清晰 .6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。

对具有相关关系的两个变量进行统计分析的方法叫做回归分析。

(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。

如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。

设已经得到具有线性相关关系的一组数据:xyx 1。

x ny 1。

y n所要求的回归直线方程为:y b x a ,其中,是待定的系数。

相关文档
最新文档