概率与统计高考数学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
辅导讲义:概率与统计
一、知识回顾:
1、总体、个体、样本、样本容量:
总体:在统计中,所有考察对象的全体。
个体:总体中的每一个考察对象。
样本:从总体中抽取的一部分个体叫做这个总体的一个样本。
样本容量:样本中个体的数目。
2、统计的基本思想:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。
3、抽样方法:简单随机抽样、系统抽样、分层抽样。
4、简单随机抽样:一般地,从个体为N烦人总体中逐个不放回地取出n个个体作为样本(n 5、抽签法和随机数表法都是简单随机抽样。 6、抽签法: (总体个数N,样本容量n) (1)将总体中的N个个体编号; (2)将这N个号码写在形状、大小相同的号签上; (3)将号签放在同一箱中,并搅拌均匀; (4)从箱中每次抽出1个号签,连续抽出n次; (5)将总体中与抽到的号签编号一致的n个个体取出。 7、随机数表法: (1)将总体中的个体编号(每位号码位数一致); (2)在随机数表内任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,若得到的号码已经在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止; (4)根据选定的号码抽取样本。 注: (1)用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此样本并不是唯一的. (2)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的(公平性)。 (3)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。 8、抽签法—编号、制签、搅拌、抽取,关键是“搅拌”后的随机性;随机数表法—编号、选数、取号、抽取,其中取号的方向具有任意性。 9、简单随机抽样的特点: 它的总体个数有限的; 它是逐个地进行抽取; 它是一种不放回抽样; 它是一种等概率抽样. 10、系统抽样: 将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样。也可称为“等距抽样”。 注:如果个体总数不能被样本容量整除时该怎么办? (1)随机将这1003个个体进行编号1,2,3,……1003。 (2)利用简单随机抽样,先从总体中剔除3个个体(可以随机数表法),剩下的个体数1000能被100整除,然后按系统抽样的方法进行。 11、系统抽样的步骤: (1)采用随机的方式将总体中的 N 个体编号。 (2)整个的编号分段(即分成几个部分),要确定分段的间隔k 。当 n N (为总体中的个体的个数,n 为样本容 量)是整数时,取n N k = ;当n N 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N '能被n 整 除,这时取n N k ' = ,并将剩下的总体重新编号; (3)在第一段中用简单随机抽样确定起始的个体编号l ; (4)按照一定的规则抽取样本,通常将编号为k n l k l k l l )1(2-+++,,,, 的个体抽出。 12、简单随机抽样、系统抽样的特点是什么? 简单随机抽样:①逐个不放回抽取;②等可能入样;③总体容量较小。 系统抽样:①分段,按规定的间隔在各部分抽取;②等可能入样;③总体容量较大。 13、分层抽样:一般地,当总体由差异明显几部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较明显的几部分,然后按照各部分在总体中所占的比实施抽样,这种抽样方法 有限性 叫分层抽样。 14、分层抽样的步骤: (1) 将总体按一定的标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样;(可用简单随机抽样或系统抽样)(5)综合每层抽样,组成样本 15、简单随机抽样、系统抽样、分层抽样的比较: 16、频数:频数是指一组数据中,某范围内的数据出现的次数。 频率:把频数除以数据的总个数,就得到频率。 17、频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布。我们把反映总体频率分布的表格称为频率分布表。 18、频率分布表的制作: 我们将整个取值区间的长度称为全距,即计算数据中最大值与最小值的差,即全距。分成的区间的长度称为组距。 编制频率分布表的步骤: (1) 求全距,决定组数和组距,组距= 组数 全距 ; (2) 分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间。 (3) 登记频数,计算频率,列出频率分布表。 19、频率分布直方图的做法: (1)把横轴分成若干段,每一线段对应一个组的组距; (2)然后以此线段为底作一矩形,它的高等于该组的频率/组距; 这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。 20、茎叶图: 如图: 21、平均数a :n a a a a n +++= 21(或称为均值)。若取值为n x x x x 321,,的频率分别为 n p p p p ,,,, 321,则其平均数为n n p x p x p x x +++= 2211。 22、极差:组数据的最大值与最小值的差称为极差。极差越大,数据越分散,极差越小,数据越集中。 极差=最大值-最小值 23、方差:设一组样本数据n x x x x 321,,,其平均数为x ,则称212 )(1∑=-=n i i x x n s 。 标准差:方差的算数平方根2 1 )(1∑=-=n i i x x n s ,简称样本方差、样本标准差。 注:方差越小,数据的波动越小。 24、必然事件:在一定条件下必然要发生的事件叫必然事件。 25、不可能事件:在一定条件下不可能发生的事件叫不可能事件. 26、随机事件:在一定条件下可能发生也可能不发生的事件叫随机事件. 27、古典概型的特征: (1)有限性:在随机试验中,其可能出现的结果有有限个,即只有有限个不同的基本事件; (2)等可能性:每个基本事件发生的机会是均等的. 1 2 3 4 5 52 54 976611 94 0 8 346 368 389 1 甲 乙 第二行表示甲得分为15分、12分,乙得分为13分、14分、16分,其他各行与此类同