计数原理与概率统计(精华)

合集下载

计数原理与概率学生

计数原理与概率学生

计数原理与概率排列组合1. 定义、公式排列与排列数组合与组合数定义1.排列:从n个不同元素中取出m(m≤n)个元素,按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列。

2.排列数:从n个不同元素中取出m(m≤n)个元素的所有不同排列的个数,叫做从n个不同元素中取出m个元素的排列数。

1.组合:从n个不同元素中取出m(m≤n)个元素合成一组,叫做从n个不同元素中取出m个元素的一个组合。

2.组合数:从n个不同元素中取出m(m≤n)个元素的所有不同组合的个数,叫做从n个不同元素中取出m个元素的组合数。

公式。

排列数公式组合数公式性质(1)(2)备注排列组合常见问题及解法一、分析题意明确是分类问题还是分步问题,是排列还是组合问题5. 用0,1,2,3,4,5这六个数字组成无重复数字的五位数,分别求出下列各类数的个数:(1)奇数;(2)5的倍数;(3)比20300大的数;(4)不含数字0,且1,2不相邻的数。

{二、特殊元素,优先处理;特殊位置,优先考虑6. 五个人站成一排,求在下列条件下的不同排法种数:(1)甲必须在排头;(2)甲必须在排头,并且乙在排尾;(3)甲、乙必须在两端;(4)甲不在排头,并且乙不在排尾;(5)甲、乙不在两端;(6)甲在乙前;(7)甲在乙前,并且乙在丙前;三、捆绑与插空7. 8人排成一队(1)甲乙必须相邻(2)甲乙不相邻(3)甲乙必须相邻且与丙不相邻(4)甲乙必须相邻,丙丁必须相邻(5)甲乙不相邻,丙丁不相邻四、间接法8. 四面体的顶点和各棱中点共10个点,在其中取4个不共面的点,不同的取法共有多少种五、隔板法9. 10个名额分配到八个班,每班至少一个名额,问有多少种不同的分配方法(六、定序问题七、10. 六人排成一排,要求甲在乙的前面,(不一定相邻),共有多少种不同的方法如果要求甲乙丙按从左到右依次排列呢…七、排列组合综合应用11. (1)某地奥运火炬接力传递路线共分6段,传递活动分别由6名火炬手完成.如果第一棒火炬手只能从甲、乙、丙三人中产生,最后一棒火炬手只能从甲、乙两人中产生,则不同的传递方案共有______种.(用数字作答)(2)有4张分别标有数字1,2,3,4的红色卡片和4张分别标有数字1,2,3,4的蓝色卡片,从这8张卡片中取出4张卡片排成一行.如果取出的4张卡片所标数字之和等于10,则不同的排法共有__________种(用数字作答).(1)根据题意,先安排第一棒,再安排最后一棒,由于甲既可以传第一棒,又可以传最后一棒,因此应分类讨论,然后再逐类排出。

专题6 计数原理与概率统计

专题6 计数原理与概率统计

精心整理【考情报告】【考向预测】计数原理与概率统计是高中数学的一个重要学习内容,也是高考考查的必考重点内容之一.本部分考查的内容主要有:抽样方法,统计图表(样本频率分布表与直方图、茎叶图),统计数据的数字特征(平均数、方差、中位数、众数),变量间的关系、回归分析与独立性检验;;离散型,识,,考查学方法.预测几何,主1.(2013( ).A.C.2.A .203.(2013 b.若13a=7b ,则A.54.数为 .5.(2013新课标全国Ⅰ卷)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为,且各件产品是否为优质品相互独立. (1)求这批产品通过检验的概率;(2)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X (单位:元),求X 的分布列及数学期望.6.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”. (1)根据已知条件完成下面的2×2列联表,(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X 的分布列,期望E (X )和方差D (X ).从n 个不同元素中取出m (m ≤n )个元素,按照一定的顺序排成一列,叫作从n 个不同元素中取出m 个元素的一个排列= 或写成=从n 个不同元素中取出m (m ≤n )个元素合成一组,叫作从n 个不同元素中取出m 个元素的一个组合= 或写成=①= ②=+ 即,,①++++②+++=++====[(-)-)n -)2s=离散型随机变量==p =, 7.回归分析和独立性检验(1)回归直线方程:=bx+a (也可写成y=a+bx 或=x+)一定过 .(2)独立性检验:假设有两个分类变量X 和(称为2×2列联表)为我们利用随机变量K2=来确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为两个分类变量的.【考点聚焦】热点一:对抽样方法的理解与应用高考对随机抽样的考查常以实际应用为背景命题,考查对分层抽样和系统抽样的理解与计算,考查样本的抽取,多以选择题、填空题的形式出现,有时也会在解答题中出现,但难度不大.某市有A、B、C三所学校共有高三理科学生1500人,且A、B、C三所学校的高三理科学生人数成等差数列,在三校学生中抽取人.),列出方程求出B,所以a+c=层抽取的2.且为整数若相邻两个个体的编号相隔.某公司研发了一款新游戏法,抽取42A.11统计是研究如何合理收集、整理、分析数据的学科,它可以帮我们从数据中提取有用信息,并为制定决策提供依据.所以,这就决定了数字特征与统计图表在统计高考题中的地位,即数字特征与统计图表就是高考试题中的热点之一.某中学高三年级从甲、乙两个班级各选取7名同学参加数学竞赛,他们取得的成绩的茎叶图如图所示,其中甲班同学的平均分是85分,乙班同学成绩的中位数是83,则x+y的值为.【分析】利用平均数求出x的值,利用中位数求出y的值.【解析】由茎叶图可知甲班同学的总分为70×2+80×3+90×2+(8+9+5+x+0+6+2)=590+x,又甲班同学的平均分是85,则85×7=590+x,所以x=5.乙班同学成绩的中位数是80+y=83,得y=3.故x+y=8.【答案】8【归纳拓展】1.众数、中位数、平均数都是描述数据的“集中趋势”的特征数,而标准差与方差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差、标准差越大,数据波动越大;方差、标准差越小,数据波动越小.2.用茎叶图表示数据有两个优点:①统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;②茎叶图中的数据可以随时记录,随时添加,方便记录和表示.变式训练2为备战2013年南京亚青会,对甲、乙两名运动员的成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是X 甲、X乙,则下列结论正确的是().A.X甲>X乙,甲比乙成绩稳定B.X甲>X乙,乙比甲成绩稳定C.X甲<X乙,甲比乙成绩稳定D.X甲<X乙,乙比甲成绩稳定热点三:独立性检验与回归分析在高考中多以选择题、填空题的形式出现,有时也以解答题的形式出现.鉴于统计案例在实际生活中的应用,预测2014年统计案别有关系,=.该①稳定,②(1)若随机地调查一位午休的走读生,其家到学校的路程(单位:里)在[2,6)的概率是多少?(2)如果把下午开始上课时间1:30作为横坐标0,然后上课时间每推迟10分钟,横坐标x增加1,并以平均每天午休人数作为纵坐标y,试根据表中的5列数据求平均每天午休人数与上课时间x之间的线性回归方程=bx+a;(3)预测下午上课时间推迟到2:20时,家距学校的路程在6里路以上的走读生中约有多少人午休.热点四:两个计数原理与排列组合高考中对于计数问题试题的考查形式不一,可以单独考查,也可以与排列、组合问题综合考查,还可以与概率问题综合考查,求解此类试题的关键是理顺计数应用问题的思路:排组分清,加乘明确;有序组合;分类相加,分步相乘.主要题型有选数字、选样品、选代表、人或物的排列或组合问题、几何计数问题等.(2013山东卷)用0,1,…,9十个数字,可以组成有重复数字的三位数的个数为().A.243B.252C.261D.279【分析】由于三位数的首位不能为零,因此可以运用分步计数原理,先排首位,然后再排十位与个位.但是这里要求的三位数是“有重复数字”,可以重复两位数字,也可以重复三位数字,故可间接考虑,先求出所有的三位数的个数,减去没有重复数字的三位数字的个数即可.【解析】由0,1,…,9这十个数字共能组成9×10×10=900个不同的三位数,其中无重复数字的三位数有-=648个,故由这十个数字能组成的有重复数字的三位数的个数为900-648=252.【答案】B【归纳拓展】1.求解计数问题要从“分析”“分辨”“分类”“分步”的角度入手.“分析”就是找出题目中的条件、结论,哪些是“元素”,哪些是“位置”;“分辨”就是辨别是排列还是组合,对某些元素的位置有无限制等;“分类”就是对于较复杂的应用题中的元素往往分成互相排斥的几类,2.(1)(2)(3).如在排列“63,5,)A.3r≤n,确定n==x)n=(r=a(1)(2)T r+1是展开中的第1项,而不是第项;(3)公式中a,b的指数和为n,且a,b不能随便颠倒位置;(4)要将通项中的系数和字母分离开,以便于解决问题;(5)对二项式展开式(a-b)n的通项公式还要注意符号.2.在二项式定理的应用中,“赋值法”是一种重要的思想方法,是处理组合数问题、系数问题的经典方法.变式训练5已知(x+)n的展开式中第五项为常数项,则展开式中各项的二项式系数之和为().A.128B.64C.32D.16热点六:几何概型几何概型是一个新增的考点,它与古典概型一样,也是高考考查的重点内容之一.从近几年高考试题来看,主要以选择题或填空题的形式呈现,多为单独考查,有时会与线性规划、定积分等知识综合考查,难度较低.利用几何概型求概率时,关键是对试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.(2013陕西卷)如图,在矩形区域ABCD的A、C两点处各有一个通信基站,假设其信号的覆盖范围分别是扇形区域ADE和扇形区域CBF(该矩形区域内无其他信号来源,基站工作正常).若在该矩形区域内随机地选一地点,则该地点无信号的概率是().A.1-B.-1C.2-D.【分析】由于是在所给矩形区域内随机地选一地点,所以它符合几何概型的两个基本特征.解答时,可先计算出矩形区域ABCD的面积,然后再计算出无信号地点的面积.从所给的几何图形中,可知直接计算出无信号地点的面积较为困难,因此可以求出有信号地点(扇形区域ADE和扇形区域CBF)的面积,然后再解之.×=率为=1-和x=±图形.型.P(B|A)=(A.B.C.D.【分析】根据条件概率公式==,P=,∴P(=.【答案】B【归纳拓展】条件概率公式揭示了条件概率P(A|B)与事件概率P(B)、P(AB)之间的关系.下列两种情况可利用条件概率公式:一种情况是已知P(B)和P(AB)时要求出P(A|B);另一种情况是已知P(B)和P(A|B)时要求出P(AB).对于后一种情况,为了方便也常将条件概率公式改写为如下的乘法公式:若P(A)>0,有P(AB)=P(A)P(B|A).变式训练7如图,EFGH是以O为圆心,1为半径的圆的内接正方形.将一颗豆子随机地扔到该圆内,用A表示事件“豆子落在正方形EFGH内”,B表示事件“豆子落在扇形OHE(阴影部分)内”,则(1)P(A)= ;(2)P(B|A)= .热点八:随机变量的分布列、期望与方差随机变量的分布列、期望与方差是高考中的重点,年年必考,以考生比较熟悉的实际应用问题为背景,综合排列组合、概率公式、互斥事件、独立事件以及统计等基础知识,考查对随机变量的识别及概率计算的能力,考查运用概率知识解决实际问题的能力,解答时要注意分类与整合、转化与化归思想的运用.题型主要以解答题的形式呈现,但有时也会以小题的形式出现,难度中等.(2013天津卷)一个盒子里装有7张卡片,其中有红色卡片4张,编号分别为1,2,3,4;白色卡片3张,编号分别为2,3,4.从盒子中任取4张卡片(假设取到任何一张卡片的可能性相同).(1)求取出的4张卡片中,含有编号为3的卡片的概率;(2)在取出的4张卡片中,红色卡片编号的最大值设为X,求随机变量X的分布列和数学期望.【分析】(1)根据题意任取的4张卡片与顺序无关,是一个组合计数问题,也是一个古典概型的概率计算问题.由于编号为3的卡片可以为红色的,也可以为白色的,因此在计算基本事件数时要分类讨论.(2)根据题意,在取出的4张卡片中,至少有一张有红色的,红色卡片中的编号有1、2、3、4,所以红色卡片编号的最大值设为X,可能取值也为1、2、3、4,然后根据卡片的最大值分别求出各自的概率,列出分布列,再根据数学期望的公式计算随机变量X的数学期望值.的卡片的概率为(2)P(X==,=P(X===所以随机变量的分布列是1234×+×=.求离散型随机变量的分布列的关键是正确理解随机变量取每一个值所表示的具体事件的公式,2.求解.,成绩分为A,B,C10人.(1)(2)①②和数学期望.热点九:事件的独立性、独立重复试验与二项分布二项分布是一种重要的概率分布,在实际生活中应用广泛.对事件的独立性、独立重复试验与二项分布的考查是高考的热点之一,考查的题型既有小题也有解答题.在小题中,侧重于考查事件相互独立性的概率;在解答题中,一般会综合事件的相互独立、互斥或对立、二项分布等知识进行考查.(2013福建卷)某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为,中奖可以获得2分;方案乙的中奖率为,中奖可以获得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X,求X≤3的概率;(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【分析】(1)因为“每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响”,所以计算概率时用相互独立事件的概率公式求解.X 表示小明、小红各抽奖一次得分的和,根据题意事件“E(X)===”的情况较多,从反面入手即先求事件X>3的概率,再用对立事件的概率公式求解;(2)因为小明、小红抽奖时,要么中奖,要么不中奖,所以它们符合二项分布的特征,可以应用二项分布的期望公式及性质计算.记“这因为P,所以P,即这2.(2)设小明、小红都选择方案甲抽奖中奖次数为期望为E(2所以E=从而E==.因为E(1),即确定p(2)(3)变式训练9甲、乙两名教师进行乒乓球比赛,采用七局四胜制(先胜四局者获胜).若每一局比赛甲获胜的概率为,乙获胜的概率为,现已赛完两局,乙暂时以2∶0领先.(1)求甲获得这次比赛胜利的概率;(2)设比赛结束时比赛的局数为随机变量X,求随机变量X的概率分布和数学期望E(X).热点十:正态分布正态分布是自然界中最常见的一种分布,许多现象都近似地服从正态分布(如长度测量误差、正常生产条件下各种产品的质量指标等),也是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)= .【分析】若随机变量ξ服从正态分布N(μ,σ2),则正态曲线关于x=μ对称;结合曲线的对称性和频率之和为1来求相应的概率即可.【解析】P(ξ<4)=0.8,则P(ξ>4)=0.2,又分布图象关于直线x=2对称,P(ξ<0)=P(ξ>4)=0.2,则P(0<ξ<4)=0.6,P(0<ξ<2)=0.3.【答案】0.3【归纳拓展】正态曲线是“钟形曲线”,具有很好的对称性.正态分布问题求解的切入点是充分利用正态分布曲线的图象特征和相关量的统计意义分析思考,把待求区间内的概率向已知区间内的概率进行转化,在此过程中注意数形结合思想的运用,记住正态分布的3σ法则.变式训练10假设每天从甲地去乙地的旅客人数X是服从正态分布N(800,502)的随机变量.记一天中从甲地去乙地的旅客人数不超过900的概率为p0,则p0的值为.(参考数据:若X~N(μ,σ2),有P(μ-σ<X≤μ+σ)=0.6826,P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-3σ<X≤μ+3σ)=0.9974.)限时训练卷(一)一、选择题1.列和第6A.2.).A.B.C.D.3.已知x与则y与x=bx+aA.,4.在棱长为与正方体各表面的距离都大于A.D.5.已知离散型随机变量X则XA.B.2 C. D.36.游客甲、游客乙暑假期间去西安看世园会的概率分别为、,假定他们两人的行动相互不受影响,则暑假期间游客甲、游客乙两人都不去西安看世园会的概率为().A.B.C.D.7.设随机变量X~N(3,1),若P(X>4)=p,则P(2<X<4)等于().A.+pB.1-pC.1-2pD.-p8.从0,1中选一个数字,从2,4,6中选两个数字,组成无重复数字的三位数,其中偶数的个数为().A.36B.30C.24D.129.设a=(cos x-sin x)d x,则二项式(x2+)6展开式中的x3项的系数为().A.-20B.20C.-160D.160二、填空题10.将序号分别为1,2,3,4,5的5张参观券全部分给4人,每人至少1张,如果分给同一人的2张参观券连号,那么不同的分法种数是.11.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则抽取的学生人数是.12.13.;若t∈(2.8,2.9]数据:(1)(2)参考公式:K参考数据:1.名学生进行调查,A.C.2.A.383.小明同学根据下表记录的产量x(吨)与能耗y(吨标准煤)对应的四组数据,用最小二乘法求出了y关于x的线性回归方程=0.7x+a,据此模型预报产量为7吨时能耗为().A.5B.5.25C.5.5D.5.754.右图是2013年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为().A.84,4.84B.84,1.6C.85,1.6D.85,45.从1,3,5,7,9这五个数中,每次取出两个不同的数分别记为a,b,共可得到lg a-lg b的不同值的个数是().A.9B.10C.18D.206.设(1+2x)10展开后为1+a1x+a2x2+…+a10x10,则a1+a2等于().A.20B.200C.55D.1807.已知随机变量ξ服从正态分布N(0,σ2),若P(ξ>2)=0.023,则P(-2≤ξ≤2)等于().A.0.477B.0.625C.0.954D.0.9778.投掷一枚正方体骰子(六个面上分别标有1,2,3,4,5,6),向上的面上的数字记为a,又n(A)表示集合的元素个数,A={x||x2+ax+3|=1,x∈R},则n(A)=4的概率为().A.B.C.D.9.如图所示,在边长为1的正方形OABC中任取一点P,则点P恰好取自阴影部分的概率为().A.B.C10.6个城市,11.12.若(x-三、解答题13.上选偏爱,(1)(2)X1.下列关于由最小二乘法求出的回归直线方程=AB该回归直线必过样本点中心(,)CD当残差平方和(y-)22.名学生,其中有A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数3.某公司对下属员工在蛇年春节期间收到的祝福短信数量进行了统计,得到了如图所示的频率分布直方图,如果该公司共有员工200人,则收到125条以上的大约有().A.6人B.7人C.8人D.9人4.甲、乙两名运动员在某项测试中的6次成绩如茎叶图所示,、分别表示甲、乙两名运动员这项测试成绩的平均数,s1、s2分别表示甲、乙两名运动员这项测试成绩的标准差,则有().A.>,s1<s2B.=,s1=s2C.=,s1<s2D.<,s1<s25.设随机变量ξ服从正态分布N(2,σ2),若P(ξ>c)=a,则P(ξ>4-c)等于().A.aB.1-aC.2aD.1-2a6.2013年第12届全国运动会在沈阳举行,某校有4名大学生申请当A,B,C三个比赛项目的志愿者,组委会接受了他们的申请,每个比赛项目至少分配一人,每人只能服务一个比赛项目,若甲要求不去服务A比赛项目,则不同的安排方案共有().A.20种B.24种C.30种D.36种7.在(-)n的展开式中,只有第5项的二项式系数最大,则展开式中常数项是().A.-7B.7C.-28D.288.甲和乙等五名志愿者被随机地分到A、B、C、D四个不同的岗位服务,每个岗位至少有一名志愿者,则甲和乙不在同一岗位服务的概率为().A. C.9.设a∈Z,0≤a<13,512014A.010.2,则+A.11.,小李在家门前的树上挂了两串彩灯,A.12.甲袋内装有个红球和2A.f(n)且最小值为B.f(n)且最大值为C.f(n)且最小值为D.f(n)且最大值为二、填空题13.一个频率分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是.14.已知Ω={(x,y)||x|≤1,|y|≤1},A是曲线y=x2与y=围成的区域,若向区域Ω上随机投一点P,则点P落入区域A的概率为.15.将A、B、C、D、E、F六个字母排成一排,且A、B均在C的同侧,则不同的排法种数共有种(用数字作答).16.若(x2-)n的展开式中含x的项为第6项,设(1-3x)n=a0+a1x+a2x2+…+a n x n,则a1+a2+…+a n的值为.三、解答题17.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是.(1)请将上面的列联表补充完整(不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关.(2)若从这30人中的女性路人中随机抽取2人参加这一活动,记反感“中国式过马路”的人数为X,求X的分布列和数学期望.18.某品牌的汽车4S店,对最近100已知分3期付款的频率为0.2,4S店经销一辆该品牌的汽车,顾客分1期付款,其利润为1万元;分2期或3期付款其利润为1.5万元;分4期或5期付款,其利润为2万元.用η表示经销一辆汽车的利润.(1)(2)(3)求η19.,得到销表示下一(1)将T(2)(3)概率(例如:20.(1)(2)21.8小时),处理完毕(A商品在每天的前6.(1)(2)22.是50的约数)只鸡一组平均分组,并把同组的n只鸡抽到的血混合在一起化验,若发现有问题,即对该组的n只鸡逐只化验.记某一组中病鸡的只数为X.(1)若n=5,求随机变量X的概率分布和数学期望;(2)为了减少化验次数的期望值,试确定n的大小.(附:0.95≈0.590,0.910≈0.349,0.925≈0.072,0.950≈0.005)。

计数原理与概率统计

计数原理与概率统计

(二十)计数原理
(1)理解分类加法计数原理和分步乘法计数原理,能正确区分“类”和“步”,并能利用两个原理解决一些简单的实际问题.
(2)理解排列的概念及排列数公式,并能利用公式解决一些简单的实际问题.
(3)理解组合的概念及组合数公式,并能利用公式解决一些简单的实际问题.
(4)会用二项式定理解决与二项展开式有关的简单问题.
(二十一)概率与统计
(1)理解取有限个值的离散型随机变量及其分布列的概念,认识分布列刻画随机现象的重要性,会求某些取有限个值的离散型随机变量的分布列.
(2)了解超几何分布及其导出过程,并能进行简单的应用.
(3)了解条件概率的概念,了解两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.
(4)理解取有限个值的离散型随机变量均值、方差的概念,会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、方差概念解决一些简单问题.
(5)借助直观直方图认识正态分布曲线的特点及曲线所表示的意义.
(6)了解回归的基本思想、方法及其简单应用.
(7)了解独立性检验的思想、方法及其初步应用.。

计数原理与概率的计算知识点总结

计数原理与概率的计算知识点总结

计数原理与概率的计算知识点总结计数原理和概率是概率论与数理统计中的重要概念和工具。

它们对于解决实际问题和理解随机事件的发生规律具有重要意义。

本文将就计数原理和概率的计算知识点进行总结。

一、计数原理计数原理是概率论中一类重要的数学方法,用于计算排列、组合、选择等情况下的可能性。

在实际问题中,经常需要求解一些特定场景下的排列和组合数,计数原理可提供有效的计算方法。

1. 排列计数排列是从给定的若干元素中选出若干元素按照一定顺序排列的方式。

对于n个元素中选取r个元素进行排列,排列数用P表示,计算公式为P(n,r)=n!/(n-r)!,其中n!表示n的阶乘。

2. 组合计数组合是从给定的若干元素中选出若干元素不考虑顺序的方式。

对于n个元素中选取r个元素进行组合,组合数用C表示,计算公式为C(n,r)=n!/((n-r)!*r!)。

3. 二项式系数二项式系数是组合数的一种特殊情况,表示的是一个二项式展开式中各项的系数。

对于二项式系数C(n,k),表示二项式展开式中x^n的系数,计算公式为C(n,k)=n!/(k!(n-k)!)。

二、概率计算概率是描述事件发生可能性大小的数值,可用来解决实际问题中的随机性情况。

概率计算包括基本概率、条件概率和复合事件概率等内容,以下进行详细总结。

1. 基本概率基本概率是指一个事件发生的可能性与样本空间中所有可能事件的比值。

设S为一个试验的样本空间,E为S中的一个事件,在试验中,事件E发生的概率记作P(E),计算公式为P(E)=n(E)/n(S),其中n(E)表示事件E中有利结果的个数,n(S)表示样本空间S中结果的总个数。

2. 条件概率条件概率是指在已知一定条件下某一事件发生的概率。

设A、B为两个事件,且P(B)>0,那么在已知B发生的条件下,事件A发生的条件概率记作P(A|B),计算公式为P(A|B)=P(A∩B)/P(B),其中P(A∩B)表示事件A与事件B同时发生的概率。

计数原理和概率

计数原理和概率

计数原理和概率计数原理是数学中的一种基本方法和理论,用于解决计数问题。

概率是数学中的一种描述事件发生的可能性的概念。

计数原理和概率是两个相互关联且相互依存的概念,在实际问题中常常同时运用。

计数原理是研究计数问题的理论,主要包括分别计数原理和完全计数原理。

首先来看分别计数原理,分别计数原理是指计数问题中若一些事物A具有n种方式,另外一些事物B具有m种方式,则A和B一起总有n*m种方式。

这种方法常常适用于计数问题中,涉及到几个不同事物的排列组合、选择等情况。

例如,有8名学生参加比赛,其中2个名额为男生,6个名额为女生。

若所有学生均报名参赛,则根据分别计数原理可知,男生的选择方式有C(8,2)=28种,女生的选择方式有C(8,6)=28种,所以总的方式数为28*28=784种。

接下来是完全计数原理,完全计数原理是指计数问题可以按照步骤进行求解,将整个过程分解为几个相关的部分,并将每个部分的计数结果相乘得到最终结果。

这种方法常常适用于计数问题中,需要经历多个步骤或条件限制的情况。

例如,现有6个箱子,每个箱子中有5个球,将球编号为1、2、3、4、5、6、现在要从箱子中同时取出两个球,求取出的两个球的编号之和为7的方式数。

根据完全计数原理,可以将问题分解为两个步骤:首先是选取第一个球的方式数,为6种;然后是选取第二个球的方式数,由于已选取了第一个球,所以第二个球只能从剩下的球中选取,也为6种。

所以最终的结果为6*6=36种。

概率是研究事件发生可能性的理论,主要包括基本概率和条件概率。

基本概率是指在试验的所有可能结果中,其中一事件发生的可能性,即事件发生的次数除以试验的总次数。

基本概率是计算概率时的基础,常通过计数原理来求解。

例如,将一颗骰子掷出,掷出的结果是1-6中的一个数。

那么掷出1的概率就是1/6,掷出2的概率也是1/6,依此类推。

条件概率是指在给定其中一条件下,其中一事件发生的概率。

条件概率的计算可以通过计数原理和基本概率结合起来。

概率与统计简述、计数原理及排列与组合

概率与统计简述、计数原理及排列与组合
排列有序,组合无序 ;可用特值法来验证有无顺序
②互异性
我们学习的排列是不同元素的排列 即同一个元素是不允许重复的排列
③线排性
高中阶段学习的排列是:线排 线排是排成一列的意思,而非一圈
(1)《选修2-3》P:11~12 n元集有2n个子集 法1.分步乘法计数原理: N=2×2×2×……×2=2n
共n个2
析:①同色的2小球交换位置不影响结果,无序 ②不同色的2小球交换位置影响结果,有序 ③官方术语是:不尽相异元素的排列
解:N 9! 1260 2!3!4!
不尽相异元素的全排列公式
已知n个元素中,有m1个元素相同,又有m2个元素相同
……又有mk个元素相同(m1+m2+…+mk≤n)
则这n个元素所有的排列数为:
CM1
C n1 N M
CM2
C n2 N M
L
CMM
C nM N M
CNn
析: “一把抓”与“两把抓”……
(6)现有A、B、C、D、E、F、G、H共有8位同学, 按前3后5排成的两列照相,则不同的排列数为_____
解:N A88 40320
(7)(2006年江苏)今有2个红球、3个黄球、4个白球 同色球不加以区分,将这9个球排成一列有_____种 不同的方法(用数字作答)
用何法?!
计数原理型
排列组合型
十大题型
三、计数原理:
1.分类加法计数原理: 完成一件事有n类方式, 在第一类方式中有m1种不同
的方法,在第二类方式中有m2种不同的方法……,在第n类 方式中有mn种不同的方法.
那么完成这件事共有 N=m1+m2+…+mn种不同的方法
2.分步乘法计数原理:

概率统计计数原理

概率统计计数原理

第十章概率统计10.1 计数原理1、分类计数原理(加法原理)2019年连淮扬镇铁路开通之后,从连云港到扬州可以乘火车,也可以乘汽车,若一天中火车有3班,汽车有2班,那么一天中,乘这些交通工具从从连云港到扬州共有多少种方法?分析:因为一天中乘火车有3种走法,乘汽车有2种走法,每一种走法都可以从连云港到扬州,所以,共有3+2=5种不同的走法。

分类计数原理:做一件事情,完成它可以有n类办法,在第一类办法中有 m1种不同的方法,在第二类办法中有 m2种不同的方法,…,在第n类办法中有 m n种不同的方法,无论通过哪类的哪种方法,都可以独立完成这件事情那么完成这件事共有N=m1+m2+⋯+m n种不同的方法。

例1 书架上有不同的数学书10本,不同的语文书11本,不同的英语书9本,现从中任取1本,问:有多少种不同的选法?解从书架上任取1本书可能是数学书、语文书、英语书,有三类取法:第一类,取出一本数学书,可以从10本书中任取一本,有 m1=10种取法;第二类,取出一本语文书,可以从11本书中任取一本,有 m2=11种取法;第三类,取出一本英语书,可以从9本书中任取一本,有 m3=9种取法;只需在书架上任取一本,即可完成任务,根据分类计数原理,不同的取法共有N=m1+m2+m3=10+11+9=30(种)例2 在某批电器产品中,国有电器有97件,进口电器有23件,从中任取一种质检,共有多少种不同的取法?解该批电器可以分为国产和进口两类,从中任取1件即完成任务,从国产电器中抽取1件有97种取法,从进口电器中抽取1件有23种取法,所以不同的取法共有N=97+23=120(种)问题解决在由电键组A与B所组成的并联电路中,如图,要接通电源,使电灯发光的方法有多少种?2、分步计数原理某人决定从连云港坐火车到扬州,再于次日从扬州乘汽车到镇江,一天中,火车有3班,汽车有2班,那么两天中,他从连云港到镇江共有多少种不同的走法?分析:因为乘火车有3种走法,乘汽车有2种走法,所以,从连云港到镇江需乘一次火车再接着乘一次汽车就可以了,共有6种不同走法。

计数原理-概率统计知识梳理(三)

计数原理-概率统计知识梳理(三)

知识梳理(三)计数原理、概率统计两个计数原理1.分类加法计数原理如果完成一件事,有n 类方式,在第1类方式中有m 1种不同的方法,在第2类方式中有m 2种不同的方法,…在第n 类方式中有m n 种不同的方法,那么完成这件事共有N =_________________种不同的方法.2.分步乘法计数原理如果完成一件事需要分成n 个步骤,做第1步有m 1种不同的方法,做第2步有m 2种不同的方法,…,做第n 步有m n 种不同的方法,那么完成这件事共有N =______________种不同的方法.3.分类计数原理与分步计数原理,都涉及完成一件事的不同方法的种数.它们的区别在于:分类计数原理与_______有关,各种方法相互独立,用其中的任一种方法都可以完成这件事;分步计数原理与_______有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成.排列与组合1.排列(1)排列的定义:从n 个不同的元素中取出m (m ≤n )个元素,按照一定的顺序排成一列,叫做从n 个不同元素中取出m 个元素的一个_______.(2)排列数的定义:从n 个不同元素中取出m (m ≤n )个元素的所有不同排列的个数叫做从n 个不同元素中取出m 个元素的排列数,用_______表示.(3)排列数公式:A m n =____________________________.(4)全排列:n 个不同元素全部取出的一个排列,叫做n 个不同元素的一个_______,A n n =______________=n !.排列数公式写成阶乘的形式为A m n =______________,这里规定0!=_______.2.组合(1)组合的定义:从n 个不同元素中取出m (m ≤n )个元素并成一组,叫做从n 个不同元素中取出m 个元素的一个_______.(2)组合数的定义:从n 个不同元素中取出m (m ≤n )个元素的所有不同组合的个数,叫做从n 个不同元素中取出m 个元素的组合数,用_______表示.(3)组合数的计算公式:C m n =_______=n !m !(n -m )!=_____________________,C 0n =_______.(4)组合数的性质:①C m n =_______;②C m n +1=C mn +_______.二项式定理1.二项式定理(a +b )n =______________________________(n ∈N *).这个公式叫做二项式定理,右边的多项式叫做(a +b )n 的二项展开式,其中的系数______(r =0,1,2,…,n )叫做二项式系数.式中的C r n a n -r b r叫做二项展开式的通项,用T r +1表示,即展开式的第r +1项:T r +1=__________.2.二项展开式形式上的特点(1)项数为______.(2)各项的次数都等于二项式的幂指数n ,即a 与b 的指数的和为______.(3)字母a 按降幂排列,从第一项开始,次数由n 逐项减1直到零;字母b 按升幂排列,从第一项起,次数由零逐项增1直到n .(4)二项式的系数为C 0n ,C 1n ,…,C n -1n ,C nn .3.二项式系数的性质(1)对称性:与首末两端“等距离”的两个二项式系数相等,即C m n =______.(2)增减性与最大值:二项式系数C rn ,当r ________时,二项式系数是递增的;当r _________时,二项式系数是递减的.当n 是偶数时,那么其展开式中间一项______的二项式系数最大.当n 是奇数时,那么其展开式中间两项__________和_________的二项式系数相等且最大.(3)各二项式系数的和(a +b )n 的展开式的各个二项式系数的和等于______,即C 0n +C 1n +C 2n +…+C k n +…+C nn =______.二项展开式中,偶数项的二项式系数的和等于奇数项的二项式系数的和,即C 1n +C 3n +C 5n +…=C 0n +C 2n +C 4n +…=______.统计与概率初步1.抽样掌握随机抽样方法:简单随机抽样,分层抽样2.总体估计(1)作频率分布直方图的方法①先制作频率分布表,然后作直角坐标系;②把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的______,这样得出一系列的矩形.③每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.(2)用样本的数字特征估计总体的数字特征对于一组数据:x 1,x 2,…,x n .①平均数:x =__________________.②样本方差、标准差方程差s 2=______________________________;标准差s =s 2.3.概率的几个基本性质(1)概率的取值范围:0≤P (A )≤1.(2)必然事件的概率P (Ω)=1.(3)不可能事件的概率P (Ø)=0.(4)互斥事件概率的加法公式①如果事件A 与事件B 互斥,则P (A +B )=____________.②若事件B 与事件A 互为对立事件,则P (A )=____________.4.古典概型的概率公式如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是1n;如果某个事件A 包括的结果有m 个,那么事件A 的概率P (A )=______.离散型随机变量及其分布列1.条件概率(1)条件概率:设A ,B 为两个事件,且P (A )>0,称P (B |A )=________为在事件A 发生的条件下,事件B 发生的条件概率.(2)性质:①0≤P (B |A )≤1;②如果B 和C 是两个互斥事件,则P (B ∪C |A )=________________.(3)乘法公式:P (AB )=________________.(4)全概率公式:若样本空间Ω中的事件A 1,A 2,…,A n 满足:①任意两个事件均互斥,即A i A j =⌀,i ,j =1,2,…,n ,i ≠j ;②A 1∪A 2∪…∪A n =Ω;③P (A i )>0,i =1,2,3,…,n .则对Ω中的任意事件B ,都有B =BA 1∪BA 2∪…∪BA n ,且P (B )=i =1nP (BA i )=________________.2.事件的独立性(1)一般地,若事件A ,B 满足________________,则称事件A ,B 独立.(2)两个事件A ,B 相互独立的充要条件是P (AB )=______________.(3)若事件A 1,A 2,…,A n 相互独立,则这n 个事件同时发生的概率P (A 1A 2…A n )=_______________.(4)若事件A 与B 相互独立,则事件A 与B -也相互独立.A -与B 相互独立,A -与B -相互独立,P (B |A )=________,P (A |B )=________.3.离散型随机变量的概率分布(1)如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量;按一定次序一一列出,这样的随机变量叫做离散型随机变量.(2)若离散型随机变量X 可能取的不同值为x 1,x 2,…,x i ,…,x n ,X 取每一个值x i (i =1,2,…,n )的概率P (X =x i )=p i ,则表X x 1x 2…x i …x n P p 1p 2…p i …p n称为随机变量X 的概率分布列,具有性质:①p i ≥0,i =1,2,…,n ;②p 1+p 2+…+p i +…+p n =________.离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.(3)均值称x 1p 1+x 2p 2+…+x n p n 为随机变量X 的均值或数学期望,记为E (X )或μ,即E (X )=μ=x 1p 1+x 2p 2+…+x n p n .它反映了随机变量取值的________水平.(4)方差与标准差(x i -μ)2(μ=E (X ))描述了x i (i =1,2,…,n )相对于均值μ的偏离程度,随机变量X 的方差,记为D (X )或σ2.即D (X )=σ2=________________________________.方差也可用公式D (X )=ni =1x 2i p i -μ2计算,随机变量X 的方差也称为X 的概率分布的方差,X 的方差D (X )的算术平方根称为X 的标准差,即σ=D (X ).随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度.方差或标准差越________,随机变量偏离于均值的平均程度就越小.(5)均值与方差的性质①E (aX +b )=________________;②D (aX +b )=_______________(a ,b 为常数).均值与方差的关系:D (X )=E (X 2)-________.4.两点分布如果随机变量X 的概率分布为:X 10P p q其中0<p <1,q =1-p ,则称离散型随机变量X 服从参数为p 的两点分布.两点分布的数学期望与方差:E (X )=________,D (X )=________.5.超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{X =r }发生的概率:P (X =r )=______________(r =0,1,2,…,l ),其中l =min{n ,M },且n ≤N ,M ≤N ,n 、M 、N ∈N *,则称X 服从超几何分布,记为X ~H (n ,M ,N ),并将P (X =r )=C r M C n -r N -MC nN,记为H (r ;n ,M ,N ).超几何分布的数学期望:E (X )=________.二项分布和正态分布1.独立重复试验与二项分布(1)独立重复试验:在相同条件下重复做的n 次试验称为n 次独立重复试验.(2)二项分布:在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为p ,则P (X =k )=_______________(k =0,1,2,…,n ),此时称随机变量X 服从二项分布,记作X ~B (n ,p ),并称p 为成功概率.2.正态分布(1)正态分布:如果对于任何实数a ,b (a <b ),随机变量X 满足P (a <X ≤b )是正态密度曲线下方和x 轴上(a ,b ]上方所围成的图形的面积,则称随机变量X 服从正态分布,记为X ~N (μ,σ2).P (x )=12πσe (x -μ)22σ2,x ∈(-∞,+∞)的图象称为正态曲线.μ和σ是参数,分别表示总体的平均数与标准差.(2)正态曲线的性质①曲线位于x 轴上方,与x 轴不相交,与x 轴之间的面积为1;②曲线是单峰的,它关于直线________对称;③曲线在x =μ处达到峰值1σ2π;④当μ一定时,曲线的形状由σ确定,σ越______,曲线越“瘦高”,表示总体的分布越集中;σ越______,曲线越“矮胖”,表示总体的分布越分散.(3)正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)=0.6826;②P (μ-2σ<X ≤μ+2σ)=0.9544;③P (μ-3σ<X ≤μ+3σ)=0.9974.线性回归分析与独立性检验一.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.1.相关关系:(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为______相关;点散布在从左上角到右下角的区域,两个变量的这种相关关系称为______相关.(2)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有_______相关关系.2.线性回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最_____的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为^y=^bx+^a,则^b=∑ni=1(x i-x-)(y i-y-)∑ni=1(x i-x-)2=∑ni=1x i y i-n x-·y-∑ni=1x i2-n x-2,^a=________,其中,^b是回归方程的斜率,^a是在y轴上的截距,回归直线一定过样本点的中心________.3.线性回归分析:(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(-x,-y)称为样本点的中心.(3)相关系数当r>0时,表明两个变量________相关;当r<0时,表明两个变量________相关.r的绝对值越接近于1,表明两个变量的线性相关性越________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.(4)相关指数:R2=1-n∑i=1(y i-y^)2n∑i=1(y i-y-)2,其中n∑i=1(y i-^y i)2是残差平方和,其值越小,则R2越大(接近1),模型的拟合效果越______.二.独立性检验1.利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为y1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d则随机变量K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d为样本容量.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越________.利用K2进行独立性检验临界值表:P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4450.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.828。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[解析]用茎叶图表示的结果如下:
甲组
乙组
7 6 58
853 7 23
865 8 998
210 9 233
第5页
3、众数、中位数、平均数 众数:频率分布最大值对应的样本数据. 在[例 4]中,成绩为 85 时所对应的人数是 4 ,为最多,则 85 就是本例的众数. 在[例 5]中,成绩为73,88,89,92,93 所对应的人数是 2 ,为最多,所以73,88,89,92,93 这 5 个数都是本例的众数. 中位数:样本数据累积到频率等于 0.5 时所对应的样本数据. 在[例 4]中,先将数据按顺序排列,总人数为 30 ,平分后是 15 ,那么在人数等于 15.5 时,对应的数据是:第 15 个和第 16 个数据的平均值,即: 85 85 85 2 故:本例的中位数是 85 . 在[例 5]中,共有 20 个样本,按顺序排列后为: 序号 1 2 3 4 5 6 7 8 9 10 成绩 65 67 68 72 73 73 75 78 85 86 序号 11 12 13 14 15 16 17 18 19 20 成绩 88 88 89 89 90 91 92 92 93 93 在 20 个样本中,其中间的数为第 10 个和第 11 个数据的平均值 即: 86 88 87 ,故:本例的中位数是 87 . 2 平均数:样本数据的算术平均值就是样本的平均数. 在[例 4]中,成绩的总和除以总人数 30 的结果,就是本例的平均数. 成绩总和为 2418 ,则 2418 80.6 ,故本例的平均数是 80.6 . 30 在[例 4]中,成绩的总和除以总人数 20 的结果,就是本例的平均数. 成绩总和为 1647 ,则 1647 82.35 ,故本例的平均数是 82.35 . 20
3 30
(75,70]
3 30
(70, 65]
10 30
(65, 60]
4 30
(60, 55]
频数(人数)
2
2
2
1
频率
2
2
2
1
30
30
30
30
9
10
88
87
19
20
82
81
29
30
58
50
(80,75]
2 2 30 (55, 50]
1 1 30
第4页
⑷ 作直方图.
频率/组距 0.06
0.04
0.02
计数原理与概率统计
一、三种抽样方法
简单随机抽样、系统抽样、分层抽样.
1、简单随机抽样
在有限个总数 N 中,随意抽取一个样本,然后在剩余的总数 N 1中再随意抽取一个
样本,这样连续地进行 n 次随意抽取,共抽取 n ( n N )个样本,这种方法就是简单随
机抽样.
简单随机抽样的特点:
⑴ 总数 N 有限;
10
10
第一个人没抽中 A 的可能性是 9 ,余下 9 个中的 8 个是不中奖的,则此时第二个人
10
没有抽中 A 的可能性: 9 8 8 ; 10 9 10
上述两者之和就是总的第二个人没抽中 A 的可能性: 1 9 8 9 . 10 10 9 10
第1页
C>由第三个人来抽,此时余 8 张牌. 由于前两个人抽中的总的可能性是 2 ,两个人没 10
[解析]本例就是采取系统抽样.
将个班的同学随机编号,分别是: 01,02,..., 40 ;
第2页
按规则,假设抽取尾号为 5 的同学,则各班编号为 05,15, 25, 35 的同学就被荣幸抽中.
5 个班共有 20 个同学成为抽取样本,这 20 个同学学习成绩可以反映学校这 200 名学生
的平均水平,这就是系统抽样.
由④⑥: ( xi yi ) x yi k xi2 nk( x)2
i
i
i
即: ( xi yi ) nx y k xi2 nk( x)2
i
i
( xi yi ) nx y
故: k i

xi2 n( x)2
i
同样,由⑥: x y k( x)2 bx
即: b y k x ⑧ 由⑦和⑧就得到了线性回归方程①式.
⑶ 作频率分布表;
⑷ 作直方图.
注意:直方图的面积总和为 1
[例 4]这是某班同学的某次考试成绩:
排名 1
2
3
4
5
6
7
8
成绩 99
95
95
94
93
90
88
88
排名 11
12
13
14
15
16
17
18
成绩 86
86
85
85
85
85
84
83
排名 21
22
23
24
25
26
27
28
成绩 77
76
75
70
65
65
2、系统抽样
将总体平均分成几部分,如总体 N 平均分成 n 等分,每部分都有 N 个样品,一般取 n
k N 为整数. 如果 k 不是整数,可以调整 n 或者调整 N . 调整 n 使 k N 成为整数好
n
n
理解,调整 N 就是去掉一些样本使 k N 成为整数. 这时按一定规则从各部分种抽取一 n
0
50 60 70 80 90 100 成绩
这里,每个成绩区出现的人数就是频数,频数所占的比例就是频率.
即:频率=(某成绩区的人数)/(总人数)
组距就是成绩区间的间隔,这里组距为 5 .
横坐标为成绩,纵坐标为对应成绩的频率除以组距.
这样,就保证了直方图的阴影面积总和等于 1 .
2、茎叶图
在样本数据较少的情况下,用茎叶图表示分布,更能直观表达数据的特点.
20 名, B 部分有 30 名,C 部分有 150 名. 现在,要抽取 40 名的抽样,那么,各部分各 取多少名?
[解析]本例就是采取分层抽样.
分层抽样就是按比例抽取.
A
部分所占比例为:
pA
20
20 30
150
1 10

B
部分所占比例为:
pB
20
30 30
150
3 20

C
部分所占比例为:
pC
i
i
i
i
即 : ( xi yi ) k xi2 nbx ④
i
i
由③:
b b
i
( yi kxi b)2
i
2( yi kxi b) 0
即: ( yi kxi b) 0 i
第8页
即: yi k xi b nk x nb ⑤
i
i
i
由⑤: x yi nk( x)2 nbx ⑥ i
有抽中 A 的可能性: 8 7 7 ; 10 8 10
上述两者之和就是总的第三个人没抽中 A 的可能性: 2 8 7 9 . 10 10 8 10
D>由此推下去,可以归纳出:这 10 人抽中 A 的可能性都是 1 ,抽不中 A 的可能性都 10
是 9 ,因此这 10 人中奖的概率相等. 10
63
60
作出直方图.
[解析]按直方图的做法
⑴ 求极差:
本组成绩最大为 99 ,最小为 50 ,故极差为 99-50=49
⑵ 定组距;
如果将组距定位 5 分,则可以分成 10 组
⑶ 作频率分布表;
分组(成绩) [100, 95] (95,90] (90,85] (85,80]
频数(人数)
3
3
10
4
频率 分组(成绩)
-1.0
时间
13
14
15
16
17
18
气温(℃) 1.0
4.0
5.0
4.5
4.0
3.2
时间
19
20
21
22
23
24
气温(℃) 2.8
1.0
-0.2 -1.5 -2.2 -3.0
[解析]建立直角坐标系,横坐标为时间,纵坐标为温度,如图
气温
4.0 2.0
0 2.0
2
4
6
8
10
12
14
20
150 30
150
3 4
.
故各部分抽取人数为:
xA
pA
40
1 10
40
4;
xB
pB
40
3 40 20
6

xC
pC
40
3 40 4
30 .
二、三种分布图
直方图、茎叶图、散点图.
1、直方图
直方图就是频率分布图,由一组直方条组成,所以叫直方图.
直方图的具体做法:
⑴ 求极差:
第3页
⑵ 定组距;
这种采用偏差平方和最小的方法叫最小二乘法.
三、三种事件与事件之间的关系
这就是标准差.
6、线性回归与最小二乘法
如果一个散点图的点分布在一条直线附近,那么这两个变量就具有某种线性关系,我
们称这两个变量具有线性关系,这条直线叫回归直线,找到这条直线的方法就是 线性回
归. 设这条直线方程为: y k x b ① 散点的数据为 ( xi , yi ) ,其中 i 1, 2, ..., n 对应于散点在回归直线上的点为 ( xi , yi ) 那么散点与直线偏差的平方为:i ( yi yi )2 ( yi kxi b)2 当所有的偏差平方和最小时,求出 k 和 b ,就得到回归直线方程.
定数量的样本,这样的抽取方法称为系统抽样.
[例 2]某校三年级共有 200 名学生,可以将它们均分成 4 个班,每班 50 人. 也可以将它们均分 成 5 个班,每班 40 人. 还可以将它们大致均分成 6 个班,每班 33 ~ 34 人,等等. 假设现在分成了 5 个班,每班 40 人,现在要了解学生的学习成绩,每班抽取 4 人,那 么,按系统抽样该如何呢?
相关文档
最新文档