(完整)概率统计大题总结,推荐文档
(完整版)概率论与数理统计知识点总结,推荐文档

第1 章随机事件及其概率在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用来表示。
基本事件的全体,称为试验的样本空间,用Ω表示。
一个事件就是由Ω中的部分点(基本事件)组成的集合。
通常用大写字母A,B,C,…表示事件,它们是Ω的子集。
Ω为必然事件,Ø 为不可能事件。
不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为 1,而概率为 1 的事件也不一定是必然事件。
1°Ω={1,2 n},12°P(1) =P(2) = P(n) =n。
设任一事件A ,它是由1,2 m组成的,则有P(A)= {(1) (2) (m)}= P(1) +P(2) + +P(m)=m=A所包含的基本事件数n 基本事件总数第二章随机变量及其分布设随机变量X 的分布律为k-P( X =k ) = e ,> 0 ,k = 0,1,2 ,k!则称随机变量X 服从参数为的泊松分布,记为X ~ () 或者P()。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
e-x , x≥0,f (x) =0, x < 0 ,其中> 0 ,则称随机变量 X 服从参数为的指数分布。
X 的分布函数为1 -e-x, x≥0,F (x) =0,x<0。
记住积分公式:+∞⎰x n e -x dx =n!正态分布设随机变量 X 的密度函数为 21-( x -) 2- ∞ < x < +∞f (x ) =e 2 , , 2其中、> 0 为常数,则称随机变量 X 服从参数为、的正态分布或高斯(Gauss )分布,记为 X ~ N (,2) 。
f (x ) 具有如下性质:1° f (x ) 的图形是关于 x = 对称的;2° 当 x = 时, f ()= 1 为最大值;若 X ~ N (,2) ,则 X 2 的分布函数为1 x e- ( t - ) 2F (x ) =⎰- 2 2dt2∞参数= 0 、= 1时的正态分布称为标准正态分布,记为X ~ N (0,1) ,1 其-密x 2度函数记为 (x ) = e 22 , - ∞ < x < +∞ ,分布函数为21x - t Φ(x ) = 2⎰ e 2dt 。
概率统计大题题型总结(理)学生版

统计概率大题题型总结题型一 频率分布直方图与茎叶图例1.〔2021广东理17〕某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如下图,其中茎为十位数,叶为个位数.(Ⅰ) 根据茎叶图计算样本均值;(Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(Ⅲ) 从该车间12名工人中,任取2人,求恰有名优秀工人的概率.例2.〔2021新课标Ⅱ理〕经销商经销某种农产品,在一个销售季度内,每售出t 该产品获利润500元,未售出的产品,每t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如下图.经销商为下一个销售季度购进了130t 该农产品,以X (单位:t,150100≤≤X )表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内销商该农产品的利润.(Ⅰ)将T 表示为X 的函数;(Ⅱ)根据直方图估量利润T 不少于57000元的概率;(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:假设[100,110)X ∈,则取105X =,且105X =的概率等于需求量落入[100,110)的概率),求利润T 的数学期望.变式1. 【2021高考重庆,理3】重庆市2021年各月的平均气温〔o C 〕数据的茎叶图如下: 则这组数据的中位数是〔 〕A 、19B 、20C 、21.5D 、23 变式2.【2021高考新课标2,理18】〔此题总分值12分〕某公司为了解用户对其产品的中意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的中意度评分如下:1 7 92 0 1 53 0第17题图A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79〔Ⅰ〕根据两组数据完成两地区用户中意度评分的茎叶图,并通过茎叶图比拟两地区中意度评分的平均值及分散程度〔不要求计算出具体值,得出结论即可〕;〔Ⅱ〕根据用户中意度评分,将用户的中意度从低到高分为三个等级:记时间C :“A 地区用户的中意度等级高于B 地区用户的中意度等级〞.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率. 变式3.〔2021辽宁理〕电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷〞.(Ⅰ)根据条件完成下面的22 列联表,并据此资料你是否认为“体育迷〞与性别有关? (Ⅱ)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采纳随机抽 样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷〞人数为X .假设每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X .变式4 【2021新课标Ⅰ理18】(本小题总分值12分)从某企业的某种产品中抽取500件,测量A 地区B 地区4 5 6 7 8 9这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(Ⅰ)求这500件产品质量指标值的样本平均数x 和样本方差2s 〔同一组数据用该区间的中点值作代表〕;〔Ⅱ〕由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2(,)N μδ,其中μ近似为样本平均数x ,2δ近似为样本方差2s . (i) 利用该正态分布,求(187.8212.2)P Z <<;(ii) 某用户从该企业购置了100件这种产品,记X 表示这100件产品中质量指标值为于区间〔〕的产品件数,利用〔i 〕的结果,求EX .假设Z ~2(,)N μδ,则()P Z μδμδ-<<+,(22)P Z μδμδ-<<+=0.9544. 题型二 抽样问题例【2021高考广东,理17】某工厂36名工人的年龄数据如下表:〔1〕用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; 〔2〕计算〔1〕中样本的平均值x 和方差2s ;〔3〕36名工人中年龄在s x -与s x +之间有多少人?所占的百分比是多少〔精确到%〕? 变式 〔2021天津卷文〕为了了解某工厂开展群众体育活动的情况,拟采纳分层抽样的方法从A ,B,C 三个区中抽取7个工厂进行调查,A,B ,C 区中分别有18,27,18个工厂〔Ⅰ〕求从A,B,C 区中分别抽取的工厂个数;〔Ⅱ〕假设从抽取的7个工厂中随机抽取2个进行调查结果的比照,用列举法计算这2个工厂中至少有1个来自A 区的概率。
概率统计大题总结

概率与统计大题总结一、知识点汇编:1.线性回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归分析:方法是画散点图,求回归直线方程,并用回归直线方程进行预报.其回归方程的截距和斜率的最小二乘估计公式分别为:回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型.说明:r 只能用于线性模型,R 2则可用于任一种模型. 对线性回归模型来说,22=R r .3、独立性检验(1)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)假设有两个分类变量X 和Y ,它们的值域分别为{}11x ,y 和{}12y ,y 其样本频数列联表称为y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d(3)构造随机变量()()()()()()22+++-=++++a b c d ad bc K ,a b c d a c b d 利用K 2的大小可以确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为如:如果k >7.879,就有99.5%的把握认为“X 与Y 有关系”. 4、概率 事件的关系:⑴事件B 包含事件A :事件A 发生,事件B 一定发生,记作B A ⊆; ⑵事件A 与事件B 相等:若A B B A ⊆⊆,,则事件A 与B 相等,记作A=B ; ⑶并(和)事件:某事件发生,当且仅当事件A 发生或B 发生,记作B A ⋃(或B A +); ⑷并(积)事件:某事件发生,当且仅当事件A 发生且B 发生,记作B A ⋂(或AB ) ;⑸事件A 与事件B 互斥:若B A ⋂为不可能事件(φ=⋂B A ),则事件A 与互斥;⑹对立事件:B A ⋂为不可能事件,B A ⋃为必然事件,则A 与B 互为对立事件。
概率与统计实际问题经典题总结

概率与统计实际问题经典题总结在我们的日常生活中,概率与统计的知识无处不在。
从预测天气变化到评估投资风险,从医学研究到质量控制,概率与统计为我们提供了理解和解决各种问题的有力工具。
接下来,让我们一起探讨一些经典的概率与统计实际问题。
一、抽奖问题假设在一个抽奖活动中,总共有 1000 张奖券,其中只有 10 张是一等奖。
小明随机抽取了一张奖券,那么他抽中一等奖的概率是多少?这是一个简单的古典概型问题。
古典概型的概率计算公式是:P(A) =事件 A 包含的基本事件数÷基本事件总数。
在这个例子中,事件 A 就是抽中一等奖,包含的基本事件数是 10,基本事件总数是 1000。
所以小明抽中一等奖的概率是 10÷1000 = 001,即 1%。
再复杂一点,如果抽奖规则变为先抽一次,如果没中,再放回奖池重新抽,连续抽 5 次,每次都没抽中的概率是多少?因为每次抽奖都是独立事件,每次没抽中的概率都是 990÷1000 = 099。
所以连续 5 次都没抽中的概率就是099×099×099×099×099 ≈ 095。
二、产品质量检测问题一家工厂生产了 10000 个零件,已知其中有 500 个是次品。
现在从这批零件中随机抽取 100 个进行检测,求抽到次品的概率。
这里可以用频率来估计概率。
抽到次品的频率约为 500÷10000 =005。
当抽取的样本数量足够大时,频率会趋近于概率。
所以抽取 100 个零件时,抽到次品的概率大约也是 005。
如果要控制这批零件的次品率不超过 2%,至少需要再检测多少个零件,并且没有检测到次品?设还需要检测 x 个零件,根据次品率的计算公式,可列出不等式:(500÷(10000 + x))≤ 002,解得x ≥ 15000。
也就是说,至少需要再检测 15000 个零件且没有检测到次品,才能将次品率控制在 2%以内。
概率大题题型总结(高三精华)

3、( 2012湖南卷)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该读表类型1、( 2012湖北卷)根据以往的经验,某工程施工期间的降水量 X (单位:mm 对工期的影响如下表:(1) 工期延误天数 丫的均值与方差;(2) 在降水量X 至少是300的条件下,工期延误不超过 6天的概率.已知这100位顾客中的一次购物量超过 8件的顾客占55% (1) 确定x,y 的值,并求顾客一次购物的结算时间X 的分布列与数学期望;(2) 若某顾客到达收银台时前面恰有 2位顾客需结算,且各顾客的结算相互独立,求该顾客结算 前的等候时间不超过 2.5分钟的概率.(注:将频率视为概率)2、(2012陕西卷)某银行柜台设有一个服务窗口,假设顾客办理业务所需的时间互相独立,且都 是整数分钟,对以往顾客办理业务所需的时间统计结果如下:(1)估计第三个顾客恰好等待 4分钟开始办理业务的概率; (2) X 表示至第2分钟末已办理完业务的顾客人数,求X 的分布列及数学期望高考统计与概率理科大题类型总结4、(2012咼考真题北京理17)近年来,某市为了促进生活垃圾的风分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾 三类,并分别设置了相应分垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类 垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):5、( 2013年咼考北京卷)下图是某市 3月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择3月1日至3 月13日中的某一天到达该市,并停留2天.(I )求此人到达当日空气重度污染的概率 ;(n )设X 是此人停留期间空气质量优良的天数 ,求X 的分布列与数学期望; (山)由图判断从哪天开始连续三天的空气质量指数方差最大 ?(结论不要求证明)1 _____ _______ ___________ _______(注:s 2 [(^ -x )2 (x 2 -X )2出…卷(Xn -X )2],其中x 为数据X1,X2,…,Xn 的平均 n数)“厨余垃圾”箱“可回收物”箱“其他垃圾”箱厨余垃圾 400 100 100 可回收物30 240 30 其他垃圾202060(山)假设厨余垃圾在“厨余垃圾”箱、 “可回收物”箱、“其他垃圾”箱的投放量分别为 a ,b ,c2其中a >0,a b c =600。
(完整版)(最全)高中数学概率统计知识点总结(可编辑修改word版)

∑ (x - x ) ∑ ( y - y ) n2n2i =1i i =1i∑ (x - x ) ∑ ( y - y ) n 2n2i =1i i =1i1 2 n 1 2 n n i iiii一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
概率与统计x + x + ⋅⋅⋅ + x x + x + ⋅⋅⋅ + x 2、平均数:①、常规平均数: x = 1 2 nn②、加权平均数: x = 1 1 2 2 n n+ + ⋅⋅⋅ + 1 2 n3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差: s 2= 1[(x - x )2+ (x - x )2+ ⋅⋅⋅ + (x - x )2 ]n1 2 n二、频率直方分布图下的频率1、频率 =小长方形面积: f = S = y ⨯ d ;频率=频数/总数2、频率之和: f + f + ⋅⋅⋅ + f = 1;同时 S + S + ⋅⋅⋅ + S = 1 ;三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: x = x f + x f + x f + ⋅⋅⋅ + x f x = x S + x S + x S + ⋅⋅⋅ + x S 1 12 23 3n n1 12 23 3n n3、中位数:从左到右或者从右到左累加,面积等于 0.5 时 x 的值。
4、方差: s 2 = (x - x )2 f + (x - x )2 f + ⋅⋅⋅ + (x - x )2 f1122nn四、线性回归直线方程: y ˆ = b ˆx + a ˆn n∑(x i - x )( y i - y ) ∑ x i y i - nxy 其中: b ˆ = i =1 = i =1 ,a ˆ = y -b ˆx∑n (x - x )2 ∑ x 2 - nx 2i =1iii =11、线性回归直线方程必过样本中心(x , y ) ;2、b ˆ > 0 : 正相关; b ˆ < 0 : 负相关。
概率论与数理统计重点总结及例题解析

概率论与数理统计重点总结及例题解析(总15页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--概率论与数理统计重点总结及例题解析一:全概率公式和贝叶斯公式例:某厂由甲、乙、丙三个车间生产同一种产品,它们的产量之比为3:2:1,各车间产品的不合格率依次为8%,9%, 12% 。
现从该厂产品中任意抽取一件,求:(1)取到不合格产品的概率;(2)若取到的是不合格品,求它是由甲车间生产的概率。
(同步45页三、1)解:设A1,A2,A3分别表示产品由甲、乙、丙车间生产,B表示产品不合格,则A1,A2,A3为一个完备事件组。
P(A1)=1/2, P(A2)=1/3, P(A3)=1/6,P(B| A1)=,P(B| A2)=,P(B| A3)=。
由全概率公式P(B) = P(A1)P(B| A1)+ P(A2)P(B| A2)+ P(A3)P(B| A3) = 由贝叶斯公式:P(A1| B)=P(A1B)/P(B) = 4/9练习:市场上出售的某种商品由三个厂家同时供货,其供应量第一厂家为第二厂家的2倍,第二、三两厂家相等,而且第一、二、三厂家的次品率依次为2%,2%,4%。
若在市场上随机购买一件商品为次品,问该件商品是第一厂家生产的概率是多少(同步49页三、1)【】练习:设两箱内装有同种零件,第一箱装50件,有10件一等品,第二箱装30件,有18件一等品,先从两箱中任挑一箱,再从此箱中前后不放回地任取2个零件,求:(同步29页三、5)(1)取出的零件是一等品的概率;(2)在先取的是一等品的条件下,后取的仍是一等品的条件概率。
解:设事件i A ={从第i 箱取的零件},i B ={第i 次取的零件是一等品}(1)P(1B )=P(1A )P(1B |1A )+P(2A )P(1B |2A )=52301821501021=+ (2)P(1B 2B )=194.02121230218250210=+C C C C ,则P(2B |1B )=)()(121B P B B P = 二、连续型随机变量的综合题例:设随机变量X 的概率密度函数为⎩⎨⎧<<=othersx x x f 020)(λ求:(1)常数λ;(2)EX ;(3)P{1<X<3};(4)X 的分布函数F(x)(同步47页三、2)解:(1)由⎰⎰==∞+∞-201)(xdx dx x f λ得到λ=1/2 (2)3421)(22===⎰⎰∞+∞-dx x dx x xf EX (3)⎰⎰===<<31214321)(}31{xdx dx x f x P(4)当x<0时,⎰∞-==xdt x F 00)( 当0≤x<2时,⎰⎰⎰∞-∞-=+==xxx tdt dx dt t f x F 00241210)()( 当x ≥2时,F (x )=1故201()02412x F x x x x <⎧⎪⎪=≤<⎨⎪≥⎪⎩练习:已知随机变量X 的密度函数为⎩⎨⎧≤≤+=others x b ax x f 010)( 且E(X)=7/12。
概率统计大题知识点总结

概率统计大题知识点总结一、概率统计简介概率统计是数学中的一个重要分支,主要研究的是随机现象的规律性,即研究随机变量及其概率分布、数学期望和方差等。
概率统计理论主要包括概率论和数理统计两部分内容,概率论是研究随机现象的规律性,而数理统计是利用样本数据对总体特性进行推断和决策。
概率统计被广泛应用于自然科学、社会科学、工程技术和经济管理等领域。
二、概率论1. 随机事件和概率随机事件是指在一定条件下具有不确定性的现象,例如抛硬币、掷骰子等。
概率是描述随机事件发生可能性的数学概念,通常用一个介于0和1之间的实数表示。
概率的性质包括必然性、互斥性、可列可加性等。
2. 随机变量和概率分布随机变量是描述随机现象数字特征的变量,包括离散随机变量和连续随机变量两种类型。
概率分布是描述随机变量取值和相应概率的函数关系,包括离散概率分布和连续概率分布两种类型。
3. 数学期望和方差数学期望是随机变量取值的加权平均数,反映了随机变量的集中趋势。
方差是随机变量取值偏离数学期望的平均平方差,反映了随机变量的离散程度。
4. 大数定律和中心极限定理大数定律指的是在独立随机变量的独立重复试验中,随机变量的平均值近似于数学期望的现象。
中心极限定理指的是在独立随机变量的独立重复试验中,随机变量的样本平均值的分布近似于正态分布的现象。
三、数理统计1. 总体和样本总体是指研究对象的全部个体的集合,而样本是从总体中抽取的部分个体的集合。
数理统计的主要任务是通过样本对总体特性进行推断和决策。
2. 参数估计参数估计是对总体参数的点估计和区间估计的问题。
点估计是用样本统计量估计总体参数的数值,区间估计是用样本统计量确定包含总体参数的区间范围。
3. 假设检验假设检验是根据样本数据对总体参数提出的假设进行检验的问题,包括原假设和备择假设两种。
假设检验的方法包括抽样分布、P值和检验统计量等。
4. 方差分析和回归分析方差分析是通过对多个总体的均值进行比较来判断它们是否相等的统计技术,包括单因素方差分析和双因素方差分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率与统计大题总结一、知识点汇编:1.线性回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归分析:方法是画散点图,求回归直线方程,并用回归直线方程进行预报.其回归方程的截距和斜率的最小二乘估计公式分别为:回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型.说明:r 只能用于线性模型,R 2则可用于任一种模型. 对线性回归模型来说,22=R r .3、独立性检验(1)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)假设有两个分类变量X 和Y ,它们的值域分别为{}11x ,y 和{}12y ,y 其样本频数列联表称为2×2列联表:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c+d(3)构造随机变量()()()()()()22+++-=++++a b c d ad bc K ,a b c d a c b d 利用K 2的大小可以确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为如:如果k >7.879,就有99.5%的把握认为“X 与Y 有关系”. 4、概率 事件的关系:⑴事件B 包含事件A :事件A 发生,事件B 一定发生,记作B A ⊆; ⑵事件A 与事件B 相等:若A B B A ⊆⊆,,则事件A 与B 相等,记作A=B ; ⑶并(和)事件:某事件发生,当且仅当事件A 发生或B 发生,记作B A ⋃(或B A +); ⑷并(积)事件:某事件发生,当且仅当事件A 发生且B 发生,记作B A ⋂(或AB ) ;⑸事件A 与事件B 互斥:若B A ⋂为不可能事件(φ=⋂B A ),则事件A 与互斥; ⑹对立事件:B A ⋂为不可能事件,B A ⋃为必然事件,则A 与B 互为对立事件。
概率公式:⑵古典概型:基本事件的总数包含的基本事件的个数A A P =)(;⑶几何概型:等)区域长度(面积或体积试验的全部结果构成的积等)的区域长度(面积或体构成事件A A P =)( ;5、统计案例 抽样方法:⑴简单随机抽样:一般地,设一个总体的个数为N ,通过逐个不放回的方法从中抽取一个容量为n 的样本,且每个个体被抽到的机会相等,就称这种抽样为简单随机抽样。
注:①每个个体被抽到的概率为Nn ; ②常用的简单随机抽样方法有:抽签法;随机数表法。
⑵系统抽样:当总体个数较多时,可将总体均衡的分成几个部分,然后按照预先制定的规则,从每一个部分抽取一个个体,得到所需样本,这种抽样方法叫系统抽样。
注:步骤:①编号;②分段;③在第一段采用简单随机抽样方法确定起始的个体编号;④按预先制定的规则抽取样本。
⑶分层抽样:当已知总体有差异比较明显的几部分组成时,为使样本更充分的反映总体的情况,将总体分成几部分,然后按照各部分占总体的比例进行抽样,这种抽样叫分层抽样。
注:每个部分所抽取的样本个体数=该部分个体数⨯Nn注:以上三种抽样的共同特点是:在抽样过程中每个个体被抽取的概率相等频率分布直方图与茎叶图:⑴用直方图反映样本的频率分布规律的直方图称为频率分布直方图。
⑵当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边像植物茎上长出来的叶子,这种表示数据的图叫做茎叶图。
总体特征数的估计:⑴样本平均数∑==+⋅⋅⋅++=ni i n x nx x x n x 1211)(1;⑵样本方差])()()[(1222212x x x x x x n S n -+⋅⋅⋅+-+-=21)(1x x nni i -=∑= ;⑶样本标准差])()()[(122221x x x x x x n S n -+⋅⋅⋅+-+-==21)(1x x nni i-∑=大题训练1.(本小题满分12分)某中学准备招聘一批优秀大学生到本单位就业,但在签约前要对他们的师范生素质进行测试.在待测试的某一个小组中有男、女生共10人(其中女生人数多于男生人数),如果从中随机选2人参加测试,其中恰为一男一女的概率为815. (1)求该小组中女生的人数;(2)假设此项专业技能测试对该小组的学生而言,每个女生通过的概率为34,每个男生通过的频率为23.现对该小组中男生甲、男生乙和女生丙3个人进行测试,记这3个人中通过测试的人数为随机变量ξ,求ξ的分布列和数学期望.解析 (1)设该小组有n 个女生,根据题意,得C 1n C 110-n C 210=815,(3分)解得n =6或n =4(舍去).(5分) ∴该小组中有6个女生.(6分)(2)由题意知,ξ的所有可能取值为0,1,2,3, P (ξ=0)=13×13×14=136,(7分)P (ξ=1)=C 12×23×13×14+(13)2×34=736,(8分) P (ξ=2)=C 12×23×13×34+(23)2×14=49,(9分) P (ξ=3)=(23)2×34=13.(10分)∴ξ的分布列为(11分)∴E (ξ)=0×136+1×736+2×49+3×13=2512.(12分)2.(2014·江西红色六校二次联考)(本小题满分12分)某企业招聘工作人员,设置A ,B ,C 三组测试项目供参考人员选择,甲、乙、丙、丁、戊五人参加招聘,其中甲、乙两人各自独立参加A 组测试,丙、丁两人各自独立参加B 组测试.已知甲、乙两人各自通过测试的概率均为13,丙、丁两人各自通过测试的概率均为12.戊参加C 组测试,C 组共有6道试题,戊会其中4题.戊只能且必须选择4题作答,至少答对3题则竞聘成功.(1)求戊竞聘成功的概率;(2)求参加A 组测试通过的人数多于参加B 组测试通过的人数的概率; (3)记A 、B 组测试通过的总人数为ξ,求ξ的分布列和期望. 解析 (1)设戊竞聘成功为A 事件,则P (A )=C 44+C 34C 12C 46=1+815=35.(3分) (2)设参加A 组测试通过的人数多于参加B 组测试通过的人数为B 事件, 则P (B )=C 12×13×23×(12)2+13×13×(12)2+13×13×C 12×(12)2=736.(6分) (3)ξ的所有可能取值为0,1,2,3,4, P (ξ=0)=23×23×12×12=19,P (ξ=1)=C 12×13×23×12×12+23×23×C 12×12×12=13, P (ξ=2)=13×13×12×12+23×23×12×12+C 12×13×23×C 12×12×12=1336, P (ξ=3)=13×13×C 12×12×12+C 12×13×23×12×12=16, P (ξ=4)=13×13×12×12=136.(10分)所以ξ的分布列为E (ξ)=0×19+1×13+2×1336+3×16+4×136=53.(12分)3.(2014·石家庄一模)(本小题满分12分)现有甲、乙、丙三人参加某电视台的应聘节目《非你莫属》,若甲应聘成功的概率为12,乙、丙应聘成功的概率均为t2(0<t <2),且三个人是否应聘成功是相互独立的.(1)若乙、丙有且只有一个人应聘成功的概率等于甲应聘成功的概率,求t 的值; (2)记应聘成功的人数为ξ,若当且仅当ξ为2时概率最大,求E (ξ)的取值范围. 解析 (1)由题意得2×t 2×(1-t 2)=12,解得t =1.(3分)(2)ξ的所有可能取值为0,1,2,3, P (ξ=0)=(1-12)(1-t 2)(1-t 2)=(2-t )28,P (ξ=1)=12×(1-t 2)×(1-t 2)+2×(1-12)×t 2×(1-t 2)=4-t28,P (ξ=2)=2×12×t 2×(1-t 2)+(1-12)×t 2×t 2=4t -t28,P (ξ=3)=12×t 2×t 2=t 28.故ξ的分布列为(7分)所以E (ξ)=t +12.(8分)由题意得P (ξ=2)-P (ξ=1)=t -12>0,P (ξ=2)-P (ξ=0)=-t 2+4t -24>0,P (ξ=2)-P (ξ=3)=2t -t 24>0.又因为0<t <2,所以t 的取值范围是1<t <2.(11分) 所以32<E (ξ)<52.(12分)4.(本小题满分12分)周先生的船舱中装有6条小鱼和1条大鱼,由于在海上漂流,他计划从当天开始,每天从该船中捕捉1条鱼(每条鱼被抓到的概率相同)并吃掉来维持生计.若大鱼未被捕捉,则它每天要吃掉1条小鱼.(1)求这7条鱼中至少有6条被周先生吃的概率;(2)以ξ表示这7条鱼中被周先生吃掉的条掉,求ξ的分布列及其数学期望. 解析 (1)设周先生能吃到的鱼的条数为ξ,若周先生要吃到7条鱼,则必须在第一天吃掉大鱼,P (ξ=7)=17,若周先生要吃到6条鱼,则必须在第二天吃掉大鱼,P (ξ=6)=67×15=635.故周先生至少吃掉6条鱼的概率是P (ξ≥6)=P (ξ=6)+P (ξ=7)=1135.(4分)(2)周先生能吃到的鱼的条数ξ可取4,5,6,7,最坏的情况是只能吃到4条鱼:前3天各吃掉1条小鱼,其余3条小鱼被大鱼吃掉,第4天吃掉大鱼,其概率为P (ξ=4)=67×45×23=1635,(6分)P (ξ=5)=67×45×13=835,由(1)知P (ξ=6)=635,P (ξ=7)=17.(8分)所以ξ的分布列为(10分)故E (ξ)=4×1635+5×835+6×635+7×17=5.(12分)5.(2014·北京)(每小题满分13分)李明在10场篮球比赛中的投篮情况统计如下(假设各场比赛相互独立):(2)从上述比赛中随机选择一个主场和一个客场,求李明的投篮命中率一场超过0.6,一场不超过0.6的概率;(3)记x 为表中10个命中次数的平均数.从上述比赛中随机选择一场,记X 为李明在这场比赛中的命中次数.比较E (X )与x 的大小.(只需写出结论)思路 (1)利用古典概型求概率;(2)利用互斥事件和独立事件概率计算公式求概率; (3)直接利用数学期望公式求解.解析 (1)根据投篮统计数据,在10场比赛中,李明投篮命中率超过0.6的场次有5场,分别是主场2,主场3,主场5,客场2,客场4.所以在随机选择的一场比赛中,李明的投篮命中率超过0.6的概率是0.5.(3分) (2)记事件A 为“在随机选择的一场主场比赛中李明的投篮命中率超过0.6”,事件B 为“在随机选择的一场客场比赛中李明的投篮命中率超过0.6”,事件C 为“在随机选择的一个主场和一个客场中,李明的投篮命中率一场超过0.6,一场不超过0.6”.则C =A B ∪A B ,A ,B 独立.(5分) 根据投篮统计数据,P (A )=35,P (B )=25.P (C )=P (A B )+P (A B ) =35×35+25×25 =1325.(8分) 所以在随机选择的一个主场和一个客场中,李明的投篮命中率一场超过0.6,一场不超过0.6的概率为1325.(9分)(3)E (X )=x .(13分) 6.(本小题满分12分)我国的高铁技术发展迅速,铁道部门计划在A ,B 两城市之间开通高速列车,假设列车在试运行期间,每天在8:00-9:00,9:00-10:00两个时间段内各发一趟由A 城开往B城的列车(两车发车情况互不影响),A 城发车时间及概率如下表所示:8:00和周日8:20.(只考虑候车时间,不考虑其他因素)(1)求甲、乙两人候车时间相等的概率;(2)设乙候车所需时间为随机变量ξ,求ξ的分布列和数学期望E (ξ).解析 (1)由题意得,甲、乙两人的候车时间分别是10分钟,30分钟,50分钟的概率为P 甲(10)=16,P 甲(30)=13,P 甲(50)=12;P 乙(10)=13,P 乙(30)=12,P 乙(50)=16×16=136.(4分)所以甲、乙两人候车时间相等的概率P =16×13+13×12+12×136=1772.(6分)(2)ξ的所有可能取值为10,30,50,70,90,(单位:分钟) 所以ξ的分布列为数学期望E (ξ)=10×13+30×12+50×136+70×118+90×112=2809.(12分)7.(本小题满分12分)考古工作人员在某遗址经过全面勘探、调查和试掘,判定该遗址有A ,B ,C ,D ,E ,F 六件珍贵物件,且这六件珍贵物件呈如图所示的位置在地底埋藏着,考古工作人员需挖掘出上面的某个物件后才能挖掘其相应位置下面的物件.(1)若要求先挖掘物件A ,B ,C ,E ,求物件E 第3次被挖掘到的概率; (2)设物件E 第X 次被挖掘到,求随机变量X 的分布列与数学期望.解析 (1)由题意,可将上述问题转化为:挖掘4个物件A ,B ,C ,E 进行了4个步骤,且挖掘B 步骤一定在挖掘E 步骤前,物件E 可在第2步、第3步或第4步被挖掘到.方法一 分类列举(不考虑D ,F ):若E 在第2步被挖掘到,则B 必在第1步被挖掘到,故有A 22=2种情况;(1分)若E 在第3步被挖掘到,则B 在E 前选1步被挖掘到,故有C 12A 22=4种情况;(3分)若E 在第4步被挖掘到,则有A 33=6种情况.(4分) 故物件E 第3次被挖掘到的概率P =412=13.(5分)方法二 排组计数(考虑了D ,F ):因为B 必在E 前,即B ,E 步骤顺序一定,故总的可能情况有C 24A 22A 22=24种.(2分) 若E 在第3步被挖掘到,则B 在E 前选1步被挖掘到,故有C 12A 22A 22=8种情况,(4分)故物件E 第3次被挖掘到的概率P =824=13.(5分)(2)由题意,可将上述问题转化为:挖掘6个物件A ,B ,C ,D ,E ,F 进行了6个步骤,且要求A 在D 前,B 在E 前,C 在F 前.则物件E 可在第2步、第3步、第4步、第5步、第6步被挖掘到,即X 的所有可能取值为2,3,4,5,6.P (X =2)=C 24C 22C 26C 24C 22=115,P (X =3)=C 12C 24C 22C 26C 24C 22=215,P (X =4)=C 13C 24C 22C 26C 24C 22=15,P (X =5)=C 14C 24C 22C 26C 24C 22=415,P (X =6)=C 15C 24C 22C 26C 24C 22=13.随机变量X 的分布列为(10分)所以E (X )=2×115+3×215+4×15+5×415+6×13=143.(12分)8.(2014·成都二次诊断)(本小题满分12分)节能灯的质量通过其正常使用时间来衡量,使用时间越长,表明质量越好,且使用时间大于或等于6千小时的产品为优质品.现用A ,B 两种不同型号的节能灯做试验,各随机抽取部分产品作为样本,得到试验结果的频率分布直方图如图所示:以上述试验结果中使用时间落入各组的频率作为相应的概率.(1)现从大量的A ,B 两种型号节能灯中各随机抽取两件产品,求恰有两件是优质品的概率;(2)已知A 型节能灯的生产厂家对使用时间小于6千小时的节能灯实行“三包”.通过多年统计发现,A 型节能灯每件产品的利润y (单位:元)与其使用时间t (单位:千小时)的关系如下表:及数学期望.解析 (1)从A 型号节能灯中随机抽取一件产品为优质品的概率P (A )=12.(1分)从B 型号节能灯中随机抽取一件产品为优质品的概率P (B )=25.(2分)∴从A ,B 两种型号节能灯中各随机抽取两件产品,恰有两件是优质品的概率P =C 12(12)1(12)1×C 12(25)1(35)1+C 22(12)2×C 22(35)2×C 22(12)2×C 22(25)2=37100.(6分) (2)据题意,知X 的可能取值为-40,0,20,40,60,80.(7分) ∵P (X =-40)=C 22(110)2=1100, P (X =0)=C 12(110)1×(25)1=225, P (X =20)=C 12(110)1×(12)1=110, P (X =40)=C 22(25)2=425, P (X =60)=C 12(25)1×(12)1=25, P (X =80)=C 22(12)2=14. ∴X 的分布列为(10分)∴数学期望E (X )=10(-4×1100+0+2×110+4×425+6×25+8×14)=52.(12分)9.(2014·安徽)(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).思路(1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事件的概率公式求运动时间超过4小时的概率;(3)根据K2的计算公式求解.解析(1)300×4 50015 0000=90,所以应收集90位女生的样本数据.(2分)(2)由频率分布直方图,得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(5分)(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:(7分)每周平均体育运动时间与性别列联表结合列联表可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841. 所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.(12分) 探究 知识:分层抽样、频率分布直方图、独立性检验.能力:根据频率分布直方图求概率、分层抽样计算女生的人数以及根据K 2进行独立性检验,考查运算求解能力、分析解决问题的能力、数据处理能力以及逻辑思维运算能力.试题难度:中等.10.(2014·山东六校联考)(本小题满分12分)为改善城市雾霾天气造成的空气污染,社会各界掀起净化、美化环境的热潮.某单位计划在办公楼前种植A ,B ,C ,D 四棵风景树,受本地地理环境的影响,A ,B 两棵树种成活的概率均为12,另外两棵树种的成活率都为a (0<a <1).(1)若出现A ,B 有且只有一棵成活的概率与C ,D 都成活的概率相等,求a 的值; (2)当a =23时,记ξ为最终成活的树的数量,求ξ的分布列和数学期望E (ξ).思路 本题以社会热点问题为命题背景,考查概率的计算、随机变量ξ的分布列和数学期望E (ξ)的计算.(1)根据A ,B 有且只有一棵成活的概率与C ,D 都成活的概率相等列出等式即可求出a 的值;(2)考查离散型随机变量的期望值,求解离散型随机变量的问题,首先根据题意分别求出随机变量ξ的可能取值对应的概率,列出ξ的分布列,再根据期望公式计算E (ξ)的值.解析 (1)由题意,得2×12×(1-12)=a 2,解得a =22.(4分)(2)依题意,随机变量ξ的所有可能取值为0,1,2,3,4, 则P (ξ=0)=C 02×(1-12)2×C 02×(1-23)2=136,P (ξ=1)=C 12×12×(1-12)×C 02×(1-23)2+C 02×(1-12)2×C 12×23×(1-23)=16, P (ξ=2)=C 22×(12)2×C 02×(1-23)2+C 12×12×(1-12)×C 12×23×(1-23)+C 02×(1-12)2×C 22×(23)2=1336, P (ξ=3)=C 22×(12)2×C 12×23×(1-23)+C 12×12×(1-12)×C 22×(23)2=13, P (ξ=4)=C 22×(12)2×C 22×(23)2=19.(9分) 所以ξ的分布列为E (ξ)=0×136+1×16+2×1336+3×13+4×19=73.(12分)11.(2014·南昌二模)(本小题满分12分)某公司生产产品A ,产品质量按测试指标分为:指标大于或等于90为一等品,大于或等于80小于90为二等品,小于80为三等品,生产一件一等品可盈利50元,生产一件二等品可盈利30元,生产一件三等品亏损10元.现随机抽查熟练工人甲和新工人乙生产的这种产品各100件进行检测,检测结果统计如下:估计为他们生产产品A 为一等品、二等品、三等品的概率.(1)计算新工人乙生产三件产品A 给工厂带来盈利大于或等于100元的概率;(2)记甲、乙两人分别生产一件产品A 给工厂带来的盈利和为X ,求随机变量X 的概率分布和数学期望.解析 甲生产一件产品A 为一等品、二等品、三等品的概率分别为310,610,110,(3分)乙生产一件产品A 为一等品、二等品、三等品的概率分别为110,710,210.(6分)(1)记“新工人乙生产三件产品A 给工厂带来盈利大于或等于100元”为事件D ,则D 包含的情况有:三件都是一等品;两件是一等品,一件是二等品或一件是一等品,两件是二等品.故P (D )=(110)3+3×(110)2×710+3×110×(710)2=1691 000.(8分)(2)随机变量X 的所有可能取值为100,80,60,40,20,-20. P (X =100)=310×110=3100,P (X =80)=310×710+110×610=27100,P (X =60)=610×710=42100=2150,P (X =40)=310×210+110×110=7100,P (X =20)=610×210+110×710=19100,P (X =-20)=110×210=2100=150.所以随机变量X 的概率分布为(10分)E (X )=300+2 160+2 520+280+380-40100=56.(12分)12.(本小题满分12分)甲、乙、丙三人参加某次招聘会、假设甲能被聘用的概率是25,甲、丙两人同时不能被聘用的概率是625,乙、丙两人同时能被聘用的概率是310,且三人各自能否被聘用相互独立.(1)求乙、丙两人各自能被聘用的概率;(2)设ξ表示甲、乙、丙三人中能被聘用的人数与不能被聘用的人数之差的绝对值,求ξ的分布列与数学期望.解析 (1)记甲、乙、丙各自能被聘用的事件分别为A 1,A 2,A 3,由已知A 1,A 2,A 3相互独立,且满足⎩⎪⎨⎪⎧P (A 1)=25,[1-P (A 1)][1-P (A 3)]=625,P (A 2)P (A 3)=310.(3分)解得P (A 2)=12,P (A 3)=35.所以乙、丙两人各自能被聘用的概率分别为12,35.(6分)(2)ξ的所有可能取值为1,3.因为P (ξ=3)=P (A 1A 2A 3)+P (A 1 A 2 A 3) =P (A 1)P (A 2)P (A 3)+[1-P (A 1)][1-P (A 2)][1-P (A 3)] =25×12×35+35×12×25=625,(8分) 所以P (ξ=1)=1-P (ξ=3)=1-625=1925.所以ξ的分布列为所以E (ξ)=1×1925+3×625=3725.(12分)。