高中数学 概率统计专题

合集下载

精品高中数学专题:概率与统计

精品高中数学专题:概率与统计

专题七 概率与统计第一讲 统计与统计案例1. 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2. 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确. 3. 线性回归方程(1)对n 个样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^ =y -b ^x ,x 、y 分别是{}x i 、{}y i 的平均数.(2)相关系数r >0,表明两个变量正相关;r <0,表明两个变量负相关;|r |越接近于1,表明两个变量的线性相关性越强;|r |越接近于0,表明两个变量之间几乎不存在线性相关关系;|r |>0.75时,认为两变量有很强的线性相关关系. 4. 独立性检测的一般步骤(1)根据样本数据列出2×2列联表,假设两个变量无关系;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)比较K 2与临界值的大小关系作统计推断.1. (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11B .12C .13D .14答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 2. (2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120答案 B解析 少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.3. (2013·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组 乙组 9 0 9 x 2 1 5 y 8 7424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8答案 C解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x =15,x =5.又因9+15+10+y +18+245=16.8,所以y =8,故选C.4. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg答案 D解析 由于线性回归方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 5.运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2 解析 x 甲=15(87+91+90+89+93)=90, x乙=15(89+90+91+88+92)=90, s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.题型一 抽样方法例1 (1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10审题破题 系统抽样的特点是“等距”,分层抽样最重要的是“比例”. 答案 (1)C (2)A解析 (1)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.(2)若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500, 解得x =1 600,故高一学生数为800,因此应抽取高一学生数为800100=8.反思归纳 (1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)在分层抽样中,要求各层在样本中和总体中所占比例相同.变式训练1 (1)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A .①简单随机抽样法,②系统抽样法B .①分层抽样法,②简单随机抽样法C .①系统抽样法,②分层抽样法D .①②都用分层抽样法 答案 B(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有________. 答案 760解析 设该校的女生为x 人,男生为(1 600-x )人,则按照分层抽样,各层的比例为2001 600=18,所以女生抽取x 8,男生抽取1 600-x 8,所以x8+10=1 600-x 8,解得x =760. 题型二 用样本估计总体例2 (2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比审题破题 (1)根据样本频率之和为1,求出参数a 的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10(人).反思归纳 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差较大的波动较大,方差较小的波动较小.变式训练2 (1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙答案 B解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x 甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙.(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为________;平均分为________.答案75%71解析及格的各组的频率是(0.015+0.03+0.025+0.005)×10=0.75,即及格率约为75%;样本的均值为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,以这个分数估计总体的分数即得总体的平均分数约为71.题型三统计案例例3(1)根据上表可得线性回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为() A.63.6万元B.65.5万元C.67.7万元D.72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20附:参考公式及数据①卡方统计量:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d);则下列说法正确的是( )A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关审题破题 (1)可以通过回归直线过(x ,y )求出a ^,然后进行预报;(2)计算K 2,然后和临界值比较. 答案 (1)B (2)C解析 (1)∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). (2)K 2=40×(14×13-7×6)220×20×21×19≈4.912,3.841<K 2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关.反思归纳 (1)线性回归分析中,回归直线过(x ,y )是解决问题的核心;(2)独立性检验问题要计算卡方值,和临界值比较,说明有多大把握认为两者有关系.变式训练3 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y -b ^x =80+20×8.5=250,从而线性回归方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.典例(12分)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学习成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率;(2)根据有关规定,成绩小于16秒为达标.根据上表数据,能否在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?附:规范解答解(1)从频率分布直方图中可以看出,成绩在[13,14)的人数为50×0.04=2(人),设为a,b;成绩在[17,18]的人数为50×(1-0.38-0.34-0.18-0.04)=3(人),设为A,B,C.[2分] m,n∈[13,14)有ab一种情况;m,n∈[17,18]时有AB,AC,BC三种情况;m,n分别在[13,14)和[17,18]时有aA ,aB ,aC ,bA ,bB ,bC 六种情况,所有基本事件总数为10.[4分] 而事件“|m -n |>2”由6个基本事件即aA ,aB ,aC ,bA ,bB ,bC 组成.所以P (|m -n |>2)=610=35.[6分](2)依题意得到相应的2×2列联表如下:[9分]K 2=50×(24×12-6×8)232×18×30×20≈8.333.由于8.333>6.635,故在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.[12分]评分细则 (1)计算出成绩在两个区间[13,14),[17,18]内的人数给1分,标记给1分;(2)列举基本事件不全扣1分;(3)卡方值计算正确得1分,和临界值比较得1分,写最后结论得1分.阅卷老师提醒 (1)频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征;(2)解决独立性检验问题,要先得到列联表,准确代入公式计算.1. 某校共有学生2 000名,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在( )A.24B .18C .16D .12答案 C解析 由2 000×0.19=380知二年级的学生人数为380+370=750,由于一年级的学生人数为373+377=750,于是三年级的学生人数为2 000-750-750=500,那么三年级应抽取的人数为500×642 000=16(人).2. (2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是 ( )A .众数B .平均数C .中位数D .标准差答案 D解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.3. 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,设回归方程为y =b x +a ,则点(a ,b )在直线x +45y -10=0的( )A .左上方B .左下方C .右上方D .右下方答案 C解析 依题意得,x =18×(10+20+30+40+50+60+70+80)=45,y =18×(62+68+75+81+89+95+102+108)=85.注意到题中的每一组点(x ,y )均位于直线x +45y -10=0的右上方,因此点(a ^,b ^)必位于直线x +45y -10=0的右上方,故选C.4. 高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________. 答案 20解析 由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.5. (2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案 (1)0.004 4 (2)70解析 (1)(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1, ∴x =0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.6. (2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1. (2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析 x男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91, s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6. 2. (2013·湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法答案 D解析 总体(100名学生)中的个体(男、女学生)有明显差异,应采用分层抽样. 3. 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的树木大约有( )A .3 000株B .6 000株C .7 000株D .8 000株答案 C解析 底部周长小于110 cm 的频率为(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的树木大约有10 000×0.7=7 000株,故选C.4. 如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有( )A.a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2大小与m 的值有关答案 B解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.5. 假设学生初一和初二数学成绩是线性相关的.若10个学生初一(x )和初二(y )的数学分数则初一和初二数学分数间的线性回归方程是( )A.y ^=1.218 2x -14.192B.y ^=14.192x +1.218 2C.y ^=1.218 2x +14.192D.y ^=14.192x -1.218 2 答案 A 解析 因为x=71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2.a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.6. (2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取( )A.08 B .07 C .02 D .01答案 D解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3 答案 D解析 逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,0,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.D 中x =2. (x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),x i ∈N *即x i ≤7.8. 有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72答案 B解析 由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10)内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36. 二、填空题9. (2013·山东改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案 367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0) =367. 10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23解析 x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24.x 乙=110×(19+17+11+21+24+22+24+30+32+30)=23.12.以下四个命题,其中正确的是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2(χ2)的值越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,随机变量K 2(χ2)的值越小,说明两个变量有关系的把握程度越小. 三、解答题13.(2013·安徽)为调查甲、乙两校高三年级学生某次联考的数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解 (1)设甲校高三年级学生总人数为n ,由已知条件 30n=0.05,则n =600. 在甲校高三年级抽取的30名学生中成绩在60分及60分以上的人数为25,因此甲校高三年级这次联考的及格率大约是2530=56=83.3%.(2)x 1=[(7+13+24+26+22+2)+40+50×4+60×9+70×9+80×5+90×2]÷30=1 04215;x 2=[(5+14+17+33+20)+40+50×3+60×10+70×10+80×5+90]÷30=2 06930.x 1-x 2=2 08430-2 06930=12.14.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 解 (1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)从题中所给条件可以看出收看新闻节目的共45人,随机抽取5人,则抽样比为545=19,故大于40岁的观众应抽取27×19=3(人).(3)抽取的5名观众中大于40岁的有3人,在20岁到40岁的有2人,记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2)共10个,其中恰有1人为20至40岁的有6个,故所求概率为610=35.。

(完整版)(最全)高中数学概率统计知识点总结

(完整版)(最全)高中数学概率统计知识点总结

(完整版)(最全)高中数学概率统计知识点总结-CAL-FENGHAI.-(YICAI)-Company One1概率与统计一、普通的众数、平均数、中位数及方差1、 众数:一组数据中,出现次数最多的数。

2、平均数:①、常规平均数:12nx x x x n++⋅⋅⋅+=②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。

4、方差:2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+-二、频率直方分布图下的频率1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。

2、平均数: 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。

4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程:ˆˆˆybx a =+ 其中:1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ;2、ˆ0:b>正相关;ˆ0:b <负相关。

3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。

五、回归分析1、残差:ˆˆi i i ey y =-(残差=真实值—预报值)。

高中数学概率统计题库及答案解析

高中数学概率统计题库及答案解析

高中数学概率统计题库及答案解析随着高中数学概率统计的教学深入,学生们需要更多的练习来巩固所学知识。

因此,一个全面且有针对性的概率统计题库及答案解析就显得尤为重要。

本文将介绍一个高中数学概率统计题库,并提供详细的答案解析,帮助学生更好地掌握该领域的知识。

一、选择题1. 已知事件A和事件B是互不相容的,且P(A)= 0.3,P(AUB) = 0.7,求P(B)的值。

解析:由题意可知 P(AUB) = P(A) + P(B) - P(AB),代入已知条件可得 0.7 = 0.3 + P(B) - 0,从而得到 P(B) = 0.4。

2. 设事件A和事件B相互独立,且P(A) = 1/4,P(B) = 1/3,求P(AB)的值。

解析:由于事件A和事件B相互独立,所以 P(AB) = P(A)P(B),代入已知条件可得 P(AB) = (1/4)(1/3) = 1/12。

二、计算题1. 从1到20中随机选取一个数,求选取的数被3整除的概率。

解析:在1到20中可以被3整除的数有3, 6, 9, 12, 15, 18共6个。

而总的样本空间为20,所以选取的数被3整除的概率为6/20 = 3/10。

2. 甲、乙、丙共参加了一次考试,甲过的概率为0.7,乙过的概率为0.8,丙过的概率为0.9。

已知甲、乙、丙三人中至少有两人过的概率是0.97,求三人中全部过的概率。

解析:设甲、乙、丙三人全部过的概率为 P(甲)P(乙)P(丙),根据题意可得到以下等式:1 - [P(甲) + P(乙) + P(丙) - P(甲)P(乙) - P(甲)P(丙) - P(乙)P(丙)] = 0.97代入已知概率可解得 P(甲)P(乙)P(丙) = 0.51,即三人全部过的概率为0.51。

三、证明题已知事件A和事件B是相互独立的,证明事件A的补事件与事件B的补事件也是相互独立的。

证明:设事件A的补事件为A',事件B的补事件为B'。

高中数学概率统计专题练习题及答案

高中数学概率统计专题练习题及答案

高中数学概率统计专题练习题及答案一、选择题1. 掷一枚骰子,结果为奇数的概率是多少?A. 1/2B. 1/6C. 2/3D. 1/32. 从1至20这20个数字中随机选出一个数,选出的数是素数的概率是多少?A. 1/5B. 1/4C. 1/2D. 2/53. 一只盒子中有5张红牌和3张蓝牌,从中随机抽取2张牌,同时放回,再随机抽取2张牌,求两次抽取都是红牌的概率是多少?A. 1/16B. 3/8C. 1/4D. 1/8二、计算题1. 一次考试中,甲乙丙三位同学都有70%的概率通过考试。

求三位同学中至少有一位通过考试的概率。

答案:1 - (1 - 0.7)^3 = 0.9732. 从1至100这100个数字中随机选出一个数,选出的数是2的倍数且小于等于50的概率是多少?答案:50/100 = 0.53. 有A、B两个车站,A车站开往B车站的列车间隔是15分钟,B车站开往A车站的列车间隔是10分钟。

现在一个人随机到达A车站,请问他至少要等待几分钟才能搭乘到开往B车站的列车?答案:最小公倍数(15, 10) = 30分钟三、应用题1. 每个学生参加一次足球比赛的概率是0.4,问一个班级20个同学中至少有10个学生参加比赛的概率是多少?答案:利用二项分布公式,计算P(X≥10),其中n=20,p=0.4,k≥10。

答案约为0.599。

2. 一批产品有10%的次品率,现从中随机抽取20个产品,求其中恰好有3个次品的概率。

答案:利用二项分布公式,计算P(X=3),其中n=20,p=0.1,k=3。

答案约为0.201。

3. 一支篮球队最近10场比赛中获胜的概率是0.8,在下一场比赛中,求该队至少获胜8次的概率。

答案:利用二项分布公式,计算P(X≥8),其中n=10,p=0.8,k≥8。

答案约为0.967。

以上为高中数学概率统计专题练习题及答案。

希望对您的学习有所帮助!。

高中数学必修二统计概率知识点总结

高中数学必修二统计概率知识点总结

必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。

高中数学概率统计(含详细答案)

高中数学概率统计(含详细答案)

1.某初级中学共有学生2000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率. 解:(1)0.192000x= ∴ 380x =(2)初三年级人数为y +z =2000-(373+377+380+370)=500, 现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:48500122000⨯= 名 (3)设初三年级女生比男生多的事件为A ,初三年级女生男生数记为(y ,z ); 由(2)知 500y z += ,且 ,y z N ∈, 基本事件空间包含的基本事件有:(245,255)、(246,254)、(247,253)、……(255,245)共11个事件A 包含的基本事件有:(251,249)、(252,248)、(253,247)、(254,246)、(255,245) 共5个∴ 5()11P A =2.为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问卷调查.6人得分情况如下:5,6,7,8,9,10.把这6名学生的得分看成一个总体. (Ⅰ)求该总体的平均数;(Ⅱ)用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率. 解:(Ⅰ)总体平均数为1(5678910)7.56+++++=. (Ⅱ)设A 表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”. 从总体中抽取2个个体全部可能的基本结果有:(56),,(57),,(58),,(59),,(510),,(67),,(68),,(69),,(610),,(78),,(79),,(710),,(89),,(810),,(910),.共15个基本结果.事件A 包括的基本结果有:(59),,(510),,(68),,(69),,(610),,(78),,(79),.共有7个基本结果. 所以所求的概率为7()15P A =.3.现有8名奥运会志愿者,其中志愿者123A A A ,,通晓日语,123B B B ,,通晓俄语,12C C ,通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组. (Ⅰ)求1A 被选中的概率;(Ⅱ)求1B 和1C 不全被选中的概率.解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={111112121()()()A B C A B C A B C ,,,,,,,,,122131()()A B C A B C ,,,,,,132()A B C ,,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,, 231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,, 322331332()()()A B C A B C A B C ,,,,,,,,}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“1A 恰被选中”这一事件,则M ={111112121()()()A B C A B C A B C ,,,,,,,,,122131132()()()A B C A B C A B C ,,,,,,,,}事件M 由6个基本事件组成, 因而61()183P M ==. (Ⅱ)用N 表示“11B C ,不全被选中”这一事件,则其对立事件N 表示“11B C ,全被选中”这一事件,由于N ={111211311()()()A B C A B C A B C ,,,,,,,,},事件N 有3个基本事件组成, 所以31()186P N ==,由对立事件的概率公式得15()1()166P N P N =-=-=.4.某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.(I )求全班人数及分数在[)90,80之间的频数;(II )估计该班的平均分数,并计算频率分布直方图中[)90,80间的矩形的高; (III )若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率.解:(I )由茎叶图知,分数在[)60,50之间的频数为2,频率为,08.010008.0=⨯ 全班人数为.2508.02= …………3分所以分数在[)90,80之间的频数为42107225=---- …………5分(II )分数在[)60,50之间的总分为56+58=114;分数在[)70,60之间的总分为60×7+2+3+3+5+6+8+9=456;(III )将[)90,80之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为: (1,2),(1,3),(1,4),(1,5),(1,6) (2,3),(2,4),(2,5),(2,6), (3,4),(3,5),(3,6) (4,5),(4,6) (5,6)共15个, …………12分 其中,至少有一个在[90,100]之间的基本事件有9个, …………14分故至少有一份分数在[90,1000]之间的频率是6.0159= …………15分5.袋子中装有编号为b a ,的2个黑球和编号为e d c ,,的3个红球,从中任意摸出2个球。

高中数学概率统计难题集

高中数学概率统计难题集

高中数学概率统计难题集
1. 排列组合
1. 某班有10个男生和8个女生,从中选择5位同学参加一次数学竞赛,其中必须至少有2名男生和3名女生参赛。

求参赛人员的组合数。

2. 概率计算
2. 在一副有52张牌的扑克牌中,从中随机抽出5张牌,求抽到四张皇后的概率。

3. 离散型随机变量
3. 一批零件的质量服从正态分布,均值为80,标准差为5。

从中随机抽取一个零件,求质量小于75的概率。

4. 连续型随机变量
4. 一家餐厅餐桌到达的时间符合指数分布,平均每10分钟有一桌。

求在20分钟内没有餐桌到达的概率。

5. 相关性分析
5. 一对骰子同时抛掷,求两个骰子的和为7的概率。

这些难题涵盖了高中数学概率统计的不同概念和技巧,希望能
够提供给学生们一些有趣而具有挑战性的练题。

尝试解答这些问题,不断提升自己的数学思维能力和解题技巧。

> 注意:以上问题解析仅供参考,具体解答可能与题目提供的
信息有关。

在实际解题过程中,请根据题目给出的条件和公式进行
思考和推导,以获得正确的答案。

以上就是一份高中数学概率统计难题集的文档,希望对你有所
帮助!。

高中数学概率统计知识点总结大全

高中数学概率统计知识点总结大全

概率统计一,统计初步1.简单随机抽样简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.2.系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.(2)系统抽样的步骤:①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k.当Nn(N为总体中的个体数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=N′n.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S +k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n 的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.3.分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.(2)分层抽样的步骤①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.(3)分层抽样的优点分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.4.绘制频率分布直方图把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.5.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.6.平均数、中位数和众数(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.7.方差、标准差(1)设样本数据为x1,x2,…,x n样本平均数为x-,则s2=1n[(x1-x-)2+(x2-x-)2+…+(x n-x-)2]=1n[(x12+x22+…+x n2)-n x2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.8.两个变量的线性相关(1)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.(2)正相关、负相关如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.9.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x、y的一组观察值为(x i,y i)(i=1,2,…,n),则回归直线方程y^=a^+b^x的系数为:⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧ b ^=∑i =1n x i y i -n x ·y ∑i =1n x i 2-n x 2=∑i =1n (x i -x -)(y i -y -)∑i =1n (x i -x -)2a^=y --b ^x 其中x -=1n ∑i =1n x i ,y -=1n ∑i =1n y i ,(x -,y -)称作样本点的中心. a ^,b ^表示由观察值用最小二乘法求得的a ,b 的估计值,叫回归系数.10.独立性检验(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.(2)两个分类变量X 与Y 的频数表,称作2×2列联表.二.随机事件的概率1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.(1)在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件.(2)在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件.(3)必然事件与不可能事件统称为确定事件.(4)在条件S 下可能发生也可能不发生的事件,叫做随机事件.(5)确定事件和随机事件统称为事件,一般用大写字母,,,A B C 表示. 2.频率与概率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数A n 为事件A 出现的频数,称事件A 出现的比例()A n n f A n=为事件A 出现的频率. (2)对于给定的随机事件A ,如果随着试验次数的增加,事件A 发生的频率()n f A 稳定在某个常数上,把这个常数记作()p A ,称为事件A 的概率,简称为A 的概率.3.互斥事件与对立事件互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即A B 为不可能事件(A B φ=),则称事件A 与事件B 互斥,其含义是:事件A 与事件B 在任何一次试验中不会同时发生.一般地,如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥.对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即A B 为不可能事件,而A B 为必然事件,那么事件A 与事件B 互为对立事件,其含义是:事件A 与事件B 在任何一次试验中有且仅有一个发生.互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.4.事件的关系与运算 B 或A B +) B (或AB ) B 为不可能事件B φ= B 为不可能事件B 为必然事件与事件B 互为对立事件 B φ=且B =Ω5.随机事件的概率事件A 的概率:在大量重复进行同一试验时,事件A 发生的频率nm 总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()p A . 由定义可知()01p A ≤≤,显然必然事件的概率是1,不可能事件的概率是0.5.概率的几个基本性质(1)概率的取值范围:()01p A ≤≤.(2)必然事件的概率:()1p A =.(3)不可能事件的概率:()0p A =.(4)互斥事件的概率加法公式:①()()()p A B p A p B =+(,A B 互斥),且有()()()1p A A p A p A +=+=. ②()()()()1212n n p A A A p A p A p A =+++ (12,,,n A A A 彼此互斥).(5)对立事件的概率:()()1P A P A =-.三.古典概型1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A 由几个基本事件组成.如果一次试验中可能出现的结果有n 个,即此试验由n 个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是n 1.如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=n m . 基本事件的特点(1)任何两个基本事件是互斥的.(2)任何事件都可以表示成基本事件的和(除不可能事件).2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性.②每个基本事件发生的可能性相等,即等可能性.概率公式:P (A )=A 包含的基本事件的个数基本事件的总数.四.几何概型1.(1)随机数的概念:随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的.(2)随机数的产生方法①利用函数计算器可以得到0~1之间的随机数;②在Scilab 语言中,应用不同的函数可产生0~1或a~b 之间的随机数.2.几何概型(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性.(3)几何概型的解题步骤:首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件A 构成的区域长度(角度、弧长等),最后代公式()p A =构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件A 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.3.几种常见的几何概型(1)设线段l 是线段L 的一部分,向线段L 上任投一点.若落在线段l 上的点数与线段L 的长度成正比,而与线段l 在线段l 上的相对位置无关,则点落在线段l 上的概率为:P=l 的长度/L 的长度(2)设平面区域g 是平面区域G 的一部分,向区域G 上任投一点,若落在区域g 上的点数与区域g 的面积成正比,而与区域g 在区域G 上的相对位置无关,则点落在区域g 上概率为:P=g 的面积/G 的面积(3)设空间区域上v 是空间区域V 的一部分,向区域V 上任投一点.若落在区域v 上的点数与区域v 的体积成正比,而与区域v 在区域v 上的相对位置无关,则点落在区域V 上的概率为:P=v 的体积/V 的体积。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高三文科数学:概率与统计专题
一、选择题:
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差
C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数
2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为
A.1
3
B.
1
2
C.
2
3
D.
3
4
3、在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散
点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=1
2
x+1上,则这组样本数据的样
本相关系数为
(A)-1 (B)0 (C)1
2
(D)1
4.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为
(A)10
3
(B)
1
5
(C)
1
10
(D)
1
20
5.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是
A.1
4B.
π
8
C.1
2
D.
π
4
6.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( )
二、填空题:
7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______。

8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.
9.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 程y ^=b ^x +a ^中的b ^=
由表中数据得回归直线方
-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题
10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售。

如果当天卖不完,剩下的玫瑰花做垃圾处理。

(Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n ∈N)的函数解析式。

(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:
(1)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;
(2)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率。

11. 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
分组115) 125)
频数 6 26 38 22 8
(I)在答题卡上作出这些数据的频率分布直方图:
(II)估计这种产品质量指标值的平均数及方差(同一组中的
数据用该组区间的中点值作代表);
(III)根据以上抽样调查数据,能否认为该企业生产的这种产
品符合“质量指标值不低于95的产品至少要占全部产品的80%”
的规定
12. 某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份2009201020112012201320142015
年份代号t1234567
人均纯收入y
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2017年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
b^=∑
n
i=1
(t i-t

)(y i-y



n
i=1
(t i-t-)2
,a^=y--b^t-.
13.某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:
月收入(单
位:百元)[15,25)[25,35)[35,45)[45,55)[55,65)
[65,
75]
赞成定价者123534
(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
(2)由以上统计数据填下面2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.
附:K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
14.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:
经计算得16119.9716i i x x ===∑,0.212s ==≈,
18.439≈,16
1
()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,
1,2,,16i =⋅⋅⋅.
(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查
(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)
附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅
的相关系数()()
n
i
i
x x y y r --=

0.09≈.。

相关文档
最新文档