高中数学概率统计专题
精品高中数学专题:概率与统计

专题七 概率与统计第一讲 统计与统计案例1. 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2. 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确. 3. 线性回归方程(1)对n 个样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^ =y -b ^x ,x 、y 分别是{}x i 、{}y i 的平均数.(2)相关系数r >0,表明两个变量正相关;r <0,表明两个变量负相关;|r |越接近于1,表明两个变量的线性相关性越强;|r |越接近于0,表明两个变量之间几乎不存在线性相关关系;|r |>0.75时,认为两变量有很强的线性相关关系. 4. 独立性检测的一般步骤(1)根据样本数据列出2×2列联表,假设两个变量无关系;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)比较K 2与临界值的大小关系作统计推断.1. (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11B .12C .13D .14答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 2. (2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120答案 B解析 少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.3. (2013·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组 乙组 9 0 9 x 2 1 5 y 8 7424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8答案 C解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x =15,x =5.又因9+15+10+y +18+245=16.8,所以y =8,故选C.4. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg答案 D解析 由于线性回归方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 5.运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2 解析 x 甲=15(87+91+90+89+93)=90, x乙=15(89+90+91+88+92)=90, s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.题型一 抽样方法例1 (1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10审题破题 系统抽样的特点是“等距”,分层抽样最重要的是“比例”. 答案 (1)C (2)A解析 (1)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.(2)若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500, 解得x =1 600,故高一学生数为800,因此应抽取高一学生数为800100=8.反思归纳 (1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)在分层抽样中,要求各层在样本中和总体中所占比例相同.变式训练1 (1)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A .①简单随机抽样法,②系统抽样法B .①分层抽样法,②简单随机抽样法C .①系统抽样法,②分层抽样法D .①②都用分层抽样法 答案 B(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有________. 答案 760解析 设该校的女生为x 人,男生为(1 600-x )人,则按照分层抽样,各层的比例为2001 600=18,所以女生抽取x 8,男生抽取1 600-x 8,所以x8+10=1 600-x 8,解得x =760. 题型二 用样本估计总体例2 (2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比审题破题 (1)根据样本频率之和为1,求出参数a 的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10(人).反思归纳 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差较大的波动较大,方差较小的波动较小.变式训练2 (1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙答案 B解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x 甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙.(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为________;平均分为________.答案75%71解析及格的各组的频率是(0.015+0.03+0.025+0.005)×10=0.75,即及格率约为75%;样本的均值为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,以这个分数估计总体的分数即得总体的平均分数约为71.题型三统计案例例3(1)根据上表可得线性回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为() A.63.6万元B.65.5万元C.67.7万元D.72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20附:参考公式及数据①卡方统计量:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d);则下列说法正确的是( )A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关审题破题 (1)可以通过回归直线过(x ,y )求出a ^,然后进行预报;(2)计算K 2,然后和临界值比较. 答案 (1)B (2)C解析 (1)∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). (2)K 2=40×(14×13-7×6)220×20×21×19≈4.912,3.841<K 2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关.反思归纳 (1)线性回归分析中,回归直线过(x ,y )是解决问题的核心;(2)独立性检验问题要计算卡方值,和临界值比较,说明有多大把握认为两者有关系.变式训练3 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y -b ^x =80+20×8.5=250,从而线性回归方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.典例(12分)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学习成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率;(2)根据有关规定,成绩小于16秒为达标.根据上表数据,能否在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?附:规范解答解(1)从频率分布直方图中可以看出,成绩在[13,14)的人数为50×0.04=2(人),设为a,b;成绩在[17,18]的人数为50×(1-0.38-0.34-0.18-0.04)=3(人),设为A,B,C.[2分] m,n∈[13,14)有ab一种情况;m,n∈[17,18]时有AB,AC,BC三种情况;m,n分别在[13,14)和[17,18]时有aA ,aB ,aC ,bA ,bB ,bC 六种情况,所有基本事件总数为10.[4分] 而事件“|m -n |>2”由6个基本事件即aA ,aB ,aC ,bA ,bB ,bC 组成.所以P (|m -n |>2)=610=35.[6分](2)依题意得到相应的2×2列联表如下:[9分]K 2=50×(24×12-6×8)232×18×30×20≈8.333.由于8.333>6.635,故在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.[12分]评分细则 (1)计算出成绩在两个区间[13,14),[17,18]内的人数给1分,标记给1分;(2)列举基本事件不全扣1分;(3)卡方值计算正确得1分,和临界值比较得1分,写最后结论得1分.阅卷老师提醒 (1)频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征;(2)解决独立性检验问题,要先得到列联表,准确代入公式计算.1. 某校共有学生2 000名,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在( )A.24B .18C .16D .12答案 C解析 由2 000×0.19=380知二年级的学生人数为380+370=750,由于一年级的学生人数为373+377=750,于是三年级的学生人数为2 000-750-750=500,那么三年级应抽取的人数为500×642 000=16(人).2. (2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是 ( )A .众数B .平均数C .中位数D .标准差答案 D解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.3. 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,设回归方程为y =b x +a ,则点(a ,b )在直线x +45y -10=0的( )A .左上方B .左下方C .右上方D .右下方答案 C解析 依题意得,x =18×(10+20+30+40+50+60+70+80)=45,y =18×(62+68+75+81+89+95+102+108)=85.注意到题中的每一组点(x ,y )均位于直线x +45y -10=0的右上方,因此点(a ^,b ^)必位于直线x +45y -10=0的右上方,故选C.4. 高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________. 答案 20解析 由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.5. (2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案 (1)0.004 4 (2)70解析 (1)(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1, ∴x =0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.6. (2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1. (2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析 x男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91, s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6. 2. (2013·湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法答案 D解析 总体(100名学生)中的个体(男、女学生)有明显差异,应采用分层抽样. 3. 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的树木大约有( )A .3 000株B .6 000株C .7 000株D .8 000株答案 C解析 底部周长小于110 cm 的频率为(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的树木大约有10 000×0.7=7 000株,故选C.4. 如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有( )A.a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2大小与m 的值有关答案 B解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.5. 假设学生初一和初二数学成绩是线性相关的.若10个学生初一(x )和初二(y )的数学分数则初一和初二数学分数间的线性回归方程是( )A.y ^=1.218 2x -14.192B.y ^=14.192x +1.218 2C.y ^=1.218 2x +14.192D.y ^=14.192x -1.218 2 答案 A 解析 因为x=71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2.a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.6. (2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取( )A.08 B .07 C .02 D .01答案 D解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3 答案 D解析 逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,0,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.D 中x =2. (x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),x i ∈N *即x i ≤7.8. 有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72答案 B解析 由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10)内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36. 二、填空题9. (2013·山东改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案 367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0) =367. 10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23解析 x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24.x 乙=110×(19+17+11+21+24+22+24+30+32+30)=23.12.以下四个命题,其中正确的是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2(χ2)的值越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,随机变量K 2(χ2)的值越小,说明两个变量有关系的把握程度越小. 三、解答题13.(2013·安徽)为调查甲、乙两校高三年级学生某次联考的数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解 (1)设甲校高三年级学生总人数为n ,由已知条件 30n=0.05,则n =600. 在甲校高三年级抽取的30名学生中成绩在60分及60分以上的人数为25,因此甲校高三年级这次联考的及格率大约是2530=56=83.3%.(2)x 1=[(7+13+24+26+22+2)+40+50×4+60×9+70×9+80×5+90×2]÷30=1 04215;x 2=[(5+14+17+33+20)+40+50×3+60×10+70×10+80×5+90]÷30=2 06930.x 1-x 2=2 08430-2 06930=12.14.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 解 (1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)从题中所给条件可以看出收看新闻节目的共45人,随机抽取5人,则抽样比为545=19,故大于40岁的观众应抽取27×19=3(人).(3)抽取的5名观众中大于40岁的有3人,在20岁到40岁的有2人,记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2)共10个,其中恰有1人为20至40岁的有6个,故所求概率为610=35.。
高中数学知识点总结概率与统计的统计推断

高中数学知识点总结概率与统计的统计推断高中数学知识点总结:概率与统计的统计推断概率与统计是高中数学中的一大重要分支,它涉及到统计推断。
统计推断是通过收集一部分数据来推断总体的特征和规律,从而对未知或难以获得的信息进行预测和判断。
本文将简要介绍概率与统计的统计推断相关的知识点。
一、抽样和抽样分布统计推断的基础是抽样,即从总体中随机选择一部分个体进行研究。
抽样要遵循随机性、代表性和独立性的原则,以确保样本的可靠性和有效性。
抽样分布是指随机抽取的各个样本所对应的统计量的分布。
常见的抽样分布有正态分布、t分布和卡方分布等。
二、参数估计参数估计是利用样本数据对总体的未知参数进行估计和推断的过程。
点估计是基于样本数据得出一个具体的数值作为总体参数的估计值,如样本均值、样本比例等。
区间估计则是确定一个区间,以一定的置信水平对总体参数进行估计,如置信区间。
三、假设检验假设检验是用于检验总体参数假设的方法。
根据已有信息和假设条件,利用样本数据对总体参数进行检验,判断假设是否被接受或拒绝。
假设检验包括原假设和备择假设,常见的检验方法有单样本均值检验、两样本均值检验、单样本比例检验等。
四、相关性与回归分析相关性分析主要研究两个变量之间的相关关系,其中常用的衡量指标是相关系数。
回归分析研究一个或多个自变量对因变量的影响程度和变化趋势。
线性回归是其中最常用的,通过最小二乘法来拟合自变量和因变量之间的线性关系。
五、抽样分布的中心极限定理中心极限定理是指当样本容量足够大时,样本均值的抽样分布逼近于正态分布。
它是统计推断的理论基础,使得我们可以基于样本均值进行正态分布的推断,如置信区间估计和假设检验等。
六、样本调查与调查问卷设计统计推断常常涉及到样本调查和调查问卷设计。
在进行统计推断之前,我们需要明确研究的目的、确定调查对象、设计合理的调查问卷,并通过适当的抽样方法进行样本调查。
合理的样本调查与问卷设计可以提高数据质量和统计结果的可信度。
高中数学概率统计题库及答案解析

高中数学概率统计题库及答案解析随着高中数学概率统计的教学深入,学生们需要更多的练习来巩固所学知识。
因此,一个全面且有针对性的概率统计题库及答案解析就显得尤为重要。
本文将介绍一个高中数学概率统计题库,并提供详细的答案解析,帮助学生更好地掌握该领域的知识。
一、选择题1. 已知事件A和事件B是互不相容的,且P(A)= 0.3,P(AUB) = 0.7,求P(B)的值。
解析:由题意可知 P(AUB) = P(A) + P(B) - P(AB),代入已知条件可得 0.7 = 0.3 + P(B) - 0,从而得到 P(B) = 0.4。
2. 设事件A和事件B相互独立,且P(A) = 1/4,P(B) = 1/3,求P(AB)的值。
解析:由于事件A和事件B相互独立,所以 P(AB) = P(A)P(B),代入已知条件可得 P(AB) = (1/4)(1/3) = 1/12。
二、计算题1. 从1到20中随机选取一个数,求选取的数被3整除的概率。
解析:在1到20中可以被3整除的数有3, 6, 9, 12, 15, 18共6个。
而总的样本空间为20,所以选取的数被3整除的概率为6/20 = 3/10。
2. 甲、乙、丙共参加了一次考试,甲过的概率为0.7,乙过的概率为0.8,丙过的概率为0.9。
已知甲、乙、丙三人中至少有两人过的概率是0.97,求三人中全部过的概率。
解析:设甲、乙、丙三人全部过的概率为 P(甲)P(乙)P(丙),根据题意可得到以下等式:1 - [P(甲) + P(乙) + P(丙) - P(甲)P(乙) - P(甲)P(丙) - P(乙)P(丙)] = 0.97代入已知概率可解得 P(甲)P(乙)P(丙) = 0.51,即三人全部过的概率为0.51。
三、证明题已知事件A和事件B是相互独立的,证明事件A的补事件与事件B的补事件也是相互独立的。
证明:设事件A的补事件为A',事件B的补事件为B'。
高中数学统计与概率知识点

高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型(定量数据与定性数据)2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数(算术平均数)- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。
这篇文章是为了提供一个关于高中数学统计与概率的知识点概览,适用于教育目的。
每个部分都包含了关键的子标题和简短的描述,以便于理解和使用。
高中数学-概率与统计专题

概率与统计专题一:二项分布一、必备秘籍一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (01p <<),用X 表示事件A 发生的次数,则X 的分布列为()(1)k k n k n P X k C p p -==-(0,1,2,k n =)如果随机变量X 的分布列具有上式的形式,则称随机变量X 服从二项分布(binomial distribution ),记作(,)X B n p 。
二、例题讲解1.(2021·全国高三其他模拟)羽毛球是一项隔着球网,使用长柄网状球拍击打用羽毛和软木刷制作而成的一种小型球类的室内运动项目.羽毛球比赛的计分规则:采用21分制,即双方分数先达21分者胜,3局2胜.每回合中,取胜的一方加1分.每局中一方先得21分且领先至少2分即算该局获胜,否则继续比赛;若双方打成29平后,一方领先1分,即算该局取胜.某次羽毛球比赛中,甲选手在每回合中得分的概率为34,乙选手在每回合中得分的概率为14.(1)在一局比赛中,若甲、乙两名选手的得分均为18,求在经过4回合比赛甲获胜的概率;(2)在一局比赛中,记前4回合比赛甲选手得分为X,求X的分布列及数学期望()E X.2.(2021·青铜峡市高级中学高三开学考试(理))设甲、乙两位同学上学期间,.假定甲、乙两位同学到校情况互不影响,且任每天7:30之前到校的概率均为23一同学每天到校情况相互独立.(1)用X表示甲同学上学期间的每周五天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(2)记“上学期间的某周的五天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多3天”为事件M,求事件M发生的概率. 3.(2020·全国高三专题练习(理))一名学生每天骑车上学,从他家到学校的途中有5个交通岗,假设他在各个交通岗遇到红灯的事件是相互独立的,并且概率都是1.3(1)设X为这名学生在途中遇到红灯的次数,求X的分布列、期望、方差;(2)设Y为这名学生在首次停车前经过的路口数,求Y的分布列;(3)求这名学生在途中至少遇到一次红灯的概率.实战练习1.(2021·湖北武汉·)在一次国际大型体育运动会上,某运动员报名参加了其中3个项目的比赛.已知该运动员在这3个项目中,每个项目能打破世,那么在本次运动会上:界纪录的概率都是23(1)求该运动员至少能打破2项世界纪录的概率;(2)若该运动员能打破世界纪录的项目数为X ,求X 的分布列及期望.2.(2021·渝中·重庆巴蜀中学高三开学考试)某医院为筛查某病毒,需要检验血液是不是阳性,现有)(n n N *∈份血液样本,为了优化检验方法,现在做了以下两种检验方式:实验一:逐份检验,则需要检验n 次.实验二:混合检验,将其中m (n *∈N 且2m ≥)份血液样本分别取样混合在一起检验.若检验结果为阴性,这m 份血液样本全为阴性,因而这m 份血液样本只要检验一次就够了;若检验结果为阳性,为了明确这m 份血液样本究竟哪几份为阳性,就要对这m 份血液样本再逐份检验,此时这m 份血液样本的检验次数总共为1m +.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为)(01p p <<.现取其中k (k *∈N 且2k ≥)份血液样本,记釆用逐份检验方式,需要检验的这k 份样本的总次数为1ξ,釆用混合检验方式,需要检验的这k 份样本的总次数为2ξ.(1)若每份样本检验结果是阳性的概率为15P =,以该样本的阳性概率估计全市的血液阳性概率,从全市人民中随机抽取3名市民,(血液不混合)记抽取到的这3名市民血液成阳性的市民个数为X ,求X 的分布列及数学期望(2)若每份样本检验结果是阳性的概率为1p =总次数2ξ的期望值比逐份检验的总次数1ξ的期望值更少,求k 的最大值.(ln 4 1.386≈,ln5 1.609≈,ln 6 1.792≈)3.(2021·全国高三其他模拟(理))新冠疫情这特殊的时期,规定居民出行或出席公共场合均需佩戴口罩,现将A 地区居民20000人一周的口罩使用量统计如表所示,其中1个人一周的口罩使用为6个以及6个上的有14000人.(1)求m 、n 的值;(2)用样本估计总体,将频率视为概率,若从A 地区的所有居民中随机抽取4人,记一周使用口罩数量(单位:个)在范围[)6,8的人数为X ,求X 的分布列及数学期望.4.(2021·新沂市第一中学高三其他模拟)市教育部门为研究高中学生的身体素质与课外体育锻炼时间的关系,对该市某校200名高中学生的课外体育锻炼平均每天锻炼的时间进行了调查,数据如下表:将学生日均课外体育锻炼时间在[40,60]内的学生评价为“课外体育达标”.(1)请根据上述表格中的统计数据填写下面22⨯列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关;(2)从上述课外体育不达标的学生中,按性别用分层抽样的方法抽取10名学生,再从这10名学生中随机抽取3人了解他们锻炼时间偏少的原因,记所抽取的3人中男生的人数为随机变量X,求X的分布列和数学期望;(3)将上述调查所得到的频率视为概率来估计全市的情况,现在从该市所有高中学生中抽取4名学生,求其中恰好有2名学生课外体育达标的概率. 5.(2021·陕西汉中·高三月考(理))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了A树木,某农科所为了研究A树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵A树木,调查得到A树木根部半径x(单位:米)与A树木高度y(单位:米)的相关数据如表所示:(1)求y关于x的线性回归方程;(2)对(1)中得到的回归方程进行残差分析,若某A树木的残差为零,则认为该树木“长势标准”,以此频率来估计概率,则在此片树木中随机抽取80棵,记这80棵树木中“长势标准”的树木数量为X,求随机变量X的数学期望与方差.参考公式:回归直线方程为y bx a=+,其中()()()1122211,n ni i i ii in ni ii ix y nxy x x y yb a y bxx nx x x====---===---∑∑∑∑6.(2021·四川成都·双流中学高三三模(理))从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图.(1)求a 的值并估计该市中学生中的全体男生的平均身高(假设同组中的每个数据用该组区间的中点值代替);(2)从该市的中学生中随机抽取一名男生,根据直方图中的信息,估计其身高在180cm 以上的概率.若从全市中学的男生(人数众多)中随机抽取3人,用X 表示身高在180cm 以上的男生人数,求随机变量X 的分布列和数学期望()E X .7.(2021·安徽安庆一中高三三模(理))安庆市某学校高三年级开学之初增加晚自习,晚饭在校食堂就餐人数增多,为了缓解就餐压力,学校在原有一个餐厅的基础上增加了一个餐厅,分别记做餐厅甲和餐厅乙,经过一周左右统计调研分析:前一天选择餐厅甲就餐第二天选择餐厅甲就餐的概率是25%、选择餐厅乙就餐的概率为75%,前一天选择餐厅乙就餐第二天选择餐厅乙就餐的概率是50%、选择餐厅甲就餐的概率也为50%,如此往复.假设学生第一天选择餐厅甲就餐的概率是23,择餐厅乙就餐的概率是13,记某同学第n 天选择甲餐厅就餐的概率为n P . (1)记某班级的3位同学第二天选择餐厅甲的人数为X ,求X 的分布列,并求E (X );(2)请写出1n P +与(*)n P n N ∈的递推关系;(3)求数列{}n P 的通项公式并帮助学校解决以下问题:为提高学生服务意识和团队合作精神,学校每天从20个班级中每班抽调一名学生志愿者为全体学生提供就餐服务工作,根据上述数据,如何合理分配到餐厅甲和餐厅乙志愿者人数?请说明理由.8.(2021·湖北恩施·高三其他模拟)目前某市居民使用天然气实行阶梯价格制度,从该市随机抽取10户调查同一年的天然气使用情况,得到统计表如下:(1)现要在这10户家庭中任意抽取3户,求抽到的年用气量超过228立方米而不超过348立方米的用户数的分布列与数学期望;(2)若以表中抽到的10户作为样本估计全市居民的年用气情况,现从全市居民中抽取10户,其中恰有k 户年用气量不超过228立方米的概率为()P k ,求使()P k 取到最大值时,k 的值.概率与统计专题二: 超几何分布一般地,假设一批产品共有N 件,其中有M 件次品.从N 件产品中随机抽取n 件(不放回),用X 表示抽取的n 件产品中的次品数,则X 的分布列为2,r其中n ,N ,M N *∈,M N ≤,n N ≤,max{0,}m n N M =-+,min{,}r n M =,则称随机变量X 服从超几何分布.1.公式 C C ()C kn k M N M n NP X k --== 中个字母的含义N —总体中的个体总数M —总体中的特殊个体总数(如次品总数)n —样本容量k —样本中的特殊个体数(如次品数)注意:(1)“由较明显的两部分组成”:如“男生、女生”,“正品、次品”;(2) 不放回抽样;(3) 注意分布列的表达式中,各个字母的含义及随机变量的取值范围。
高中数学概率统计专题练习题及答案

高中数学概率统计专题练习题及答案一、选择题1. 掷一枚骰子,结果为奇数的概率是多少?A. 1/2B. 1/6C. 2/3D. 1/32. 从1至20这20个数字中随机选出一个数,选出的数是素数的概率是多少?A. 1/5B. 1/4C. 1/2D. 2/53. 一只盒子中有5张红牌和3张蓝牌,从中随机抽取2张牌,同时放回,再随机抽取2张牌,求两次抽取都是红牌的概率是多少?A. 1/16B. 3/8C. 1/4D. 1/8二、计算题1. 一次考试中,甲乙丙三位同学都有70%的概率通过考试。
求三位同学中至少有一位通过考试的概率。
答案:1 - (1 - 0.7)^3 = 0.9732. 从1至100这100个数字中随机选出一个数,选出的数是2的倍数且小于等于50的概率是多少?答案:50/100 = 0.53. 有A、B两个车站,A车站开往B车站的列车间隔是15分钟,B车站开往A车站的列车间隔是10分钟。
现在一个人随机到达A车站,请问他至少要等待几分钟才能搭乘到开往B车站的列车?答案:最小公倍数(15, 10) = 30分钟三、应用题1. 每个学生参加一次足球比赛的概率是0.4,问一个班级20个同学中至少有10个学生参加比赛的概率是多少?答案:利用二项分布公式,计算P(X≥10),其中n=20,p=0.4,k≥10。
答案约为0.599。
2. 一批产品有10%的次品率,现从中随机抽取20个产品,求其中恰好有3个次品的概率。
答案:利用二项分布公式,计算P(X=3),其中n=20,p=0.1,k=3。
答案约为0.201。
3. 一支篮球队最近10场比赛中获胜的概率是0.8,在下一场比赛中,求该队至少获胜8次的概率。
答案:利用二项分布公式,计算P(X≥8),其中n=10,p=0.8,k≥8。
答案约为0.967。
以上为高中数学概率统计专题练习题及答案。
希望对您的学习有所帮助!。
高中数学必修二统计概率知识点总结

必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。
高中数学:概率统计专题

高三文科数学:概率与统计专题一、选择题:1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量单位:kg分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为A.13B.12C.23D.343、在一组样本数据x1,y1,x2,y2,…,x n,y n n≥2,x1,x2,…,x n不全相等的散点图中,若所有样本点x i,y i i=1,2,…,n都在直线y=错误!x+1上,则这组样本数据的样本相关系数为A-1 B0 C错误! D14.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为A103 B15C110D1205.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是A.14B.π8C.12D.π46.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是二、填空题:7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______;8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.9.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 由表中数据得回归直线方程错误!=错误!x +错误!中的错误!=-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售;如果当天卖不完,剩下的玫瑰花做垃圾处理;Ⅰ若花店一天购进17枝玫瑰花,求当天的利润y 单位:元关于当天需求量n 单位:枝,n ∈N 的函数解析式;Ⅱ花店记录了100天玫瑰花的日需求量单位:枝,整理得下表: 日需求量n 14 15 16 17 18 19 20 频数102016161513101假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润单位:元的平均数;气温℃ 18 13 10 -1 用电量度243438642若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率;11. 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值75,85 85,95 95,105 105,115 115,125 分组频数 6 26 38 22 8 I在答题卡上作出这些数据的频率分布直方图:II估计这种产品质量指标值的平均数及方差同一组中的数据用该组区间的中点值作代表;III根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定12. 某地区2009年至2015年农村居民家庭人均纯收入y单位:千元的数据如下表:年份2009201020112012201320142015年份代号t1234567人均纯收入y1求y关于t的线性回归方程;2利用1中的回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2017年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:错误!=错误!,错误!=错误!-错误!错误!.13.某省会城市地铁将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:1若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少结果保留2位小数;2由以上统计数据填下面2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.附:K2=错误!14.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸单位:cm .下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.1求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小.2一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.ⅰ从这一天抽检的结果看,是否需对当天的生产过程进行检查ⅱ在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.精确到附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑,0.09≈.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ĸ将编 段 Ĺ在第一段中用简单随机抽样确定起始的个体编 ĺ按 先研究的规则抽取样 . 3 适用范
围 个体数较多的总体. 学科网
例 2 2008 高考广东卷理 3 某校共 学生 2000 ,各 男、女生人数如表.已知在全校学生中随机抽取1 ,
抽到
女生的概率是 0.19 . 用 层抽样的方法在全校抽取 64 学生,则 在
基础知识和基 方法.该部 在高考试卷中,一般是 2—3 个小 和一个解答 . 学科网 考点透析 概率统计的考 要 概率 统计包括随机 件,等可能性 件的概率,互斥 件 一个发生
的概率,古 概型,几何概型,条件概率,独立 复试验
,超几何 ,离散型随机变 的 列,离散
型随机变 的期望和方差,抽样方法,总体 的估计, 态
解析 中 用了系统抽样的方法采确定中奖 码,中奖 码依次 088 ,188 ,288 ,388 ,488 ,588 ,688 ,
788 , 888 , 988 .答案 B. 学科网 评 关于系统抽样要注意如 几个问
1 系统抽样是将总体 均衡几个部 ,然按照预先定 的规则从
一部 抽取一个个体,得到所需要的样 的一种抽样方法. 2 系统抽样的 骤 ķ将总体中的个体随机编
例题解析 学 科网
型 1 抽样方法 学科 网
例 1 在1000 个 机会中奖的 码 编
000 − 999
,线性回 等. 学科网
中,在 证部门 督 按照随机抽取的方法确定 两
数 的 码 中奖 码,该抽样 用的抽样方法是 学科网
A.简单随机抽样 B.系统抽样 C.
层抽样 D.
均
对 学科网
析 实际“间隔距离相等”的抽取,属于系统抽样. 学科 网
好素材.在高考试卷中,概率 统计的内容 都 所涉及, 解答 形式 的试 常常设计 包含离散型随机变
的 列 期望、统计 表的识别等知识 的综合 , 考生比较熟悉的实际 用问 载体, 排列 合和概
率统计等基础知识 工 ,考查对概率 件的识别及概率计算.解答概率统计试 时要注意 类 整合、化 转化、
或然 必然思想的 用. 于中学数学中所学 的概率 统计内容是最基础的,高考对 一部 内容的考查注 考查
抽取的学生人数
学科网
A. 24
B.18
C.16
D.12
学科网
学科网
一
学科网
学科网 学科网
女
生
373
x
y
析 根据给 的概率先求 x 的
男ห้องสมุดไป่ตู้
值, 样就可 知道
的学生人数,
问 就解决了. 学科网
生
377 370 z
解析 C
女生 全校学生总
数的19% ,即 x = 2000× 0.19 = 380 ,
样一 和
(0.0005 + 0.0003)× 500 = 0.4 ,故 收入在[2500,3500) 人数是10000 × 0.4 = 4000 , 学科网
故抽取 25 人. 学科网
评
把统计 表和抽样方法结合起来, 要目的是考查识 和计算能力.
学科网
型 2 统计 表问 学科网
例 4 安徽省皖南 校 2009 届高 第 次联考理科数学第 2 从某校高
解析 于中 数是把样 数据按照 小到大的 序排列起来,处在中间 置的一个 或是最中间两个数的 均
数 ,故从茎 可 看 中 数是 23 而众数是样 数据中 次数最多的数,故众数 是 23 . 学科网
评 一表 频率 表 、
频率 直方 、频率折线 、茎 、 数 众数、中 数、众数 和标
准差,是高考考查统计的一个 要考 . 学科网
评 在解决频率 别直方 问 时容易 的错误是认 直方 中小矩形的高就是各段的频率,实际 小矩形
的高是频率除
距. 学科网
例 5 2009 杭州 第一次高考科目教学质 检测理科第 13 某篮球 员在一个赛季的 40 场比赛中的得
的茎 如 所示,则 数据的中 数是
众数是
.
学科网
学科网
析 根据茎 和中 数、众数的概念解决. 学科网
了样 的频率 直方 如 . 了 析居民的收入 龄、学历、职 等方面的关系,要从 10000 人
中再用 层抽样方法抽 100 人作进一 调查,则在[2500, 3500) 元 收入段 抽
人.
学科网
学科网
析 实际 是 100 人抽取一人,只要把 间内的人数找 来即可. 学科网
解析 根据 可 看 收入在[2500, 3500) 的人数的频率是 学科网
.
学科网
学科网
析 找 频率即可. 学科网
解析 20× (0.040 + 0.0025)×10 = 13 .学科网
评
考查频率 直方 ,解 的关键是明确 个直方 的纵坐标是频率/ 距,得 生产数 在[55, 75)
随机抽取一个班,对该班 50 学
生的高校招生体检表中视力情况进行统计, 结果的频率 直方 如右 若某高校 A 对视力的要求在 0.9
,则该班学生中能报 A
的人数 学科网
学科网
A.10
B. 20
析 根据 找 视力在 0.9
C. 8
D.16
学科网
的人数的频率即可. 学科网
解析 B. 视力 0.9 的频率 (1+ 0.75 + .025) × 0.2 = 0.4 ,人数 0.4× 50 = 20 . 学科网
学生的总数是 373 + 377 + 380 + 370 = 1500 ,
学生 500 人,用 层抽样抽取的
学生 评
是 64 × 500 = 16 .答案 C. 学科网 2000
考查概率统计最基础的知识,
涉及到一
析问 的能力和 算能力, 目 抽样的等可能性
发 考查随机抽样和 层抽样的知识. 学科网
例 3. 2009 泰州期 第 2 一个社会调查机构就某地居民的 收入调查了10000 人,并根据所得数据画
例 5 2008 高考广东文 11 了调查某厂工人生产某种产品的能力,随机抽查了 20 工人某天生产该产品的数
.产品数 的
间 [45,55) ,[55, 65),[65, 75),[75,85) , 学科网
[85, 95) 得到频率 直方 如 ,则 20 工人中一天生产该产品数 在[55, 75) 的人数是
专题二 概率统计专题 学 科网
命题趋向 概率 统计是高中数学的 要学 内容,它是一种处理或然问 的方法,在工 生产和社会生
活中 着广泛的 用,渗 到社会的方方面面,概率 统计的基础知识
个 民的必备常识.概率 统计的引入,
拓广了 用问 取材的范围,概率的计算、离散型随机变 的 列和数学期望的计算及 用都是考查 用意识的良