高中数学专题——概率统计专题

合集下载

高中数学概率统计题型归纳13 超几何分布

高中数学概率统计题型归纳13 超几何分布

专题13 超几何分布例1.有N 件产品,其中有M 件次品,从中不放回地抽n 件产品,抽到的次品数的数学期望值是( ) A .nB .(1)M n N- C .M n ND .(1)M n N+ 【解析】解:设抽到的次品数为X ,则有N 件产品,其中有M 件次品,从中不放回地抽n 件产品,抽到的次品数X 服从超几何分布即~(X H n ,M ,)N ,∴抽到的次品数的数学期望值nMEX N=故选:C .例2.有6个大小相同的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,有如下几种变量:①X 表示取出的最大号码;②Y 表示取出的最小号码;③取出一个黑球记2分,取出一个白球记1分,ξ表示取出的4个球的总得分;④η表示取出的黑球个数,这四种变量中服从超几何分布的是( ) A .①②B .③④C .①②④D .①②③④【解析】解:超几何分布取出某个对象的结果数不定,也就是说超几何分布的随机变量为实验次数,即指某事件发生n 次的试验次数,由此可知③④服从超几何分布. 故选:B .例3.在15个村庄中有7个村庄交通不方便,现从中任意选10个村庄,用X 表示这10个村庄中交通不方便的村庄数,则(4)P X ==140429.(用数字表示) 【解析】解:由题意467810157658714032121(4)151413121142954321C C P X C ⨯⨯⨯⨯⨯⨯⨯⨯====⨯⨯⨯⨯⨯⨯⨯⨯ 故答案为:140429例4.有一批产品,其中有6件正品和4件次品,从中任取3件,至少有2件次品的概率为13. 【解析】解:从10件产品任取3件的取法共有310C ,其中所取的三件中“至少有2件次品”包括2件次品、3件次品,取法分别为2146C C ,34C .因此所求的概率21346431013C C C P C +==.故答案为13.例5.设袋中有8个红球,2个白球,若从袋中任取4个球,则其中恰有3个红球的概率为815. 【解析】解:从袋中10个球中任取4个球,共有410C 种取法,则其中恰有3个红球的取法为3182C C .∴从袋中任取4个球,则其中恰有3个红球的概率3182410815C C P C ==. 故答案为815. 例6.在10件产品中有2件次品,任意抽取3件,则抽到次品个数的数学期望的值是 35. 【解析】解:设抽到次品个数为ξ,则~(3H ξ,2,10) 323105nM E N ξ⨯∴=== 故答案为:35例7.在箱子中有10个小球,其中有3个红球,3个白球,4个黑球.从这10个球中任取3个.求: (1)取出的3个球中红球的个数X 的分布列; (2)取出的3个球中红球个数多于白球个数的概率.【解析】解:(1)由题意知,随机变量X 的所有可能取值为0,1,2,3, 且X 服从参数为10N =,3M =,3n =的超几何分布,因此337310()(0,1,2,3)k kC C P X k k C -===;⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(1分) 所以0337310357(0)12024C C P X C ====,12373106321(1)12040C C P X C ====,2137310217(2)12040C C P X C ====,30373101(3)120C C P X C ===;⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(4分) 所以X 的分布列为:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(6分)(2)设“取出的3个球中红球个数多于白球个数”为事件A ,“恰好取出1个红球和2个黑球” 为事件1A ,“恰好取出2个红球”为事件2A ,“恰好取出3个红球”为事件3A ,⋯⋯⋯⋯⋯(7分) 由于事件1A ,2A ,3A 彼此互斥,且123A A A A =++,而123413103()20C C P A C ==,27()(2)40P A P X ===, 31()(3)120P A P X ===,⋯⋯⋯⋯(10分) 所以取出的3个球中红球个数多于白球个数的概率为: 1233711()()()()20401203P A P A P A P A =++=++=.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(11分) 答:取出的3个球中红球个数多于白球个数的概率为13.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(12分)例8.某班组织知识竞赛,已知题目共有10道,随机抽取3道让某人回答,规定至少要答对其中2道才能通过初试,他只能答对其中6道,试求: (1)抽到他能答对题目数的分布列; (2)他能通过初试的概率.【解析】解:(1)设随机抽出的三道题目某人能答对的道数为X ,且0X =、1、2、3,X 服从超几何分布, 分布列如下:即(2)要答对其中2道才能通过初试,则可以通过初试包括两种情况,这两种情况是互斥的,根据上一问的计算可以得到 112(2)(2)(3)263P X P X P X ==+==+= 例9.某校高二年级某班的数学课外活动小组有6名男生,4名女生,从中选出4人参加数学竞赛考试,用X 表示其中男生的人数,(1)请列出X 的分布列;(2)根据你所列的分布列求选出的4人中至少有3名男生的概率. 【解析】解:(1)依题意得,随机变量X 服从超几何分布, 随机变量X 表示其中男生的人数,X 可能取的值为0,1,2,3,4.464410(),0,1,2,3,4k kC C P X k k C -===. ∴所以X 的分布列为:(2)由分布列可知至少选3名男生, 即8119(3)(3)(4)211442P X P X P X ==+==+=. 例10.某批产品共10件,已知从该批产品中任取1件,则取到的是次品的概率为0.2P =.若从该批产品中任意抽取3件,(1)求取出的3件产品中恰好有一件次品的概率;(2)求取出的3件产品中次品的件数X 的概率分布列与期望.【解析】解:设该批产品中次品有x 件,由已知0.210x=, 2x ∴=⋯(2分)(1)设取出的3件产品中次品的件数为X ,3件产品中恰好有一件次品的概率为12283107(1)15C C P X C ===⋯(4分)(2)X 可能为0,1,2∴383107(0)15C P X C ===7(1)15P X ==21283101(2)15C C P X C ===⋯(10分)X ∴的分布为:则77130121515155EX =⨯+⨯+⨯=⋯(13分) 例11.生产方提供50箱的一批产品,其中有2箱不合格产品.采购方接收该批产品的准则是:从该批产品中任取5箱产品进行检测,若至多有1箱不合格产品,便接收该批产品.问:该批产品被接收的概率是多少?【解析】解:以50箱为一批产品,从中随机抽取5箱,用X 表示“5箱中不合格产品的箱数”,则X 服从超几何分布(5H ,2,50).这批产品被接收的条件是5箱中没有不合格的箱或只有1箱不合格,所以被接收的概率为(1)P X ,即051455_2_48_2_48243(1)_50_50245C C C C P X C C =+=. 答:该批产品被接收的概率是243245. 例12.甲与乙两人掷硬币,甲用一枚硬币掷3次,记下国徽面朝上的次数为m ;乙用一枚硬币掷2次,记下国徽面朝上的次数为n . (1)算国徽面朝上不同次数的概率并填入下表:(2)现规定:若m n >,则甲胜;若n m ,则乙胜.你认为这种规定合理吗?为什么? 【解析】解:(1)根据相互独立事件概率乘法公式得:(2)这种规定是合理的.这是因为甲获胜,则m n>当3m=时,2n=,1,0,其概率为11111 () 84248⨯++=当2m=时,1n=,0,其概率为3119() 82432⨯+=;当1m=时,0n=,其概率为313 8432⨯=;∴甲获胜的概率为1931 832322 ++=若乙获胜,则m n当2n=时,2m=,1,0,其概率为13317() 488832⨯++=;当1n=时,1m=,0,其概率为1318() 28832⨯+=;当0n=时,0m=,其概率为111 4832⨯=;∴乙获胜的概率为7811 3232322 ++=甲和乙获胜的概率相等,即获胜机会相等,所以这种规定是合理的.例13.某热水瓶胆生产的6件产品中,有4件正品,2件次品,正品和次品在外观上没有区别,从这6件产品中任意抽检2件,计算(1)2件都是正品的概率(2)至少有一件次品的概率.【解析】解:从6件产品中,抽取2件的概率有266515 21C⨯==⨯种(1)其中两件都是正品的基本事件有:246C=种故2件都是正品的概率62155 P==(2)由于“抽检的2件产品中有次品”与“2件都是正品”为对立事件故抽检的2件产品中至少有一件次品的概率23155P =-= 即至少有一件次品的概率35.例14.已知10件不同的产品中共有3件次品,现对它们进行一一测试,直到找出所有3件次品为止. (1)求恰好在第5次测试时3件次品全部被测出的概率;(2)记恰好在第k 次测试时3件次品全部被测出的概率为()f k ,求()f k 的最大值和最小值.【解析】解:(1)若恰好在第5次测试时3件次品全部被测出,则第5次取出第3件次品,前4次中有2次是次品,2次是正品;则有124374A C A 种情况,从10件产品中顺序取出5件,有510A 种情况,则第5次测试时3件次品全部被测出的概率124374510120A C A P A ==, (2)根据题意,分析可得k 的范围是39k ,当36k 时,若恰好在第k 次测试时3件次品全部被测出,则第k 次取出第3件次品,前1k -次中有2次是次品,3k -次是正品;而从10件产品中顺序取出k 件,有10kA 种情况,则1312371101()(32)240k k k kA C A f k k k A ---==-+, 则f (3)1120=,f (4)140=,f (5)120=,f (6)112=; 当7k =时,即恰好在第7次测试时3件次品全部被测出,有两种情况,一是第7次取出第3件次品,前6次中有2次是次品,4次是正品;二是前7次没有取出次品,此时也可以测出三件次品,则146737677102(7)15A C A A f A +==; 当8k =时,即恰好在第8次测试时3件次品全部被测出,有两种情况,一是第8次取出第3件次品,前7次中有2次是次品,5次是正品;二是前7次恰有一次次品,第8次取出为合格品,则1571173777378107(8)30A C A A C A f A +==; 当9k =时,即恰好在第9次测试时3件次品全部被测出,此时f (9)1f =-(3)f -(4)f -(5)f -(6)f -(7)f -(8)715= 故1()(3)120min f k f ==,7()(9)15max f k f ==.例15.在袋子中装有10个大小相同的小球,其中黑球有3个,白球有(25,3)n n n ≠个,其余的球为红球.(Ⅰ)若5n =,从袋中任取1个球,记下颜色后放回,连续取三次,求三次取出的球中恰有2个红球的概率;(Ⅱ)从袋里任意取出2个球,如果这两个球的颜色相同的概率是415,求红球的个数; (Ⅲ)在(Ⅱ)的条件下,从袋里任意取出2个球.若取出1个白球记1分,取出1个黑球记2分,取出1个红球记3分.用ξ表示取出的2个球所得分数的和,写出ξ的分布列,并求ξ的数学期望E ξ. 【解析】解:(Ⅰ)设“从袋中任取1个球是红球”为事件A ,则1()5P A =. 所以,22331412(2)()55125P C ==. 答:三次取球中恰有2个红球的概率为12125.⋯(4分) (Ⅱ)设“从袋里任意取出2个球,球的颜色相同”为事件B ,则222372106(1)(7)(6)4()9015n n C C C n n n n P B C -+++-+--===, 整理得:27120n n -+=,解得3n =(舍)或4n =. 所以,红球的个数为3个.⋯(8分)(Ⅲ)ξ的取值为2,3,4,5,6,且242102(2)15C P C ξ===,11432104(3)15C C P C ξ===,1123432101(4)3C C C P C ξ+===,11332101(5)5C C P C ξ===,232101(6)15C P C ξ===.所以ξ的分布列为所以,241111923456151535155E ξ=⨯+⨯+⨯+⨯+⨯=.⋯(13分)。

高中数学概率统计题型归纳05 回归分析

高中数学概率统计题型归纳05 回归分析

专题5 回归分析例1.已知回归方程y=5x+1,则该方程在样本(1,4)处的残差为()A.﹣2B.1C.2D.5【解析】解:当x=1时,y=5x+1=6,∴方程在样本(1,4)处的残差是4﹣6=﹣2.故选:A.例2.研究变量x,y得到一组样本数据,进行回归分析,有以下结论①残差平方和越小的模型,拟合的效果越好;②用相关指数R2来刻画回归效果,R2越小说明拟合效果越好;③在回归直线方程y=−0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y平均减少0.2个单位;④若变量y和x之间的相关系数为r=﹣0.9462,则变量y和x之间的负相关很强.以上正确说法的是①③④.【解析】解:①可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故①正确;②用相关指数R2来刻画回归效果,R2越大说明拟合效果越好,故②错误;③在回归直线方程y=−0.2x+0.8中中,当解释变量x每增加1个单位时,预报变量y平均减少0.2个单位,故③正确;④若变量y和x之间的相关系数为r=﹣0.9462,r的绝对值趋向于1,则变量y和x之间的负相关很强,故④正确.故答案为:①③④.例3.下列命题中,正确的命题有②③.①回归直线y=b x+a恒过样本点中心(x,y),且至少过一个样本点;②用相关指数R2来刻画回归效果,表示预报变量对解释变量变化的贡献率,R2越接近于1说明模型的拟合效果越好;③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适;④两个模型中残差平方和越大的模型的拟合效果越好.【解析】解:①回归直线y=b x+a恒过样本点中心(x,y),不一定过样本点,故①正确;②用相关指数R2来刻画回归效果,表示预报变量对解释变量变化的贡献率,R2越接近于1说明模型的拟合效果越好,正确;③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适,正确;④两个模型中残差平方和越大的模型的拟合效果越差.故④错误,故正确的是②③,故答案为:②③例4.下列命题:①相关指数R2越小,则残差平方和越大,模型的拟合效果越好.②对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”可信程度越大.③残差点比较均匀地落在水平带状区域内,带状区域越宽,说明模型拟合精度越高.④两个随机变量相关性越强,则相关系数的绝对值越接近0.其中错误命题的个数为4.【解析】解:对于①,相关指数R2越小,则残差平方和越大,此时模型的拟合效果越差,所以①错误;对于②,对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”可信程度越小,所以②错误;对于③,残差点比较均匀地落在水平带状区域内,带状区域越宽,说明模型拟合精度越低,所以③错误;对于④,两个随机变量相关性越强,则相关系数的绝对值越接近1,所以④错误.综上知,错误命题的序号是①②③④,共4个.故答案为:4.例5.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(x i,y i)(i=1,2,……,20),其中x i和y i分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得∑20i=1x i=80,∑20i=1y i=4000,∑20i=1(x i−x)2=80,∑20i=1(y i−y)2=8000,∑20i=1(x i−x)(y i−y)=7000.(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;(2)求y关于x的线性回归方程;(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:1年2年3年4年5年使用年限台数款式甲款520151050乙款152010550某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率.根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?参考公式:相关系数r=∑n i=1i−x)(y i−y)√∑i=1(x i−x)∑i=1(y i−y)2.对于一组具有线性相关关系的数据(x i,y i)(i=1,2,……,n),其回归直线y=b x+a的斜率和截距的最小二乘估计分别为:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2,a=y−b x.【解析】解:(1)由题意知相关系数r=∑20i=1i−x)(y i−y)√∑i=1(x i−x)2∑i=1(y i−y)2=√80×8000=78=0.875,因为y与x的相关系数接近1,所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合.(2)由题意可得,b=∑20i=1(x i−x)(y i−y)∑20i=1(x i−x)2=70080=8.75,a=y−b x=400020−8.75×8020=200−8.75×4=165,所以y=8.75x+165.(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用X(单位:万元)的分布列为X﹣50050100P0.10.40.30.2E(X)=﹣50×0.1+0×0.4+50×0.3+100×0.2=30(万元)购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用Y(单位:万元)的分布列为:Y﹣302070120P0.30.40.20.1E(Y)=﹣30×0.3+20×0.4+70×0.2+120×0.1=25(万元)因为E(X)>E(Y),所以该县城选择购买一台甲款垃圾处理机器更划算.例6.某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.据统计该基地的西红柿增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,请计算相关系数r(精确到0.01),并以此判定是否可用线性回归模型拟合y 与x的关系?若是请求出回归直线方程,若不是请说明理由;(2)过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X限制,并有如表关系:周光照量X(单位:小时)30<X<5050≤X≤70n≥2光照控制仪最多可运行台数542若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了5台光照控制仪,求商家在过去50周每周利润的平均值.附:对于一组数据(x1,y1),(x2,y2),……,(x n,y n),其相关系数公式r=∑n i=1i−x)(y i−y)√∑i=1i−x)2∑i=1i−y)2,回归直线y=b x+a的斜率和截距的最小二乘估计分别为:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nxy∑n i=1(x i−x)2,a=y−b x,参考数据√0.3≈0.55,√0.9≈0.95.【解析】解:(1)由已知数据可得x=2+4+5+6+85=5,y=3+4+4+4+55=4,因为∑5i=1(x i−x)(y i−y)=(−3)×(−1)+0+0+0+3×1=6,√∑5i=1(x i−x)2=√(−3)2+(−1)2+02+12+32=2√5,√∑5i=1(y i−y)2=√(−1)2+02+02+02+12=√2.所以相关系数r=∑n i=1i−x)(y i−y)√∑i=1i −x)2√∑i=1i−y)2=2√5⋅√2=√910≈0.95,因为r>0.75,所以可用线性回归模型拟合y与x的关系,因为b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=620=0.3,a=y−b x=2.5,所以回归直线方程y=0.3x+2.5.(2)记商家周总利润为Y元,由条件可得在过去50周里:X>70时,共有10周,只有2台光照控制仪运行,周总利润Y=2×3000﹣3×1000=3000元,当50≤X≤70时,共有35周,有4台光照控制仪运行,周总利润Y=4×3000﹣1×1000=11000元,当X<50时,共有5周,5台光照控制仪都运行,周总利润Y=5×3000=15000元,所以过去50周每周利润的平均值Y=3000×10+11000×35+15000×550=9800元,所以商家在过去50周每周利润的平均值为9800元.例7.湖南省从2021年开始将全面推行“3+1+2”的新高考模式,新高考对化学、生物、地理和政治等四门选考科目,制定了计算转换T分(即记入高考总分的分数)的“等级转换赋分规则”(详见附1和附2),具体的转换步骤为:①原始分Y等级转换;②原始分等级内等比例转换赋分.某校的一次年级统考中,政治、生物两选考科目的原始分分布如表:等级A B C D E比例约15%约35%约35%约13%约2%政治学科各等级对应的原始分区间[81,98][72,80][66,71][63,65][60,62]生物学科各等级对应的原始分区间[90,100][77,89][69,76][66,68][63,65]现从政治、生物两学科中分别随机抽取了20个原始分成绩数据,作出茎叶图:(1)根据茎叶图,分别求出政治成绩的中位数和生物成绩的众数;(2)该校的甲同学选考政治学科,其原始分为82分,乙同学选考生物学科,其原始分为91分,根据赋分转换公式,分别求出这两位同学的转化分;(3)根据生物成绩在等级B的6个原始分和对应的6个转化分,得到样本数据(Y i,T i),请计算生物原始分Y i与生物转换分T i之间的相关系数,并根据这两个变量的相关系数谈谈你对新高考这种“等级转换赋分法”的看法.附1:等级转换的等级人数占比与各等级的转换分赋分区间等级A B C D E原始分从高到低排序的等级人数占比约15% 约35% 约35% 约13% 约2%转换分T 的赋分区间[86,100] [71,85][56,70] [41,55] [30,40]附2:计算转换分T 的等比例转换赋分公式:Y 2−Y Y−Y 1=T 2−T T−T 1.(其中:Y 1,Y 2别表示原始分Y 对应等级的原始分区间下限和上限;T 1,T 2分别表示原始分对应等级的转换分赋分区间下限和上限.T 的计算结果按四舍五入取整).附3:∑ 6i=1(Y i −Y )(T i −T )=74,√∑ 6i=1(Yi −Y)2∑ 6i=1(T i −T)2=√5494≈74.12,r =∑n i=1i −Y)(T i −T)√∑i=1i −Y)2∑i=1i −T)2.【解析】解:(1)根据茎叶图知,政治成绩的中位数为72,生物成绩的众数为73; (2)甲同学选考政治学科的等级为A ,由转换赋分公式:98−8282−81=100−T T−86,解得T =87;乙同学选考生物学科的等级为A ,由赋分转换公式:100−9191−90=100−T T−86,解得T =87;所以甲、乙两位同学的转换分都是87分. (3)由题意知,r =∑n i=1i −Y)(T i −T)√∑ i=1(Y i −Y)2∑ i=1(T i −T)2=7474.12≈0.998, 说法1:等级转换赋分公平,因为相关系数十分接近1,接近函数关系,因此高考这种“等级转换赋分”具有公平性与合理性.说法2:等级转换赋分法不公平,在同一等级内,原始分与转化分是确定的函数关系,理论上原始分与转化分的相关系数为1,在实际赋分过程中由于数据的四舍五入,使得实际的转化分与应得的转化分有一定的误差,极小部分同学赋分后会出现偏高或偏低的现象. (只要说法有道理,都可以得分).例8.某市房管局为了了解该市市民2018年1月至2019年1月期间买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m (单位:平方米,60≤m ≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1﹣13分别对应2018年1月至2019年1月).(Ⅰ)试估计该市市民的购房面积的中位数m0;(Ⅱ)现采用分层抽样的方法从购房面积位于[110,130]的40位市民中随机抽取4人,再从这4人中随机抽取2人,求这2人的购房面积恰好有一人在[120,130]的概率;(Ⅲ)根据散点图选择y=a+b√x和y=c+d lnx两个模型进行拟合,经过数据处理得到两个回归方程,分别为y=0.9369+0.0285√x和y=0.9554+0.0306lnx,并得到一些统计量的值如表所示:y=0.9369+0.0285√x y=0.9554+0.0306lnx ∑13i=1(y i−y i)20.0005910.000164∑13i=1(y i−y)20.006050请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测出2019年12月份的二手房购房均价(精确到0.001).【参考数据】ln2≈0.69,ln3≈1.10,ln23≈3.14,ln25≈3.22,√2≈141,√3≈1.73,√23≈4.80.【参考公式】R2=1−∑ni=1(y i−y i)2∑n i=1(y i−y)2.【解析】解:(I)由频率分布直方图,可得,前三组频率和为0.05+0.1+0.2=0.35,前四组频率和为0.05+0.1+0.2+025=0.6,故中位数出现在第四组,且m0=90+10×0.150.25=96.(Ⅱ)设从位于[110,120)的市民中抽取x人,从位于[120,130]的市民中抽取y人,由分层抽样可知:440=x30=y10,则x=3,y=1,在抽取的4人中,记3名位于[11,120)的市民为A1,A2,A3,位于[120,130]的市民为B则所有抽样情况为:(A1,A2),(A1,A3),(A1,B),(A2,A3),(A2,B),(A3,B)共6种.而其中恰有一人在位于购房面积[120,130]的情况共有3种,故所求概率P=36=12,(III)设模型y=0.9369+0.0285√x和y=0.955+0.0306lnx的相关指数分别为R12,R22,则R12=1−0.0005910.006050,R22=1−0.0001640.006050,显然R12<R22,故模型y=0.9554+0.0306lnx的拟合效果更好.由2019年12月份对应的代码为24,则y=0.9554+0.0306ln24=0.9554+0.0306(3ln2+ln3)≈1.052万元/平方米.例9.某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如表:x2346810132122232425y1322314250565868.56867.56666当0<x≤16时,建立了y与x的两个回归模型:模型①:y=4.1x+11.8;模型②:y=21.3√x−14.4;当x>16时,确定y与x满足的线性回归方程为:y=−0.7x+a.(Ⅰ)根据下列表格中的数据,比较当0<x≤16时模型①、②的相关指数R2,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.回归模型模型①模型②回归方程y=4.1x+11.8y=21.3√x−14.4∑7i=1(y i−y i)2182.479.2(附:刻画回归效果的相关指数R2=1−∑n i=1(y i−y i)2∑n i=1(y i−y)2.)(Ⅱ)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入16元与20亿元时公司实际收益的大小;(附:用最小二乘法求线性回归方程y=b x+a的系数公式b=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2;a=y−b x)(Ⅲ)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%但不超过53%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励4万元.求每台发动机获得奖励的数学期望.(附:随机变量ξ服从正态分布N(μ,σ2),则P(μ﹣σ<ξ<μ+σ)=0.6827,P(μ﹣2σ<ξ<μ+2σ)=0.9545.)【解析】解:(Ⅰ)由表格中的数据,有182.4>79.2,即182.4∑7i=1(y i−y)2>79.2∑7i=1(y i−y)2,∴模型①的R2小于模型②的R2,说明模型②的刻画效果更好.∴当x=16亿元时,科技改造直接收益的预测值为y=21.3×√16−14.4=70.8(亿元);(Ⅱ)由已知可得,x−20=0.5+2+3.5+4+55=3,则x=23,y−60=8.5+8+7.5+6+65=7.2,则y=67.2,∴a=y−0.7x=67.2+0.7×23=83.3,∴当x>16亿元时,y与x满足线性回归方程y=−0.7x+83.3,当x=20亿元时,科技改造直接收益的预测值为y=−0.7×20+83.3=69.3.∴当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>70.8亿元.∴科技改造投入20亿元时,公司的实际收益更大;(Ⅲ)∵P(0.52﹣0.02<X<0.52+0.02)=0.9545,∴P(X>0.50)=1+0.95452=0.97725,P(X≤0.50)=1−0.95452=0.02275,∵P(0.52﹣0.01<X<0.52+0.01)=0.6827,∴P(X>0.53)=1−0.68272=0.15865,∴P(0.50<X≤0.53)=0.97725﹣0.15865=0.8186.设每台发动机获得的奖励为Y(万元),则Y的分布列为:Y024P0.022750.81860.15865∴每台发动机获得的奖励的数学期望为:E(Y)=0×0.02275+2×0.8186+4×0.15865=2.2718(万元).例10.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的 频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2 +77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为 r =0.99→1,线性相关很强,故可以用线性回归直线来 刻画中学生身高与体重的相关, x =145+155+165+175+1855=165,y =45+75+60+53.6+66.45=60,b =∑ 8i=1x i y i −8x⋅y ∑ 8i=1x i 2−8x2=38608+175×66.4−5×165×601000=0.728, a =y −b x =60−0.728×165=−60.12, 所以回归直线方程为:y =0.728x −60.12,(3)残差平方和越小或相关指数 R 2 越接近于1,线性回归模型拟合效果越好.例11.2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)根据散点图选择y =a +b √x 和y =c +dlnx 两个模型进行拟合,经过数据处理得到两个回归方程分别为y ^=0.9369+0.0285√x和y^=0.9554+0.0306lnx,并得到以下一些统计量的值:y^=0.9369+0.0285√x y^=0.9554+0.0306lnx ∑13i=1(y i−y^i)20.0005910.000164∑13i=1(y i−y)20.006050(1)请利用相关指数R2判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年4月购买这个小区m(70≤m≤160)平方米的二手房(欲购房为其家庭首套房).若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问题:(i)估算该购房者应支付的购房金额;(购房金额=房款+税费,房屋均价精确到0.001万元/平方米)(ii)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格=房款)进行征收的.房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为1%;首套面积90平方米以上且140平方米以内(含140平方米)1.5%;首套面积140平方米以上或非首套为3%.参考数据:ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,√2≈1.41,√3≈1.73,√17≈4.12,√19≈4.36.参考公式:相关指数R2=1−∑ni=1(y i−y^i)2∑n i=1(y i−y)2.【解析】解:(1)模型一中,y=0.9369+0.0285√x的残差平方和为0.000591,相关指数为R21−0.0005910.006050≈0.923,模型二中,y=0.9554+0.0306lnx的残差平方和为0.000164,相关指数为 R 21−0.0001640.006050≈0.973,∴ 相关指数较大的模型二拟合效果好些. (2)通过散点图确定2020年4月对应的 x =18, 代入(1)中拟合效果更好的模型二,代入计算 y =0.9554+0.0306ln18 =0.9554+0.0306×(ln 2+2ln 3) =0.9554+0.0306×(0.69+2×1.10) ≈1.044 (万元/平方米),则2020年4月份二手房均价的预测值为1.044(万元/平方米).(i )设该购房者应支付的购房金额 h 万元,因为税费中淵方只需缴纳契税, ①当70⩽m ⩽90 时,契税为计税价格的 1%, 故h =m ×1.044×(1%+1)=1.05444m ; ②当90<m ⩽144 时,契税为计税价格的 1.5%, 故h =m ×1.044×(1.5%+1)=1.05966m ; ③当144<m ⩽160 时,契税为计税价格的 3%, 故h =m ×1.044×(3%+1)=1.07532m ;∴ℎ={1.05444m ,70⩽m ⩽901.05966m ,90<m ⩽1441.07532m ,144<m ⩽160;∴ 当 70⩽m ⩽90 时购房金额为 1.05444m 万元, 当 90<m ⩽144 时购房金额为 1.05966m 万元, 当 144<m ⩽160 时购房金额为 1.07532m 万元.(ii )设该购房者可购买该小区二手房的最大面积为 t 平方米,由(i ) 知,当70⩽m ⩽90时,应支付的购房金额为 1.05444t ,又1.05444t ⩽1.05444×90<100, 又因为房屋均价约为1.044万元/平方米,所以 t <100,所以90⩽t <100, 由1.05966t ⩽100,解得 t ⩽1001.05966,且1001.05966≈94.4,所以该购房者可购买该小区二手房的最大面积为94平方米.例12.某新兴科技公司为了确定新研发的产品下一季度的营销计划,需了解月宣传费x (单位:万元)对月销售量y(单位:千件)的影响,收集了2020年3月至2020年8月共6个月的月宣传费x和月销售量y的数据如表:月份345678宣传费x5678910月销售量y0.4 3.5 5.27.08.610.7现分别用模型①y=b x+a和模型②y=e m x+n对以上数据进行拟合,得到回归模型,并计算出模型的残差如表:(模型①和模型②的残差分别为e1和e2,残差=实际值﹣预报值)x5678910y0.4 3.5 5.37.08.610.7e1﹣0.60.540.280.12﹣0.24﹣0.1e2﹣0.63 1.71 2.10 1.63﹣0.7﹣5.42(1)根据上表的残差数据,应选择哪个模型来拟合月宣传费x与月销售量y的关系较为合适,简要说明理由;(2)为了优化模型,将(1)中选择的模型残差绝对值最大所对应的一组数据(x,y)剔除,根据剩余的5组数据,求该模型的回归方程,并预测月宣传费为12万元时,该公司的月销售量.(剔除数据前的参考数据:x=7.5,y=5.9,∑6i=1x i y i=299.8,∑6i=1x i2=355,z=lny.z≈−1.41,∑6i=1x i y i=−73.10,ln10.7≈2.37,e4.034≈56.49.)参考公式:b=∑ni=1x i y i−nxy∑n i=1x i2−nx2,a=y−b x.【解析】解:(1)应选择模型①,因为模型①每组数据对应的残差绝对值都比模型②的小,残差波动小,残差点比较均匀地落在水平的带状区域内,说明拟合精度高.(2)由(1)知,需剔除第一组数据,则剔除后的x=7.5×6−55=8,y=5.9×6−0.45=7,5xy=280,5x2=320,∑5i=1x i y i=299.8−5×0.4=297.8,∑5i=1x i2=355−25=330.∴b=∑5i=1x i y i−5xy∑5i=1x i2−5x2=297.8−280330−320=1.78,a=y−b x=7−1.78×8=−7.24.得①的回归方程为y=1.78x−7.24,则当x=12时,y=1.78×12−7.24=14.12.故月宣传费为12万元时,该公司的月销售量为14.12千件.例13.新型冠状病毒肺炎COVID﹣19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.如表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.日期代码x12345678累计确诊人数y481632517197122为了分析该国累计感染人数的变化趋势,小王同学分别用两种模型:①y=bx2+a,②y=dx+c对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差e î=y i−y î):经过计算得它∑8i=1(x i−x)(y i−y)=728,∑8i=1(x i−x)2=42,∑8i=1(z i−z)(y i−y)=6868,∑8i=1(z i−z)2=3570,其中z i=x i2,z=18∑8i=1z i.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?附:回归直线的斜率和截距的最小二乘估计公式分别为:b=∑8i=1(x i−x)(y i−y)∑8i=1(x i−x)2,a=y−b x.【解析】解:(1)选择模型①,理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对比较大,所以模型①的拟合效果相对较好;(2)由(1)可知y关于x的回归方程为y=bx2+a,令z=x2,则y=bz+a,由所给的数据可得:z=18(1+4+9+16+25+36+49+64)=25.5,y=18(4+8+16+31+51+71+97+122)=50,b=∑8i=1(z i−z)(y i−y)∑8i=1(z i−z)2=68683570≈1.92,则a=y−b z≈50﹣1.92×25.5=1.04,所以y关于x的回归方程为y=1.92x2+1.04;(3)将x=9代入回归方程,可得y=1.92×92+1.04=156.56≈157(人),所以预测该地区第9天新型冠状病毒感染确诊的累计人数约为157人.例14.H市某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(吨)与相应的生产总成本y(万元)的五组对照数据.产量x(件)12345生产总成本y(万元)3781012(Ⅰ)根据上达数据,若用最小二乘法进行线性模拟,试求y关于x的线性回归方程y=b x+a;参考公式:b=∑ni=1x i y i−nxy∑n i=1x i2−nx2,a=y−b x.(Ⅱ)记第(Ⅰ)问中所求y与x的线性回归方程y=b x+a为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:y=12x2+1.其中模型②的残差图(残差=实际值﹣预报值)如图所示:请完成模型①的残差表与残差图,并根据残差图,判断哪一个模型更适宜作为y关于x的回归方程?并说明理由;(Ⅲ)根据模型①中y与x的线性回归方程,预测产量为6吨时生产总成本为多少万元?【解析】解:(Ⅰ)计算x=15(1+2+3+4+5)=3,y=15(3+7+8+10+12)=8,∑5i=1x i2=12+22+32+42+52=55,∑5i=1x i y i=1⋅3+2⋅7+3⋅8+4⋅10+5⋅12=141,b=∑5i=1x i y i−nxy∑5i=1x i2−nx2=141−5×3×855−5×9=2.1,a=y−b x=8−2.1×3=1.7,因此,回归直线方程为y=2.1x+1.7.(Ⅱ)模型①的残差表为:x12345y3781012 y 3.8 5.9810.112.2 e﹣0.8 1.10﹣0.1﹣0.2画出残差图,如图所示;结论:模型①更适宜作为y关于x的回归方程,因为:理由1:模型①的4个样本点的残差点落在的带状区域比模型②的带状区域更窄;理由2:模型①的4个样本点的残差点比模型②的残差点更贴近进x轴..(不列残差表不扣分,写出一个理由即可得分.)(Ⅲ)根据模型①中y与x的回归直线方程,计算x=6时,y=2.1×6+1.7=14.3,所以预测产量为6吨时生产总成本为14.3万元.例15.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见表:23456年广告投入x(万元)346811年利润y(十万元)根据以上数据,研究人员分别借助甲.乙两种不同的回归模型,得到两个回归方程,方程甲:方程甲:y(1)=b(x﹣1)2+2.75,方程乙:y(2)=c x﹣1.6.(1)求b(结果精确到0.01)与c的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:e î=y i−y î,e î称为相应于点(x i,y i)的残差;年广告投入x(万元)23456年利润y(十万元)346811模型甲估计值y î(1)残差e î(1)模型乙估计值y î(2)残差e î(2)②分别计算模型甲与模型乙的残差平方和Q1及Q2,并通过比较Q1,Q2的大小,判断哪个模型拟合效果更好.【解析】解:(1)设t=(x﹣1)2,则t=15(1+4+9+16+25)=11.∵y=6.4,∴6.4=b×11+2.75,解得b≈0.33.又x=4,∴6.4=c×4−1.6,即c=2.(2)①经计算,可得下表:年广告投入x(万元)23456年利润y(十万元)346811模型甲估计值y î(1) 3.08 4.07 5.728.0311残差e î(1)﹣0.08﹣0.070.28﹣0.030模型乙估计值y î(2) 2.4 4.4 6.48.410.4残差e î(2)0.6﹣0.4﹣0.4﹣0.40.6②Q1=(−0.08)2+(−0.07)2+0.282+(−0.03)2=0.0906.Q2=0.62×2+(−0.4)2×3=1.2.∵Q1<Q2,∴模型甲的拟合效果更好.。

高中数学概率统计练习题

高中数学概率统计练习题

y 2015年12月31日期末复习题(二)一.选择题(共12小题)1.某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,则此样本的容量为()A.40B.80C.160D.3202.某县教育局为了解本县今年参加一次大联考的学生的成绩,从5000名参加今年大联考的学生中抽取了250名学生的成绩进行统计,在这个问题中,下列表述正确的是()A.5000名学生是总体B.250名学生是总体的一个样本C.样本容量是250D.每一名学生是个体3.(2015?抚顺模拟)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法.抽取4个班进行调查,若抽到的最小编号为3,则抽取最大编号为()A.15B.18C.21D.224.一个频率分布表(样本容量为30)不小心倍损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为()A.15B.16C.17D.195.如图是一容量为100的样本的重量的频率分布直方图,则由图可估计样本重量的中位数为()A.11B.11.5C.12D.12.56.某公司在2014年上半年的收入x(单位:万元)与月支出(单位:万元)的统计资料如下表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出Y5.63 5.75 5.82 5.89 6.11 6.18根据统计资料,则()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系7.下列事件是随机事件的是()(1)连续两次掷一枚硬币,两次都出现正面向上.(2)异性电荷相互吸引(3)在标准大气压下,水在1℃时结冰(4)任意掷一枚骰子朝上的点数是偶数.A.(1)(2)B.(2)(3)C.(3)(4)D.(1)(4)8.从装有除颜色外完全相同的2个红球和2个白球的口袋内任取2个球,那么对立的两个事件是()A.至少有1个白球,至少有1个红球B.至少有1个白球,都是红球C.恰有1个白球,恰有2个白球D.至少有1个白球,都是白球9.抛掷一枚质地均匀的硬币,如果连续抛掷2011次,那么第2010次出现正面朝上的概率是()A.B.C.D.10.口袋内装有一些大小相同的红球、白球和黒球,从中摸出1个球,摸出红球的概率是0.42,摸出白球的概率是0.28,那么摸出黒球的概率是()A.0.42B.0.28C.0.3D.0.711.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任取2件,恰有一件次品的概率为()A.0.4B.0.6C.0.8D.112.函数f(x)=x2﹣x﹣2,x∈[﹣5,5],在定义域内任取一点x0,使f(x0)≤0的概率是()A.B.C.D.二.填空题(共4小题)13.在棱长为2的正方体内随机取一点,取到的点到正方体中心的距离大于1的概率.14.从甲、乙、丙、丁四人中任选两名代表,甲被选中的概率为。

(完整版)(最全)高中数学概率统计知识点总结

(完整版)(最全)高中数学概率统计知识点总结

(完整版)(最全)高中数学概率统计知识点总结-CAL-FENGHAI.-(YICAI)-Company One1概率与统计一、普通的众数、平均数、中位数及方差1、 众数:一组数据中,出现次数最多的数。

2、平均数:①、常规平均数:12nx x x x n++⋅⋅⋅+=②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。

4、方差:2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+-二、频率直方分布图下的频率1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。

2、平均数: 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。

4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程:ˆˆˆybx a =+ 其中:1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ;2、ˆ0:b>正相关;ˆ0:b <负相关。

3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。

五、回归分析1、残差:ˆˆi i i ey y =-(残差=真实值—预报值)。

高中数学概率统计(含详细答案)

高中数学概率统计(含详细答案)

1.某初级中学共有学生2000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率. 解:(1)0.192000x= ∴ 380x =(2)初三年级人数为y +z =2000-(373+377+380+370)=500, 现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:48500122000⨯= 名 (3)设初三年级女生比男生多的事件为A ,初三年级女生男生数记为(y ,z ); 由(2)知 500y z += ,且 ,y z N ∈, 基本事件空间包含的基本事件有:(245,255)、(246,254)、(247,253)、……(255,245)共11个事件A 包含的基本事件有:(251,249)、(252,248)、(253,247)、(254,246)、(255,245) 共5个∴ 5()11P A =2.为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问卷调查.6人得分情况如下:5,6,7,8,9,10.把这6名学生的得分看成一个总体. (Ⅰ)求该总体的平均数;(Ⅱ)用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率. 解:(Ⅰ)总体平均数为1(5678910)7.56+++++=. (Ⅱ)设A 表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”. 从总体中抽取2个个体全部可能的基本结果有:(56),,(57),,(58),,(59),,(510),,(67),,(68),,(69),,(610),,(78),,(79),,(710),,(89),,(810),,(910),.共15个基本结果.事件A 包括的基本结果有:(59),,(510),,(68),,(69),,(610),,(78),,(79),.共有7个基本结果. 所以所求的概率为7()15P A =.3.现有8名奥运会志愿者,其中志愿者123A A A ,,通晓日语,123B B B ,,通晓俄语,12C C ,通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组. (Ⅰ)求1A 被选中的概率;(Ⅱ)求1B 和1C 不全被选中的概率.解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={111112121()()()A B C A B C A B C ,,,,,,,,,122131()()A B C A B C ,,,,,,132()A B C ,,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,, 231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,, 322331332()()()A B C A B C A B C ,,,,,,,,}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“1A 恰被选中”这一事件,则M ={111112121()()()A B C A B C A B C ,,,,,,,,,122131132()()()A B C A B C A B C ,,,,,,,,}事件M 由6个基本事件组成, 因而61()183P M ==. (Ⅱ)用N 表示“11B C ,不全被选中”这一事件,则其对立事件N 表示“11B C ,全被选中”这一事件,由于N ={111211311()()()A B C A B C A B C ,,,,,,,,},事件N 有3个基本事件组成, 所以31()186P N ==,由对立事件的概率公式得15()1()166P N P N =-=-=.4.某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.(I )求全班人数及分数在[)90,80之间的频数;(II )估计该班的平均分数,并计算频率分布直方图中[)90,80间的矩形的高; (III )若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率.解:(I )由茎叶图知,分数在[)60,50之间的频数为2,频率为,08.010008.0=⨯ 全班人数为.2508.02= …………3分所以分数在[)90,80之间的频数为42107225=---- …………5分(II )分数在[)60,50之间的总分为56+58=114;分数在[)70,60之间的总分为60×7+2+3+3+5+6+8+9=456;(III )将[)90,80之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为: (1,2),(1,3),(1,4),(1,5),(1,6) (2,3),(2,4),(2,5),(2,6), (3,4),(3,5),(3,6) (4,5),(4,6) (5,6)共15个, …………12分 其中,至少有一个在[90,100]之间的基本事件有9个, …………14分故至少有一份分数在[90,1000]之间的频率是6.0159= …………15分5.袋子中装有编号为b a ,的2个黑球和编号为e d c ,,的3个红球,从中任意摸出2个球。

高中概率专题研究报告

高中概率专题研究报告

高中概率专题研究报告高中概率专题研究报告概率是数学中的一个重要分支,广泛应用于各个领域。

本文主要探讨高中概率专题,包括概率的基本概念、概率的计算方法以及概率在现实生活中的应用。

概率的基本概念包括随机事件、样本空间、事件的概率。

随机事件是在一定条件下可能出现也可能不出现的事件,例如掷骰子、抽卡等。

样本空间是所有可能结果组成的集合,例如掷一个骰子的样本空间就是{1,2,3,4,5,6}。

事件的概率用一个数值表示,表明事件发生的可能性大小,介于0和1之间。

概率的计算方法主要包括频率法、几何概率法和古典概率法。

频率法是通过大量实验得到频率,将频率作为概率的估计值。

例如,通过多次抛掷一枚硬币,统计正面朝上的次数,正面朝上的频率就是正面出现的概率估计值。

几何概率法是通过几何分析得到概率,例如掷一个骰子,正面朝上的概率为1/6。

古典概率法适用于实验次数不确定的情况下,通过样本空间和事件的可能性分析得到概率。

例如掷一个非均匀骰子,掷出1的概率可能是1/4。

概率在现实生活中有着广泛的应用。

例如,在生活中经常会遇到购买彩票的情况。

购买彩票就是一种随机事件,中奖的概率可以通过几何概率法或者频率法进行估算。

又如,在体育比赛中,预测比赛结果也是一个涉及概率的问题。

通过分析参赛队伍的实力、历史表现等因素,可以估算每支队伍获胜的概率。

概率还可以应用于金融领域,例如投资分析中的风险评估,通过概率模型对不同投资方案的风险进行比较和评价。

总结起来,高中概率专题研究了概率的基本概念、计算方法以及在现实生活中的应用。

掌握概率的基本知识和方法,对于提高数学分析和判断能力、促进科学决策具有重要意义。

希望本文对读者对概率这一重要数学概念有所启发,深入了解概率的理论和应用。

高中数学概率与统计的常见题型解析

高中数学概率与统计的常见题型解析

高中数学概率与统计的常见题型解析概率与统计是高中数学中的一门重要课程,也是学生们普遍感觉较难的一部分内容。

在考试中,概率与统计题型占比较大,因此对于这部分知识的掌握至关重要。

本文将结合常见的概率与统计题型,进行解析和说明,帮助高中学生和他们的父母更好地理解和应对这些题目。

一、事件概率计算题事件概率计算题是概率与统计中的基础题型,也是最常见的题型之一。

这类题目要求计算某个事件发生的概率。

例如:【例题】已知一副扑克牌中有52张牌,其中红心牌有13张。

从中随机抽取一张牌,求抽到红心牌的概率。

解析:这是一个典型的事件概率计算题。

根据题目所给的信息,我们知道红心牌有13张,总共有52张牌,因此红心牌的概率为13/52,即1/4。

这类题目的考点在于理解概率的定义,并且能够根据题目给出的条件计算出事件发生的概率。

在解题过程中,可以通过简化分数、约分等方法,使计算更加简便。

二、排列组合题排列组合题是概率与统计中的另一类常见题型,也是较为复杂的题目之一。

这类题目要求计算事件的排列或组合方式。

例如:【例题】某班有10个学生,要从中选出3个学生组成一支篮球队,求不考虑位置的情况下,有多少种不同的组合方式。

解析:这是一个排列组合题。

我们需要从10个学生中选出3个学生,不考虑位置的情况下,即选出的学生是无序的。

根据组合的定义,我们可以使用组合公式C(n,m) = n!/(m!(n-m)!)进行计算。

代入题目的数据,即C(10,3) = 10!/(3!(10-3)!)=120种不同的组合方式。

这类题目的考点在于理解排列和组合的概念,并且能够根据题目给出的条件进行计算。

在解题过程中,可以使用排列组合公式简化计算,同时注意分子和分母的阶乘运算。

三、事件独立性题事件独立性题是概率与统计中的另一个重要题型,也是较为复杂的题目之一。

这类题目要求判断多个事件之间是否独立。

例如:【例题】甲、乙、丙三个人独立地进行一项考试,他们的及格率分别为0.8、0.9和0.7。

高中数学概率统计题型归纳03 频率分布直方图

高中数学概率统计题型归纳03 频率分布直方图

专题3 频率分布直方图例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b ,则( )A .a =0.2,b =2B .a =0.025,b =3C .a =0.3,b =4D .a =0.030,b =3【解析】解:由题得10×(0.005+0.035+a +0.020+0.010)=1,所以a =0.030.在[120,130)之间的学生人数为:100×10×0.030=30人,在[130,140)之间的学生人数为:100×10×0.020=20人,在[120,140)之间的学生人数为:100×(10×0.030+0.020)=50人,又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以成绩在[120,130)之间的学生中抽取的人数应,30×110=3,即b =3,故选:D .例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[70,80) [80,90) [90,100) [100,110) 110,120)频数 14 20 36 18 12 估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )A .100B .98.8C .96.6D .94.4 【解析】解:平均数x →=0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.故选:D .例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )A .86%B .83%C .90%D .84% 【解析】解:利用求加权平均数的公式解得:30×71%+40×85%+50×91%30+40+50=0.84=84%, 故选:D . 例4.已知样本数据x 1,x 2,…,x n (n ∈N *)的平均数与方差分别是a 和b ,若y i =﹣2x i +3(i =1,2,…n ),且样本数据y 1,y 2,…,y n 的平均数与方差分别是b 和a ,则a ﹣b =( )A .1B .2C .3D .4【解析】解:由题意得:{−2a +3=b a =4b ,解得:{a =43b =13,故a ﹣b =1, 故选:A .例5.下面定义一个同学数学成绩优秀的标志为:“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):①甲同学:5个数据的中位数为127,众数为120;②乙同学:5个数据的中位数为125,总体均值为127;③丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8.则可以判定数学成绩优秀同学为( )A .甲、乙B .乙、丙C .甲、丙D .甲、乙、丙 【解析】解:在①中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,故①成立;在②中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故②不成立;在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x 1<x 2<x 3<x 4,则丙的方差为15[(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2+(135﹣128)2]=19.8, ∴(x 1﹣128)2+(x 2﹣128)2+(x 3﹣128)2+(x 4﹣128)2=50,∴(x 1﹣128)2≤50,得|x 1﹣128|≤5,∴x 1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.∴数学成绩优秀有甲和丙2个同学.故选:C .例6.若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( )A .6,6B .9,2C .9,6D .9,4【解析】解:由题意若数据x 1,x 2,…,x n 的平均数x =3,方差s 2=1,可得x 1+x 2+…+x n =3n ,则:2x 1+3+x 2+3+…+x n +3=2(x 1+x 2+…+x n )+3n =9n ,所以数据2x 1+3,2x 2+3,…,2x n +3的平均数为9.又S 2=1n [(x 1﹣3)2+(x 2﹣3)2+…+(x n ﹣3)2]=1,所以[(x 1﹣3)2+(x 2﹣3)2+…+(x n ﹣3)2]=n ,所以1n [(2x 1+3﹣9)2+(2x 2+3﹣9)2+…+(2x n +3﹣9)2]=4n [(x 1﹣3)2+(x 2﹣3)2+…+(x n ﹣3)2]=4, 则数据2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为9,4.故选:D .例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A 区住户满意度评分的频率分布直方图和B 区住户满意度评分的频率分布表.B区住户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数4610128(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由.【解析】解:(Ⅰ)作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A区住户满意度评分比较分散.(Ⅱ)记D表示事件:“A区住户的满意度等级为不满意”,记E表示事件:“B区住户的满意度等级为不满意”,则P(D)=(0.010+0.020+0.030)×10=0.6,P(E)=(0.010十0.015)×10=0.25,所以A区住户的满意度等级为不满意的概率较大.若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【解析】解:(1)由频率分布直方图得第七组的频率为:1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C52=10,他们的分差的绝对值小于10分包含的基本事件个数m=C32+C22=4,∴他们的分差的绝对值小于10分的概率p=mn=410=25.例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.①求直方图中a的值;②试估计该市居民月均用水量的众数、平均数;③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;④如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?【解析】解:①由概率统计相关知识,各组频率之和的值为1,∵频率=(频率/组距)*组距,∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a )=1,解得:a =0.3,∴a 的值为0.3;②由频率分布直方图估计该市居民月均用水量的众数为2+2.52=2.25(吨), 估计该市居民月均用水量的平均数为:0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,∴全市月均用水量不低于3吨的人数为:30×12%=3.6(万);④由频率分布直方图得月均用水量低于2.5吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,月均用水量低于3吨的频率为:0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,∴x =2.5+0.5×0.85−0.730.3×0.5=2.9(吨).例10.如图是某校高三(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.(1)求全班人数以及频率分布直方图中的x,y;(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).【解析】解:(1)分数在[50,60)的频率为0.020×10=0.2,由茎叶图知,分数在[50,60)之间的频数为5,所以全班人数为50.2=25(人);分数在[90,100)之间的频数为2,由225=10y,解得y=0.008;又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.(2)由频率分布直方图,计算平均数为x=55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,解得m≈71.67,所以中位数约为71.67.例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.数据一:身高在[170,180)(单位:cm)的体重频数统计体重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数206010010080201010数据二:身高所在的区间含样本的个数及部分数据身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均体重y(kg)4553.66075(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:cm)的中学生的平均体重;(保留小数点后一位)(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)参考公式:b=∑ni=1(x i−x)(y i−y)∑n i=1(x i−x)2=∑ni=1x i y i−nx⋅y∑n i=1x i2−nx2,a=y−b x.参考数据:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的总人数为:20+60+100+100+80+20+10+10=400,体重在[55﹣60)的频率为:60400=0.15,体重在[70﹣75)的频率为:80400=0.2,平均体重为:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来刻画中学生身高与体重的相关,x=145+155+165+175+1855=165,y=45+75+60+53.6+66.45=60,b=∑8i=1x i y i−8x⋅y∑8i=1x i2−8x2=38608+175×66.4−5×165×601000=0.728,a=y−b x=60−0.728×165=−60.12,所以回归直线方程为:y=0.728x−60.12,(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:t),频数分布如下:分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]频数4815222514642(1)根据所给数据将频率分布直方图补充完整(不必说明理由);(2)根据频率分布直方图估计本市居民月均用水量的中位数;(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).【解析】解:(1)频率分布直方图如图所示:(2)∵0.04+0.08+0.15+0.22=0.49<0.5,∴中位数为2+0.5−0.490.25×0.5=2.02,(3)由频率分布直方图得平均数为:0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02.例13.某地区100居民的人均用水量(单位:t)的分组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?为什么?【解析】解:(1 )分组频数频率[0,0.5 )40.04[0.5,1 )80.08[1,1.5 )150.15[1.5,2 )220.22[2,2.5 )250.25[2.5,3 )140.14[3,3.5 )60.06[3.5,4 )40.04[4,4.5 )20.02(2):频率分布直方图如下图,由图知,这组数据的众数为2.25.(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】解:(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,∵中位数要平分直方图的面积,∴n=70+0.5−0.40.03=73.3(7分)(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,频率和为(0.015+0.03+0.025+0.005)*10=0.75所以,抽样学生成绩的合格率是75% (11分)利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71估计这次考试的平均分是71分.(14分)例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案, 甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元. (Ⅰ)请分别求出这两种薪酬方案中日薪y (单位:元)与送货单数n 的函数关系式;(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格: 日均派送单数 50 54 56 58 60 频数(天) 23221回答下列问题:①根据以上数据,设每名派送员的日薪为X (单位:元),试分别求出这10天中甲、乙两种方案的日薪X 的平均数及方差;②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:172=289,372=1369) 【解析】解:(1)甲方案,y =100+n ;乙方案,y ={150,n ≤5510n −400,n >55.(2),①甲方案中,根据已知表格可计算出日平均派送单数为2×50+3×54+2×56+2×58+6010=55,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8, 所以,由(1)中变量之间的关系,可以指,甲方案的日薪X 的平均数为155,方差为9.8.乙方案中,日薪X 的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱“可回收垃圾”箱“有害垃圾”箱“其他垃圾”箱厨余垃圾300703080可回收垃圾302103030有害垃圾20206020其他垃圾10201060(1)分别估计厨余垃圾和有害垃圾投放正确的概率;(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d 的值(结论不要求证明),并求此时s2的值.【解析】解:(1)根据题意,厨余垃圾共300+70+30+80=480吨,其中投放正确的有300吨,则厨余垃圾投放正确的概率P1=300480=58,有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,则害垃圾投放正确的概率P2=60120=12;(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,则其平均数x=8004=200,则其方差S2=14[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],当a=600,b=c=d=0时,s2最大,而x=a+b+c+d4=200,此时s2=14[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:学生编号12345678高一阶段幸福指数9593969497989695学生编号12345678高二阶段9497959695949396幸福指数(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.【解析】解:(1)8名学生在高一阶段的幸福指数的平均数为:x=18(95+93+96+94+97+98+96+95)=95.5,方差为:S12=18∑8i=1(x i−x1)2=2.25,8名学生在高二阶段的幸福指数的平均数为:y=18(94+97+95+96+95+94+93+96)=95,方差为:S22=18∑8i=1(y i−y)2=1.5;(2)①∵x>y,∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,②∵S12>S22,∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.新材料产业是重要的战略性新兴产业,如图是我国2011﹣2019年中国新材料产业市场规模及增长趋势图.其中柱状图表示新材料产业市场规模(单位:万亿元),折线图表示新材料产业市场规模年增长率(%).(1)求从2012年至2019年,每年新材料产业市场规模年增长量的平均数(精确到0.1);(2)从2015年至2019年中随机挑选两年,求两年中至少有一﹣年新材料产业市场规模年增长率超过20%的概率;(3)由图判断,从哪年开始连续三年的新材料产业市场规模的方差最大.(结论不要求证明)【解析】解:(1)从2012年起,每年新材料产业市场规模的年增加值依次为:0.3,0.2,0.3,0.5,0.6,0.4,0.8,0.6,(单位:万亿元),∴年增加的平均数为:0.3+0.2+0.3+0.5+0.6+0.4+0.8+0.68=0.5万亿元.(2)设A表示事件“从2015年至2019年中随机挑选两个,两年中至少有一年新材料产业市场规模增长率超过20%”,依题意P(A)=1−C22C52=910.(3)从2017年开始连续三年的新材料产业市场规模的方差最大.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题二 概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产

和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用. 由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有

一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等. 【例题解析】

题型1 抽样方法 【例1】在1000个有机会中奖的号码(编号为000999)中,在公证部门监督下按照随机抽取的方法确定后两位数为的号码为中奖号码,该抽样运用的抽样方法是 ( ) A.简单随机抽样 B.系统抽样 C. 分层抽样 D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B.

点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2) 系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( ) A.24 B.18 C.16 D.12

分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. 解析:C 二年级女生占全校学生总数的19%,即20000.19380x,这样一年级和二年级学生的总数是3733773803701500,三年级学生

有500人,用分层抽样抽取的三年级学生应是64500162000.答案C. 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,

要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在2500,3500(元)月收入段应抽出 人.

一年级 二年级 三年级 女生 373

x

y

男生 377 370

z 分析:实际上是每100人抽取一人,只要把区间内的人数找出来即可. 解析:根据图可以看出月收入在2500,3500的人数的频率是

0.00050.00035000.4,故月收入在2500,3500人数是100000.44000,

故抽取25人. 点评:本题把统计图表和抽样方法结合起来,主要目的是考查识图和计算能力. 题型2统计图表问题 例4(安徽省皖南八校2009届高三第二次联考理科数学第2题)从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如右图:若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为

A.10 B.20 C.8 D.16 分析:根据图找出视力在0.9以上的人数的频率即可.

解析:B. 视力住0.9以上的频率为(10.75.025)0.20.4,人数为0.45020. 点评:在解决频率分别直方图问题时容易出现的错误是认为直方图中小矩形的高就是各段的频率,实际上小矩形的高是频率除以组距. 例5 (2009年杭州市第一次高考科目教学质量检测理科第13题)某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如图所示,则这组数据的中位数是 ;众数是 .

分析:根据茎叶图和中位数、众数的概念解决. 解析:由于中位数是把样本数据按照由小到大的顺序排列起来,处在中间位置的一个(或是最中间两个数的平均数),故从茎叶图可以看出中位数是23;而众数是样本数据中出现次数最多的数,故众数也是23. 点评:一表(频率分布表)、三图(频率分布直方图、频率折线图、茎叶图)、三数(众数、中位数、众数)和标准差,是高考考查统计的一个主要考点. 例5(2008高考广东文11)为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为45,55,55,65,65,75,75,85,



85,95由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在55,75 的人数

是 .

分析:找出频率即可. 解析: 200.0400.00251013. 点评:本题考查频率分布直方图,解题的关键是明确这个直方图上的纵坐标是频率/组距,得出生产数量在55,75的人数的频率. 题型3 平均数、标准差(方差)的计算问题 例6 (2008高考山东文9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100 人成绩的标准差为( )

A.3 B.2105 C.3 D.85 分析:根据标准差的计算公式直接计算即可. 解析: 平均数是5204103302301103100, 标准差是 222222053104330333023101310080103040821010055s



答案B. 点评:本题考查数据组的平均数和标准差的知识,考查数据处理能力和运算能力.解题的关键是正确理解统计表的意义,会用平均数和标准差的公式,只要考生对此认识清楚,解答并不困难.

例7.(中山市高三级2008—2009学年度第一学期期末统一考试理科第9题)若数据123,,,,nxxxx的

平均数5x,方差22,则数据12331,31,31,,31nxxxx的平均 数为 ,方差为 . 分析:根据平均数与方差的性质解决.

解析:16,18 例8.(浙江宁波市2008学年度第一学期期末理科第3题)如图是2009年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 A. 84,4.84 B.84,1.6 C. 85,1.6 D.85,4

解析:C 题型4 用样本估计总体 例8(2008高考湖南文12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:

则该地区生活不能自理的老人中男性比女性约多_____________人. 解析:60 由上表得23211500023060.500 点评:考查样本估计总体的思想. 题型5.线性回归分析

例9.(2007高考广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据

3 6

2.5 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ybxa; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?

分析:本题中散点图好作,本题的关键是求y关于x的线性回归方程ybxa,它既可以由给出的回归系数公式直接计算,也可以遵循着最小二乘法的基本思想――即所求的直线应使残差平方和最小,用求二元函数最值的方法解决. 解析: (1)散点图如右; (2)方法一:设线性回归方程为ybxa,则

222222222(,)(32.5)(43)(54)(64.5)42(1814)(32.5)(43)(54)(64.5)fabbabababaaabbbab



∴793.54.52bab时, (,)fab取得最小值2222(1.51)(0.50.5)(0.50.5)(1.51)bbbb, 即22250.5[(32)(1)]572bbbb,∴0.7,0.35ba时,fab取得最小值. 所以线性回归方程为0.70.35yx. 方法二:由系数公式可知,266.544.53.566.5634.5,3.5,0.758644.5xyb 93.50.70.352a,所以线性回归方程为0.70.35yx.

(3)100x时,0.70.3570.35yx,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤. 点评:本题考查回归分析的基本思想.求线性回归方程的方法一这实际上是重复了回归系数公式的推导

过程,这里的另一个解决方法是对,fab我们再按b集项,即

22222,86(36133)2.5344.5fabbabaaaa,而这个时候,当

13336172ab时,fab有最小值,结合上面解法中3.54.5ab时,fab有最小值,组成方程组就

可以解出a,b的值;方法二前提是正确地使用回归系数的计算公式,一般考试中都会给出这个公式,但要注意各个量的计算;最后求出的19.65是指的平均值或者是估计值,不是完全确定的值.对于本题我们

可以计算题目所给的数据组的相关系数0.9899r,相关指数20.98R.这说明x,y具有很强的线性相关性,说明解释变量对预报变量的贡献率是98%,即耗煤量的98%是来自生产量,只有约2%来自其它因素,这与我们的直观感觉是十分符合的.本题容易用错计算回归系数的公式,或是把回归系数和回归常数弄颠倒了. 例10.(江苏扬州市2008-2009学年度第一学期期未调研测试第17题)为了分析某个高三学生的学习状

相关文档
最新文档