高考一轮复习《统计(第一课时)》
2019届高考数学一轮复习第九章算法初步、统计与统计案例第1节算法初步第1节算法与框图练习新人教A版

第九章第1节算法与框图[基础训练组]1.(导学号14577834)阅读如图所示的程序框图,运行相应的程序,输出S的值为( )A.15 B.105C.245 D.945解析:B [逐次计算的结果是T=3,S=3,i=2;T=5,S=15,i=3;T=7,S=105,i=4,此时输出的结果为S=105.选B.]2.(导学号14577835)执行如图所示的程序框图,如果输入的t∈[-1,3],则输出的s 属于( )A.[-3,4] B.[-5,2]C.[-4,3] D.[-2,5]解析:A [当-1≤t<1时,s=3t,则s∈[-3,3).当1≤t≤3时,s=4t-t2.函数在[1,2]上单调递增,在[2,3]上单调递减.∴s∈[3,4].综上知s∈[-3,4].故选A.] 3.(导学号14577836)(2018·郴州市二模)秦九韶是我国南宋时期的数学家,普州(现四川省安岳县)人,他在所著的《数书九章》中提出的多项式求值的秦九韶算法,至今仍是比较先进的算法.如图所示的程序框图给出了利用秦九韶算法求多项式值的一个实例,若输入n,x的值分别为3,2,则输出v的值为( )A .35B .20C .18D .9解析:C [输入n ,x 的值分别为3,2,v 初始化赋值为1,则i =2,满足循环控制条件,执行循环体得v =4,i =1;仍然满足循环控制条件,继续执行循环体得v =9,i =0,还满足循环控制条件,再执行循环体得v =18,i =-1,此时不满足进行循环控制条件,退出循环,输出的v 值为18.故选C.]4.(导学号14577837)(2018·南昌市一模)执行如图所示的程序框图,输出S 的值为( )A .log 210-1B .2log 23-1 C.92D .6解析:B [由于log 2i +1i =12[log 2(i +1)-log 2i ],所以程序运行可得:当i =7时,进入循环,有S =3+12[log 221+log 232+…+log 287]=3+12[(log 22-log 21)+(log 23-log 22)+…+(log 28-log 27)]=92,当i =8时退出循环,输出S =log 292=2log 23-1.故选B.]。
高三数学人教版A版数学(理)高考一轮复习教案变量间的相关关系、统计案例1

第四节 变量间的相关关系、统计案例变量间的相关关系、统计案例 1.变量间的相关关系(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)回归方程为y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x 2,a ^=y -b ^x . (3)通过求Q =∑ni =1(y i -bx i -a )2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.易误提醒1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x ,y )点,可能所有的样本数据点都不在直线上 .3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).[自测练习]1.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( )x 0 1 3 4 y2.24.3 4.86.7A.3.25 B .2.6 C .2.2D .0解析:∵回归直线必过样本点的中心(x ,y ),又x =2,y =4.5,代入回归方程,得a ^=2.6.答案:B2.(2016·镇江模拟)如图所示,有A ,B ,C ,D ,E 5组(x ,y )数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D . 答案:D知识点二 独立性检验 独立性检验假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.[自测练习]3.下面是2×2列联表:y1y2总计x1 a 2173x2222547总计 b 46120则表中a,b的值分别为()A.94,72B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.答案:C考点一相关关系的判断|1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3解析:易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.答案:A2.(2015·高考湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1,x的系数为负,故x与y负相关;而y与z正相关,故x与z 负相关.答案:C相关关系的判断的两种方法(1)散点图法.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.考点二回归分析|(2015·高考全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑8i =1(x i -x)2∑8i =1(w i -w)2∑8i =1(x i -x )(y i-y )∑8i =1(w i -w )(y i -y ) 46.6 563 6.8 289.8 1.6 1 469108.8表中w i =x i ,w =18∑i =1w i.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于 d ^=∑8i =1(w i -w )(y i -y )∑8i =1 (w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6, 年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归直线方程的求法(1)利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心求系数.1.(2016·银川一中模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.x 3 4 5 6 y2.5344.5(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^. (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤,试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由对照数据,计算得∑4i =1x 1y 1=66.5,∑4i =1x 21=32+42+52+62=86,x =4.5,y =3.5,b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,所求的回归方程为y ^=0.7x +0.35.(2)x =100,y ^=100×0.7+0.35=70.35,预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).考点三 独立性检验|(2016·邯郸模拟)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.常喝 不常喝 合计 肥胖 2 不肥胖 18 合计30已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2≥k 0 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .[解] (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计102030(2)由已知数据可求得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽出一男一女的概率是P =815.解独立性检验的应用问题的关注点(1)两个明确: ①明确两类主体; ②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表; ②准确理解K 2.提醒:准确计算K 2的值是正确判断的前提.2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男 女 总计 走天桥 40 20 60 走斑马线 20 30 50 总计6050110K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A .有99%以上的把握认为“选择过马路的方式与性别有关”B .有99%以上的把握认为“选择过马路的方式与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关” 解析:K 2=110×(40×30-20×20)260×50×60×50≈7.8.P (K 2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.答案:A12.独立性检验与概率交汇综合问题的答题模板【典例】(12分)(2016·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)判断是否有(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)[规范解答](1)由公式K2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,(3分) 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)(2)设所抽样本中有m个男生,则630=m20,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)所以恰有1个男生和1个女生的概率为815.(12分)[模板形成]分析2×2列联表数据↓利用K 2公式计算K 2值↓对分类变量的相关性作出判断↓求相应事件的概率↓反思解题过程,注意规范化[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:(1)加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d );其中n =a +b +c +d .解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是2250=1125;抽到不参加社团活动且学习积极性一般的学生的概率是2050=25.(2)因为K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(17×20-5×8)225×25×22×28≈11.688>10.828,所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.A 组 考点能力演练1.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0 B.a >0,b <0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析:把样本数据中的x ,y 分别当作点的横、纵坐标,在平面直角坐标系xOy 中作出散点图(图略),由图可知b ^<0,a ^>0.故选B.答案:B2.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y^=-0.3x +4.4解析:依题意知,相应的回归直线的斜率应为正,排除C ,D.且直线必过点(3,3.5),代入A ,B 得A 正确.答案:A3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .则下面的正确结论是( )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k 0=100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.答案:A4.根据如下样本数据:得到的回归方程为y =b x +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位解析:依题意得,a +b -25=0.9,故a ^+b ^=6.5①;又样本点的中心为(5,0.9),故0.9=5b ^+a ^②,联立①②,解得b ^=-1.4,a ^=7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位,故选B.答案:B5.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b ^=∑6i =1x i y i -6x ·y ∑6i =1x 2i -6x2=58-6×72×13691-6×⎝⎛⎭⎫722=57,a ^=y -b ^x =136-57×72=-13,所以b ^<b ′,a ^>a ′.答案:C6.(2016·忻州联考)已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为________. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.答案:-0.617.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:(请用百分数表示).解析:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=50×(20×15-5×10)225×25×30×20≈8.333>7.879.答案:0.5%8.已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.解析:回归直线y ^=4x +242必过样本点的中心点(x ,y ),而x =2+3+4+5+65=4,y =251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.答案:2629.(2015·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类合计 50岁以下 50岁以上 合计(2)能否有99% 解:(1)2×2列联表如下:主食蔬菜主食肉类合计 50岁以下 4 8 12 50岁以上 16 2 18 合计201030(2)因为K 2=30×(8-128)212×18×20×10=10>6.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.10.(2015·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t12345(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 附:回归方程y ^=b ^t +a ^中, b ^=∑ni =1t i y i -n t y ∑ni =1t 2i -n t2,a ^=y -b ^t .解:(1)列表计算如下这里n =5,t =1n ∑n i =1t i =155=3,y =1n ∑n i =1y i =365=7.2. 又l tt =∑ni =1t 2i -n t2=55-5×32=10,l ty =∑ni =1t i y i-n t y =120-5×3×7.2=12,从而b ^=l ty l tt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).B 组 高考题型专练1.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C.12.0万元D.12.2万元^=0.76,∴a^=8-0.76×10=0.4,∴回归方程为y^=0.76x 解析:∵x=10.0,y=8.0,b+0.4,把x=15代入上式得,y^=0.76×15+0.4=11.8(万元),故选B.答案:B2.(2015·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.答案:乙数学。
高考数学一轮复习《统计》练习题(含答案)

高考数学一轮复习《统计》练习题(含答案)一、单选题1.已知条件p :11x -<<,q :x >m ,若p 是q 的充分不必要条件,则实数m 的取值范围是( ) A .[)1,-+∞B .(),1-∞-C .()1,0-D .(],1-∞-2.下表为随机数表的一部分:08015 17727 45318 22374 21115 78253 77214 77402 43236 00210 45521 64237已知甲班有60位同学,编号为00~59号,规定:利用上面的随机数表,从第1行第4列的数开始,从左向右依次读取2个数,则抽到的第8位同学的编号是( ) A .11B .15C .25D .373.一组数据的方差为()20S S ≥,将该组数据都乘以2,所得到的一组新数据的标准差为( )A .22S B .SC .2SD .2S4.甲、乙两所学校的男女生比例如图所示,已知甲校学生总数为1500,乙校学生总数为1000,下列结论错误的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲校女生比乙校男生少5.某校共有学生3000人,为了解学生的身高情况,用分层抽样的方法从三个年级中抽取容量为100的样本,其中高一抽取40人,高二抽取30人,则该校高三学生人数为( ) A .600B .800C .900D .12006.设某高中的男生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据()(12)i i x y i n =,,,,,用最小二乘法建立的回归方程为ˆ0.8580.71y x =-,则下列结论中不正确的是( ) A .y 与x 有正的线性相关关系B .回归直线过样本点的中心(),x yC .若该高中某男生身高增加1cm ,则其体重约增加0.85kgD .若该高中某男生身高为170cm ,则可断定其体重必为63.79kg 7.x 是12100,,,x x x 的平均值,5为4120,,,x x x 的平均值,10为4142100,,,x x x 的平均值,则x =( ) A .8B .9C .15D .1528.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.769.某样本点)()(,1,2,,i i x y i n =⋅⋅⋅的经验回归方程为ˆ0.50.7yx =+,当8x =时,y 的实际值为4.5,则当8x =时,预测值与实际值的差值为( ). A .0.1B .0.2C .0.3D .0.410.若数据9,m ,6,n ,5的平均数为7,方差为2,则数据11,9,21m -,17,21n -的平均数和方差分别为( ) A .13,4B .14,4C .13,8D .14,811.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )A .甲的化学成绩领先年级平均分最多.B .甲有2个科目的成绩低于年级平均分.C .甲的成绩最好的前两个科目是化学和地理.D .对甲而言,物理、化学、地理是比较理想的一种选科结果.12.冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产,某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3℃,则称没有发生群体性发热,下列连续7天体温高于37.3℃人数的统计特征数中,能判定该公司没有发生群体性发热的为( )(1)中位数为3,众数为2 (2)均值小于1,中位数为1(3)均值为3,众数为4 (4)均值为2 A .(1)(3)B .(3)(4)C .(2)(3)D .(2)(4)二、填空题13.某校高一、高二、高三年级的学生人数之比为5:5:4,现按年级用分层抽样的方法抽取若干人,若抽取的高三年级的学生人数为20,则抽取的样本容量为______.14.已知具有线性相关的变量x 、y ,设其样本点为()(1,2,,,8)i i i A x y i =,回归直线方程为1ˆ2yx b =+,若128(6,2)OA OA OA +++=(O 为原点),则b =_______.15.已知一组数据按顺序排列为:12,16,20,n ,46,51,58,60.若这组数据的第30百分位数的两倍与这组数据的第50百分位数相等,则n 的值为___________.16.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中的数据得线性回归方程为y bx a =+,其中20b =-,预测当产品价格定为9.5(元)时,销量约为__________件.三、解答题17.某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92.(1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.18.由于疫情影响,今年我们学校开展线上教学,高一年级某班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是0.15,0.25,0.35,0.20,0.05,则根据直方图所提供的信息:(1)这一天上网学习时间在100~119分钟之间的学生有多少人?(2)估计这40位同学的线上平均学习时间(同一组中的数据用该组区间的中点值为代表)以及中位数分别是多少?(精确到0.1)(3)如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?为什么?19.省政府坚持以习近平新时代中国特色社会主义思想为指导,落实全国、全省教育大会部署,坚持社会主义办学方向,落实立德树人根本任务,发展素质教育,推进育人方式变革,引导全社会树立科学的教育质量观和人才培养观,切实减轻有损中小学生身心健康的过重学业负担,遵循教育教学规律,促进中小学生健康成长,培养德智体美劳全面发展的社会主义建设者和接班人.从某市抽取1000名一年级小学生进行调查,统计他们每周做作业的时长(单位:小时),根据结果绘制的频率分布直方图如下:(1)根据频率分布直方图,求所有被抽查小学生每周做作业的平均时长和中位数;(同一组中的数据用该组区间的中点值作代表)(2)①为了进一步了解,现采用分层抽样的方法从[8,10]和[10,12]组中抽取50名学生,则两组各抽取多少人?②再利用分层抽样从抽取的50人中选5人参加一个座谈会.现从参加座谈会的5名学生中随机抽取两人发言,求[8,10]小组中恰有2人发言的概率?20.为了调查某地区高中女生的日均消费情况,研究人员随机抽取了该地区5000名高中女生作出调查,所得数据统计如下图所示.(1)求a 的值以及这5000名高中女生的日均消费的平均数(同一组数据用该组区间的中间值代替);(2)在样本中,现按照分层抽样的方法从该地区消费在[)15,20与[)20,25的高中女生中随机抽取9人,若再从9人中随机抽取3人,记这3人中消费在[)15,20的人数为X ,求X 的分布列以及数学期望.21.道德与法律的联系:法律、道德都是行为规范,都是为规范人们的行为而规定的行动准则.1.法律需要道德的奠基和撑持;2.道德的实施需要法律的强制保障.某校进行了一次道德与法律的相关测试(满分:100分),并随机抽取了50个统计其分数,得到的结果如下表所示: 成绩/分 [)0,20[)20,40[)40,60[)60,80[)80,100人数/个 44102210(1)若同一组数据用该区间中点值作代表,试估计这次测试的平均分和中位数(所得结果四舍五入保留整数);(2)假设处于[)20,40的4个人的成绩分别为20,26,35,38,求表中成绩的10%分位数; (3)以频率估计概率,若在这个学校中,随机挑选3人,记3人的成绩在[)80,100间的数量为随机变量X ,求X 的分布列和数学期望()E X .22.某校从高三年级学生中随机抽取100名学生的某次数学考试成绩,将其成绩分成[)50,60,[)60,70,[)70,80,[)80,90,[]90,100的5组,制成如图所示的频率分布直方图.(1)求图中x 的值;(2)估计这组数据的平均数;(3)若成绩在[)50,60内的学生中男生占40%.现从成绩在[)50,60内的学生中随机抽取2人进行分析,求2人中恰有1名女生的概率.23.某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出频率分布表;(2)画出频率直方图及频率折线图.24.某农业科学研究所为检验某农作物种子的培育有效率,进行了如下试验:一是对该农作物的10000粒种子进行培育,发现有20粒种子未发芽;二是将未进行培育的该农作物的2500粒种子种植在5块试验田中,各试验田种植的种子数及未发芽数如下表:(1)求y 关于x 的回归直线方程; (2)在上述试验下,若以1nN-表示该农作物种子的培育有效率,其中n 为进行培育的10000粒种子的未发芽数,N 为依据上述回归方程估算的未进行培育的10000粒种子的未发芽数,请估计该农作物种子的培育有效率(结果保留3位有效数字).参考公式;在回归方程ˆˆˆy bx a =+中,1221ˆni ii nii x y nx ybxnx==-⋅=-∑∑,ˆˆa y bx=-参考答案1.D2.A3.D4.D5.C6.D7.A8.D9.B10.C11.A12.D 13.7014.18-##-0.12515.34 16.6017.(1)由已知可得,0.25(0.02500.04750.05000.0125)0.1150a =-+++=. 则0.1150492n ⨯⨯=,得922000.11504n ==⨯.(2)设中位数为x ,则0.050040.01254(16)0.11500.5x ⨯+⨯+-⨯=,得13.83x ≈.(3)按照分层抽样的方法从(16,20]内选取的人数为0.050540.05000.0125⨯=+,从(20,24]内选取的人数为0.0125510.05000.0125⨯=+.记二等奖的4人分别为a ,b ,c ,d ,一等奖的1人为A ,事件E 为“从这5人中抽取2人作为主宣讲人,且这2人均是二等奖”.从这5人中随机抽取2人的基本事件为(,)a b ,(,)a c ,(,)a d ,(,)a A ,(,)b c ,(,)b d ,(,)b A ,(,)c d ,(,)c A ,(,)d A ,共10种,其中2人均是二等奖的情况有(,)a b ,(,)a c ,(,)a d ,(,)b c ,(,)b d ,(,)c d ,共6种, 由古典概型的概率计算公式得()63105P E ==. 18.(1)因为频数=样本容量⨯频率,一天上网学习时间在100119分钟之间的学生所占频率为0.35,所以一天上网学习时间在100~119分钟之间的学生人数为400.3514⨯=(人) (2)40位同学的线上学习时间估计值为:0.1569.90.2589.90.35109.90.20129.90.05149.9104.9⨯+⨯+⨯+⨯+⨯=分钟在中位数左边和右边的小长方形的面积和是相等的,设在99.9~119.9靠近左侧长度为x ,则0.15+0.25+0.350.5x =解得0.27x ≈; 所以中位数估计值是99.9+0.27=100.17100.2≈(3)因为该样本的选取只在高一某班,不具有代表性,所以这样推断不合理. 19.(1)设抽查学生做作业的平均时长为x ,中位数为y ,0.0510.130.2550.370.1590.1110.0513 6.8x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 0.050.10.250.15(6)0.5y y =+++⨯-=,解得203y =即抽查学生做作业的平均时长为6.8,中位数为203. (2)①[8,10]组的人数为10000.15150⨯=人,设抽取的人数为a ,[]10,12组的人数为10000.1100⨯=人, 设抽取的人数为b ,则50150100250a b ==,解得30a =,20b = 所以在[8,10]和[]10,12两组中分别抽取30人和20人,②再抽取5人,其中[8,10]和[]10,12两组中分别抽取3人和2人,将[8,10]组中被抽取的工作人员标记为1A ,2A ,3A ,将[]10,12中的标记为1B ,2B . 设事件C 表示从[8,10]小组中恰好抽取2人,则抽取的情况如下:{}12,A A ,{}13,A A ,{}11,A B ,{}12,A B ,{}23,A A ,{}21,A B ,{}22,A B ,{}31,A B ,{}32,A B ,{}12,B B 共10种情况;其中在[8,10]中恰好抽取2人有3种,则3()10P C =. 20.(1)由题意得,()20.040.080.0651a +++⨯=,解得0.01a =,故所求平均数为17.50.427.50.332.50.0537.50.0524.25⨯0.2+22.5⨯+⨯+⨯++=(元); (2)由题意得,消费在[)15,20,[)20,25的高中女生分别有3人和6人,故X 的可能取值为0,1,2,3,∴()6033395021C C P X C ===,()21633915128C C P X C ===,()1263393214C C P X C ===,()0363391384C C P X C ===, 故X 的分布列为:∴()515310123121281484E X =⨯+⨯+⨯+⨯=; 故答案为:1. 21.(1)估计这次测试的平均分为1043045010702290106250x ⨯+⨯+⨯+⨯+⨯==(分);设这次测试的中位数为0x ,显然()060,80x ∈,则060441022200.550x -+++⋅=,解得066x ≈(分). 即估计这次测试的中位数为66.(2)由于5010%5⨯=,所以表中成绩的10%分位数为2026232+=. (3)X 所有可能取值为0,1,2,3.由表中数据可知,任意挑选一人,成绩在[)80,100间的概率为101505=. 所以()346405125P X ⎛⎫=== ⎪⎝⎭,()21341481C 55125P X ⎛⎫=== ⎪⎝⎭, ()122341122C 55125P X ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31135125P X ⎛⎫=== ⎪⎝⎭, 故X 的分布列为故X 的数学期望()6448121301231251251251255E X =⨯+⨯+⨯+⨯=. 22.(1)由频率分布直方图得()0.0050.0350.0300.010101x ++++⨯=,解得0.020x =, 所以图中x 的值是0.020.(2)由频率分布直方图得这组数据的平均数: (550.005650.020750.03585x =⨯+⨯+⨯+⨯)0.030950.0101077+⨯⨯=, 所以这组数据的平均数为77.(3)数学成绩在[)50,60内的人数为0. 005101005⨯⨯=(人),其中男生人数为540%2⨯=(人),则女生人数为3人,记2名男生分别为1A ,2A ,3名女生分别为1B ,2B ,3B ,从数学成绩在[)50,60内的5人中随机抽取2人进行分析的基本事件为:121112132122A A A B A B A B A B A B ,,,,,,23121323A B B B B B B B ,,,,共10个不同结果,它们等可能, 其中2人中恰有1名女生的基本事件为111213212223,,,,,A B A B A B A B A B A B ,共6种结果, 所以2人中恰有1名女生的概率为为63105=. 23.(1)解:频率分布表如下:(2) 频率直方图及频率折线图如图所示.24. (1)依题意,3004005006007005005x ++++==,2466755y ++++==, 513002400450066006700713700ii i x y ==⋅+⋅+⋅+⋅+⋅=∑, 52222221(34567)100001350000i i x==++++⋅=∑, 于是得512252113700550051200ˆ0.01213500005500100000i ii i i x y nx y b x nx==-⋅-⋅⋅====-⋅-∑∑,ˆˆ50.0125001ay bx =-=-⨯=-, 所以y 关于x 的回归直线方程为ˆ0.0121yx =-; (2)由(1)知,估计未进行培育的10000粒种子的未发芽数N 约为:ˆ0.012100001119y =⨯-=,而已培育的10000粒种子有20粒种子未发芽,即20n =, 所以该农作物种子的培育有效率为209910832119119-=≈。
2024届高考一轮复习数学课件(新教材人教A版强基版):统计与统计分析

n
uivi-n u ·v
n
u
i-
u
2
i=1
i=1
^
^
=
,α= v -β u .
n
u2i -n u 2
i=1
123456
7
7
参考数据: yi=9.24, tiyi=39.75,
i=1
i=1
7
yi- y 2≈0.53, 7≈2.646.
i=1
样本相关系数 r=
n
xi- x yi- y
i=1
.
n
123456
由图可知,10×(2×0.005+a+0.02+0.025+0.03)=1, 解得a=0.015. 设中位数为x, 则0.05+0.15+0.2+0.03× (x-70)=0.5, 所以 x=2320. 这100人问答成绩的平均数为 45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
n
xi- x 2 yi- y 2
i=1
i=1
123456
由 y =9.724=1.32,
7
ti- t yi- y
^ i=1
又由(1)得b=
7
ti- t 2
=22.789≈0.10,
i=1
^
^
a= y -b t ≈1.32-0.10×4=0.92,
^
所以 y 关于 t 的经验回归方程为y=0.92+0.10t.
i=1
7
xiyi-7
i=1
所以b^ =
7
x
·y
=452-7×42×8 70+7m+n,
x2i -7 x 2
i=1
高考数学一轮总复习教学课件第三章 一元函数的导数及其应用第一课时 利用导数研究不等式问题

,+∞),
)上单调递增, 在(
,+∞)上单调递减.
综上,当a≤0时,f(x)在(0,+∞)上单调递增;
当a>0时,f(x)在(0,
)上单调递增, 在(
,+∞)上单调递减.
(2)若存在x∈(1,+∞),f(x)>-a,求a的取值范围.
解:(2)由f(x)>-a,
得a(x2-1)-ln x<0,x∈(1,+∞),-ln x<0,x2-1>0.
在(ln a,+∞)上单调递增,所以当a≤0时,f(x)在(-∞,+∞)上单调递
增,当a>0时,f(x)在(-∞,ln a)上单调递减,在(ln a,+∞)上单调递增.
(2)当a=1时,令g(x)=
()
.证明:当x>0时,g(x)>1.
(2)证明:当a=1时, g(x)=
当x>0时,
令 F(x)=
提升·关键能力
类分考点,落实四翼
考点一
利用导数解决不等式的恒成立问题
[例1] (2024·广西柳州模拟)已知函数f(x)=aln x+
+bx,且曲线
y=f(x)在点(1,f(1))处的切线方程为2x-y+1=0.
(1)求实数a,b的值及函数f(x)的单调区间;
+-
g(x)≥1成立,求b的最大值.
x
解:(2)g(x)=a(x-1)e -f(x)=(ax-
当a=1时,g(x)=(x-
高考数学第一轮复习学案---计数原理

⾼考数学第⼀轮复习学案---计数原理第⼀课时:两个基本原理、排列组合的基本知识考纲要求:①理解分类加法计数原理和分类乘法计数原理;理解排列、组合的概念;②能利⽤计数原理推导排列数公式、组合数公式;③会⽤以上原理和概念解决⼀些简单的实际问题. ⼀、两个基本原理:1、分类加法计数原理:做⼀件事,完成它可以有n 类办法,在第⼀类办法中有m 1种不同的办法;在第⼆类办法中有m 2种不同的办法……在第n 类办法中有m n 种不同的办法,那么完成这件事共有N=m 1+m 2+…..+ m n 种不同的办法.2、分步乘法计数原理:做⼀件事,完成它需要分成n 个步骤,做第⼀步有m 1种不同的办法;做第⼆步有m 2种不同的办法……做第n 步有m n 种不同的办法,那么完成这件事共有N=m 1*m 2*…..* m n 种不同的办法.3、两个原理的共同点和不同点共同点:都是有关做⼀件事的不同⽅法的种数问题;不同点:(1)分类加法计数原理针对的是“分类”问题,其中各种⽅法相互独⽴,⽤其中任何⼀种⽅法都可以做完这件事;(2)分步乘法计数原理针对的是“分步”问题,各个步骤中的⽅法互相依存,只有各个步骤都完成才算做完这件事.▲要注意“类”和“类”的独⽴性,“步”与“步”的连续性. ⼆、排列1、排列的概念:⼀般地,从n 个不同元素中取出m (m ≤n )个元素,按照⼀定的顺序排成⼀列,叫做从n 个不同元素中取出m 个元素的⼀个排列.2、排列数:从n 个不同元素中取出m (m ≤n )个元素的所有不同排列的个数叫做从n 个不同元素中取出m (m ≤n )个元素的排列数,记作m n A .3、排列数公式:(1)(1)(2)(1)m n A n n n n m =---+ (,,m n N m n *∈≤)▲(1)(2)321!n n A n n n n =--??= ▲0!1= (2))!(!m n n A mn -==nnn mn mA A -- (,,m n N m n *∈≤)三、组合1、组合的概念:从n 个不同元素中,任取m(m ≤n)个元素并成⼀组,叫做从n 个不同元素中取出m 个元素的⼀个组合.2、组合数:从n 个不同元素中取出m 个元素的所有组合的个数,叫做从n 个不同元素中取出m 个元素的组合数,记作mn C .3、排列与组合的区别和联系:相同点:不同点:两者的联系:从n 个不同元素中取出m 个元素的⼀个排列可以看成先从n 个不同元素中取出m 个元素的⼀4、组合数公式:(1)!)1()2)(1(m m n n n n C mn +---=▲1n n C =; 01n C =(2)组合数性质:① =mn C mn n C -②=+mn C 1+mn C 1-m nC③1121++++++=++++m n m mn m mm mm mm C C C C C 例题与练习:1、(2010湖北⽂6)现有6名同学旁听同时进⾏的5个课外知识讲座,每名同学可⾃由选择其中的⼀个讲座,不同选法的种数是()AABCDEF(补充题)GA .45 B. 56 C.5654322D.6543????23、(2010全国卷2理6)将标号为1,2,3,4,5,6的6张卡⽚放⼊3个不同的信封中.若每个信封放2张,其中标号为1,2的卡⽚放⼊同⼀信封,则不同的⽅法共有()B (A )12种(B )18种(C )36种(D )54种4、(2010湖南理数7)在某种信息传输过程中,⽤4个数字的⼀个排列(数字允许重复)表⽰⼀个信息,不同排列表⽰不同信息,若所⽤数字只有0和1,则与信息0110⾄多有两个对应位置上的数字相同的信息个数为( ) BA.10B.11C.12D.155、(2010四川⽂9)由1、2、3、4、5组成没有重复数字且1、2都不与5相邻的五位数的个数是()A (A )36 (B )32(C )28 (D )246、(2009⼴东7)2010年⼴州亚运会组委会要从⼩张、⼩赵、⼩李、⼩罗、⼩王五名志愿者中选派四⼈分别从事翻译、导游、礼仪、司机四项不同⼯作,若其中⼩张和⼩赵只能从事前两项⼯作,其余三⼈均能从事这四项⼯作,则不同的选派⽅案共有( )AA.36种B.12种C.18种D.48种7、(2007⼴东12)如果⼀个凸多⾯体是n 棱锥,那么这个凸多⾯体的所有顶点所确定的直线共有条,这些直线中共有()f n 对异⾯直线,则(4)f = ;()f n = .:(1)2n n +;8;n(n-2)(答案⽤数字或n 的解析式表⽰)8、(2010全国卷2⽂9)将标号为1,2,3,4,5,6的6张卡⽚放⼊3个不同的信封中,若每个信封放2张,其中标号为1,2的卡⽚放⼊同⼀信封,则不同的⽅法共有( )B(A ) 12种 (B) 18种 (C) 36种 (D) 54种9、(2010湖北理8)现安排甲、⼄、丙、丁、戌5名同学参加上海世博会志愿者服务活动,每⼈从事翻译、导游、礼仪、司机四项⼯作之⼀,每项⼯作⾄少有⼀⼈参加.甲、⼄不会开车但能从事其他三项⼯作,丙丁戌都能胜任四项⼯作,则不同安排⽅案的种数是()B A .152 B.126 C.90 D.54 作业:《⼗年》P213 Ex1-15补充题: (14分)如图,已知四边形ABCD 为矩形,A D ⊥平⾯ABE ,AE =EB =BC =2,F 为CE 上的点,且BF ⊥平⾯ACE .(1)求证:AE //平⾯BDF ;(2)求三棱锥D -ACE 的体积.(34)题7第⼆课时:⼆项式定理考纲要求:①能⽤计数原理证明⼆项式定理;②会⽤⼆项式定理解决与⼆项式展开式有关的简单问题.⼀、⼆项式定理:当n ∈N *时,nr r n r n n n n n n n b b a C b a C b a C a b a ++++++=+---......)(22211b a n ++与整体展开式⼀样,但展开式的通项不⼀样:)(b a n +的通项是b r ar n C r n T r ?-?=+1;n a b )(+的通项是.'1a r b r n C r n T r ?-?=+ 1、通项公式:第r+1项为.1r b r n ar n C r T -=+ 2、⼆项式的性质:(1)⼆项式系数的对称性在⼆项展开式中,与⾸末两端“等距离”的两项的⼆项式系数相等. (2)⼆项式系数的⼤⼩规律如果⼆项式的幂指数是偶数,中间⼀项即12+n T 的⼆项式系数最⼤;如果⼆项式的幂指数是奇数,中间两项即21+n T 与121++n T 的⼆项式系数最⼤;(3)⼆项式系数和nn n n n C C C 210=+++ ; 1422-=+++n n n n C C C ; 15312-=+++n n n n C C C ;.11--=?r n r n nCC r(1)121++++++=++++m n m mn m mm mm mm C C C C C mn m mm n n n n C C C C C 1221...+++++=++++3、⼆项式系数与项的系数的区别如n bx a )(+的展开式中,第r+1项的⼆项式系数为r n C ;第r+1项的系数为.rb r n a r n C - 4、求展开式的各项系数之和 5、最⼤系数及最⼤项的求法例题1、在2nx- 的展开式中,只有第5项的⼆项式系数最⼤,则展开式中常数项是________.72、(2010四川理13)6(2-的展开式中的第四项是 .-160x3、(2010全国卷2理14)若9()a x x-的展开式中3x 的系数是84-,则a = . 14、(2010湖北⽂11)在210(1)x -的展开中, 4x 的系数为______. 455、(2006江苏)10)31(xx -的展开式中含x 的正整数指数幂的项数是( )B(A )0 (B )2 (C )4 (D )66、(2006江西)在(x2006 的⼆项展开式中,含x 的奇次幂的项之和为S ,当xS 等于7、(2007江西⽂5)11112210102)2()2()2(+++++++=+x a x a x a a x x ,则=++++11211a a a a ________-2 8、(2010湖北理11)在(x+)20的展开式中,系数为有理数的项共有_______项. 6【解析】⼆项式展开式的通项公式为202012020)(020)rrr r r rrr T C x C xy r --+==≤≤要使系数为有理数,则r 必为4的倍数,所以r 可为0.、4、8、12、16、20共6种,故系数为有理数的项共有6项. 9、(2005⼴东13)已知5)1cos (+θx 的展开式中2x 的系数与4)45(+x 的展开式中x 3的系数相等,则θcos = . 22±作业:1、(2010全国卷1⽂5)43(1)(1x --的展开式中2x 的系数是()A(A)-6 (B)-3 (C)0 (D)331+x x 的展开式中,x 的幂的指数是整数的项共有(C ) A.3项 B.4项 C.5项 D.6项3、(2010辽宁理13)261(1)()x x x x++-的展开式中的常数项为_________. -54、(2010江西理6)(82-展开式中不含..4x 项的系数的和为()BA.-1B.0C.1D.2 5、(2010安徽理12)6)(xy yx -展开式中,3x 的系数等于__________. 156、(2010全国卷1理5)35(1(1+-的展开式中x 的系数是()C (A) -4 (B) -2 (C) 2 (D) 47、已知2012(1)n nn x a a x a x a x -=++++ ,若12520a a +=,则0123(1)nn a a a a a -+-++-= ________.64补充题: (06辽宁22)已知0(),n11()()(1)k k k f x f x f --=,其中(,)k n n k N +≤∈,设02122201()()()...()...()knn n n k n n F x C f x C f x C f x C f x =+++++,[]1,1x ∈-. (I) 写出(1)k f ;(II) (▲思考)证明:对任意的[]12,1,1x x ∈-,恒有112()()2(2)1n F x F x n n --≤+--.【解析】(I)由已知推得()(1)n kk f x n k x -=-+,从⽽有(1)1k f n k =-+(II)当11x -≤≤时,212(1)22(2)2()12()(1)...(1)...21nn n kn k n n n n nF x xnC xn C xn k C x C x ----=++-+-++++当x>0时, ()0F x '>,所以()F x 在[0,1]上为增函数因函数()F x 为偶函数,所以()F x 在[-1,0]上为减函数所以对任意的[]12,1,1x x ∈-12()()(1)(0)F x F x F F -≤-0121(1)(0)(1)...(1)...2k n n n n n nF F C nC n C n k C C --=++-+-+++211(1)(0)23......k n n n nnn F F C C kC nC C ---=++++++所以12112[(1)(0)](2)[......]2k n n n n nn F F n C C C C C ---=+++++++121112(1)(0)[......]22(22)12(2)12k n n n nn nnn n F F C C C C C n n n ---+-=+++++++=-+=+--因此结论成⽴.《⼗年》P215-216: Ex2、4、6、7、9、12、15、24、29、31第三课时:排列组合的⽅法(1)⼀、特殊(元素或位置)优先法例1、(2006年上海春)电视台连续播放6个⼴告,其中含4个不同的商业⼴告和2个不同的公益⼴告,要求⾸尾必须播放公益⼴告,则共有 48 种不同的播放⽅式(结果⽤数值表⽰). 例2、(2010重庆理9)某单位安排7位员⼯在10⽉1⽇⾄7⽇值班,每天1⼈,每⼈值班1天,若7位员⼯中的甲、⼄排在相邻两天,丙不排在10⽉1⽇,丁不排在10⽉7⽇,则不同的安排⽅案共有()C A. 504种 B. 960种 C. 1008种 D. 1108种解析:分两类:甲⼄排1、2号或6、7号共有4414222A A A ?种⽅法;甲⼄排中间,丙排7号或不排7号,共有)(43313134422A A A A A +种⽅法;故共有1008种不同的排法⼆、合理分类、准确分步例3、安排5名歌⼿的演出顺序时,要求某名歌⼿不第⼀个出场,另⼀名歌⼿不最后⼀个出场,不同排法的总数是 .(78)例4、(2006年辽宁卷)5名乒乓球队员中,有2名⽼队员和3名新队员.现从中选出3名队员排成1、2、3号参加团体⽐赛,则⼊选的3名队员中⾄少有⼀名⽼队员,且1、2号中⾄少有1名新队员的排法有____种.(48)例5、(2010浙江理17)有4位同学在同⼀天的上、下午参加“⾝⾼与体重”、“⽴定跳远”、“肺活量”、“握⼒”、“台阶”五个项⽬的下午测试握⼒,则其余三⼈对应三个项⽬且不重复,只有2种⽅法,⽽若A 下午不测试握⼒,则握⼒测试有BCD3个⼈选,其余三个项⽬有3种⽅案,故共有24(2+3×3)=264种安排.例6、(2010四川理10)由1、2、3、4、5、6组成没有重复数字且1、3都不与5相邻的六位偶数的个数是()C (A )72(B )96 (C ) 108 (D )144 解析:先选⼀个偶数字排个位,有3种选法①若5在⼗位或⼗万位,则1、3有三个位置可排,32232A A =24个②若5排在百位、千位或万位,则1、3只有两个位置可排,共32222A A =12个算上个位偶数字的排法,共计3(24+12)=108个答案:C三、相邻(捆绑法)与不相邻(插空法)问题例7、有8本互不相同的书,其中数学书3本,外⽂书2本,其他书3本,若将这些书排成⼀列放在书架上,则数学书恰好排在⼀起、外⽂书也恰好排在⼀起的排法共有_____种. 1440.例8、(2010北京理4)8名学⽣和2位⽼师站成⼀排合影,2位⽼师不相邻的排法种数为( )A (A )8289A A (B )8289A C (C ) 8287A A (D )8287A C例9、⾼三(⼀)班学要安排毕业晚会的4各⾳乐节⽬,2个舞蹈节⽬和1个曲艺节⽬的演出顺序,要求两个舞蹈节⽬不连排,则不同排法的种数是()B 5256A A =3600(A )1800 (B )3600 (C )4320 (D )5040 例10、在数字1,2,3与符号“+”,“-”五个元素的所有全排列中,任意两个数字都不相邻的全排列个数是()B A .6 B . 12 C. 18 D . 24 四、先选后排法例11、某校从8名教师中选派4名教师同时去4个边远地区⽀教(每地1⼈),其中甲和⼄不同去,则不同的选派⽅案共有种.解析:可以分情况讨论,①甲去,则⼄不去,有3464C A ?=480种选法;②甲不去,⼄去,有3464C A ?=480种选法;③甲、⼄都不去,有46A =360种选法;共有1320种不同的选派⽅案.五、定序均分问题先排后除法例12、(2006年湖北)某⼯程队有6项⼯程需要先后单独完成,其中⼯程⼄必须在⼯程甲完成后才能进⾏,⼯程丙必须在⼯3320A A =例13、(2006年江苏)今有2个红球、3个黄球、4个⽩球,同⾊球不加以区分,将这9个球排成⼀列有_______种不同的⽅法.992342341260A A A A =,本题主要考查不全相异元素的全排列作业:《⼗年》P213 16-29第四课时:排列组合的⽅法(2)六、先分组后分配法(平均分组与不平均分组)例1、某校安排5个班到4个⼯⼚进⾏社会实践,每个班去⼀个⼯⼚,每个⼯⼚⾄少安排⼀个班,不同的安排⽅法共有______种.(240)例2、5名志愿者分到3所学校⽀教,每个学校⾄少去⼀名志愿者,则不同的分派⽅法共有( ). A (A )150种 (B)180种 (C)200种 (D)280种解:⼈数分配上有1,2,2与1,1,3两种⽅式,若是1,2,2,则有3113521322C C C A A ?=60种,若是1,1,3,则有1223542322C C C A A ?=90种,所以共有150种,选A例3、(2010江西理14)将6位志愿者分成4组,其中两个各2⼈,另两个组各1⼈,分赴世博会的四个不同场馆服务,不同的分配⽅案有种. 1080【解析】考查概率、平均分组分配问题等知识,重点考查化归转化和应⽤知识的意识.先分组,考虑到有2个是平均分组,得22116421222C C C C A A 两个两⼈组两个⼀⼈组,再全排列得:221146421422221080C C C C A A A ??= 七、相同元素分配的隔板法例4、将⾃主招⽣的10个名额分配给7所学校,每校⾄少1名,则名额的分配⽅式有_________种.84解:问题等价于在10个相同元素的9个间隔(除去两端)中插⼊6块隔板隔成7份,共有8469=C 种. 例5、⽅程x+y+z=8(x 、y 、z 都是⾮负整数)有________组解. 45210=C例6、将⾃主招⽣的10个名额分配给3所学校,每校⾄少2名,则名额的分配⽅式有_________种.1526=C⼋、等价转化法:正难则反、分排问题连排处理等例7、从4名男⽣和3名⼥⽣中选出3⼈,分别从事三项不同的⼯作,若这3⼈中⾄少有1名⼥⽣,则选派⽅案共有()解析:从全部⽅案中减去只选派男⽣的⽅案数,共有3374A A -=186种,选B.(A )108种(B )186种(C )216种(D )270种例8、有两排座位,前排10个座位,后排11个座位,现安排两⼈就座,如果因故后排中间3个座位不能坐,并且这2⼈不能左右相邻,那么不同排法的种数是________.2218215A A -=276例9、(2006年全国卷I )设集合{}1,2,3,4,5I =.选择I 的两个⾮空⼦集A 和B ,要使B 中最⼩的数⼤于A 中最⼤的数,则不同的选择⽅法共有( )种.B A .50 B .49 C .48 D .47 解析:显然A B =? ,设A B C = ,则C 是I 的⾮空⼦集,且C 中元素不少于2个(当然,也不多于5个);另⼀⽅⾯,对I 的任何⼀个k (25k ≤≤)元⼦集C ,我们可以将C 中元素从⼩到⼤排列,排好后,相邻数据间共有k -1个空档,在任意⼀个空挡间插⼊⼀个隔板,隔板前的元素组成集合A ,隔板后元素组成集合B . 这样的A 、B ⼀定符合条件,且集合对{A ,B }⽆重复.综上,所求为:213141515152535449C C C C C C C C +++=例10、8⼈排成前后两排,每排4⼈,其中有2个⼥⽣要排在前排,另有2个个⼦⾼的要排在后排,共有_____种不同的排法. =??442424A A A 3456九、染⾊、⼏何计数问题例11、某城市在中⼼⼴场建造⼀个扇环形花圃,花圃分为6个部分,如图,现要栽种4种不同颜⾊的花,每⼀部分栽种⼀种且相邻部分不能栽种同样颜⾊的花,有______种不同的栽种⽅法.120例12、⼀个地区分为5个⾏政区域,如右上图,现给地图着⾊,要求相邻区域不得使⽤同⼀种颜⾊.现有四种颜⾊可供选择,则不同的着⾊⽅法共有种.72例13、将⼀个四棱锥的每个顶点染上⼀种颜⾊,并使同⼀条棱上的两端异⾊,如果只有5种颜⾊可供使⽤,求不同的涂⾊⽅法总数.420例14、现⽤4种颜⾊给三棱柱的6个顶点涂⾊,要求同⼀条棱的两端点的颜⾊不同,4种颜⾊全部⽤上,有_________种不同的涂⾊⽅案.216例15、(2010天津理10)如图,⽤四种不同颜⾊给图中的A,B,C,D,E,F 六个点涂⾊,要求每个点涂⼀种颜⾊,且图中每条线段的两个端点涂不同颜⾊,则不同的涂⾊⽅法⽤() B (A )288种(B )264种(C )240种(D )168种【解析】(1)B,D,E,F ⽤四种颜⾊,则有441124A ??=种涂⾊⽅法;(2)B,D,E,F ⽤三种颜⾊,则有334422212192A A ??+=种涂⾊⽅法;(3)B,D,E,F ⽤两种颜⾊,则有242248A ??=种涂⾊⽅法;共有24+192+48=264种不同的涂⾊⽅法.例13、( 2006年湖南卷)过平⾏六⾯体ABCD-A 1B 1C 1D 1任意两条棱的中点作直线,其中与平⾯DBB 1D 1平⾏的直线共有 ( ) D A.4条 B.6条 C.8条 D.12条例14、(2006年上海卷)如果⼀条直线与⼀个平⾯垂直,那么,称此直线与平⾯构成⼀个“正交线⾯对”.在⼀个正⽅体中,由两个顶点确定的直线与含有四个顶点的平⾯构成的“正交线⾯对”的个数是.36 作业:《⼗年》P213 Ex30-45第五课时:习题课题组⼀ (排队问题、相邻、不相邻、特殊位置、特殊元素、定序、分排等)1、从8⼈中选5⼈排成⼀排照相,每次拍照时甲或⼄两⼈中要有⼀⼈排在正中间,有____种不同的排法.( 1680247=A )2、从8⼈中选5⼈排成⼀排照相,若选到甲或⼄,他们两⼈都不能排在正中间,有____种不同的排法.( 47583624461456250402A A A A A C A -==++)3、4名男⽣和5名⼥⽣排成⼀横队,其中甲、⼄都不能排在两端,有______种不同的排法.(7727A A )4、4名男⽣和5名⼥⽣排成⼀横队,任何两个男⽣不能连排在⼀起,有______种不同的排法.(4655A A )5、4名男⽣和5名⼥⽣排成⼀横队,男⼥⽣相间,有______种不同的排法.(5544A A )6、4名男⽣和5名⼥⽣排成⼀横队,男⽣不能都排在⼀起,有______种不同的排法.(664499A A A -)7、4名男⽣和5名⼥⽣排成⼀横队,男、⼥⽣各在⼀边,有______种不同的排法.(55442A A )8、4名男⽣和5名⼥⽣排成⼀横队,其中甲在⼄的左边,丙在⼄的右边,有______种不同的排法.(3399A A )9、4名男⽣和5名⼥⽣排成前后两⾏,男、⼥⽣各在⼀⾏,有______种不同的排法.(55442A A )题组⼆(分组分配问题、区分均匀与⾮均匀分组)1、有6本不同的书,甲⼄丙3⼈每⼈2本,有_____种不同的分法.( 222426C C C )2、有6本不同的书,分给甲⼄丙3⼈,⼀⼈1本,⼀⼈2本,⼀⼈3本,有_____种不同的分法.(3 3332516A C C C )3、有6本不同的书,分给甲1本,⼄2本,丙3本,有_____种不同的分法.( 332516C C C )4、有6本不同的书,分成3堆,每堆2本,有_____种不同的分法.(33222426A C C C )5、有6本不同的书,分成3堆,⼀堆1本,⼀堆2本,⼀堆3本,有_____种不同的分法.(332516C C C ) 6、有6本不同的书,分成3堆,有2堆各1本,另⼀堆4本,有_____种不同的分法.(22441516A C C C )7、有6本不同的书,分给甲⼄丙3⼈,其中甲、⼄各1本,丙4本,有_____种不同的分法.(441516C C C ) 8、有6本不同的书,分给甲⼄丙3⼈,其中两⼈各1本,另⼀⼈4本,有_____种不同的分法.( 332244151C C C )题组三(排列有序、组合⽆序、排列组合不能重复选取,能重复选取为次幂问题,相同元素的隔板模型) 1、3个不同的⼩球放进4个不同的盒⼦,有_______种放法.34=642、3个不同的⼩球放进4个不同的盒⼦,不同的⼩球必须放进不同的盒⼦,有_______种放法.34A =243、3个相同的⼩球放进4个不同的盒⼦,有_______种放法. 142434C A C ++=204、3个相同的⼩球放进4个不同的盒⼦,每个盒⼦放不超过1个⼩球,有_______种放法. 34C =45、4个不同的⼩球放进3个不同的盒⼦,每个盒⼦⾄少放⼊⼀个⼩球,有_______种放法. 3324A C =366、4个相同的⼩球放进3个不同的盒⼦,每个盒⼦⾄少放⼊⼀个⼩球,有_______种放法. 13C =3 7、4个不同的⼩球放进3个相同的盒⼦,每个盒⼦⾄少放⼊⼀个⼩球,有_______种放法. 24C =6 8、4个不同的⼩球放进3个相同的盒⼦,有_______种放法. 44142224242C C C C C+++=149、12个相同的⼩球放进编号为1、2、3、4的盒⼦中,要求每个盒⼦中的⼩球个数不⼩于其编号数,有_______种不同的放法. (转化为隔板模型1035=C )题组四1、8个⼈分配到4辆车上⼯作,每车两⼈,若车不相同,车上⼯种相同,有_____种不同的分配⽅法.2、8个⼈分配到4辆车上⼯作,每车两⼈,若车不相同,车上⼯种不同,有_____种不同的分配⽅法.3、8个⼈分配到4辆车上⼯作,每车两⼈,若车相同,车上⼯种相同,有_____种不同的分配⽅法.4、8个⼈分配到4辆车上⼯作,每车两⼈,若车相同,车上⼯种不同,有_____种不同的分配⽅法.1、22242628CC C C2、88A 3、22242628AC C C C 4、42244222426284488)(A AC C C C AA 或作业:《备考指南练习册》P203-204补充:设函数()f x 是定义在[1,0)(0,1]- 上的奇函数,当[1,0)x ∈-时,21()2f x a x x=+(a 为实数)(1)当(0,1]()x f x ∈时,求的解析式;21()2f x a x x=-(2)若()f x 在]1,0(上为增函数,求a 的取值范围. 1a ≥-。
2023年高考数学(文科)一轮复习讲义——变量间的相关关系与统计案例

第4节 变量间的相关关系与统计案例考试要求 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^__,则b ^=, a ^=y --b ^x -.其中,b ^是回归方程的斜率,a ^是在y 轴上的截距.回归直线一定过样本点的中心(x -,y -). 3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x 1, y 1)(x 2, y 2),…,(x n, y n ), 其中(x -,y -)称为样本点的中心. (3)相关系数当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.(4)相关指数:R 2=.其中是残差平方和,其值越小,则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验(1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为y 1 y 2 总计 x 1 a b a +b x 2 c dc +d总计a +cb +d a +b +c +d则随机变量K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )n =a +b +c +d 为样本容量.1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本点的中心(x -,y -).2.根据回归方程计算的y ^值,仅是一个预报值,不是真实发生的值.3.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变量有关的把握越大.1.思考辨析(在括号内打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )(2)通过回归直线方程y ^=b ^x +a ^可以估计预报变量的取值和变化趋势.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (4)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( ) 答案 (1)√ (2)√ (3)√ (4)√2.(易错题)(2022·兰州模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,n ∈N *,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A.-1 B.0C.12D.1答案 D解析 由题设知,所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,可知这组样本数据完全正相关,故其相关系数为1,故选D.3.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R 2为0.98 B.模型2的相关指数R 2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25答案 A解析在两个变量y与x的回归模型中,它们的相关指数R2越近于1,拟合效果越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.4.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+b e xD.y=a+b ln x答案 D解析由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D. 5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.答案 5%解析 K 2的观测值k ≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.6.(2022·银川模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:零件数x (个) 10 20 30 40 50 加工时间y (min)62a758189若用最小二乘法求得回归直线方程为y ^=0.67x +54.9,则a 的值为________. 答案 68解析 x -=10+20+30+40+505=30,y -=62+a +75+81+895=61+2+a 5,所以61+2+a5=0.67×30+54.9, 解得a =68.考点一 相关关系的判断1.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份 1 2 3 4 5 6 人均销售额 6 5 8 3 4 7 利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是( ) A.利润率与人均销售额成正相关关系 B.利润率与人均销售额成负相关关系 C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系 答案 A解析 由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C 和D ;其属于正相关关系,A 正确,B 错误.2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A.r 2<r 4<0<r 3<r 1B.r 4<r 2<0<r 1<r 3C.r 4<r 2<0<r 3<r 1D.r 2<r 4<0<r 1<r 3 答案 A解析 由散点图知图①与图③是正相关,故r 1>0,r 3>0, 图②与图④是负相关,故r 2<0,r 4<0,且图①与图②的样本点集中在一条直线附近,因此r 2<r 4<0<r 3<r 1,故选A. 3.(2022·合肥模拟)根据如下样本数据,得到回归直线方程y ^=b ^x +a ^,则( )x 3 4 5 6 7 8 y-3.0 -2.00.5-0.52.54.0A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<0答案 C解析 作出散点图(图略),由散点图可知,a ^<0,b ^>0. 感悟提升 判断相关关系的两种方法:(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r |越趋近于1,相关性越强. 考点二 回归分析 角度1 线性回归方程及应用例1 (2021·成都诊断)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x (单位:年)与失效费y (单位:万元)的统计数据如下表所示:使用年限x (单位:年) 1234567失效费y (单位:万元)2.903.30 3.604.40 4.805.20 5.90(1)由上表数据可知,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明;(精确到0.01)(2)求出y 关于x 的线性回归方程,并估算该种机械设备使用10年的失效费. 参考公式:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑ni =1 (x i -x -)2∑ni =1(y i -y -)2.线性回归方程y ^=b ^x +a ^中斜率和截距最小二乘估计计算公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2,a ^=y --b ^x -. 参考数据:∑7i =1(x i -x -)(y i -y -)=14.00, ∑7i =1(y i -y -)2=7.08,198.24≈14.10.解 (1)由题意,知x -=1+2+3+4+5+6+77=4,y -=2.90+3.30+3.60+4.40+4.80+5.20+5.907=4.30,∑7i =1(x i -x -)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28, ∴r =14.0028×7.08=14.00198.24≈14.0014.10≈0.99.因为y 与x 的相关系数近似为0.99,所以y 与x 的线性相关程度相当大,从而可以用线性回归模型拟合y 与x 的关系. (2)∵b ^=∑7i =1 (x i -x -)(y i -y -)∑7i =1 (x i -x -)2=1428=0.5, ∴a ^=y --b ^x -=4.3-0.5×4=2.3.∴y 关于x 的线性回归方程为y ^=0.5x +2.3.将x =10代入线性回归方程,得y ^=0.5×10+2.3=7.3, ∴估算该种机械设备使用10年的失效费为7.3万元. 角度2 非线性回归方程及应用例2 (2022·郑州调研)人类已经进入大数据时代.目前,数据量级已经从TB(1 TB =1 024 GB)级别跃升到PB(1 PB =1 024 TB),EB(1 EB =1 024 PB)乃至ZB(1 ZB =1 024 EB)级别.国际数据公司(IDC)研究结果表明,2008年全球产生的数据量为0.49 ZB ,2009年数据量为0.8 ZB ,2010年增长到1.2 ZB ,2011年数据量更是高达1.82 ZB.下表是国际数据公司(IDC)研究的全球近6年每年产生的数据量(单位:ZB)及相关统计量的值:表中z i =ln y i ,z -=16∑6i =1z i . (1)根据上表数据信息判断,方程y =c 1·e c 2x (e 是自然对数的底数)更适宜作为该公司统计的年数据量y 关于年份序号x 的回归方程类型,试求此回归方程(c 2精确到0.01);(2)有人预计2022年全世界产生的数据规模将超过2011年的50倍.根据(1)中的回归方程,说明这种判断是否准确,并说明理由. 参数数据:e4.56≈95.58,e4.58≈97.51,回归方程y ^=a ^+b ^x 中,b ^=∑n i =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -nx - y -∑n i =1x 2i -nx -2, a ^=y --b ^x -.解 (1)由y =c 1·e c 2x 得ln y =c 2x +ln c 1, 即z =c 2x +ln c 1,∴c 2=∑6i =1(x i -x -)(z i -z -)∑6i =1(x i -x -)2=6.7317.5≈0.38.又∵z -=c 2x -+ln c 1,0.38×3.5+ln c 1=2.85,ln c 1=1.52. ∴ln y =0.38x +1.52,即y =e 0.38x +1.52为所求的回归方程. (2)根据(1)知回归方程为y =e 0.38x +1.52.当x =9时,y =e 0.38×9+1.52=e 4.94>e 4.56≈95.58,95.581.82≈52.52.据此可以判断2022年全球产生的数据量超过2011年的50倍,因此,这种判断是准确的.感悟提升 回归分析问题的类型及解题方法 (1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关. ②利用公式,求出回归系数b ^.③待定系数法:利用回归直线过样本点的中心求系数a ^.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数b ^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.训练1 下面给出了根据我国2015~2021年水果人均占有量y (单位:kg)和年份代码x 绘制的散点图和线性回归方程的残差图.(2015年~2021年的年份代码x 分别为1~7)(1)根据散点图分析y 与x 之间的相关关系;(2)根据散点图相应数据计算得∑7i =1y i =1 074,∑7i =1x i y i =4 517,求y 关于x 的线性回归方程;(精确到0.01)(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果. 附:回归方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为 b ^=∑ni =1 (x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -nx - y -∑n i =1x 2i-nx -2, a ^=y --b ^x -.解 (1)从散点图可以看出,这些点的分布整体上在一条直线附近,且当x 由小变大时,y 也由小变大,所以y 与x 之间具有线性相关关系,且是正相关. (2)由题意可知,x -=1+2+3+4+5+6+77=4,y -=17∑7i =1y i=1 0747, ∑7i =1x 2i =12+22+32+42+52+62+72=140, ∴b ^=∑7i =1x i y i-7x - y -∑7i =1x 2i -7x -2=4 517-7×4×1 0747140-7×42=22128≈7.89,∴a ^=y --b ^x -=1 0747-7.89×4≈121.87,∴y 关于x 的线性回归方程为y ^=7.89x +121.87.(3)由残差图可以看出历年数据的残差均分布在-2~2之间,且图中各点比较均匀地分布在数值0所在直线附近,带状区域很窄,说明对应的回归直线拟合效果较好.考点三 独立性检验例3 (2021·武汉质检)有关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展,行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯,该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1 000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到统计图如图所示.(1)估算该市电动自行车骑乘人员的平均年龄; (2)根据所给的数据,完成列联表:是否佩戴头盔是否(3)根据(2)中的列联表,判断是否有99%的把握认为佩戴安全头盔与年龄有关. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)该市电动自行车骑乘人员平均年龄为25×0.25+35×0.35+45×0.2+55×0.15+65×0.05=39(周岁). (2)完成2×2列联表如下:(3)K 2的观测值k =1 000×(60×540-60×340)2600×400×880×120=12522≈5.682<6.635.故没有99%的把握认为佩戴安全头盔与年龄有关.感悟提升 1.在2×2列联表中,如果两个变量没有关系,则应满足ad -bc ≈0. |ad -bc |越小,说明两个变量之间关系越弱;|ad -bc |越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)计算K2的观测值k;(3)通过比较观测值k与临界值的大小关系来作统计推断.训练2 (2022·南宁模拟)第五代移动通信技术(5G技术)是最新一代蜂窝移动通信技术,也是继4G、3G和2G系统之后的延伸.5G的性能目标是高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接.某大学为了解学生对“5G”相关知识的了解程度,随机抽取100名学生参与测试,并根据得分划分成“不太了解”或“比较了解”两类后整理得到如下列联表:(1)补全列联表,并判断是否有99.9%的把握认为“学生对5G的了解程度与性别有关”;(2)从“不太了解”的学生中按性别分层抽取6人,再从这6人中随机选取2人参加“5G”知识讲座,求抽到的2人中恰有1名女生的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d). 临界值表:解(1)补全的列联表如下:不太了解 比较了解 总计 男生 25 33 58 女生 5 37 42 总计3070100所以K 2的观测值k =100×(25×37-33×5)258×42×30×70≈11.291>10.828,故有99.9%的把握认为“学生对5G 的了解程度与性别有关”. (2)“不太了解”的男生有25人,女生有5人,按性别分层抽样从中抽取6人,则男生应抽取5人,记为a ,b ,c ,d ,e ,女生应抽取1人,记为x ,再从这6人中随机抽取2人共有15种情况:xa ,xb ,xc ,xd ,xe ,ab ,ac ,ad ,ae ,bc ,bd ,be ,cd ,ce ,de ,抽到恰有1名女生有5种情况:xa ,xb ,xc ,xd ,xe , 所以所求的概率为515=13.1.为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( ) A.回归分析 B.均值与方差 C.独立性检验 D.概率答案 C解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断. 2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v ,有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2),由这两个散点图可以判断( )A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关 答案 C解析 由题图(1)可知,y 随x 的增大而减小,各点整体呈下降趋势,x 与y 负相关,由题图(2)可知,u 随v 的增大而增大,各点整体呈上升趋势,u 与v 正相关. 3.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数R 2来刻画回归的效果,R 2值越接近于1,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是( ) A.①② B.②③ C.①③ D.①②③答案 D4.(2022·昆明诊断)下表是关于某设备的使用年限x (单位:年)和所支出的维修费用y (单位:万元)的统计表:x 2 3 4 5 6 y3.44.25.15.56.8由表可得线性回归方程y ^=0.81x +a ^,若规定:维修费用y 不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为( ) A.7B.8C.9D.10答案 D解析 由已知表格,得x -=15×(2+3+4+5+6)=4, y -=15×(3.4+4.2+5.1+5.5+6.8)=5,因为回归直线恒过样本点的中心(x -,y -), 所以5=0.81×4+a ^,解得a ^=1.76, 所以回归直线的方程为y ^=0.81x +1.76,由y ≤10,得0.81x +1.76≤10,解得x ≤82481≈10.17,由于x ∈N *,所以据此模型预测,该设备使用年限的最大值为10.故选D. 5.某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:附表:参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别有关B.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别无关C.有99.99%以上的把握认为喜欢“应用统计”课程与性别有关D.有99.99%以上的把握认为喜欢“应用统计”课程与性别无关 答案 A解析 ∵K 2的观测值k =55×(20×20-5×10)225×30×30×25≈11.978>10.828,所以有99.9%的把握认为喜欢“应用统计”课程与性别有关,即在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别有关. 6.下列说法:①残差可用来判断模型拟合的效果;②设有一个回归方程:y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线:y ^=b ^x +a ^必过点(x -,y -);④在一个2×2列联表中,由计算得K 2的观测值k =6.665,则有99%的把握确认这两个变量间有关系(其中P (K 2≥6.635)=0.010), 其中错误的个数是( ) A.0 B.1 C.2 D.3答案 B解析 对于①,残差可用来判断模型拟合的效果,残差越小,拟合效果越好,∴①正确;对于②,回归方程y ^=3-5x 中,变量x 增加一个单位时,y 平均减少5个单位,∴②错误;对于③,线性回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -),∴③正确; 对于④,在2×2列联表中,由计算得k =6.665,对照临界值得,有99%的把握确认这两个变量间有关系,∴④正确. 综上,其中错误的命题是②,共1个,故选B.7.已知x 和y 的散点图如图所示,在相关关系中,若用y =c 1e c 2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21,R 22中较大的是________.答案 R 21解析 由散点图知,用y =c 1e c 2x 拟合的效果比y ^=b ^x +a ^拟合的效果要好,所以R 21>R 22,故较大者为R 21.8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2的观测值k ≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%. 答案 ①解析 k ≈3.918≥3.841,而P (K 2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.9.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是________(填序号).①人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%; ②人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%;③人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%; ④人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%. 答案 ②解析 观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.10.(2022·河南名校联考)某学校食堂统计了最近5天到餐厅就餐的人数x (单位:百人)与食堂向食材公司购买所需食材(原材料)的数量y (单位:袋),得到如下统计表:(1)根据所给的5组数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)已知购买食材的费用C (单位:元)与数量y (单位:袋)的关系为C =⎩⎨⎧400y -20,0<y <36(y ∈N ),380y ,y ≥36(y ∈N ),投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1 500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -nx - y -∑n i =1x 2i-nx -2,a ^=y --b ^x -. 参考数据:∑5i =1x i y i =1 343,∑5i =1x 2i =558,∑5i =1y 2i=3 237. 解 (1)由所给数据可得x -=13+9+8+10+125=10.4,y -=32+23+18+24+285=25,所以b ^=∑5i =1x i y i -5x - y -∑5i =1x 2i-5x -2=1 343-5×10.4×25558-5×10.42=2.5,又a ^=y --b ^x -=25-2.5×10.4=-1, 所以y 关于x 的线性回归方程为y ^=2.5x -1. (2)由(1)中求出的线性回归方程知,当x =15时,y =36.5,即预计需要购买食材36.5袋. 因为C =⎩⎪⎨⎪⎧400y -20,0<y <36(y ∈N ),380y ,y ≥36(y ∈N ),所以当y <36时,利润L =700y -(400y -20)=300y +20,y ∈N , 此时当y =35时,利润L max =300×35+20=10 520(元);当y ≥36时,根据线性回归方程预测需要购买食材36.5袋,并且剩余的食材只能无偿退还,此时当y =36时,利润L =700×36-380×36=11 520(元), 当y =37时,利润L =700×36.5-380×37=11 490(元).综上,食堂应购买36袋食材,才能获得最大利润,最大利润为11 520元. 11.(2022·“四省八校”开学考试)据我国一项专题调查显示,某市高级职称的中年知识分子中竟有高达75.3%的人处于亚健康状态,更令人担忧的是85%以上的企业管理者处于慢性疲劳状态或亚健康状态,这是由他们所处的特殊工作及生活的环境和行为模式所决定的.亚健康是指非病非健康的一种临界状态.如果这种状态不能及时得到纠正,非常容易引起身心疾病.某高科技公司为了了解亚健康与性别的关系,对本公司部分员工进行了不记名问卷调查,该公司处于正常工作状态的员工(包括管理人员)共有8 000人,其中男性员工有6 000人,女性员工有2 000人,从8 000人中用分层抽样的方法随机抽取了400人作为样本进行健康状况的调查.(1)求男性员工、女性员工各抽取多少人?(2)通过调查得到如图所示的统计图,其中a=0.2,b=0.1.根据统计图,完成下面2×2列联表,健康亚健康总计男员工女员工总计400问是否有97.5%的把握认为人处于亚健康状态与性别有关?参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d. 参考数据:P(K≥k0)0.050.0250.0100.005k0 3.841 5.024 6.6357.879解(1)由题意知样本容量与总体的比值为4008 000=120,∴男性员工抽取了6 000×120=300(人),女性员工抽取了2 000×120=100(人).(2)由统计图可知,样本中男员工处于亚健康状态的人数为300×0.2=60,样本中女员工处于亚健康状态的人数为100×0.1=10,2×2列联表为健康 亚健康 总计 男员工 240 60 300 女员工 90 10 100 总计33070400则K 2的观测值k =400×(240×10-60×90)2300×100×330×70≈5.195>5.024,∴有97.5%的把握认为人处于亚健康状态与性别有关.12.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号 1 2 3 4 5 6 7 8 数学成绩 60 65 70 75 80 85 90 95 物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高. 其中正确的为________(填序号). 答案 ①解析 由散点图知,各点大致分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.13.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-12附近波动.经计算∑6i =1x i =12,∑6i =1y i =14,∑6i =1x 2i =23,则实数b 的值为________. 答案 1723解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y =bt -12, 此时t -=∑6i =1x 2i 6=236,y -=∑6i =1yi 6=73,代入y =bt -12,得73=b ×236-12,解得b =1723.14.近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:(1)求y 关于x 的线性回归方程(计算结果保留两位小数);(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2,a ^=y --b ^x -,K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:解 (1)依题意得,x -=1+2+3+4+55=3,y -=8+10+13+25+245=16,故∑5i =1(x i -x -)(y i -y -)=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47, ∑5i =1(x i -x -)2=4+1+1+4=10,则b ^=∑5i =1(x i -x -)(y i -y -)∑5i =1 (x i -x -)2=4710=4.7,a ^=y --b ^x -=16-4.7×3=1.9.所以y 关于x 的线性回归方程为y ^=4.7x +1.9. (2)依题意,女性不愿意参与管理的人数为50, 计算得K 2的观测值为k =300×(150×50-50×50)2200×100×200×100=300×5 000×5 000200×100×200×100=18.75>10.828, 故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.。
2023年高考政治一轮复习(部编版) 第1课 第1课时 原始社会的解体和阶级社会的演进

第一课社会主义从空想到科学、从理论到实践的发展第一课时原始社会的解体和阶级社会的演进课标要求:描述不同社会形态的本质特征;解释人类社会发展的一般过程。
分析资本主义社会的历史地位。
核心素养:政治认同:通过对私有制的出现、阶级和国家产生以及阶级社会的更替,明确人类社会是不断发展的,通过评析当代资本主义的发展困境,明确社会主义终将代替资本主义是历史发展的必然趋势。
科学精神:通过分析原始社会、奴隶社会、封建社会和资本主义社会形态的本质特征,科学分析和把握推动社会发展的基本矛盾运动。
公共参与:查阅史料,了解社会的演进过程,总结各种社会形态生产关系的特点。
思维导图核心考点一从原始社会到奴隶社会1.原始社会与奴隶社会的对比原始社会奴隶社会地位人类社会发展的最初阶段,也是最低阶段人类社会发展中的第一个阶级社会,也是人类文明的开端生产力劳动技能低下,生产工具简陋,劳动对象范围有限,生产力水平非常低下金属工具广泛使用,社会分工越来越细,劳动生产率大幅提高生产关系共同劳动、共同占有生产资料,在生产中结成平等互助的关系,平均分配劳动产品奴隶主占有生产资料并完全占有奴隶;奴隶毫无人身自由,在奴隶主的强制下劳动;奴隶劳动的全部产品都归奴隶主占有和支配,奴隶主只给奴隶最低限度的生活资料管理氏族、部落或部落联盟,共同管理集体事务国家:奴隶主阶级建立军队、法庭、监狱等暴力机关进步性生产力决定生产关系,奴隶社会代替原始社会,是顺应生产力发展要求的,促进了生产力的发展;促进了城市和文字的出现,使人类进入了文明时代[提醒]原始社会并不是人类的理想社会①原始社会的生产关系是由当时极端低下的生产力水平决定的。
只有共同劳动,才能满足人们维持生存的基本需要。
共同劳动必然要求生产资料归集体所有,而且生产资料必然采取平均分配的方式。
②原始社会是人类社会发展的最初阶段,也是最低阶段。
原始社会虽然没有剥削和压迫,但并不是人类的理想社会。
2.正确认识阶级与国家的关系阶级国家含义在一定生产关系中处于不同地位的集团阶级统治的工具产生社会生产发展到一定阶段,一是剩余产品的出现;二是私有制的形成阶级矛盾不可调和的产物,是随着阶级的产生而产生的一种历史现象本质是与特定的生产关系相联系的、在经济上处于不同地位的社会集团国家是经济上占统治地位的阶级进行阶级统治的工具。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当堂检测
6.(1) 某学校为了了解 2016 年高考数学学科的考试成
绩,在高考后对 1 200 名学生进行抽样调查,其中文
科400名考生,理科600名考生,艺术和体育类考生共
200名,从中抽取120名考生作为样本.
(2)从10名家长中抽取3名参加座谈会.
Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法
A.抽签法 B.随机数法
C.系统抽样法
D.分层抽样法
当堂检测
4 . 老 师 在 班 级 50 名 学 生 中 , 依 次 抽 取 学 号 为 5,10,15,20,25,30,35,40,45,50 的学生进行作业检查, 这种抽样方 法是( ) B.分层抽样 D.以上都不是
A.随机抽样 C.系统抽样
本,需要剔除2个学生,这样对被剔除者不公平.( × )
(6) 分层抽样中 ,每个个体被抽到的可能性与层数及分层有 关.( × )
当堂检测
3.(2013·湖南卷)某学校有男、女学生各500名.为
了解男女学生在学习兴趣与业余爱好方面是否存在显
著差异,拟从全体学生中抽取100名学生进行调查,
则宜采用的抽样方法是( D )
一、抽样调查 1.定义:从调查对象中按照一定的方法抽取一部分,
进行调查或观测,获取数据,并以此对调查对象的
某一项或多项指标作出推断,这就是抽样调查.
(1)总体:调查对象的全体; (2)个体:总体中的每一个对象; (3)样本:被抽取的一部分; (4)总体容量:总体中的个体数量; (5)样本容量:样本中的个体数量. 研究对象
成绩,从中抽取1 000名考生的数学成绩进行统计分析,在这个问 题中,有以下四种说法: ①1 000名考生是总体的一个样本; ②可用1 000名考生数学成绩的平均数去估计总体平均数; ③70 000名考生的数学成绩是总体; ④样本容量是1 000.
其中正确的说法有( C
A.1种 B.2种
)
C.3种 D.4种
[答案] B
当堂检测
(2)防疫站对学生进行身体健康调查,采用分层抽样法抽 取, 红星中学共有学生 1 600 名, 抽取一个容量为 200 的样本, 已知女生比男生少抽了 10 人,则该校的女生总共人数为 ______.
[答案]
760
典例精讲
考点4 系统抽样
例4.某工厂平均每天生产某种机器零件大约10 000件,要求 产品检验员每天抽取50件零件,检查其质量状况,采用系统
当堂检测
7.某学校高一,高二,高三年级的学生人数之比为3∶3∶4, 现用分层抽样的方法从该校高中三个年级的学生中抽取容量 15 名学生. 为50的样本,则应从高二年级抽取___
当堂检测
(1)(文)某市 A、B、C 三个区共有高中学生 20 000 人,其中 A 区高中学生 7 000 人,现采用分层抽样的方法从这三个区所有 高中学生中抽取一个容量为 600 人的样本进行学习兴趣调查, 则 A 区应抽取( A.200 人 C.210 人
知识梳理
3、系统抽样 (1)定义:将总体平均分成几部分,然后按照一定的规则, 从每一部分抽取一些个体作为样本,这种抽样的方法叫做系
统抽样,又称等距抽样。
总体容量N较大 时。 (2)适应范围:当_________________ (3)从容量为N的总体中抽取容量为n的样本,用系统抽样的 一般步骤: ①将总体中的N个个体编号. ②将编号按间隔k分段(k∈N).
知识梳理
二、抽样方法
1、简单随机抽样
(1)定义:设一个总体含有 N个个体, 从中 逐个不放回地 __________ __ 抽取n个 个体作为样本(n N ), 如果每次抽取时总体内 的各个个体抽到
相等 这种抽样方法叫做简单 的概率都 ______, 随机抽样。
(2)适用范围:总体的个体数有限且较少; (3)最常用的简单随机抽样方法:
①抽签法; ②随机数表法.
用抽签法抽取样本的步骤:
简记为:编号;制签;搅匀;抽签;取个体。
用随机数表法抽取样本的步骤:
简记为:编号;选数;读数;取个体。
知识梳理
2、分层抽样
(1)定义:将总体按其属性特征分成若干类型(有时称作
按照所占比例随机抽取 一定 层),然后在每个类型中按照______________________
[答案] C
当堂检测
5.要完成下列两项调查: ①从某社区 125 户高收入家庭、280 户中等收入家 庭、 95 户低收入家庭中选出 100 户调查社会购买 力的某项指标; ②从某中学的 15 名艺术特长生中选出 3 人调查学习 负担情况.宜采用的抽样方法依次为( B ) A.①简单随机抽样法,②系统抽样法 B.①分层抽样法,②简单随机抽样法 C.①系统抽样法,②分层抽样法 D.①②都用分层抽样法
[答案] 37 20
方法总结
类别 简单随 机抽样 抽样过 系统抽 样 共同点 各自特点 从总体中逐个抽 取 相互联系 适用范围 总体中的个 体数较少 在起始部分抽 样时采用简单
程中每
个个体 被抽到 的机会
将总体均分成几
部分,按事先确 定的规则在各部 分抽取 将总体分成几层, 分层进行抽取
总体中的个 体数较多
(1)Ⅲ,(2)Ⅰ 问题与方法配对正确的是___________.
典例精讲
考点3 分层抽样
例3.某公司有员工500人,其中不到35岁的有125人,35~49岁
的有280人,50岁以上的有95人,为了调查员工的身体健康状
况,从中抽取100名员工,则应在这三个年龄段分别抽取人数 25,56ห้องสมุดไป่ตู้19 为_________.
的样本.这种抽样方法通常叫作分层抽样,也称为类型抽样.
差异明显的几个部分 (2)适应范围:总体由__________________________ 组成。
ni 样本容量 n (3)抽样比k 总体容量 N Ni
N 总体容量 n 样本容量 N i 总体中第i层的个体数 ni 样本中第i层的个体数
N N 当 是整数时,取k= n n ;
知识梳理
N 当 不是整数时,可以先从总体中随机地剔除 n 几个个体,使得总体中剩余的个体数能被样
N 本容量整除.通常取k= n
③在第一段用简单随机抽样确定起始个体的编号l
( l ∈N, l ≤k)。
④按照一定的规则抽取样本,通常将编号为
数量
典例精讲
考点1 随机抽样中的有关概念
例1. 2017年某县主管部门从全县4600名五年级的小学生中抽
取520名学生进行视力情况的统计分析,下列说法正确的是
③④ __________ .
①4600名学生是总体;
②每名学生是个体;
③抽取的520名学生的视力情况是一个样本; ④4600是总体容量; ⑤520名学生的视力情况是样本容量. 【思路点拨】先弄清考查对象是什么,再根据概念作以判断.
[答案] C
) B.205 人 D.215 人
当堂检测
(理)某单位有职工 750 人,其中青年职工 350 人,中年职 工 250 人, 老年职工 150 人, 为了了解该单位职工的健康情况, 用分层抽样的方法从中抽取样本,若样本中的青年职工为 7 人,则样本容量为( A.7 B.15 )
C.25 D.35
[答案] B
)
B.3,13,23,33,43 D.2,4,6,16,32
当堂检测
6.某单位 200 名职工的年龄分布情况如图所示,现要从 中抽取 40 名职工作样本,用系统抽样法,将全体职工随机按 1~200 编号,并按编号顺序平均分为 40 组(1~5 号,6~10 号…,196~200 号).若第 5 组抽出的号码为 22,则第 8 组抽 出的号码应是________.若用分层抽样方法,则 40 岁以下年 龄段应抽取________人.
随机抽样
各层抽样时采
分层抽 样
均等
总体由差异
用简单随机抽
样或系统抽样
明显的几部
分组成
当堂检测
1.某校从高中一年级500名学生中抽取100名学生进
行体重的统计分析,则下列说法中正确的是( C )
A.500名学生是总体;
B.每名学生是个体;
C.抽取的100名学生的体重是一个样本;
D.抽取的100名学生是样本容量.
当堂检测
2.某次考试有70 000名学生参加,为了解这70 000名考生的数学
抽样方法抽取,若抽取的第一组中的号码为0010,则第三组 0410 抽取的号码为______.
10 000 分段间隔数为 50 =200,
则第三组抽取的号码为0010+2×200=0410.
当堂检测
从编号为 1~50 的 50 枚最新研制的某种型号的导弹中随机 抽取 5 枚来进行发射实验, 若采用每部分选取的号码间隔一样的 系统抽样方法,则所选取 5 枚导弹的编号可能是( A.5,10,15,20,25 C.1,2,3,4,5
专题三
统计
§1 随机抽样
讲课人:张艳琴
石泉中学
高三数学一轮复习
北师大版
高考定位
考纲解读 1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本;了解分层 抽样和系统抽样方法. 考向预测 本节主要考查学生在应用问题中构造抽样模型、识别模 型、选择适当的抽样方法抽取样本.
知识梳理
l,l+k,l+2k,…,l+ (n-1)k
的个体抽出.
典例精讲
考点2 抽样方法的选择
例2.判断下列结论是否正确(请在括号中打“√”或“×”)
(1)简单随机抽样是一种不放回抽样.( √ ) (2) 简单随机抽样每个个体被抽到的机会不一样 ,与先后有 关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × ) (4)系统抽样在第1段抽样时采用简单随机抽样.( √ ) (5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样