高中数学必修三《相关关系的强与弱》优秀教学设计
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
人教A版高中数学必修三新课标优秀教案示范教案两个变量的线性相关

2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.。
人教A版高中数学必修3《二章 统计 2.3 变量间的相关关系 阅读与思考 相关关系的强与弱》优质课教案_9

引
入
有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系。
在散点图中,从整体上点的分布看,大致在一条直线附近,我们就称物理成绩和数学成绩这两个变量之间具有线性相关关系,这条直线叫做回归直线。
我们可以利用线性关系来进行预测。
思考:
的值越大,是否意味着正相关程度越强?(给出两幅图让学生观察思考)
(3)
问题:为什么不用协方差除以各自的标准差,反而要除以各自的标准差?
思考:
什么时候取到最值?它的取值范围是什么?
统计学认为:
,Байду номын сангаас
则相关程度很强;
,
则相关程度一般;
,
则相关程度很弱
学生思考回答
根据以往经验,学生可以想到和班级均分做比较
讲
解
协
方
差
相
关
系
数
1.散点图中,我
们看到物理成 绩和数学成绩这两个变量成正相关关系,它们具有相同的变化趋势,即数学成绩好,物理成绩也好。
(1)问题1:
怎么分析一个同学的数学成绩
和物理成绩的好与不好?
(2)
问题2:怎么从数说明随着数学成绩增加,物理成绩也增加?
协方差的定义及其意义
(3)
1.(1)
教师提问:怎么分析一个同学的数学成绩和物理成绩的好不好?
利用物理成绩和数学成绩之间的这种线性关系来进行预测的准确度有多高?即物理成绩与数学成绩的相关关系的程度有多大?这是要去考虑的一个问题。
书写板书
“相关关系的强与弱”
回顾之前所学:相关关系,散点图,回归直线。
从学生学过的知识出发,引出本节课学习的必要性,在课前激发学生对本节课的兴趣,引起他们的重视。
人教A版高中数学必修3《二章统计2.3变量间的相关关系阅读与思考相关关系的强与弱》优质课教案_4

课堂教学设计案四、教学环境及资源准备让不同层次的学生优化组合,围圈而坐,相互促进•把制作模型的材料分类整理好摆放在学具摆放区,并设置好卡片、张贴板与多媒体课件进行辅助教学.主持台学具摆放区多媒体展示区成果展示区习题训练区C. r 2 :: r 4 :: 0 . r 1 ■■■. r 3D. .r 4 :: r 2 :: 0 :: r 3 :: r 1两个变量x 与y 正(负)相关时,他们就有相同(反)的变化趋势, 当x 和由小变大时,相应的 y 有由小(大)变大(小)的趋势,因此可 以用回归直线来描述这种关系。
与此相关的一个问题是:如何描述 x与y 之间的这种线性关系的强弱?【阅读与思考】(约10分钟)1•两个变量的相关关系的计算公式为r= ____________2•对于变量x,y ,如果 产 ________ ,那么负相关很强;产 __________ , 那么正相关很强; 如果r 匕 _________ 或r 匕 _________ ,那么相关性一般; 如果 汚 __________ ,那么相关性较弱.【知识启航站】(约5分钟)例1:对四组数据进行统计,获得如图所示的散点图,关于其相关关系 的比较,正确的是( ) Is1S536提出问题, 学生主动思 考并完成卡 片上的问题检验学生 对基础知识的掌握 能力•有 利于对新 课的引入 5 10 15 20 25 M 35 A .r 2 :: r 4 :: 0 :: r 3 :: r 1B. r 4 :: r 2 :: 0 :: A :: r 3 学生小组内 交换交流, 相互检查纠 正规范书 写,强调 细节,使 学生再次 熟悉上节 课内容, 有利于本 节课知识 的学习学生通过阅 读课本92-93页内容,了解相 关系数的强 与弱的概 念,思考相 关系数的强 与弱的计算 方法,并尝 试计算相关 系数.让单调的 数学概念 问题变得 有活力,提高学生 的参与例2.甲、乙、丙、丁四位同学各自对A,B 两变量的线性相关关系做实验,并用回归分析的方法分别求得相关系数如表:则哪位同学的试验结果体现 A,B 两变量有更强的相关性()A.甲B.乙 C 丙D. 丁【合作与探究】(品出知识,品出题型,品出方法)例3. 5个学生的数学和物理成绩如下表:画出散点图,计算相关系数,并判断它们相关关系的强弱 学生小组讨论完成,教 师在各个小 组间个别指 导学生小组讨 论完成,未 完成及错误 的由学生先 补充,老师 做适当点 评,完成后 各小组展示 讨论成果通过思考 形成结 论,有利 于学生掌 握与记忆让学生通 过实践计算,初步 掌握相关 系数的计练习3.下表提供了某厂节能降耗技术改造后生产甲产品过程中 记录的产量x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据 (2) 请根据上表提供的数据,计算相关系数,并判断它们相关关 系的强弱.(J2.5 : 3.54)练习4.某公司利润y (单位:万元)与销售总额 x (单位:千 万元)之间有如表对应数据:(1) 画出散点图;(2) 求相关系数r,判断x 与y 线性相关强度学生完成后 在白板上展 示自己的讨 论结果,并讲 解给其他同 学听 老师对学生 未说明和错 的地方做适 当的补充和 纠正检验学生所 学知识的运 用能力,锻 炼学生的思 维严密性以 及语言表达 能力培养学生小 组合作思 考、解决问 题的能力, 并提高思维 的灵活性学生通过思 考和观察,在 生活中寻找 两个变量,并通过Excel 软件,快速计算 出相关系数, 再应用所学 知识,判断两 个变量间的 关系让学生体会 生活中变量 之间的关 系,培养学 生归纳能力,给予自 我展示的机 会,提高学 生的自信心学生思考、总 结,并发表自 己的意见,教 师指导,并给 出完整小结 重温知识 点,让学生 再次回顾本 节课知识【课堂小结】【实践与探索】每个小组选取合适的样本,收集好数据,并用 Excel 展示两组数据的散点图,并对它们的相关性进行讨论和展示.我是第—小组代表,我们搜集了 ________________________ 与 ______ 之间的数据,从搜集的数据的散点图中我们估计, ________ 与 ______ 之间存在 (正相关、负相关、不相关)的 关系。
人教版高中数学必修三《相关关系的强与弱》

n
n
y
i 1
i
y
2
有关系,即还要考虑它们
各自的标准差. 除以标准差,
就是把变量变化的幅度对
n
i 1 n
xi x yi y
2 n 2 i 1
i 1
xi x yi y
相关程度的影响剔除掉了.
Page
8
8
相关系数
统计中用相关系数 r 来衡量两个变量之间线性关系的强弱.
若相应于变量 x 的取值 x i ,变量 y 的观测值为 yi (1 i n) ,
则两个变量的相关系数的计算公式为:
r
i 1 n
xi x yi y
2 n 2 i 1
n
思考: 相关系数取值
i 1
xi x yi y
范围是多少?
1 r 1
72 73 71 65 60 46 59 50 58 61
51 37 67 60 75 67 95 91 81 82
72 75 59 74 58 50 81 67 50 57
66 66 61 49 89 88 75 61 71 60
72 72 64 63 66 73 64 43 72 77
yi y D(Y )
n
72 72 64 63 66 73 64 43 72 77
74 72 73 68 88 70 65 52 59 41
i
63 55 79 83 72 66 70 79 42 50
83 74 82 69 69 60 67 55 46 41
i
86 70 80 85 61 63 82 65 45 40
问题2:
高中数学新人教版B版精品教案《人教版B高中数学必修3 2.3.1 变量间的相关关系》0

变量间的相关关系——陈世亮教学目标:1通过收集现实问题中两个变量的数据,探究变量间的关系;2通过散点图直观判断两变量间的相关关系;3通过收集、整理、分析数据,培养学生解决问题的能力。
教学重点:通过收集现实问题中两个有关联变量的数据,利用散点图直观认识并判断变量间的相关关系。
教学难点:变量间相关关系的理解,回归分析思想的理解。
教学用具:电教平台。
教学方法:类比、观察、交流、讨论、迁移。
教学过程:一情景引入问题1:现实生活中存在许多变量,请判断下列几组变量之间是否存在关系?是的话,是什么关系?1人的身高与视力;2正方形边长与面积;3商品销售收入与广告支出经费;4粮食产量与施肥量;5人体内的脂肪含量与年龄学生通过类比、观察、交流、讨论,得出结论,并由两名学生回答问题。
老师点评并得出:小结一1函数关系:当自变量取值一定时,因变量的取值由它唯一确定,是一种确定的关系。
2相关关系:当自变量取值一定时,因变量的取值带有一定的随机性,是一种不确定的关系。
3相关关系与函数关系的异同点与联系:函数关系相关关系相同点 均是指两个变量的关系不同点1确定关系;2是因果关系,有这样的因,必有 那样的果。
1非确定的关系;2不一定是因果关系,可能是伴随关 系。
联系在一定条件下可相互转化对具有相关关系的两个变量进行统计分析的方法叫回归分析。
练习一1下列两个变量之间的关系是相关关系的是 A 正方体的棱长和体积 B 学生的身高与数学成绩 C 圆的半径与圆的周长 D 日照时间与水稻的亩产量 2下列关系中,属于相关关系的是 填序号. ①人的身高与体重的关系;②做自由落体运动的物体的质量与落地时间的关系; ③降雪量与交通事故的发生率之间的关系.学生思考,并回答问题。
老师点评并引导学生得出:要分析这些变量之间相关程度的强弱, 一是凭经验粗略估计; 二是可发挥统计知识的作用, 用一些有说服力的数据来确定变量之间的相关关系二探究新知问题2:为了研究人体脂肪含量和年龄关系,研究人员获得了一组样本数据:思考1:观察上表中的数据,人体的脂肪含量与年龄之间有怎样的关系? 思考2:以轴表示年龄,轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?50494541392723年龄28.226.327.525.921.217.89.5脂肪61605857565453年龄34.635.233.530.831.430.229.6脂肪学生思考,并上黑板画出图形。
最新人教A版必修3高中数学2.3变量间的相关关系教学设计

2. 3变量间的相关关系一、教材分析本节知识内容不多,但分析本节内容,至少有下列特点:1)知识的联系面广,应用性强,概念的真正理解有难度,教学既要承前启后,完成统计必修基础知识的构建;也要知道知识的来龙去脉,提升学生运用统计知识解决实际问题的能力,更要抓住本质,正确理解统计推断的结论。
2)通过典型案例进行教学,使知识形成的过程中具有可操作性,易于创设问题情境,引导学生参与,而学生借助解决问题,通过自主思维活动,会产生感悟、发现,能提出问题,思考交流,不仅能正确、全面地理解基础知识和基本方法,而且能促进、发展学生的统计意识、统计思想。
二、教学目标1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;2. 知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
三、教学重点难点重点:作出散点图和根据给出的线性回归方程系数公式建立线性回归方程。
难点:对最小二乘法的理解。
四、学情分析本节是一种对样本数据的处理方法,但侧重的是由样本推断总体,其方法是学生初识的、知识的作用也是学生初见的。
知识量并不大,但涉及的数学方法、数学思想较充分,同时,在教材中留有供发现的点,设有开放性问题,既具有体验数学方法、数学思想的功能,也具有培养学生从具体到抽象能力、锻炼创造性思维能力的作用。
五、教学方法1.自主探究,互动学习2.学案导学:见后面的学案。
3.新授课教学基本环节:预习检查、总结疑惑→情境导入、展示目标→合作探究、精讲点拨→反思总结、当堂检测→发导学案、布置预习六、课前准备1.学生的学习准备:预习课本,初步把握必须的定义。
2.教师的教学准备:多媒体课件制作,课前预习学案,课内探究学案,课后延伸拓展学案。
七、课时安排:1课时八、教学过程〖复习回顾〗标准差的公式为:______________________________________________________ 〖创设情境〗1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。
第 3 章 强联系和弱联系

– 两个节点A和B,设想1个单位的流量从A到B ,均分到它们之间所有的最短路径上
• K条路径,则每条路径上分得1/k, • 若一条边被m条路径共用,则在它上面流过m/k
– 所有节点对都考虑后,一条边上的累记流量 就是它的介数(betweenness)
有没有数据来支持这结论?
• 上述结论的精神:两人关系的强度与是否 有共同朋友直接相关
– 捷径意味着没有共同朋友,强度为“弱”。
• 推论:共同朋友数越多,关系的强度越高
– 精细一些,可以说共同朋友数在总朋友数中 的占比(邻里重叠度)
• 我们来找一个能验证这个推论的场景,从 而也就间接验证上述结论
逐步删除高介数边:例
• b(7,8) = 49
– 两边各7个节点,都要经 过它,7*7;7个节点内 部则不经过
• b(3,7)=b(6,7)=b(8,9)= b(8,12) = 33 – 3*7+3*4 • b(1,3)=… = 12
– 涉及1和3-14等12个节点
• b(1,2)=… b(13,14) = 1
• 若A有两个强关系邻居B和C,但B-C之间没 有任何关系(s或w),则称节点A违背了 强三元闭包原理; • 如果节点A没有违背强三元闭包原理,则 称节点A符合强三元闭包原理。
注意:如同聚集系数,一个节点是否符合强三元闭包也是严 格定义的,即每个节点要么“符合”,要么“违背”。
哪些节点符合/违背强三元闭包?
自底向上 -每个节点得单位流量 -在其上面的边上按最 短路径数的比例分配
社会网络的基本概念 及其在OSN上的体现 •
三元闭包,关系的强度及其与网络结构的关系, 同质性及其影响,正负关系及其平衡,幂率, 小世界,节点的地位与关系的均衡,…
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《相关关系的强与弱》
教学设计
教学过程
教学过程一、导入新课:
我们知道,两个变量x与y正(负)相关时,他们就有相同(反)
的变化趋势,当x和由小变大时,相应的y有由小(大)变大(小)
的趋势,因此可以用回归直线来描述这种关系。
与此相关的一个问题
是:如何描述x与y之间的这种线性关系的强弱?例如,物理成绩与
数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是
相关强弱的问题,类似的还有吸烟语健康的负相关强度、父母身高与
子女身高的正相关强度、农作物的产量与施肥量的正相关强度等。
从上节课的例题我们来看一看两个变量之间的相关强度如何:
1.下图是人体脂肪含量与年龄的散点图:
如下图:
从散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在
从左下角到右上角的区域,成正相关。
2.汽车的载重和汽车每消耗1升汽油所行使的平均路程,作出散点图发
现,它们散布在从左上角到右下角的区域内,它们成负相关。
3.5个学生的数学和物理成绩如下表:
画出散点图,看它们相关关系的强弱。
展示)
的
发,让学生
充分体会数
学与实际生
活的联系,
从而使得本
节知识的形
成更自然、
更生动。
借助多媒体
辅助教学进
行演示,引
导学生观察
并分析由图
形得出的结
论。
设置问题,
教学过由散点图可见,两者之间具有正相关关系。
4.气温与热饮销售杯数之间关系的散点图:
可见气温与热饮杯数成负相关,即气温越高,卖出去的热饮杯数越少。
5.看下面一组图片:
引发学生的
思考,激发
学生的求知
欲望。
以教师为主
导,遵从学
生认识规律
进行启发;
以学生为主
体,合作探
究式进行学
习。
答物理成绩
50
55
60
65
70
75
80
405060708090
40
50
60
70
80
90
100
110
120
130
140
150
160
-10010203040
程
教引出相关系数r及其含义
从这些案例的散点图中我们能比较直观的看出两个变量之间是否具有
线性关系,且初步判断强弱,但我们并不能确切地量化
的进行区分,下面我看看如何用数据进行判断。
统计中用相关系数r来衡量两个变量之间线性关系的强弱,若相
应于变量x的取值i x,变量y的观测值为i y)
1(n
i≤
≤,则两个变量
的相关系数的计算公式为
.
11
2
2
1
∑∑
∑
==
-
-
=
-
-
⎪
⎭
⎫
⎝
⎛-
⎪
⎭
⎫
⎝
⎛-
⎪
⎭
⎫
⎝
⎛-
⎪
⎭
⎫
⎝
⎛-
=
n
i
n
i
i
i
n
i
i
i
y
y
x
x
y
y
x
x
r
不同的相关性可以从散点图上直观地反映出来。
图1、图2反映了变量
x和y之间很强的线性相关关系,而图4中的两个变量的线性相关程
度很弱。
对于相关系数r,首先值得注意的是他的符号,当r为正时,表明变量
x和y正相关;当r为负时,表明变量x和y负相关,反映在散点图
上,图1中的变量x和y正相关,这时的r为正,图2中的变量x和y
负相关,这时的r为负。
另一个值得注意的是r的大小。
统计学认为,对于变量x、y,如果[]75.0,1-
-
∈
r,那么负相关很强;如果[]1,75.0
∈
r,那么正相关很强,
如果(]30.0,75.0-
-
∈
r或[),
75
.0,
30
.0
∈
r那么相关性一般,如果
借助多媒体
辅助教学进
行演示,引
导学生观察
并分析由图
形得出的结
论。
学过程
教
[)25.0,25.0-
∈
r,那么相关性较弱。
反映在散点图上,图1的r=0.97,
这些点有明显的从左下角到右上角沿直线分布趋势,这时用线性回归
模型描述两个变量之间的关系效果很好;图2的r=-0.85,这些点也有
明显的从左上角到右下角沿直线分布趋势,这时用线性回归模型描述
两个变量之间的关系也有好的效果;图3 的r=0.24,这些点的分布几
乎没有什么规则,这时不能用线性回归模型描述两个变量之间的关系;
图4 的r=-0.05,两个变量之间几乎没有什么关系,这时就更不能用线
性回归模型描述两个变量之间的关系。
你能试着对自己身边的某个问题,确定两个变量,通过收集数据,极
端相关系数,计算相关系数,然后分析一下能否用线性回归模型来拟
合它们之间的关系吗?
看下面的问题:
例1:甲、乙、丙、丁四位同学各自对A,B两变量的线性相关关系做实
验,并用回归分析的方法分别求得相关系数r如表:
甲乙丙丁
r-0.82 -0.78 -0.69 -0.85
则哪位同学的试验结果体现A,B两变量有更强的相关性( )
A.甲
B.乙
C.丙
D.丁
例2:对四组数据进行统计,获得如图所示的散点图,关于其相关关系
的比较,正确的是()
1
3
4
2
.r
r
r
r
A
3
1
2
4
.r
r
r
r
B
1
3
2
4
.r
r
r
r
C
3
1
4
2
,r
r
r
r
D
例3:某公司利润y(单位:万元)与销售总额x(单位:千万元)之
间有如表对应数据:
x10 15 17 20 25 28 32
y 1 1.3 1.8 2 2.6 2.7 3.3
(1)画出散点图;
(2)求相关系数r判断y与x线性相关强度.
例4:一个车间为了规定工时定额,需要确定加工零件所花费的时间,
为此进行了10次试验,收集数据如下:
零件(个
数)
10 20 30 40 50 60 70 80 90 100
加工时
间(min)
62 68 75 81 89 95 102 108 115 122
(1) 画出散点图;
学生活动,
动手计算,
做出相关结
论。
学生活动:。