第34课时 频率分布与线性回归

合集下载

高考数学 课时34 变量的相关性与统计案例单元滚动精准测试卷 文 试题

高考数学 课时34 变量的相关性与统计案例单元滚动精准测试卷 文 试题

课时34变量的相关性与统计案例制卷人:歐陽文化、歐陽理複;制卷時間:二O 二二年二月七日模拟训练〔分值:60分 建议用时:30分钟〕1. (2021·三中月考,5分)某商品销售量y (件)与销售价格x (元/件)负相关,那么其回归方程可能是( )A. y ^=-10x +200B. y ^=10x +200 C. y ^=-10x -200 D. y ^=10x -200 【答案】:A【解析】:因为销量与价格负相关,由函数关系考虑为减函数可排除B 、D ,又因为不能为负数,再排除选项C,所以选A.2.〔2021·二模,5分〕对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截距为( )A.a ^=y +b ^xB.a ^=y +b ^xC.a ^=y -b ^xD.a ^=y -b ^x【答案】:D【解析】:由回归直线方程恒过(x ,y )定点.3. 〔2021·六校联考,5分〕研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如下表所示:女 143 8 151 合计30535340根据以上数据,那么( )A. 性别与获取学位类别有关B. 性别与获取学位类别无关C. 性别决定获取学位的类别D. 以上都是错误的 【答案】:A 【解析】:,所以性别与获取学位类别有关.4.(2021·模拟)对两个变量y 和x 进展回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),那么以下说法中不.正确的选项是( ) A .由样本数据得到的回归方程y ^=b ^x +a ^必过样本中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好D .假设变量y 和x 之间的相关系数为r =-0.9362,那么变量y 和x 之间具有线性相关关系【答案】:C【解析】:C 中应为R 2越大拟合效果越好.5.(2021·四校)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:甲乙丙丁rm 106115124103那么哪位同学的试验结果表达A、B两变量有更强的线性相关性( )A.甲B.乙C.丙D.丁【答案】:D【解析】:丁同学所得相关系数0.85最大,残差平方和m最小,所以A、B两变量线性相关性更强.6. (2021·月考)下表是某同学记载的12月1日到12月12日每天某感冒病患者住院人数数据,及根据这些数据绘制的散点图,如以下图.日期人数100109115118121134141152168175186203以下说法正确的个数有( )①根据此散点图,可以判断日期与人数具有线性相关关系;②根据此散点图,可以判断日期与人数具有一次函数关系;③后三天住院的人数约占这12天住院人数的30%.A. 1个B. 2个C. 3个D. 0个【答案】:B【解析】:12天得住院总人数是1722人,后3天住院人数为564人,①③正确7.〔2021·测试,5分〕某小卖部为了理解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:由表中数据算得线性回归方程y ^=b ^x +a ^中的b ^≈-2,预测当气温为-5℃时,热茶销售量为________杯.(回归系数b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )【答案】:70【解析】:根据表格中的数据可求得x =14(18+13+10-1)=10,y =14(24+34+38+64)=40.∴a ^=y -b ^x =40-(-2)×10=60,∴y ^=-2x +60,当x =-5时,y ^=-2×(-5)+60=70.8.〔2021·湟川中学月考,5分某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比拟,提出假设H 0:“这种血清不能起到预防感冒的作用〞,利用2×2列联表计算得K 2≈3.918,经查临界值表知P (K 2≥3.841)≈0.05.那么以下结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用〞; ②假设某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%. 【答案】:①9.〔2021·广西柳铁一中月考,10分〕某车间为了规定工时定额,需要确定加工零件所花费的时间是,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=bx +a ,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )【解析】:(1)散点图如图.零件的个数x (个) 2345加工的时间是y (小时) 3 4(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b =0.7,∴a =1.05,∴y ^x +1.05, 回归直线如下图.归直线方程,得y ^=0.7×10+1.05=(3)将x =10代入回8.05,∴预测加工10个零件需要8.05小时.10.〔2021·教育学院附中质检,10分〕x 、y 之间的一组数据如下表:x 1 3 6 7 8 y12345(1)从x 、y 中各取一个数,求x +y ≥10的概率;(2)针对表中数据,甲、乙两同学给出的拟合直线分别为y =13x +1与y =12x +12,试利用“最小二乘法〞判断哪条直线拟合程度更好.用y =12x +12作为拟合直线时,y 的实际值与所得的y 值的差的平方和为s 2=(1-1)2+(2-2)2+(3-72)2+(4-4)2+(5-92)2=12.因为s 1>s 2,故直线y =12x +12的拟合程度更好.[新题训练] 〔分值:10分 建议用时:10分钟〕 11. 〔5分〕以下命题错误的个数是 .①考古学家在内蒙古大草原上,发现了史前马的臀骨,为了预测其身高,利用建国后马的臀骨(x )与身高(y )之间的回归方程对史前马的身高进展预测.②康乃馨、蝴蝶兰、洋兰是母亲节期间常见的花卉,一花农为了在节前能培育出三种花卉,便利用蝴蝶兰的温度(x )与发芽率(y )之间的回归方程来预测洋兰的发芽率.③一饲料商人,根据多年的经销经历,得到广告费用(x /万元)与销售量(y /万吨)之间的关系大体上为yx +7,于是投入广告费用100万元,并信心十足地说,今年销售量一定到达47万吨以上.④女大学生的身高和体重之间的回归方程为y ^x -85.7,假设小明今年13岁, 他的身高是150 cm ,那么他的体重为41.65 kg 左右.【答案】:4【解析】:①忽略了回归方程建立的时间是性,现代马匹对史前马匹存在着很大程度上的差异,所以这样预测没有意义;对于②其在很大程度上,看中的是三种花卉在母亲节意义上的平行性,而忽略了物种本身的生理特点;对于③误把回归方程中的两个变量x 与y 的关系作为函数中的自变量与因变量,将x 与y 看做因果关系,而错误的认为预报值即为预报变量的准确值,其实回归方程得到的预报值是预报变量的可能取值的平均值.④使用范围不对,无法估计.故4中说法都是错误的.12. 〔5分〕某服装厂引进新技术,其消费服装的产量x (百件)与单位本钱y (元)满足回归直线方程yx ,那么以下说法正确的选项是( )【答案】:A【解析】:回归直线的斜率为-16.2,所以x 每增加1,y 下降16.2,即服装产品每增加100件,单位本钱下降16.2元.制卷人:歐陽文化、歐陽理複;制卷時間:二O二二年二月七日。

第三章3.4-3.5经典线性模型回归模型-检验及预测

第三章3.4-3.5经典线性模型回归模型-检验及预测

p

F0 F 不能拒绝域 拒绝域
关于拟合优度检验与 方程显著性检验关系的讨论

R
2
1
RSS /( n k 1 ) TSS /( n 1 )

n 1
F
ESS / k RSS /( n k 1 )
可推出: 或
R
2
1
n k 1 kF
F
R
2
2
/k
(1 R ) /( n k 1 )
样本容量变大参数估计量的标准差变小样本容量变大t分布的临界值变小提高模型的拟合优度模型的拟合优度越高残差平方和越小增大样本容量因为参数估计量的标准差与残差平方和成正比参数估计量的标准差变小可以证明
§3.4
线性回归模型的统计检验
• 拟合优度检验-R2检验 • 方程的显著性检验-F检验 • 变量的显著性检验-t 检验
Stata 回归结果如下:
reg yi xi Source SS df MS 4482804.38 13402.003 510002.267 Number of obs = 10 F( 1, 8) = 334.49 Prob > F = 0.0000 R-squared = 0.9766 Adj R-squared = 0.9737 Root MSE = 115.77
j
0 ( i 1, 2 , , k )
H1: j 0
构造检验的t统计量
由无偏性,估计量的期望值等于参数真值:
E ( j ) j ( j 1, 2 , , n )

OLS估计中
的方差协方差阵为
cov( 0 , 1 ) Var 1

中考专题复习第34课时 数据的集中趋势和离散程度

中考专题复习第34课时 数据的集中趋势和离散程度
回归统计与概率 考点3 用样本估计总体
1.统计的基本思想:利用样本特征去估计总体的 特征是统计的基本思想.注意样本的选取要有足够的代 表性. 2.利用数据进行决策时,要全面、多角度地去分 析已有数据,比较它们的代表性和波动大小,发现它们 的变化规律和发展趋势,从而做出正确的决策.
[解析] 把这 25 个数据按从小到大的顺序排列,第 13 个 数据是 350,故该月销售量的中位数是 350 件.所给出的 25 个数据中出现次数最多的数据是 300,有 7 次,故众数为 300 件.
回归教材
考点聚焦
考向探究
第八单元┃ 统计与概率
4.[九上 P103 习题第 7 题] 某公司为了解每天的用电 情况,抽查了某月 10 天该公司的用电量,统计如下(单位: 度) :
用电量 天数 90 93 102 113 114 120 1 1 2 3 1 2
108 度; (1)该公司这 10 天的日平均用电量是________ (2) 估 计 该 公 司 该 月 的 用 电 量 ( 按 30 天 计 算 ) 为 3240 度; ________ (3)若每度电的定价为 0.5 元,估计该公司该月的电费 1620 元. 支出是________
初三中考复习34
初三数学组
第八单元
第34课时
统计与概率
数据的集中趋势和离散程度
第八单元┃ 统计与概率
回 归 教 材
1.[九上 P116 练习第 1 题] 某地某日最高气温为 12 ℃, 19 最低气温为-7 ℃,该日气温的极差是________ ℃.
[ 解析 ] 极差是一组数据中最大数据与最小数据之 差,12-(-7)=19,故极差是 19 ℃.
回归教材
考点聚焦

正态分布与线性回归

正态分布与线性回归
独立重复试验时事件 A 第一次发生,且 P(ξ=k)=_q_k_-_1_p_(其中 P 是在
一次试题中事件 A 发生的概率;p+q=1,k=1,2,3,…),则称 ξ 服从 几何分布,记作 g(k,p)=qk-1p.
第74讲 │ 要点探究
要点探究
► 探究点1 离散型随机变量的分布列及其应用
例 1 已知某离散型随机变量 ξ 的分布列如下:
A=A1 B 1+ A 1B1+A1B1+A2B2,故所求的概率为
P(A)=P(A1 B 1)+P( A 1B1)+P(A1B1)+P(A2B2)
第74讲 │ 要点探究
=P(A1)P( B 1)+P( A 1)P(B1)+P(A1)P(B1)+P(A2)P(B2) =0.1×0.9+0.9×0.1+0.1×0.1+0.3×0.3=0.28.
[点评] (1)二项分布是一类重要的分布,要熟练掌握.在写分布列时, 首先要判断随机变量是否满足二项分布的条件.(2)在进行概率计算时, 要注意排列、组合等知识在等可能事件中的应用,要注意互斥事件、相 互独立事件、独立重复试验的概率的应用.
第74讲 │ 要点探究
某厂生产电子元件,其产品的次品率为 5%,现从 一批产品中任意连续取出 2 件.
3.课时安排:本单元共安排了4讲及一个单元能力训练卷, 每讲建议1课时完成,单元能力训练卷建议1课时完成,大约共 需5课时.
第74讲 │ 离散型随机变量的分布列
第74讲 离散型随机变量的分布 列
第74讲 │ 编读互动
编读互动
离散型随机变量及其分布列是高考必考的一个知识点,常常作为 解答题的一问出现.本讲主要复习离散型随机变量及其分布列的计算, 复习时,要抓住离散型随机变量的概率分布的两个本质特征:pi≥0(i =1,2,…,n),p1+p2+…+pn=1,这是确定分布列中参数值的依据.求 离散型随机变量的分布列时,首先要根据具体情况确定随机变量 ξ 的 取值情况,然后利用排列、组合与概率知识求出 ξ 取各个值的概率.掌 握几个典型的分布列:几何分布、二项分布等.

八年级数学第五章数据的收集与处理第34节北师大版知识精讲

八年级数学第五章数据的收集与处理第34节北师大版知识精讲

初二数学第五章:数据的收集与处理第3、4节北师大版【本讲教育信息】一. 教学内容:第五章:数据的收集与处理第三节:频数与频率第四节:数据的波动二. 教学要求:1、理解频数与频率等概念,并能绘制相应的频数分布直方图和频数分布折线图。

能根据数据处理的结果,做出合理的判断和预测,从而解决实际问题,并在这一过程中体会统计对决策的作用。

2、了解极差、方差、标准差的概念,知道极差、方差、标准差都是刻画数据离散程度的统计量。

熟练掌握方差的计算公式,并会用计算器计算一组数据的标准差与方差。

理解一组数据的极差、方差或标准差越小,这组数据就越稳定。

三. 重点、难点:重点:1、运用频数与频率概念以及相应的频数分布直方图进行数据处理,做出合理判断和预测。

2、运用极差、方差、标准差解决实际问题。

难点:1、根据数据处理的结果,做出合理的判断和预测。

2、对极差、方差、标准差概念的理解。

四. 课堂教学:[知识要点]知识点1、有关概念(1)频数:在数据的收集中由于某些对象出现的频繁程度不同,称每个对象出现的次数为频数。

频数(2)频率:每个对象出现的次数与总次数的比值为频率,即频率=数据总数(3)频数分布直方图:对收集的数据可用适当的统计图表示出来,当收集的数据需连续取值时,可先将数据适当分组,然后再绘制出频数分布直方图。

(4)频数分布折线图:为了更好地刻画数据的总体规律,在频数分布直方图上取点,连线即得到频数分布折线图。

知识点3、如何绘制频数分布直方图频数分布直方图反映了样本数据落在各个小范围内的多少,绘制一组数据的频数分布直方图的步骤有:(1)计算最大值与最小值的差; (2)决定组距与组数,(数据越多,分的组数也应越多,当数据在100个以内时,通常按照数据的多少分成5——12个组,组距是指每个小组的两个端点之间的距离,一般要求各组的组距相等)(3)决定分点 (4)列频数分布表(5)画频数分布直方图。

对于一组已给出的数据,可以通过求平均数、中位数和众数来反映数据的平均水平,也可以通过求极差、方差和标准差来了解数据的离散程度,极差极易计算,但只对极端值比较敏感,方差计算比较复杂,但能比较全面地刻画一组数据的离散程度。

高中数学第三章统计案例3.1第2课时线性回归分析达标练习含解析2_3

高中数学第三章统计案例3.1第2课时线性回归分析达标练习含解析2_3

第三章统计案例3.1 回归分析的基本思想及其初步应用第2课时线性回归分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r 0.820。

780.690。

85m 106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.已知回归方程错误!=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9。

1),则残差平方和是()A.0。

01 B.0。

02 C.0.03 D.0.04解析:因为残差错误!i=y i-错误!i,所以残差的平方和为(4。

9-5)2+(7。

1-7)2+(9.1-9)2=0。

03。

答案:C3.若某地财政收入x与支出y满足线性回归模型y=bx+a +e(单位:亿元),其中b=0.8,a=2,|e|〈0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿元B.9亿元C.10。

5亿元D.9。

5亿元解析:x=10时,错误!=0。

8×10+2=10.因为|e|〈0.5,所以年支出预计不会超过10.5亿元.答案:C4.下列说法中正确的是()①相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;②回归直线错误!=错误!x+错误!一定经过样本点的中心(x,y);③随机误差e满足E(e)=0,其方差D(e)的大小用来衡量预报的精确度;④相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好.A.①②B.③④C.①④D.②③解析:①线性相关关系r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,①错误;②回归直线错误!=错误!x +错误!一定通过样本点的中心(x,y),②正确;③随机误差e是衡量预报精确度的一个量,它满足E(e)=0,③正确;④用相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,④错误.答案:D5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),且e i恒为0,则R2为________.解析:由e i恒为0,知y i=错误!i,即y i-错误!i=0,答案:17.根据如下样本数据得到的回归方程为错误!=错误!x+错误!,若错误!=5。

高考数学理一轮复习 X1-4正态分布、线性回归精品课件

高考数学理一轮复习 X1-4正态分布、线性回归精品课件

备选例题1 设随机变量ξ服从正态分布:ξ~ N(1,4),试求:
(1)P(0<ξ≤2); (2)求常数C,使P(ξ≤C)=32·P(ξ>C).
参考数据:Φ(0)=0.5,Φ(1)=0.8413,Φ(2) =0.9772,Φ(0.5)=0.6915,Φ(1.88)= 0.9697,Φ(3)=0.9987.
2.小概率事件是指事件发生的概率很小的事, 通常认为这些情况在一次试验中几乎是不可 能发生的.
3.统计中假设检验的基本思想:根据小概率 事件在一次试验中几乎不可能发生的原理和 从总体中抽测的个体的数值,对事先所作的 统计假设作出判断,是拒绝假设,还是接受 假设.
4.利用线性回归方程,可由一个变量的值预 测或控制另一个变量的值.借助计算器,特 别是含统计的计算器,能简化手工的计算, 迅速得出正确结果.
(函数Φ(x0)实际上是正态总体N(0,1)的累积分
布函数),即Φ(x0)=

(5)两个重要公式:ⅰ.Φ(-x)=1Φ(x)


Φ(a)
ⅱ.P(a<ξ<b)=Φ(b)-
. 小于
(6)对于任一正态分布总体N(μ,σ2)来说,取
值 x的概率为F(x)=Φ(
).
(7)假设检验的基本思想
ⅰ.提出统计假设,如假设随机变量服从正态 分布等;
5.“回归”和“相关”含义是不同的:如果 两个变量中的一个变量是人为可以控制、非 随机的,另一变量的变化是随机的且随着控 制变量的变化而变化,则这两变量间的关系 就称为回归关系;若两个变量都是随机的, 则称它们之间的关系为相关关系,在本教材 中,两者不加区别.
方法规律·归纳
题型 一
正态分布的基本运算
思维 提示
①P(x<x0)=Φ(x0); ②Φ(x0)=1-Φ(-x0);

正态分布 线性回归

正态分布 线性回归

正态分布与线性回归1 已知连续型随机变量ζ的概率密度函数⎪⎩⎪⎨⎧>≤≤+<=)2(0)20(1)0(0)(x x kx x x f ,且f(x) ≥0,求常数k 的值,并计算概率P(1.5≤ξ<2.5)。

分析:凡是计算连续型随机变量ξ的密度函数f(x)中的参数、概率P(a ≤ξ≤b)都需要通过求面积来转化而求得。

若f(x) ≥0且在[a ,b]上为线性,那么P(a ≤ξ≤b)的值等于以b-a 为高,f(a)与f(b)为上、下底的直角梯形的面积,即1()[()()]()2P a b f a f b b a ξ≤≤=+-。

解: ∵1()(0)(02)(2)P P P P εξξξ=-∞<<+∞=-∞<<+≤≤+<<+∞0(02)0P ξ=+≤≤+1[(0)(2)](20)(0)(2)222f f f f k =+-=+=+∴21-=k ;∴1(1.5 2.5)(1.52)(2 2.5)(1.52)16P P P P ξξξξ≤<=≤≤+<<=≤≤=。

2 设),(~2σμN X ,且总体密度曲线的函数表达式为:412221)(+--=x x ex f π,x ∈R 。

(1)求μ,σ;(2)求)2|1(|<-x P 及)22121(+<<-x P 的值。

分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。

利用一般正态总体),(2σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。

解:(1)由于222)2(2)1(41222121)(--+--⋅==x x x eex f ππ,根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。

(2))2121()2|1(|+<<-=<-x P x P2121(12)(12)()()22(1)(1)2(1)120.84131F F 1+-1--=+--=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

龙文教育学科教师教案
课程/科目: 高中数学 合同编号: 学员姓名: 年级:高三
上课日期: 上课时间: 学科教师:何鹏

学科组长签名及日期
课 题 第34课时 频率分布与线性回归分析

学习目标
1、学会看频率分布直方图、茎叶图,并求有关的数据
2、会求线性回归方程,并理解其意义

考点及考试要求 根据频率分布直方图求有关的频数和概率;根据散点坐标求线性回归方程
教学内容
知识点与考点
一、频率分布直方图
样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率。所有数据(或数据组)的频率的分布变化规
律叫做频率分布,可以用频率分布直方图来表示。
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图。

注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。

二、茎叶图
茎叶图的概念:当数据是几位有效数字时,用中间的数字表示高位数,两边的数字表示个位数,它的中间部分像植物的
茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;
二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示
(2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
三、用样本的数字特征估计总体的数字特征
(1)众数、中位数
在一组数据中出现次数最多的数据叫做这组数据的众数;
将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据
的中位数;
(2)平均数与方差

如果这n个数据是nxxx,,.........,21,那么niixnx11叫做这n个数据平均数;

如果这n个数据是nxxx,,.........,21,那么)(112niixxnS叫做这n个数据方差;同时s )(11niixxn叫做这n
个数据的标准差。
四、线性回归方程与回归直线
1、线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,称这两个变量之间具有线性相关关系,
这条直线叫回归直线
2、最小二乘法:使得样本数据的点到回归直线的距离之和最小的方法:

3、回归方程:两个具有线性相关关系的的变量,其线性回归方程,ˆabxyab,叫回归系数.其中niiniiixnxyxnyxb1221,
xbya
.点),(yx叫回归直线的样本中心点.

注意:回归直线一定经过样本的中心点。


课前热身
1、为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分
布直方图如下:

根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )
(A)20 (B) 30
(C)40 (D)50
2、频率分布直方图的重心是( )
A. 众数 B. 中位数 C. 标准差 D. 平均数
3、从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的
人数为8人,其累计频率为0.4, 则样本容量是 ( )
A. 20人 B. 40人 C. 70人 D. 80人
4、已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本的范围是 ( )
A. 5.5,7.5 B. 7.5,9.5 C. 9.5,11.5 D. 11.5,13.5

5、两个样本甲和乙,其中x甲=10,x乙=10,2s甲=0.055,2s乙=0.015,那么样本甲比样本乙波动 ( )
A. 大 B. 相等 C. 小 D.无法确定

6、线性回归方程^y=bx+a必过 ( )
A.(0,0)点 B.(x,0)点 C.(0,y)点 D.(x,y)点
典型例题
例1、为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如
下:
组 别 频数 频率
145.5~149.5
1 0.02
149.5~153.5
4 0.08
153.5~157.5
20 0.40
157.5~161.5
15 0.30
161.5~165.5
8 0.16
165.5~169.5
m n
合 计
M N

(1)求出表中,,,mnMN所表示的数分别是多少?
(2)画出频率分布直方图.
(3)全体女生中身高在哪组范围内的人数最多?

例2、某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流
水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为

(490,495,(495,500,……(510,515,由此得到样本的频率分布直
方图,如图4所示.
(1)根据频率分布直方图,求重量超过505克的产品数量.

相关文档
最新文档