高中数学第三章统计案例3.1回归分析的基本思想及其初步应用讲义新人教A版选修23

高中数学第三章统计案例3.1回归分析的基本思想及其初步应用讲义新人教A版选修23
高中数学第三章统计案例3.1回归分析的基本思想及其初步应用讲义新人教A版选修23

高中数学第三章统计案例3.1回归分析的基本思想及其初步应用

讲义新人教A 版选修23

知识点

线性回归模型

(1)函数关系是一种□

01确定性关系,而相关关系是一种□02非确定性关系. (2)回归分析是对具有□

03相关关系的两个变量进行统计分析的一种常用方法. (3)对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),回归直线y ^

=b ^

x +a ^

的斜率和截距的最小二乘估计公式分别为b ^

=□

04∑n

i =1

(x i -x -)(y i -y -

)∑n

i =1

(x i -x -)2

∑n

i =1

x i y i -n x -y -

∑n

i =1

x 2

i -n x

-2

,a ^

=□05y --b ^

x -,其中□06(x -,y -)称为样本点的中心.

(4)线性回归模型y =bx +a +e ,其中a 和b 是模型的未知参数,e 称为□07随机误差,自变量x 称为□

08解释变量,因变量y 称为□09预报变量. 知识点 线性回归分析

1.残差平方和法

(1)e ^

i =□01y i -y ^

i =□02y i -b ^

x i -a ^

(i =1,2,…,n )称为相应于点(x i ,y i )的□03残差. (2)残差平方和□04∑n i =1 (y i -y ^

i )2越小,模型拟合效果越好. 2.残差图法

残差点□

05比较均匀地落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度□

06越窄,说明模型的精确度越高. 3.利用相关指数R 2

刻画回归效果

其计算公式为:R 2=1-□

07∑n

i =1

(y i -y ^

i )2

∑n

i =1

(y i -y -)2

.

其几何意义:□

08R 2越接近于1,表示回归效果越好.

1.建立回归模型的基本步骤

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.

(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等).

(3)由经验确定回归方程的类型(如观察到数据呈线性相关关系,则选用线性回归方程y ^

b ^

x +a ^

).

(4)按一定规则估计回归方程中的参数(如最小二乘法).

(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误或模型是否合适等.

2.线性回归模型中随机误差的主要来源

(1)用线性回归模型作为真实模型的近似所引起的误差.可能存在非线性的函数能够更好地描述y 与x 之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差.

(2)忽略了某些因素的影响.影响变量y 的因素不仅有变量x ,可能还包括其他许多因素,例如,在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响.

(3)观测误差.由于测量工具等原因,导致y 的观测值产生误差. 3.残差分析的结果

(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.

(2)若是有个别样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.

4.对R 2

的理解

(1)预报变量的变化与解释变量和随机误差的关系

预报变量的变化程度可以分解为解释变量引起的变化程度与残差变量的变化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R 2

的值决定的.在线性回归模型中,R 2

表示解释变量对预报变量变化的贡献率.R 2

越接近于1,表示解释变量和预报变量的线性相关性越强;反之,R 2

越小,说明随机误差对预报变量的效应越大.

(2)R 2

与r 的关系

①相关系数可较好地反映变量的相关性及正相关或负相关,而R 2

反映了回归模型拟合数据的效果;

②R 2

是相关系数的平方,其变化范围为[0,1],而相关系数的变化范围为[-1,1]; ③当相关系数|r |接近于1时说明两变量的相关性较强,当|r |接近于0时说明两变量的相关性较弱,而当R 2

接近于1时,说明线性回归方程的拟合效果较好.

1.判一判(正确的打“√”,错误的打“×”)

(1)残差平方和越小,线性回归方程的拟合效果越好.( )

(2)在画两个变量的散点图时,预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2

越接近于1,线性回归方程的拟合效果越好.( ) 答案 (1)√ (2)× (3)√ 2.做一做

(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.

(2)在残差分析中,残差图的纵坐标为________.

(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.

答案 (1)正相关 (2)残差 (3)0 1或-1

解析 (1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关.

(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.

(3)设样本点为(x i ,y i ),i =1,2,3,…,n ,回归直线为y ^

=b ^

x +a ^

;若散点图中所有

的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有y i =y ^

i ;残差平方和∑n

i =1

(y i

-y ^

i )2=0;解释变量和预报变量之间的相关系数R 满足R 2

=1-∑n

i =1 (y i -y ^

i )2

∑n i =1

(y i -y -)2

=1,

所以R =±1.

探究1 求线性回归方程

例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据

x 6 8 10 12

y 2 3 5 6

(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^

=b ^

x +a ^

; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. (相关公式:b ^

=∑n

i =1x i y i -n x -y -

∑n i =1

x 2

i -n x -2,a ^ =y --b ^ x -

)

[解] (1)如图:

(2)∑4

i =1x i y i =6×2+8×3+10×5+12×6=158, x -=6+8+10+12

4=9,

y -

2+3+5+6

4

=4, ∑4

i =1

x 2

i =62

+82

+102

+122

=344, b ^

158-4×9×4344-4×92=

14

20

=0.7, a ^

=y --b ^

x -

=4-0.7×9=-2.3,

故线性回归方程为y ^

=0.7x -2.3.

(3)由(2)中线性回归方程当x =9时,y ^

=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.

拓展提升

求线性回归方程的步骤

(1)列出散点图.从直观上分析数据间是否存在线性相关关系.

(2)计算x -,y -,∑n i =1x 2i ,∑n i =1y 2

i ,∑n

i =1

x i y i . (3)代入公式求出y ^

=b ^

x +a ^

中参数b ^

,a ^

的值. (4)写出回归方程并对实际问题作出估计.

[跟踪训练1] 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:

零件的个数x (个) 2 3 4 5 加工的时间y (小时)

2.5

3

4

4.5

(1)

(2)求出y 关于x 的线性回归方程,y ^

=b ^

x +a ^

,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?

注:b ^

∑i =1

n

x i y i -n x -y

∑i =1

n

x 2

i -n x -

2

,a ^ =y --b ^

x -

. 解 (1)散点图如图.

(2)由表中数据得∑i =1

4

x i y i =52.5,

x -

=3.5,y -

=3.5,∑i =1

4

x 2i =54,

所以b ^

∑i =1

n

x i y i -n x -y

∑i =1

n

x 2

i -n x -

2

=0.7. 所以a ^ =y --b ^

x -

=1.05.

所以y ^

=0.7x +1.05. 回归直线如图中所示.

(3)将x =10代入回归直线方程,得y ^

=0.7×10+1.05=8.05(小时), 所以预测加工10个零件大约需要8.05小时. 探究2 线性回归分析

例2 已知某种商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:

x 14 16 18 20 22 y

12

10

7

5

3

求y 对x [解] x -=1

5

(14+16+18+20+22)=18,

y -

=15

(12+10+7+5+3)=7.4,

∑5

i =1

x 2

i =142

+162

+182

+202

+222

=1660, ∑5

i =1

x i y i =14×12+16×10+18×7+20×5+22×3=620,所以,b ^

∑5

i =1

x i y i -5x -y -

∑5

i =1

x 2i -5x -2=

620-5×18×7.4

1660-5×18

2

=-1.15, a ^

=y --b ^

x -

=7.4+1.15×18=28.1,

所以所求回归直线方程是y ^

=-1.15x +28.1. 列出残差表:

所以,∑i =1 (y i -y i )2

=0.3,∑i =1

(y i -y )2

=53.2, R 2=1-

∑5

i =1 (y i -y ^

i )

2

∑5

i =1

(y i -y -)2

≈0.994,

所以回归模型的拟合效果很好. 拓展提升

这类题目的数据运算繁琐,通常采用分步计算的方法,由R 2

可以看出回归模型的拟合效果,也可以计算相关系数r ,看两个变量的相关关系是否很强.

[跟踪训练2] 为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:

(2)求出R 2

; (3)进行残差分析. 解 (1)散点图如图

x -=16(5+10+15+20+25+30)=17.5,

y -

=16

(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,

∑i =1

6

x 2

i =2275,∑i =1

6

x i y i =1076.2

计算得,b ^

≈0.183,a ^

≈6.285,

所求线性回归方程为y ^

=0.183x +6.285. (2)列表如下:

y i -y ^

i 0.05 0.005 -0.08 -0.045 0.04 0.025 y i -y -

-2.24

-1.37

-0.54

0.41

1.41

2.31

所以∑i =1

6

(y i -y ^

i )2

≈0.01318,∑i =1

6

(y i -y -)2

=14.6784.

所以,R 2

=1-0.0131814.6784≈0.9991,

回归模型的拟合效果较好.

(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与重量成线性关系.

探究3 非线性回归分析

例3 为了研究某种细菌随时间x 变化繁殖的个数,收集数据如下:

天数x /天 1 2 3 4 5 6 繁殖个数y /个

6

12

25

49

95

190

(1)将天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系; (3)计算残差、相关指数R 2

.

[解] (1)由表中数据作散点图如图所示.

(2)由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的图象的周围,其中c 1和c 2是待定系数.于是令z =ln y ,则z =bx +a (a =ln c 1,b =c 2),因此变换后的样本点应该分布在直线z =bx +a 的周围,因此可以用线性回归模型来拟合z 与x 的关系,则变换后的样本数据如下表:

x 1 2 3 4 5 6 z

1.79

2.48

3.22

3.89

4.55

5.25

由表中数据得到线性回归方程z =0.69x +1.115. 因此细菌繁殖个数关于时间的回归方程为

y ^

=e 0.69x +1.115.

(3)列出残差表:

编号i

1 2 3 4 5 6 y ^

i 6.08 12.12 24.17 48.18 96.06 191.52 y i

6 12 25 49 95 190 e ^

i

-0.08

-0.12

0.83

0.82

-1.06

-1.52

∑6i =1e ^ 2

i =∑6i =1 (y i -y ^ i )2

=4.8161,∑6

i =1

(y i -y -i )2

=24630.1, R 2=1-

4.8161

24630.1

≈0.9998.

故解释变量天数对预报变量繁殖个数解释了99.98%,说明该回归模型拟合效果非常好. 拓展提升

非线性回归方程的求法

(1)根据原始数据(x ,y )作出散点图; (2)根据散点图,选择恰当的拟合函数;

(3)作恰当的变换,将其转化成线性函数,求线性回归方程; (4)在(3)的基础上通过相应的变换,即可得非线性回归方程.

[跟踪训练3] 某电容器充电后,电压达到100 V ,然后开始放电,由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt

(b <0)表示,现测得时间t (s)时的电压U (V)如下表:

试求:电压U 对时间t 的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)

解 对U =A e bt

两边取对数得ln U =ln A +bt ,

令y =ln U ,a =ln A ,x =t ,则y =a +bx ,y 与x 的数据如下表:

根据表中数据画出散点图,如图所示,从图中可以看出,y 与x 具有较好的线性相关关系,由表中数据求得x -=5,y -

≈3.045,

由公式计算得b ^

≈-0.313, a ^

=y --b ^

x -

=4.61,

所以y 对x 的线性回归方程为y ^

=-0.313x +4.61.

所以ln U ^

=-0.313t +4.61,即U ^

=e

-0.313t +4.61

,因此电压U 对时间t 的回归方程为U ^

=e

0.313t +4.61

.

1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .散点图中,解释变量在x 轴,预报变量在y 轴 C .回归模型中一定存在随机误差 D .散点图能明确反映变量间的关系 答案 D

解析 用散点图反映两个变量间的关系时,存在误差.

2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,

计算可得它们的相关指数R 2

分别如下表:

A .甲

B .乙

C .丙

D .丁

答案 A

解析 相关指数R 2

越大,表示回归模型的拟合效果越好.

3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组

样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^

=0.85x -85.71,则下列结论中不正确的是( )

A .y 与x 具有正的线性相关关系

B .回归直线过样本点的中心(x -,y -

)

C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg

D .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D

解析 A ,B ,C 均正确,是回归方程的性质,D 项是错误的,线性回归方程只能预测学生的体重.选项D 应改为“若该大学生某女生身高为170 cm ,则估计其体重大约为58.79 kg”.

4.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:

由表中数据得线性回归方程y =bx +a 中b =-2,预测当气温为-4 ℃时,用电量的度数约为________.

答案 68

解析 x -=10,y -=40,回归方程过点(x -,y -

), ∴40=-2×10+a .

∴a =60.∴y ^

=-2x +60.

令x =-4,∴y ^

=(-2)×(-4)+60=68.

5.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4

y 39.442.942.943.149.2

(1)以x

(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;

(3)计算各组残差,并计算残差平方和;

(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几?

解(1)散点图如下:

(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.

设回归方程为y

^

=b

^

x+a

^

,x

=30.36,y

=43.5,

i=1

5

x2i=5101.56,∑

i=1

5

y2i=9511.43.

x-y-=1320.66,y-2=1892.25,x-2=921.7296,

i=1

5

x i y i=6746.76.

由b

^

i=1

5

x i y i-5x-y-

i=1

5

x2i-5x-2

≈0.29,

a

^

=y

-b

^

x-=43.5-0.29×30.36≈34.70.

故所求的线性回归方程为

y ^

=34.70+0.29x .

当x =56.7时,y ^

=34.70+0.29×56.7=51.143. 估计成熟期有效穗为51.143. (3)由于y =bx +a +e ,

可以算得e ^

i =y i -y ^

i 分别为e ^

1=0.35,e ^

2=0.718,e ^

3=-0.5,e ^

4=-2.214,e ^

5=1.624,

残差平方和:∑i =1

5

e ^2

i ≈8.43.

(4)∑i =1

5

(y i -y -)2

=50.18,

所以R 2

=1-8.4350.18

≈0.832.

所以解释变量小麦基本苗数对有效穗约贡献了83.2%.残差变量贡献了约1-83.2%=16.8%.

高中数学统计与概率知识点

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三.众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。

高中数学第三章统计案例2独立性检验教学案北师大版选修2_3

§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]

[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:

2018版高中数学第一章统计1.3统计图表学案

1.3 统计图表 1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图和茎叶图)的功能及其特点.(重点) 2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.(难点) 3.能从统计图表中获取有价值的信息.(难点、易错点) [基础·初探] 教材整理1 统计图表 阅读教材P16~P20“练习1”以上部分,完成下列问题. 1.条形统计图 条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比. 2.折线统计图 建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况. 3.扇形统计图 扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.优点:扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点:会丢失部分数据信息且不适合总体中部分较多的情况. 判断(正确的打“√”,错误的打“×”) (1)扇形统计图比其他统计图更优越.( )

(2)统计图和统计表相比,用直线、折线来说理比用数据说理来的形象一些,数量关系也更明显.( ) (3)要反映台州市某一周每天的最高气温的变化趋势,宜采用条形统计图.( ) 【解析】(1)×,扇形统计图与其他统计图各有优缺点. (2)√,统计图比统计表表达的更明确. (3)×,适合用折线统计图. 【答案】(1)×(2)√(3)× 教材整理2 茎叶图 阅读教材P21第三自然段到P22“信息技术应用”以上部分,完成下列问题. 1.茎叶图 茎叶图的制作:茎相同的共用一个茎,茎按从小到大的顺序从上到下列出,共茎的叶一般按从大到小或从小到大的顺序同时列出. 2.用茎叶图表示数据有两个突出特点 第一,统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到; 第二,茎叶图可以随时记录,方便表示与比较. 但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了. 判断(正确的打“√”,错误的打“×”) (1)制作茎叶图时,茎叶图的茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.( ) (2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.( ) (3)茎叶图对重复出现的数据不可以重复记录.( ) 【解析】(1)√,结合茎叶图的做法,茎按从小到大的顺序从上向下列出,叶无规定的顺序. (2)√,结合茎叶图的特点可知,用茎叶图表达两组数据很方便,但若是多组数据,却不是那么方便,直观、清晰了. (3)×,茎叶图中的数据应当全部记录,不可以遗漏,包括重复数据. 【答案】(1)√(2)√(3)× [小组合作型]

高中数学第三章统计案例章末小结知识整合与阶段检测教学案北师大版选修2_334.doc

第三章统计案例 知识整合与阶段检测 [ 对应学生用书P42] 一、回归分析 1.线性回归分析 对于一组具有线性相关关系的数据( x1,y1) , ( x2,y2) ,, ( x n,y n) ,其线性回归直线方程为 y= a+bx, n n x i- xy i- y x i y i- n x · y i = 1 i =1 其中 b==, n n x i- x 2 2 2 x i- n x i = 1 i = 1 a= y - b x . 2.相关系数 n x i- x y i- y i = 1 r = n n x i- x 2·y i- y 2 i = 1 i =1 n x i y i- n x · y i = 1 =, n n 2 2 2 - n y 2 x i- n x ·y i i =1 i = 1 | r | 值越大,相关性越高,| r | 值越接近0,线性相关程度越低. 二、独立性检验

独立性检验的一般步骤(1)列出 2×2列联表; (2) 代入公式计算 2 n ad- bc 2 χ =a+c a+ b b+d c+d ; (3)根据χ2的值的大小作出判断. 对应阶段质量检测三 见 8开试卷 ( 时间 90 分钟,满分120 分 ) 一、选择题 ( 本大题共10 小题,每小题 5 分,共50 分.在每小题给出的四个选项中, 只有一项是符合题目要求的) 1. ( 全国新课标 ) 在一组样本数据 ( x1,y1) , ( x2,y2) ,, ( x n,y n)( n≥2,x1,x2,, x 不全相等 ) 的散点图中,若所有样本点( x,y )( i=1,2 ,,n) 都在直线y=2x+ 1 上,则n i i 1 这组样本数据的样本相关系数为( ) A.- 1 B. 0 1 C. 2 D. 1 解析:因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为 1. 答案: D 2.已知x与y之间的一组数据: x 0 1 2 3 y 1 3 5 7 则 y 与 x 的线性回归方程y= a+ bx 必过点( ) A. (2,2) B. (1.5,0) C. (1,2) D. (1.5,4) 解析:线性回归方程y=a+ bx 必过点--( x,y ) . 答案: D 3.下列现象的相关程度最高的是( ) A.某商店的职工人数与商品销售额之间的相关系数为0.87 B.流通费用率与商业利润之间的相关系数为-0.94 C.商品销售额与商业利润之间的相关系数为0.51 D.商品销售额与流通费用率之间的相关系数为-0.81

数学:第三章《统计案例》测试(2)(新人教A版选修2-3)

高中数学精品资料 2020.8 高中新课标选修(2-3) 第三章统计案例综合测试题 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841 K< K>B.2 3.841 C.2 6.635 K< K>D.2 6.635 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4 组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 不患肺病患肺病合计 不吸烟7775 42 7817 吸烟2099 49 2148 合计9874 91 9965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90%B.95%C.99%D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴24 31 55 女婴8 26 34

合计 32 57 89 A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 答案:C 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度 5- 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54 如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A.100 B.143 C.200 D.243 答案:B 10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表: 优秀 不优秀 合计

高中数学 1.3 统计图表课后作业 北师大版必修3

§3统计图表 一、非标准 1.某支股票近10个交易日的价格如下: 下列几种统计图中,表示上面的数据较合适的是( ) A.条形统计图 B.扇形统计图 C.折线统计图 D.茎叶图 解析:对于股票,我们最关心它的涨跌情况,即价格的增减变化情况,因此用折线统计图较合适. 答案:C 2.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的数据,结果用条形统计图(如下图)表示.根据条形统计图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6时 B.0.9时 C.1.0时 D.1.5时 解析:这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(时). 答案:B 3.如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图的情况可以知道丙、丁两组人数和为( ) A.250 B.150 C.400 D.300 解析:甲组人数是120,占30%,则总人数是=400.则乙组人数是400×7.5%=30,则丙、丁两组人数和为400-120-30=250. 答案:A 4.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得

的最高分分别为( ) A.51,83 B.41,47 C.51,47 D.41,83 答案:B 5.甲、乙两班学生的体育成绩的条形统计图如图所示,不用计算,体育成绩好的班级是( ) A.甲班 B.乙班 C.甲、乙一样 D.无法确定 解析:由两个条形统计图中各部分的人数可知乙班学生的体育成绩好一些. 答案:B 6.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委对参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( ) A.1 B.2 C.4 D.6 解析:若x≤4,因为平均分为91,所以总分应为637,即637=89+89+92+93+92+91+90+x,所以x=1.若x>4,637≠89+89+92+93+92+91+94=640,不合题意. 答案:A 7.某班学生在课外活动中参加文娱、美术、体育小组的人数之比为3∶1∶6,则在扇形统计图中表示参加体育小组人数的扇形对应的圆心角的度数是. 解析:所求圆心角的度数是×100%×360°=216°. 答案:216° 8.如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是,最大日温差等于℃. 解析:逐一计算发现,5月5日的日温差最大,最大日温差为24.5-12=12.5(℃). 答案:5月5日12.5

高中数学选修2-3第三章《统计案例》测试题

高中数学选修2-3第三章《统计案例》测试题 姓名___________学号______(满分100分,时间90分钟) 一、选择题:(每题5分,共50分,请将准确答案填在答题卡内) 1.已知一个线性回归方程为?y =1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.5 2.对有线性相关关系的两个变量建立的回归直线方程 ???y a bx =+中,回归系数? b ( ) A .能等于0 B .小于0 C .可以小于0 D .只能等于0 3.能表示n 个点与相应直线在整体上的接近程度的是( ) A.1 ()n i i y i =-∑ B 1 ()n i i i y =-∑ C. 2 1 () n i i y i =-∑ D. 21 ()n i i y y =-∑ 4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2 = ()()()()() n ad bc a b c d a c b d -++++算得K 2 =2 110(40302030)7.860506050 ??-?≈???附表: P (K 2≥k ) 0.10 0.05 0.025 0.01 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^ =-3+bx ,若∑i =1 10x i =17,∑i =1 10 y i =4,则b 的值为( ) A .2 B .1 C .-2 D .-1 6.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( ) A. y ^ =x +1 B. y ^=x +2 C. y ^=2x +1 D . y ^ =x -1 7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

高中数学统计

【课题】10.2 概率(二) 【教学目标】 知识目标: 理解古典概型的概念及互斥事件的古典概率. 能力目标: (1)会判定互斥事件及古典概型; (2)会解决简单的古典概型实际问题,会计算互斥事件的概率; (3)通过实际问题的解决,培养学生的数据处理技能和分析与解决问题的能力. 情感目标: (1)体验应用数学知识解决实际问题的过程,发展数学兴趣; (2)经历合作学习的过程,尝试探究与讨论,树立团队合作意识. 【教学重点】 运用公式()m P A n = 计算等可能事件的概率. 【教学难点】 概率的计算. 【教学设计】 由于本教材没有介绍排列与组合等内容,所以,等可能事件概率的计算不要搞得太复杂,重点放在理解算法原理上.等可能事件A 的概率计算公式为()m P A n = ,其中n 是基本事件总数、m 是事件A 包含的基本事件数.有些教材用这个公式来定义概率,叫做概率的古典定义. 教师在讲解例3、例4时,重点应剖析清楚等可能事件的概率计算公式()m P A n =中的基本事件总数n 、事件A 包含的基本事件数m 的确定方法. 为了计算一些复合事件的概率,教材介绍了互斥事件的概率加法公式,在讲此公式以前,首先用实例引入了互斥事件的概念,要向学生强调,互斥事件不能同时发生,同时发生的两个事件一定不是互斥事件.当互斥事件A ,B 中至少有一个发生(用A B 表示)时,我们 可以使用概率的加法公式()()()P A B P A P B =+来计算概率.需要指出的是,在A ,B 中 至少有一个发生实际上就是A 发生或者B 发生,而A ,B 不能同时发生.一定要强调概率公式()()()P A B P A P B =+只适用于互斥事件.

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

2016-2017学年高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新

3.1 第二课时 残差分析及回归模型的选择 一、课前准备 1.课时目标 (1) 了解残差分析回归效果; (2) 了解相关指数2R 分析回归效果; (3) 了解常见的非线性回归转化为线性回归的方法. 2.基础预探 1.在线性回归模型y bx a e =++中,a b 和为模型的未知参数,e y 是与y bx a =+之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差2 ()0D e σ=>. 线性回归模型的完整表达形式为2 ()0,()y bx a e E e D e σ=++??==? .在此模型中,随机误差r的方差2 σ越小,通过回归直线y bx a =+预报真实值y的精度越高. 2.对于样本点1122(,),(,), ,(,)n n x y x y x y 而言,相应于它们的随机误差为 (1,2,,)i i i i e y y y bx a i n =-=--=,其估计值为(1,2, ,)i i i i i e y y y bx a i n =-=--=, i e 称为相应于点(,)i i x y 的______.类比样本方差估计总体方差的思想,可以用 2 1 (,)2 Q a b n σ= -(n>2)作为2σ的估计量,其中a b 和由公式给出,()Q a b ,称为残差平方和.可以用2 σ衡量回归直线方程的预报精度.通常2 σ越小,预报精度越高. 3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差12,, n e e e 来判断模型拟合的效果,判断 原始数据中是否存在可疑数据.这方面的分析工作称为_______. 4.用相关指数2 R 来刻画回归的效果,其计算公式是:2 2 12 1 () 1() n i i n i i y y R y y ==-=- -∑∑.显然2 R 取值 越大,意味着残差平方和_______,也就是说模型的拟合效果________. 二、学习引领 1. 进行回归分析的步骤是什么? (1)确定研究对象,明确是哪两个变量之间的相关关系. (2)画出散点图,观察它们之间的关系是否存在线性关系,也可计算变量间的线性相关系数的值来精确判断它们之间是否存在相关关系.如果不存在线性相关关系,判断散点图是否存在非线性相关关系.

高中数学 第三章《统计案例》综合测试题 新人教B版选修2-3

高中新课标第三章统计案例综合测试题选修2-3 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841 K>B.2 3.841 K< C.2 6.635 K>D.2 6.635 K< 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4 组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 不患肺病 患 肺病 合 计 不吸烟7775 42 7 817 吸烟2099 49 2 148 合计9874 91 9 965 A.90%B.95%C.99%D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上 白 天 合 计 男婴 2 4 3 1 5 5 女8 23

你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 答案:C 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一 35A.100 B.143 C.200 D.243 答案:B 10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下

高中数学第三章统计案例单元测评北师大版选修2-3

《统计案例》测评 (时间90分钟,满分100分) 一、选择题(本大题共12小题,每小题4分,共48分) 1.下面变量之间的关系是函数关系的是 A.已知二次函数y=ax 2 +bx+c ,其中a 、c 是已知常数,取b 为自变量,因变量是这个函数的 判别式Δ=b 2 -4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩施用肥料量和粮食亩产量 答案:A 解析:B 、C 、D 是相关关系,A 是确定性关系,即函数关系. 2.设有一个回归方程为y=3-5x ,变量x 增加一个单位时 A.y 平均增加3个单位 B.y 平均减少5个单位 C.y 平均增加5个单位 D.y 平均减少3个单位 答案:B 解析:斜率b=-5的意义是:变量x 增加1个单位时,y 平均增加-5个单位,即y 平均减少5个单位. 3.若回归直线方程中的回归系数b=0时,则相关系数为 A.r=1 B.r=-1 C.r=0 D.无法确定 答案:C 解析:当b=0时,即 ∑∑==--n i i n i i i x n x y x n y x 1 2 21=? ∑=n i i i y x 1 -n x y =0, ∴r= ∑∑∑===---n i i n i i n i i i y n y x n x y x n y x 1 2 2 1 2 2 1 =0. 4.在一个2×2列联表中,由其数据计算得χ2 =13.097,则其两个变量间有关系的可能性为 A.99% B.95% C.90% D.无关系 答案:A 解析:当χ2 >6.635时,有99%的把握认为两个变量之间有关系. 5.线性回归方程y=bx+a 必过 A.(0,0) B.(x ,0) C.(0,y ) D.(x ,y ) 答案:D 解析:∵a=y -b x , 即y =b x +a. ∴回归方程y=bx+a 一定过(x ,y ).

最新高中数学统计与概率知识点归纳(全)

高中数学统计与概率知识点(文) 一、众数: 一组数据中出现次数最多的那个数据。 二、 众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 三、二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数) 四、 三 .众数、中位数及平均数的求法。 五、 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。 五.平均数、中位数与众数的异同: ⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响; ⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。 六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算? 思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数 据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是: 12|||||| n x x x x x x n 22 2 12()()()n x x x x x x s

高中数学统计图表 同步练习2

统计图表同步练习2 一、选择题 1.下面哪种统计图没有信息的损失,所有的原始数据都可以从该图中得到() A.条形统计图 B.茎叶统计图 C.扇形统计图 D.折线统计图 答案:B 2.2001年上海市居民的支出构成情况如下表所示. 用下列哪种统计图表示上面的数据较合适() A.条形统计图 B.茎叶统计图 C.扇形统计图 D.折线统计图 答案:C 3.下面茎叶统计图表示乙城市一台自动售货机的销售额情况,图中数字7的意义是表示这台自动售货机销售额为元.() 乙 1 0 2 8 2 0 2 3 3 7 3 1 2 4 4 8 4 2 3 8 5 A.7 B.37 C.27 D.2337 答案:C 4.当收集到的数据量很大或有多组数据时,用哪种统计图表示较合适() A.茎叶统计图 B.条形统计图 C.折线统计图 D.扇形统计图 答案:B 二、填空题 5.茎叶统计图表示数据有两个突出的优点:其一,; 其二, . 答案:统计图上没有信息的损失,所有的原始数据都可以从这个茎叶统计图中得到茎叶统计图可以随时记录,方便表示与比较 6.扇形统计图如下图,若该圆表示某城市人口共300000的分布情况,则甲县有人.

7.为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午 8:00~10:00间各自的点击量: 甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25; 乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14. 请用适当的统计图表示上面的数据,并根据统计图分析两个网站的受欢迎程度. 答案:用茎叶图表示数据的结果如下图所示. 甲 乙 .从数据请将上面的数据用统计图表示出来,你觉得哪种统计图更合适? 答案:可以用扇形统计图或条形统计图表示. 不少于75000 15000以下 不少于75015000以50000~75015000~25035000~50025000~350

2017-2018版高中数学 第三章 统计案例 1.1 回归分析 1.2 相关系数学案 北师大版选修

1.1 回归分析 1.2 相关系数 学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.掌握建立线性回归模型的步骤. 知识点一 线性回归方程 思考 (1)什么叫回归分析? (2)回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 梳理 (1)平均值的符号表示 假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),在统计上,用x 表示一组数据x 1,x 2,…, x n 的平均值,即x =______=________;用y 表示一组数据y 1,y 2,…,y n 的平均值,即y =______________=______________. (2)参数a ,b 的求法 b =l xy l xx =____________=____________,a =________. 知识点二 相关系数 思考1 给出n 对数据,按照公式求出的线性回归方程,是否一定能反映这n 对数据的变化规律? 思考2 怎样通过相关系数刻画变量之间的线性相关关系? 梳理 (1)相关系数r 的计算公式 r =∑n i =1x i y i -n x y ∑n i =1 x 2 i -n x 2 ∑n i =1 y 2 i -n y 2 . (2)相关系数r 的取值范围是________,|r |值越大,变量之间的线性相关程度越高;|r |值

越接近0,变量之间的线性相关程度越低. (3)当r>0时,b________0,称两个变量正相关; 当r<0时,b________0,称两个变量负相关; 当r=0时,称两个变量线性不相关. 类型一概念的理解和判断 例1 有下列说法: ①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归方程y=bx+a可以估计观测变量的取值和变化趋势; ④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( ) A.1 B.2 C.3 D.4 跟踪训练1 下列关系中,是相关关系的是________.(填序号) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. 类型二回归分析 命题角度1 求线性回归方程 例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据: (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.

2018版高中数学第一章统计1.3统计图表学案

统计图表 1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图和茎叶图)的功能及其特点.(重点) 2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.(难点) 3.能从统计图表中获取有价值的信息.(难点、易错点) [基础·初探] 教材整理1 统计图表 阅读教材P16~P20“练习1”以上部分,完成下列问题. 1.条形统计图 条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比. 2.折线统计图 建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况. 3.扇形统计图 扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.优点:扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点:会丢失部分数据信息且不适合总体中部分较多的情况. 判断(正确的打“√”,错误的打“×”) (1)扇形统计图比其他统计图更优越.( )

(2)统计图和统计表相比,用直线、折线来说理比用数据说理来的形象一些,数量关系也更明显.( ) (3)要反映台州市某一周每天的最高气温的变化趋势,宜采用条形统计图.( ) 【解析】(1)×,扇形统计图与其他统计图各有优缺点. (2)√,统计图比统计表表达的更明确. (3)×,适合用折线统计图. 【答案】(1)×(2)√(3)× 教材整理2 茎叶图 阅读教材P21第三自然段到P22“信息技术应用”以上部分,完成下列问题. 1.茎叶图 茎叶图的制作:茎相同的共用一个茎,茎按从小到大的顺序从上到下列出,共茎的叶一般按从大到小或从小到大的顺序同时列出. 2.用茎叶图表示数据有两个突出特点 第一,统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到; 第二,茎叶图可以随时记录,方便表示与比较. 但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了. 判断(正确的打“√”,错误的打“×”) (1)制作茎叶图时,茎叶图的茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.( ) (2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.( ) (3)茎叶图对重复出现的数据不可以重复记录.( ) 【解析】(1)√,结合茎叶图的做法,茎按从小到大的顺序从上向下列出,叶无规定的顺序. (2)√,结合茎叶图的特点可知,用茎叶图表达两组数据很方便,但若是多组数据,却不是那么方便,直观、清晰了. (3)×,茎叶图中的数据应当全部记录,不可以遗漏,包括重复数据. 【答案】(1)√(2)√(3)× [小组合作型]

高中数学第三章统计案例1回归分析课后作业含解析北师大版选修2_3 (1)

1 回归分析 [A组基础巩固] 1.设有一个线性回归方程y=2-2.5x,则变量x增加1个单位时() A.y平均增加2.5个单位 B.y平均增加2个单位 C.y平均减少2.5个单位 D.y平均减少2个单位 解析:在线性回归方程y=bx+a中,①当b>0时,说明变量y与x正相关;②当b<0时,说明变量y与x负相关;③x每增加1个单位,y就增加或减少|b|个单位.因为回归直线的斜率为-2.5,即变量x增加1个单位,y平均减少2.5个单位. 答案:C 2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断() A.变量x与y正相关,u和v正相关 B.变量x与y正相关,u和v负相关 C.变量x与y负相关,u和v正相关 D.变量x与y负相关,u和v负相关 解析:由这两个散点图可以判断,变量x与y负相关,u与v正相关. 答案:C 3.观察两个变量的如下数据: x -1-2-3-4-55432 1 y -0.9-2-3.1-3.9-5.15 4.1 2.9 2.10.9 若x与y具有线性相关关系,则两个变量间的线性回归方程为() A.y=0.5x-1 B.y=x C.y=2x+0.3 D.y=x+1

解析:∵x =0,y =0,∴回归直线必定经过点(0,0),经检验知B 正确. 答案:B 4.已知x 与y 之间的几组数据如下表: x 1 2 3 4 5 6 y 2 1 3 3 4 假设根据上表数据所得线性回归方程y =bx +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A .b >b ′,a >a ′ B .b >b ′,a <a ′ C .b <b ′,a >a ′ D .b <b ′,a <a ′ 解析:b ′=2,a ′=-2, 由公式b = 6 i =1 (x i -x )(y i -y ) 6 i =1 (x i -x )2 求得. b =57,a =y -b x =136-57×7 2 =-13 , ∴b <b ′,a >a ′.选C. 答案:C 5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( ) A .u =c +bx B .u =b +cx C .y =b +cx D .y =c +bx 解析:对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx . 答案:A 6.已知x 与y 之间的一组数据如下表: x 0 1 2 3 y 2 4 6 8 则可求得y 与x 的线性回归方程y =bx +a 必过点________.

相关文档
最新文档