统计与统计案例

统计与统计案例
统计与统计案例

统计与统计案例

考纲解读

1. 理解随机抽样的必要性和重要性。

2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。

3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。

4. 理解样本数据标准差的意义和作用,会计算数据标准差。

5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。

6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。

7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。

8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。 (1)独立性检验

了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。 (2)回归分析

了解回归分析的基本思想、方法及其简单应用。 命题趋势探究

1. 本节内容是高考必考内容,以选择题、填空题为主。

2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。(1)(2)有结合趋势,考题难度中下。

3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。 知识点精讲 一、抽样方法

三种抽样方式的对比,如表13-7所示。

类型 共同点

各自特点

相互关系 使用范围 简单随机抽样

抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N ,样本容量n ,每个个体被抽到的概率n P N

=

从总体中随机逐个抽取

总体容量较小 系统抽样

总体均分几段,每段T 个,

第一段取a 1, 第二段取a 1+T , 第三段取a 1+2T , ……

第一段简单随机抽样

总体中的个体个数较多

分层抽样

将总体分成n 层,每层按比例抽取

每层按简单随机抽样或系统抽样

总体由差异明显的几部分组成

二、样本分析

(1)样本平均值:1

1n

i i x x n ==∑。

(2)样本众数:样本数据中出现次数最多的那个数据。

(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。

(4)样本方差:()2

21

1n

i i s x x n ==-∑。

众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。

三、频率分布直方图的解读 (1)频率分布直方图的绘制

①由频率分布表求出每组频数n i ;

②求出每组频率i

i

n P N

=(n 为样本容量); ③列出样本频率分布表; ④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。

(2)样本估计总体

步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。

样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。

(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。 公式:aX b ax b +=+,s 2

(aX +b )=a 2s 2

(X )。 四、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程$

$y bx a =+$的求法为

$()()()11

22211n n

i i i i i i n n

i i

i i x x y y x y nx y b x x x nx a y bx

====?

---??==??--??=-??∑∑∑∑$$ 其中,11n i i x x n ==∑,1

1n

i i y y n ==∑,(x ,y )称为样本点的中心。

步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关。

五、独立性

独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。

步骤为列出2?2列联表(如表13-8所示),求出()()()()()

22

n ad bc K a b c d a c b d -=++++,并判断:

表13-8

A 1 A 2 合计

B 1 a c a +c B 2 b d b +d

合计 a +b c +d n =a +b +c +d

若K 2

>10.828,有99.9%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;

若10.828≥K 2

>6.635,有99%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;

若6.635≥K 2

>3.841,有95%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;

若K 2

≤3.841,没有把握称A 与B 相关。 题型归纳及思路提示 题型181 抽样方式 思路提示

根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。

例13.16(2021天津理9)

某地区有小学150所,中学75所,大学25所。现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取 所学校,中学中抽取 所学校。

解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取150

3018250

?=(所),

从中学中抽取75

309250

?=(所)。

变式1 (优质试题山东理4)

采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C 。则抽到的人中,做问卷B 的人数为( )。

A. 7

B. 9

C. 10

D. 15

变式2 某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为( )。

表13-9

一年级 二年级 三年级

女生 373

x y 男生 377 370

z 变式3 某企业三月中旬生产A ,B ,C 三种产品其3000件,根据分层抽样的结果,企业统计员制作了统计表格,如表13-10所示,由于不小心,表格中的A ,C 产品的有的有关数据被污染看不清楚,统计员记得A 产品样本容量比C 产品的样本容量多10,由此可得C 产品数量为_______。

表13-10

产品类型

A B C 产品数量(件) 1300 产品样本数量(件) 130

题型182 样本分析——用样本估计总体 思路提示

对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。在进行样本分析时,应从统计图表中获取数据。体现在以下

几个方面:(1)在频率分布直方图中,长方形面积=组距?频率

组距

=频率,即随机变量的概率;(2)

对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。

例13.17(优质试题广东理17)

某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。

1792015

3013-16

(1)根据茎叶图计算样本均值;

(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;

(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。

分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人”的组合的个数,利用古典概型概率公式进行计算。

解析:(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值

171920212530

226

x +++++=

=,故样本均值为22。

(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为

21

63

=,该车间12名工人中优秀工人大约有2

1246

?=(名),故该车间约有4名优秀工人。

(3)记“恰有1名优秀工人”为事件A ,其包含的基本事件个数为C 14C 1

8=32,所有基本

事件的总数为C 2

12=66,由古典概型概率公式,得()3216

6633

P A =

=

。所以恰有1名优秀工人的概率为

1633

。 变式1 (优质试题陕西理6)

从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎

叶图表示(如图13-17所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )。

865088400

1028

752202337800312448314

238

13-17

甲乙图 A. x 甲m 乙

B. x 甲x 乙,m 甲>m 乙

D. x 甲>x 乙,m 甲

变式2 某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙。

(1)假设n =4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望;

(2)试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地

上的每公顷产量(单位:kg/hm 2

)如表13-11所示。

表13-11

品种甲

403 397 390 404 388 400 412 406

品种乙 419 403 412 418 408 423 400 413 分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果你认为应该种植哪一品种?

附:样本数据x 1,x 2,…,x n 的样本方差[()()()]2222121

n s x x x x x x n

=-+-++-L ,其中

x 为样本平均数。

例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀。

(1)表13-12所示的是这次考试成绩的频数分布表,求正整数a ,b 的值;

表13-12

区间 [75,80) [80,85) [85,90) [90,95) [95,100] 人数 50 a 350 300

b (2)现在要用分层抽样的方法从这1000人中抽取40人的成绩进行分析,求其中成绩为优秀的学生人数;

(3)在(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数”为X ,求X 的分布列与数学期望。

解析:(1)由频率分布直方图可知,a =0.4?5?1000=200,b =0.02?5?1000=100。

(2)设抽取的40人中成绩为优秀的学生人数为x ,则350300100

401000

x ++=

,解得x =30,即其中成绩为优秀的学生人数为30名。

(3)依题意,随机变量X 的可能取值为:0,1,2。

且()210240C 30C 52P X ===,()111010240C C 51C 13P X ===, ()220

240C 292C 52

P X ===,所以X 的分布

列为:

X 0 1 2

P

352 513 2952

数学期望为()35293

0125213522

E X =?+?+?=。

变式1 某班50名同学在一次百米测试中的成绩全部介于13秒和19秒之间,将测试结果按如下方式分成六组:

第一组,成绩大于等于13秒且小于14秒;

0.07 0.06 0.05 0.04 0.03 0.02 0.01

0 75 80 85 90 95 100 分数 图 13-18

频率 组距

第二组,成绩大于等于14秒且小于15秒; ……

第六组,成绩大于等于18且小于19秒。

如图13-19所示是由上述分组方法得到的频率分布直方图,设成绩小于17秒的学生占全班总人数的百分比为x ,成绩大小等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )。

A. 0.9,35

B. 0.9,45

C. 0.1,35

D. 0.1,45

变式2 (优质试题安徽理5)

甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图13-20所示,则( )。

A. 甲的成绩的平均数小于乙的成绩的平均数

B. 甲的成绩的中位数等于乙的成绩的中位数

C. 甲的成绩的方差小于乙的成绩的方差

D. 甲的成绩的极差小于乙的成绩的极差

题型183 线性回归方程 思路提示

首先通过对散点图观察分析是否为线性回归,若为线性回归则利用最小二乘法求出回归直线方程。

具体步骤为:

(1)求x ,y ,2

x ,x y ;

频率/组距

0.36 0.34

0.18

0.06 0.04 0.02

0 13 14 15 16 17 18 19 (秒) 图 13-19

0 3 4 5 6 7 8 9 10 环数 (乙)

3 2 1

0 3 4 5 6 7 8 9 10 环数 (甲) 3 2 1

图 13-20 频数

频数

(2)求1

n

i i i x y =∑;

(3) 21

n

i i x =∑;

(4)代入公式,求1

2

2

1

n

i i

i n

i

i x y

nx y

b

x

nx

==-=-∑∑$;

(5)代入公式求,$a

y bx =-$,代入直线方程得$$=+y bx a $。 这里要注意的是回归直线恒过样本中心点(x ,y )。

例13.19如表13-13所示,其中提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产耗能y (吨)标准煤的几组对照数据。

表13-13

x 3 4 5 6

y

2.5

3.

4

4.5

(1)请画出表示数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程$

$=+y bx a $; (3)已知该厂技改前100吨产品的生产耗能为90号标准煤,试根据(2)求得的回归方程,预测生产100吨甲产品耗能比技改前降低多少吨标准煤?

(参考数值:3?2.5+4?3+5?4+6?4.5=66.5)。 解析:(1)由题设所给数据,可得散点图(如图13-21所示)上的点基本在一条直线附近,数据正相关,存在回归方程。

(2)由表13-14所示可知,()()

()1

2

1

3.5=

=0.75

n

i

i

i n

i

i x x y

y b x

x ==--=-∑∑$,$a

y bx =-$=0.35,即x ,y 的回归方程为$

=0.7+0.35y x 。 表13-14

x i x i -x (x i -x )

2

(x i -x )(y i -y )

y i -y y i 3 -1.5 2.25 1.5 -1 2.5 4 -0.5 0.25 0.25 -0.5 3 5 0.5 0.25 0.25 0.5 4 6

1.5

2.25

1.5

1

4.5

5 4.5 4 3 2.5 2 1

y (吨标准煤)

O 1 2 3 4 5 6 x (吨甲产品) 图 13-21

x =4.5

()4

21

i

i x

x =-∑=5

()()4

1

i

i i x

x y y =--∑=3.

5

y =3.5

(3)由(2)的回归方程及技改前生产100吨甲产品的生产耗能,得节省的生产耗能为90-(0.7?100+0.35)=19.5(吨)标准煤。

评注:(1)两个变量是否具有相关关系,主要依据散点图加以判断,看变量对应的点是否分布在一条直线附近,若是,则具有相关关系;否则不具有相关关系;(2)用公式计数为,$a

,b $的值时,要先算b $的值,然后才能算$a 。 变式1 某产品的广告费用x 与销售额y 的统计数据如表13-15所示。

表13-15

广告费用x (万元) 4 2 3 5 销售额y (万元) 49 26 39 54

根据表13-15可得回归方程$$=+y bx a $中的b $为9.4,据此模型预报首先费用为6万元时销售额为( )。

A. 63.6万元

B. 65.5万元

C. 67.7万元

D. 72.0万元

变式2 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并出调查数据得到y 对x 的回归直线

方程:$

y =0.254x _0.321。由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元。

变式3 (优质试题湖南理4)

设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为$

y =0.85x -85.71,则下列结论中不正确的是

A. y 与x 具有正的线性相关关系

B. 回归直线过样本点的中心(x ,y )

C. 若该大学某女生身高增加1cm ,则其体重约增加0.85kg

D. 若该大学某女生身高为170cm ,则可断定其体重比为58.79kg

题型184 独立性检验 思路提示

独立性检验是判断两个分类变量是否存在相关关系的案例分析方法,它与概率中事件的独立性不同,具体步骤为:

(1)列出2?2列联表;

(2)求()()()()()

22

n ad bc K a b c d a c b d -=++++;

(3)最后根据临界值作出判断。

例13.20为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样调查了500位老人,结果如表13-16所示。

男 女 需要 40 30 不需要 160 270

(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;

(2)能否有99%的把握认为该地区的老年人是否需要志愿者帮助与性别相关? (3)根据(2)的结论,能否提出更好的调查方法估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由。

解析:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,

需要帮助的老年人的比例估计值为7014

=

500100

。 (2)列出2?2列联表(如表13-17所示)。 表13-17

男 女 合计

需要 40 30 70 不需要 160 270 430 合计

200

300

500

()2

2

50040270301609.96720030070430

K ?-?=≈???。

由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者帮助与性别有关。

(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出,该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查中,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好。

变式1 为比较注射A ,B 两种药物产生的皮肤疱疹的面积,选200只家兔作试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B 。表13-18和表13-19所示的分别是注射药物A 和药物B 后皮肤疱疹面积的频率分布(疱疹面积单位:mm 2

)。

表13-18

疱疹 [60,65) [65,70) [70,75) [75,80]

频数

30 40 20 10 表13-19

疱疹面积

[60,65) [65,70) [70,75) [75,80] [80,85) 频数

10

25

20

30

15

(1)完成图13-22和图13-23所示的分别注射药物A ,B 后皮肤疱疹面积的频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;

(2)完成表13-20所示的2×2列联表,并回答能否有99.9%的把握认为注射药物A 后的疱疹面积与注射药物B 的疱疹面积有差异.

疱疹面积小于70mm 2

疱疹面积不小于

70mm 2

合计 注射药物A a = b = 注射药物B c = d = 合计

0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01

频率/组距 0 60 65 70 75 80 85 疱疹面积 图 13-22 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01

频率/组距

0 60 65 70 75 80 85 疱疹面积 图 13-23

附:2

2

()()()()()

n ad bc K a b c d a c b d -=++++.

2()0.1000.0500.0250.0100.001

2.706

3.811 5.021 6.63510.828

P K k k

变式2 (优质试题辽宁理19) 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”

(1)根据已知条件完成下面的22?列联表,并据此资料你是否认为“体育迷“与性别有关?

非体育迷 体育迷 合计 男

10 55 合计

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X

附:()2

112212212

1+2++1+2

-=n n n n n n n n n χ,

()2P k χ≥

0.05 0.01 k

3.841

6.635

最有效训练55(限时40分钟)

1.变量X 与Y 的卡方统计量K 2的值,下列说法正确的是( ) A .K 2越大,“X 与Y 有关系”可信度越小 B .K 2越小,“X 与Y 有关系”可信度越小 C .K 2越接近0,“X 与Y 无关”程度越小 D .K 2越大,“X 与Y 无关”程度越大

2.甲乙两名同学在5次体育测试中的成绩如图13-25所示,则有( ) A .x x <甲乙,乙比甲稳定 B .x x >甲乙,甲比乙稳定 C .x x >甲乙,乙比甲稳定

D .x x <甲乙,甲比乙稳定

统计学 统计学-——典型案例、问题和思想

经济管理类“十二五”规划教材统计学 -基于典型案例、问题和思想 主讲林海明

第一章绪论 【引言】我们从如下9个重要事例,说明统计学有什么用。 事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了

这些危险区域,使英军取得了空战的胜利。 事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。

事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。 事例4:在居民收入贫富差距的测度方

面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。 事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,

日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。 事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。 事例7:在产品质量检验方面,英国统

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

2019年高考数学统计案例(文科) 含解析

统计案例 一、选择题 1.(2018·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样 C .①系统抽样,②分层抽样 D .①②都用分层抽样 答案:B 解析:因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以①用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法,故选B. 2.(2018·贵州遵义联考)某校高三年级有1 000名学生,随机编号为0001,0002,…,1 000.现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是( ) A .0927 B .0834 C .0726 D .0116 答案:A 解析:系统抽样就是等距抽样,被抽到的编号满足0122+5k ,k ∈Z .因为0927=0122+5×161,故选A. 3.(2018·江西九校联考(一))一组数据共有7个数,其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数据的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为( ) A .3 B .17 C .-11 D .9 答案:D 解析:设这个数是x ,则平均数为25+x 7,众数为2,若x ≤2,则

中位数为2,此时x =-11,若2

专题五 第1讲 统计与统计案例(解析版)

第1讲 统计与统计案【典例】 【要点提炼】 考点一 统计图表 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 【热点突出】 【典例】1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量 【答案】 CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根

据调查结果绘制学生周末阅读时间的频率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 【答案】 A 【解析】根据频率分布直方图可列下表: 阅读时间(分 钟) [0,10 ) [10,20) [20,30) [30,40) [40,50) [50,60] 抽样人数(名) 10 18 22 25 20 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂. (2)频率分布直方图中纵坐标不要误以为频率. 【拓展训练】1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )

统计案例试题及答案

10-4统计案例 基 础 巩 固 一、选择题 1.对于事件A 和事件B ,通过计算得到χ2的观测值χ2≈4.514,下列说法正确的是( ) A .有99%的把握说事件A 和事件 B 有关 B .有95%的把握说事件A 和事件B 有关 C .有99%的把握说事件A 和事件B 无关 D .有95%的把握说事件A 和事件B 无关 [答案] B [解析] 由独立性检验知有95%的把握说事件A 与B 有关. 2.r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强; ③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1 B .2 C .3 D .4 [答案] D 3.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得∑i =1 8 x i =52,∑i =1 8 y i =228,∑ i =18 x 2 i =478,∑ i =1 n x i y i =1849,则 y 与x 的回归方程是( ) A.y ^ =11.47+2.62x B.y ^ =-11.47+2.62x

C.y ^ =2.62+11.47x D.y ^ =11.47-2.62x [答案] A 4.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=(a +b )(c +d )(a +c )(b +d ) 算得,K 2= 110×(40×30-20×20)2 60×50×60×50≈7.8. 附表: A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C [解析] 本小题考查内容为独立性检验.

统计案例分析

统计案例分析 毛石小学:彭向慈 1、学生在一年级上学期已初步学习统计的方法,会认识象形统计图和统计表,并善于提出不同的数学问题。但是,因而要在学习中,进一步引导学生深层次地分析问题,促进学生比较合理地解决问题。 2.学生已有生活经验和学习该内容的经验 学生绝大多数来源于城市,学生思维活跃,表达能力较强,善于动手操作,有初步的合作交流能力,能够积极探究新知识。 3.学生学习该内容可能的困难 学生在统计的过程中,还存在收集数据不仔细、数据不准确的情况,同时对统计中的数学问题的分析还比较肤浅。 4.学生学习的兴趣、学习方式和学法分析 一年级的学生年龄小,好奇心强,喜欢动手操作、直观感悟强, 5.我的思考: 通过对教材和学生的分析,我清醒地认识到,对一个一年级的学生来说,如何让学生经历“简单的条形统计”的整个过程,创设什么样的问题情境,运用什么样的教学方法,是我这节课应该关注的焦点。为此,在教学设计中要突出以下两个方面: ①预设矛盾,感受统计的必要——“生活中需要统计”。 设计一个有价值的矛盾生成点,往往会对一节课取到事半功倍的效果。统计教学对于小学生来说比较枯燥,尤其是低年级的学生,注意力容易转移,激发他们的学习兴趣显得更为重要。本课教学中,我注重在每一环节中设计有价值的问题情境,以激活学生的思维。上课伊始,我可以采取谈话法与学生交流:你们喜欢看动画片吗?焦老师也给大家带来了几部动画片,想看吗?用学生喜闻乐见的动画片调动学生的积极性。然后趁热打铁地提出问题:我们时间有限,只能放一部动画片,你最希望放哪一部?大家的意见不统一,老师应该听谁的呢?矛盾产生后,学生积极主动地探索解决的办法。这样借助学生现实生活中的喜欢看的动画片进行教学,根据学生实际喜欢的项目提出问题,让他们觉得确实需要统计。 ②开放活动的探索空间,让学生亲历统计过程——“培养统计意识”。

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

2015届高考数学二轮专题训练:专题七 第3讲 统计与统计案例

第3讲 统计与统计案例 考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题. 1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数

(2)方差:s 2=1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 标准差: s = 1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q =∑i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是 则K 2 (χ2 )=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量). 热点一 抽样方法 例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 (2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200 解析 (1)由840 42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为 720-48020=240 20 =12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以1603 200=160-150 x ,所以x =200.

统计案例的应用就在身边

统计案例的应用就在身边 224100 江苏省盐城市大丰区南阳中学 潘锦明 统计是与生活关系最为密切的一门学科, 统计知识的学习更侧重于体会,理解统计学的基本概念、方法、原理及其相应的实际意义,突出了统计中分析处理问题的基本思想方法.同学们只有亲自实践并与实际问题进行对比,才能有深刻而真实的体会. 一.环保问题 例1 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP )和这一年各城市患白血病的儿童数量,如下表: (1)画出散点图; (2)求y 对x 的回归直线方程; (3)如果这个省的某一城市同时期年人均GDP 为12万元,估计这个城市一年患白血病的儿童数目; 分析:利用公式分别求出∧ ∧a b ,的值,即可确定回归直线方程,然后再进行预测. 解:(1)作x 与y 对应的散点图,如右图所示; (2)计算得67.1286)()(, 17.226,33.56 1 =--==∑ =y y x x y x i i i 33.55)(6 1 2=-∑ =i i x x , ∴25.2333.5567 .1286≈=∧ b ,25.10233.525.2317.226≈?-=∧a , ∴y 对x 的回归直线方程是25.10225.23+=∧ x y ; (3)将12=x 代入25.10225.23+=∧ x y 得38125.1021225.23≈+?=∧ y ,估计这个城市一年患白血病的儿童数目约为381. 评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题——环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识. 二.互联网问题 例2 寒假中,某同学为组织一次爱心捐款,于2010年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计: 人均G

统计学案例二 统计数据采集与处理

统计学案例二统计数据采集与处理 一项完整的统计数据采集与处理工作,应当包括调查方案的制定和调查问卷设计;对调查资料的分组、汇总、编制统计表和绘制统计图;根据整理后的统计资料进行基本的统计分析,写出调查报告。本案例的目的就是为了展现上述数据采集与处理的基本过程。 (一)调研题目 某省高职教育培养费用及其分担问题研究 (二)调查方案 高职教育学生培养费用调查方案 为了了解××省高职院校学生在校期间费用支出情况,研究高职教育相关各方对学生教育培养费用的负担程度,并对比国际高等教育培养费用水平,提出相应政策意见和建议,特制定本调查方案。 1.调查目的 通过对××省数所有代表性(在社会经济发展水平等方面)的高等职业技术院校及其在校学生的调查,全面掌握高职教育相关各方关于学生培养教育费用支出的数据资料,为科学制定高职教育基本费用水平、费用分担对象及分担比率,提供可靠依据。 2.调查方法 在组织方式上采用典型调查,即选择该省中等发展水平地区少数高等职业技术院校进行调查。在数据采集方法上采用统计报表和调查问卷相结合的方法,即请选中的调查院校填报学校培养费用调查表,对选中院校的部分班籍进行问卷调查。同时,通过文案调查法搜集国内外关于高职教育的成本及其分担问题的文献资料,以便比较研究。 3.调查对象和调查单位 根据研究目的,某省高等职业技术教育培养费用调查对象应当是该省所有高等职业技术院校及其在校学生,调查单位则应是该省每一所高等职业技术院校及其每一名在校学生。由于我们采用了典型调查,所以具体的调查对象是被选中的高等职业技术院校及其部分在校学生。 4.调查项目和调查表 根据调查目的要求,本次调查的主要对象分院校和学生两个部分。 具体调查项目如下: (1)对高职院校的调查项目:应包括有为教育培养本校学生所支出的全面费用项目,主要有基本工资、职工福利费、社会保障费、奖(助)学金、公务费、业务费、设备购置费(当年应分摊)、修缮费、财务费、其它费用; (2)对学生的调查项目:应包括学生在校学习期间正常学习和生活的全部费用支出,主要有学费、生活费(按10个月算)、住宿费、书杂费、通讯费(按10个月算)、交通费(按10个月算)、医疗费(按10个月算)、其它正常开支。 调查表样式见后面的调查资料表。 此外,还要通过相关数据库查阅国内外关于高职教育成本及成本分担问题的文献资料。 5.调查时间 调查资料所属时间是:高职院校费用项目为2005年、2006年和2007年三年的数据资料;学生的费用支出为2007年全年的数据资料。 调查工作期限为2008年5月1日至5月31日。 6.调查组织实施计划 这次调查由选中的三所院校分管财务工作的副院长、相关财务工作人员、调查主持人组成调查领导小组,选中院校的相关统计教师、班主任(或辅导员)、班干部组成调查工作组,具体实施调查工作。在调查过程中,每周作一次进度通报,月中进行一次质量检查,以确保

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

统计与统计案例(文科)

统计与统计案例 第一节随机抽样 1.下面的抽样方法是简单随机抽样的是( ) A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见 D.用抽签方法从10件产品中选取3件进行质量检验 答案:D 2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 答案:D 3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 答案:C 4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案:B 5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案:4 6.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在

抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) A.90 B.100 C.180 D.300 答案:C 7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案:5 8.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90 C.45 D.126 答案:B 9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人). 从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________. 答案:30 10.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案:1800 11.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人. 答案:40

数学: 专题十五 统计、统计案例

专题十五 ? ?? 统计、统计案例 [题组全练]

1.(2018·石家庄模拟)某校高一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为() A.80B.120 C.160 D.240 解析:选A因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该 抽取男生的人数为140× 4 4+3 =80,故选A. 2.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为() A.100,20 B.200,20 C.200,10 D.100,10 解析:选B由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选 B. 3.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为() 92644607202139207766381732561640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 4488 A.76,63,17,00B.16,00,02,30 C.17,00,02,25 D.17,00,02,07 解析:选D在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07. 4.(2019届高三.南昌调研)某校高三(2)班现有64名学生,随机编号为0,1,2, (63) 依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8

[高考专项训练]统计与统计案例

[高考专项训练]统计与统计案例

小题押题16—14??统计与统计案例 卷别年 份 考题位 置 考查内 容 命题规律分析 全 国卷Ⅱ201 5 选择题 第3题 条形图、 两变量 间的相 关性 统计与统计案 例部分,抽样方法考 查较少,且考查时题 目较简单;回归分析 与独立性检验在客 观题中单独考查时 较少;随机抽样、用 样本估计总体以及 全国卷Ⅲ201 7 选择题 第3题 折线图 的应用201 6 选择题 第4题 统计图 表的应

用 变量的相关性是命 题热点,难度较低. 江苏 201 8 第3题 平均数、茎叶图 考查点一 抽样方法 1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人 数

老年 教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90B.100 C.180 D.300 解析:选C设该样本中的老年教师人数为 x,由题意及分层抽样的特点得 x 900= 320 1 600,解 得x=180. 2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是

() A.抽签法B.系统抽样法 C.分层抽样法D.随机数法 解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为(). A.89 B.91 C.90 D.900 解析:选C考察平均数的计算与茎叶图的转换关系 考查点二用样本估计总体 4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定

统计学教学案例汇总

统计学教学案例集统计学精品课建设小组

2004年11月

【案例一】全国电视观众抽样调查抽样方案 一、调查目的、范围和对象 1.1 调查目的 准确猎取全国电视观众群体规模、构成以及分布情况;猎取这些观众的收视适应,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。 1.2 调查范围 全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。 1.3 调查对象 全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居

(村)委会内居住满6个月或可能居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住宅的人口。 二、抽样方案设计的原则与特点 2.1 设计原则 抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的都市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量可能的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。 2.2 需要考虑的具体问题、专门要求及相应的处理方法 2.2.1 城乡区分 都市与农村的电视观众的收视适应与爱好有专门大的区不。理所因此地应分不研究,以便于对比。最方便的处理是将他们作为两个研

究域进行独立抽样,但代价是,如此做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。如此做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采纳第二种处理方式。 在样本区、县中,以居委会的数据代表都市;以村委会的数据代表农村。 2.2.2 抽样方案的类型与抽样单元的确定 全国性抽样必须采纳多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个不直辖市及都市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量专门大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。

统计与统计案例(文科)教程文件

统计与统计案例(文科)

统计与统计案例 第一节随机抽样 1.下面的抽样方法是简单随机抽样的是( ) A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见 D.用抽签方法从10件产品中选取3件进行质量检验 答案:D 2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 答案:D 3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 答案: C 4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案:B 5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案:4 6.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,

在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) A.90 B.100 C.180 D.300 答案:C 7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案:5 8.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90 C.45 D.126 答案:B 9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人). 个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________. 答案:30 10.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案:1800 11.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人. 答案:40

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

相关文档
最新文档