统计与统计案例知识点及题型归纳

统计与统计案例知识点及题型归纳
统计与统计案例知识点及题型归纳

统计与统计案例知识点及题型归纳

知识点精讲

一、抽样方法

二、样本分析

(1)样本平均值:1

1n

i i x x n ==∑。

(2)样本众数:样本数据中出现次数最多的那个数据。

(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。

(4)样本方差:()2

21

1n i i s x x n ==-∑。

众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。 三、频率分布直方图的解读 (1)频率分布直方图的绘制

①由频率分布表求出每组频数n i ;

②求出每组频率i

i n P N

=

(n 为样本容量); ③列出样本频率分布表;

④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。

(2)样本估计总体

步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。

样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。 (3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。

公式:aX b ax b +=+,s 2

(aX +b )=a 2s 2

(X )。 四、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程$

$y bx a =+$的求法为 $()()()11

2

22

11

n

n

i i i i

i i n n

i i

i i x x y y x y

nx y

b x x x

nx a y bx

====?

---?

?==??--??=-??∑∑∑∑$$

其中,11n i i x x n ==

∑,1

1n

i i y y n ==∑,(x ,y )称为样本点的中心。 步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关。

五、独立性

独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。

步骤为列出2?2列联表(如表13-8所示),求出()()()()()

22

n ad bc K a b c d a c b d -=++++,并判断:

表13-8

若K 2

>10.828,有1212若10.828≥K 2

>6.635,有99%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;

若6.635≥K 2

>3.841,有95%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;

若K 2

≤3.841,没有把握称A 与B 相关。

题型归纳及思路提示

题型1 抽样方式 思路提示

根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。

例13.16某地区有小学150所,中学75所,大学25所。现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取 所学校,中学中抽取 所学校。

解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取150

3018250

?=(所),从中学中抽取

75309250

?=(所)。

变式1 采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的32人中,编号落入区间[1,450]的人做

问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C 。则抽到的人中,做问卷B 的人数为( )。

A. 7

B. 9

C. 10

D. 15

变式2 某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为( )。

变式3 统计表格,如表13-10所示,由于不小心,表格中的A ,C 产品的有的有关数据被污染看不清楚,统计员记得A 产品样本容量比C 产品的样本容量多10,由此可得C 产品数量为_______。

题型2 思路提示

对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。在进行样本分析时,应从统计图表中获取数据。体现在以下几个方面:(1)在频率分布

直方图中,长方形面积=组距?频率

组距

=频率,即随机变量的概率;(2)对于频数、频率、样本容量,已知其二

必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。

例13.17:某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。

1792015

3013-16

(1)根据茎叶图计算样本均值;

(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;

(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。

分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人”的组合的个数,利用古典概型概率公式进行计算。

解析:(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值

171920212530

226

x +++++=

=,故样本均值为22。

(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为

21

63

=,该车间12名工人中优秀工人大约有2

1246

?=(名),故该车间约有4名优秀工人。

(3)记“恰有1名优秀工人”为事件A ,其包含的基本事件个数为C 14C 1

8=32,所有基本事件的总数为

C 2

12=66,由古典概型概率公式,得()32166633

P A =

=

。所以恰有1名优秀工人的概率为16

33。 变式1 从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表

示(如图13-17所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )。

865088400

1028

752202337800312448314

238

13-17

甲乙图 A. x 甲m 乙

B. x 甲x 乙,m 甲>m 乙

D. x 甲>x 乙,m 甲

变式2 某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙。

(1)假设n =4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望; (2)试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量

(单位:kg/hm 2

)如表13-11所示。

表13-11

种?

附:样本数据x 1,x 2,…,x n 的样本方差[()()()]2222121

n s x x x x x x n

=-+-++-

L ,其中x 为样本平均

数。

例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀。

(1)表13-12所示的是这次考试成绩的频数分布表,求正整数a ,b 的值;

(2)数;

(3)在(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数”为X ,求X 的分布列与数学期望。

解析:(1)由频率分布直方图可知,a =0.4?5?1000=200,b =0.02?5?1000=100。

(2)设抽取的40人中成绩为优秀的学生人数为x ,则350300100

401000

x ++=

,解得x =30,即其中成绩为优秀的学生人数为30名。

(3)依题意,随机变量X 的可能取值为:0,1,2。

且()210240C 30C 52P X ===,()

1110102C C 51C 13P X ===, ()220

2C 292C 52P X ===,所以X 的分布列为:

数学期望为()350125213522

E X =?+?+?=。

变式1 某班50名同学在一次百米测试中的成绩全部介于13秒和19秒之间,将测试结果按如下方式分成六组:

第一组,成绩大于等于13秒且小于14秒; 第二组,成绩大于等于14秒且小于15秒; ……

第六组,成绩大于等于18且小于19秒。

如图13-19所示是由上述分组方法得到的频率分布直方图,设成绩小于17秒的学生占全班总人数的百分比为x ,成绩大小等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )。

A. 0.9,35

B. 0.9,45

C. 0.1,35

D. 0.1,45

甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图13-20所示,则( )。

A. 甲的成绩的平均数小于乙的成绩的平均数

B. 甲的成绩的中位数等于乙的成绩的中位数

C. 甲的成绩的方差小于乙的成绩的方差

D. 甲的成绩的极差小于乙的成绩的极差

题型3 线性回归方程 思路提示

首先通过对散点图观察分析是否为线性回归,若为线性回归则利用最小二乘法求出回归直线方程。 具体步骤为:

(1)求x ,y ,2

x ,x y ; (2)求1n

i i i x y =∑;

(3) 21

n

i i x =∑;

(4)代入公式,求1

2

2

1

n

i i

i n

i

i x y

nx y

b

x

nx

==-=-∑∑$;

(5)代入公式求,$a

y bx =-$,代入直线方程得$$=+y bx a $。 这里要注意的是回归直线恒过样本中心点(x ,y )。

例13.19如表13-13所示,其中提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产耗能y (吨)标准煤的几组对照数据。

表13-13

(1)请画出表示数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程$

$=+y bx a $; (3)已知该厂技改前100吨产品的生产耗能为90号标准煤,试根据(2)求得的回归方程,预测生产100吨甲产品耗能比技改前降低多少吨标准煤?

(参考数值:3?2.5+4?3+5?4+6?4.5=66.5)。

解析:(1)由题设所给数据,可得散点图(如图13-21所示)上的点基本在一条直线附近,数据正相关,存在回归方程。

(2)由表13-14所示可知,()()

()1

2

1

3.5=

=0.75

n

i

i

i n

i

i x x y

y b x

x ==--=-∑∑$,$a

y bx =-$=0.35,即x ,y 的回归方程为$=0.7+0.35y x 。

(3)由产耗能为90-(0.7?100+0.35)=19.5(吨)标准煤。

评注:(1)两个变量是否具有相关关系,主要依据散点图加以判断,看变量对应的点是否分布在一条

直线附近,若是,则具有相关关系;否则不具有相关关系;(2)用公式计数为,$a

,b $的值时,要先算b $的

值,然后才能算$a

。 变式1 某产品的广告费用x 与销售额y 的统计数据如表13-15所示。

根据表13-15可得回归方程=+y bx a 中的b 为9.4,据此模型预报首先费用为6万元时销售额为( )。

A. 63.6万元

B. 65.5万元

C. 67.7万元

D. 72.0万元

变式2 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收

入x 与年饮食支出y 具有线性相关关系,并出调查数据得到y 对x 的回归直线方程:$

y =0.254x _0.321。由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元。

变式3 设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据

(x i ,y i )(i =1,2,…,n),用最小二乘法建立的回归方程为$

y =0.85x -85.71,则下列结论中不正确的是 A. y 与x 具有正的线性相关关系 B. 回归直线过样本点的中心(x ,y )

C. 若该大学某女生身高增加1cm ,则其体重约增加0.85kg

D. 若该大学某女生身高为170cm ,则可断定其体重比为58.79kg

题型4 独立性检验 思路提示

独立性检验是判断两个分类变量是否存在相关关系的案例分析方法,它与概率中事件的独立性不同,具体步骤为:

(1)列出2?2列联表;

(2)求()()()()()

22

n ad bc K a b c d a c b d -=++++;

(3)最后根据临界值作出判断。

例13.20为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样调查了500位老人,结果如表13-16所示。

(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者帮助与性别相关?

(3)根据(2)的结论,能否提出更好的调查方法估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由。

解析:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老

年人的比例估计值为7014

=

500100

。 (2)列出2?2列联表(如表13-17所示)。 表13-17

()2

50040270301609.96720030070430

K ?-?=≈???。

由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要志愿者帮助与性别有关。

(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出,该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查中,先确定该地区老年人中男、女的比例,

再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好。

变式1 为比较注射A ,B 两种药物产生的皮肤疱疹的面积,选200只家兔作试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B 。表13-18和表13-19所示的分别

是注射药物A 和药物B 后皮肤疱疹面积的频率分布(疱疹面积单位:mm 2

)。

表13-18

疱疹 [60,65) [65,70) [70,75) [75,80]

频数

30

40

20

10

表13-19

疱疹面积 [60,65) [65,70) [70,75) [75,80] [80,85) 频数

10

25

20

30

15

(1)完成图13-22和图13-23所示的分别注射药物A ,B 后皮肤疱疹面积的频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;

(2)完成表13-20所示的2×2列联表,并回答能否有99.9%的把握认为注射药物A 后的疱疹面积与注射药物B 的疱疹面积有差异.

疱疹面积小于70mm 2

疱疹面积不小于70mm 2

合计 注射药物A a = b = 注射药物B c =

d =

合计

附:2

2

()()()()()

n ad bc K a b c d a c b d -=++++.

2()0.1000.0500.0250.0100.001

2.706

3.811 5.021 6.63510.828

P K k k

变式2 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图: 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”

(1)根据已知条件完成下面的22?列联表,并据此资料

你是否认 非体育迷 体育迷 合计 男 女 10 55 合计

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X

0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01

频率/组距 0 60 65 70 75 80 85 疱疹面积 图 13-22 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01

频率/组距

0 60 65 70 75 80 85 疱疹面积 图 13-23

附:

()2

11221221

2

1+2+

+1+2

-

=

n n n n n

n n n n

χ,

()

2

P k

χ≥0.05 0.01

k 3.841 6.635

有效训练

1.变量X与Y的卡方统计量K2的值,下列说法正确的是()

A.K2越大,“X与Y有关系”可信度越小 B.K2越小,“X与Y有关系”可信度越小

C.K2越接近0,“X与Y无关”程度越小 D.K2越大,“X与Y无关”程度越大

2.甲乙两名同学在5次体育测试中的成绩如图13-25所示,则有()

A.x x

<

甲乙,乙比甲稳定B.x x

>

甲乙,甲比乙稳定

C.x x

>

甲乙,乙比甲稳定D.x x

<

甲乙,甲比乙稳定

87278

6828

2915

13-25

十位

甲乙

数字

个位数字个位数字

3.为了了解某地区高三学生的身体状况,抽查了该地区100名17.5~18岁的男生体重(千克),得到频率分布直方图(如图13-26所示).由图知这100名学生在[56.5,64.5)的学生人数为()

A.20 B.30 C.40 D.50

4.设两个变x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()

A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反

5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到台表13-23所示的2×2列联表.

表13-23

由22

()()()()()n ad bc K a b c d a c b d -

=++++算得:22

110(40302020)7.860506050

K ??-?=

≈???. 附表13-24:

参照表13-24,得到正确的结论是( )

A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”

C .有99%以上的把握认为“爱好该项运动与性别有关”

D .有99%以上的把握认为“爱好该项运动与性别无关”

6.设1122(,),(,),,(,)n n x y x y x y g

g g 是娈量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图13-27所示),以下结论中正确的是( )

A .x 和y 的相关系数为直线l 的斜率

B .x 和y 的相关系数在0到1之间

C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同

D .直线l 通过点(,)x y

7.某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取 名学生.

8.某学校食堂随机调查了一些学生是否因距离远近而选择食堂就餐的情况,经计算得到K 2

=4.932.所以判定距离远近与选择食堂有关系,那么这种判断出错的可能性为 . 附表13-25:

9.某数学老师身高176c m ,他爷爷,父亲,儿子的身高分别是173c m ,170c m 和182c m ,因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是 C m .

10.已知样本X :

则:(1)x=;(2)2()

s x= .

11.为调查某社区居民的业余生活状况,研究这一社区居民在20:00~22:00时间段的休闲方式与性别关系,随机调查了该社区80人,得到下面的数据表(如表13-26所示).

(1)将此样本的频率估计为总体的概率,随机调查3名在该社区的男性,设调查的3人在这一时间段以看书为休闲方式的人数为随机变量X,求X的分布列和数学期望;

(2)根据以上数据,能否有99%的把握认为“在20:00~22:00时间段居民的休闲方式与性别有关系”?

参考公式:

2

2

()

()()()()

n ad bc

K

a b c d a c b d

-

=

++++

,其中n=a+b+c+d.

参考数据(如表13-27)

12.某种产品的广告费支出现x与销售额y(单位:万元)之间有如表13-28所示的对应数据:

(1)画出散点图;

(2)求回归直线方程;

(3)若实际销售额不低于82.5万元,则广告费支出最少是多少万元?

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

高项案例知识点总结

1、项目经理的选择和素质:P18-23 一个合格项目经理应具备的素质:(1)广博的知识,丰富的经历,良好的协调能力,良好的职业道德,良好的沟通和表达能力,良好的领导能力。 项目经理应具备的五大知识领域:项目管理知识体系,应用领域的知识、标准和规定,项目环境知识,通用的管理知识和技能,软技能和人际关系技能。 2、项目干系人的需求分析和沟通分析,两部分组成——P31+P232 项目干系人的分析:1、非组员的干系人的三大职责:参与、审查、反馈2、项目干系人的分析的目的:确定项目干系人的需求,帮助项目经理制定沟通管理策略。 项目干系人的管理的方法:沟通方法(分析干系人需求和期望目标,分层次分目标进行沟通,不同干系人采用不同的沟通策略,综合运用正式的和非正式的或公开或私下等多种沟通方法),问题日志需求分析就是确定待开的信息系统应该做什么。 需求分析的特点: 1、用户与开发人员之间存在着沟通方面的困难; 2、用户的需求是动态变化的; 3、生命周期种不同的阶段系统变更的代价呈非线性增长; 需求分析的过程1、问题识别;2、分析与综合;3、制订规格说明;4、评审; 需求分析的方法1、原型化方法2、结构化方法3、动态分析法 需求分析步骤: 1、阅读甲方所有资料文件-组织资产、业务法规制度、业务流程; 2、撰写调研提纲,并与甲方业务人员确认; 3、业务岗位实地调研,岗位调研报告(一地)业务调研集中会议与试点地区岗位调研(省地市异地); 4、撰写业务调研报告,与甲方主要需求人员开会讨论; 5、甲方高层参加的业务需求调研报告会,认可业务需求内容 6、正式撰写“需求分析”系列文档;与甲方主要需求人员讨论; 7、真是提交需求评审,开会,确认需求; 3、项目的组织结构对项目管理的影响P34 第五章 4、整体管理计划的制定流程,作用和内容P91-93 整体管理作用:对项目管理过程中的不同过程和活动进行识别、定义、整合、统一和协调的过程。 整体管理计划的制定流程:制订项目章程,制订项目范围说明书初步,制订项目管理计划,指导和管理项目执行,监督和控制项目工作,整体变更控制,项目收尾。 5、范围管理——范围的定义、确认,P110 范围定义:描述项目过程并把结果与项目写进详细范围说明书中。 项目范围确认的工作要点:制订并执行确认程度,项目干系人对项目范围的正式确认,让系统的使用者有效参与,项目各阶段的确认和项目最终验收的确认。 分阶段分步骤的确认是归避风险的有效方法。确认的方法:测量、测试、检验,审查、产品评审、走查 6、WBS——工作分解的方法、作用P113 创建WBS所采用的方法:使用指导方针,类比法,自顶向下、自底向上 WBS的局限:不能显示活动之间的顺序,不能显示活动之间的依赖关系 WBS的表现形式:分级的树型结构,表格形式 WBS分解的详细程度:大项目:WBS分为总纲和子项目目录;小项目:WBS直接划分到工作包。 WBS的作用通及意义:将项目大的可交付物成果与项目工作划分为较小的和易管理的组成部分,详

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

专题突破练20 统计与统计案例 1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就 是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表: (1)根据列联表,能否有99%的把握认为满意程度与年龄有关? (2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案 乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率. 附:K2=-,其中n=a+b+c+d. 参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

(完整版)数学知识点--考点14--统计与统计案例

极差 组数、组距 分组 列表 咼频率/组距 面积=频率= 频数 样本容量 小矩形面积和=1 统计与统计案例 1. 统计的基本思想是用部份来估计总体。 2. 统计中所考察的对象的全体构成的集合看做总体, 构成总体的每个元素作为个体,从总 体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。 一、抽样方法 2.图形特征 1) 茎叶图 2) 直方图 、用样本估计总体 1.数字特征 注意: 2 2 i am b ,贝U i 的平均数为ax b ,方差为a s

3)条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开; 直方图是用面积表示各 组频率的多少, 高表示每一组的频率除以组距, 组距,条形图的高表示频数的多少,其宽是固定的,表示类别。 三、变量间的相关关系 确定关系:函数关系 2.样本相关系数r : r 0.75时,认为两个变量有很强的线性相关关系。 3. 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。 过样本中心X, y 2 2 6. 相关指数R : R 的值越大,说明残差平方和越小,即模型的拟合效果起好。 回归效果越好。 7. 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总 体的范围;预报值与精 确值往往不一样。 8. 步骤 宽表示 关系 非确定:相关关系 回归分析 散点图 回归曲线 回归直线 y $x $b X i y i i 1 nxy -2 x y i y X i nx 5.随机误差 e y bX i a 估计值 残差 y i bX i $ 残差分析 形:残差图 数:R 2 0,1 线性回归模型中, R 2表示解释变量对预报变量的贡献率, R 2越接近于 1,表示

高中数学选修1-2《统计案例》知识点讲义汇编

第一章 统计案例 一、回归分析的基本思想及其初步应用 1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关 不相关 (2)相关性系数r (在《必修3》中有介绍) 用相关系数r 来衡量两个变量之间的相关关系 ()() ()() 1 2 2 1 1 n i i i n n i i i i x x y y r x x y y ===--= --∑∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

人教版高中数学【选修2-3】[知识点整理及重点题型梳理]-《统计案例》单元复习巩固

人教版高中数学选修2-3 知识点梳理 重点题型(常考知识点)巩固练习 《统计案例》单元复习巩固 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用. 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 3. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤. 4. 能作出散点图,能求其回归直线方程。 5. 会用所学的知识对简单的实际问题进行回归分析。 【知识网络】 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验 1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2 K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2 K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2 K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把

专题五 第1讲 统计与统计案例

本资料分享自千人QQ 群323031380 期待你的加入与分享 第1讲 统计与统计案例 [考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量

答案CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是() A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 答案 A 解析根据频率分布直方图可列下表: 阅读时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60] 抽样人数(名)1018222520 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率. 跟踪演练1(1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是() A.各月的平均最低气温都在0 ℃以上 B.七月的平均温差比一月的平均温差大

相关文档
最新文档