统计学的几个概念

统计学的几个概念
统计学的几个概念

一 统计学的几个概念 1、总体和个体:

在统计学中,研究对象的全体称为总体;组成总体的每个单位,即每个研究对象称为个体;

总体中所包含的个体的数量------总体容量;

容量有限-----有限总体; 容量无限-------无限总体 2、样本:

从总体中抽出的部分个体组成的集合称为称为来自总体的样本。通常样本是相互独立且与总体同分布;

样本中所含个体的数量称为样本容量。

一般地:设X 是一个随机变量,n X X X ,,,21 是一组相互独立且与X 同分布的随机变量,则称X 是总体,n X X X ,,,21 为来自总体X 的简单随机样本,简称:样本,n 为样本容量。 3、统计量

定义:设n X X X ,,,21 为来自总体X 的简单随机样本,

),,,(21n X X X g 是一个关于n X X X ,,,21 的连续函数,若g 中不含 任何未知参数,则称),,,(21n X X X g 是一统计量. 常见的统计量有:

①样本平均值: X = ∑=n

i i X n 1

1

②样本方差:21

2

)(11∑=--=n

i i X X n S 备注: 21

2

)(1∑=-=n

i i X X n S 叫做未修正的样本方差;2S 称为修正的样本方差,平时若未特别标明,样本方差均指修正的2

S

2

S 有较简单的计算公式: )(11122

2

∑=--=n i i X n X n S

证明:

③样本标准差:21

)(11∑=--=

n

i i X X n S ④样本k 阶原点矩:∑==n i k

i k X n A 1

1 ,2,1=k

⑤样本k 阶中心矩:∑=-=n i k

i k X X n A 1

)(1 ,2,1=k

二、抽样分布

统计量的分布叫做抽样分布. 1.样本均值的分布:

由中心极限定理可知: 只要n X X X ,,,21 是相互独立且同分布的(设

i i DX EX ,μ==2σ),则 当n 充分大时,X 就可近似的服从正态分布.

即X ~ ),(2

n

N σμ

应用举例:

设X ~],[b a U ,5021,,,X X X 是来自X 的一个样本, X 是样本均值,求)(X E 和)(X D

解: 因为X ~],[b a U ,所以2b a EX +=, 12

)(2

a b DX -=

故)(X E =2b a EX +=,)(X D =600

)(12

a b DX n -=

设总体X ~),(2σμN ,n X X X ,,,21 是一个样本, X 是样本均值,,求①设25=n ,求}2.02.0{σμσμ+<<-X P

②要使05.0}1.0{≤>-σμX P ,n 至少应等于多少? 解:

设X 与Y 相互独立,而且都服从)9,30(N ,2021,,,X X X 和

2521,,,Y Y Y 是分别来自X 与Y 的样本,求4.0>-Y X 的概率?

解:

结论:若(n X X X ,,,21 )是来自总体2~(,)X N μσ的一个样本,X 为

样本均值,则

①~X ),

(2

n

N σμ

②X 与2

S 相互独立。(结论在2χ分布的结论中)

2、2χ分布

1)定义:设(n X X X ,,,21 )是来自总体),

(N ~X 10 的一个样本,则称统计量:∑==

n

i i

X

1

2

2

χ所服从的分布是自由度为n 的2χ分布,

记作:)n (~22χχ。

)(2

n χ的概率密度函数为:??

???Γ=--0)

(21)(2122x n n e x x f n 00≤>x x ,

其中:?∞--=Γ012

)2

(dx e x n x n

,()π=Γ21 备注:)0()(0

1>=

Γ-+∞

-?

a dx e x a x a 称作Γ函数,Γ函数有数值表可查,

并且:!)1(n n =+Γ π=??

?

??Γ21,1)1(=Γ

事实上,2

χ∑=Γ=

n

i i

n X 1

2

)21,2(~(Γ分布在第三章例3 中有定义) 2)2χ分布的性质 ①2χ分布的可加性:

设)(~1221n χχ,)(~2222n χχ,且21χ与2

2χ相互独立,则:

21χ+~22χ)(212

n n +χ

②若)(~2

2n χχ,则n E =χ)(2,n D 2)(2=χ, 证明:因为)1,0(~N X i ,则:1)()(2==i i X D X E ,

213121)]([)()(2

2

42

242

=-=-=-=?

+∞

--dx e

x X E X E X D x

i

i i π

n i ,,2,1 =

所以:2

22

11()(

)()n n

i

i i i E E X E X n ==χ===∑∑;

2

221

1

()()()2n

n

i

i i i D D X D X n ==χ===∑∑

3)结论:

设(n X X X ,,,21 )为来自总体),(~2

σμN X 的一个样本,μ,2

σ为已知常数,则:

I)统计量∑=χμ-σ

=χn

i i

n X

1

222

2

)(~)(1 (当μ=0时也成立)

事实上,令σ

μ

-=

i i X Y ,则)1,0(~N Y i ,所以∑=χ=

χn

i i

n Y

1

22

2

)(~

II)样本均值X 与样本方差2

S 相互独立,且统计量

∑=-χ-σ=σ-n

i i

n X X

S n 1

222

22)1(~)(1

)1(。

例4.设 54321,,,,X X X X X 是来自正态总体)4,0(N 的简单随机抽样,记:

25243221)43()2(cX X X b X X a T +-+-=,问当c b a ,,各取何值时,

统计量T 服从2χ分布,其自由度如何? 解:

3、t -分布

1)定义:设)1,0(~N X ,)(~2n Y χ,且X 与Y 相互独立,则称统计量:

n

Y

X

T =

所服从的分布是自由度为n 的t 分布,记为)(~n t T ,t 分布又称

为学生氏(Student )分布。

t 分布的概率密度函数为:21

)1()

()

(),(2221

+-++Γ?Γ=

n n x n n x t n n π +∞<<∞-x 。

2)t 分布的特点(性质)。

I 、);(n x t 关于x =0对称; II 、);(n x t 在x =0达最大值; III 、);(n x t 的x 轴为水平渐近线;

I V 、2

2

21),(lim x x e

n x t -

→=

π

;即∞→n 时,t 分布)1,0(N →,一般地,

当n >30时,t 分布与)1,0(N 非常接近。

V 、当n 较小时,t 分布与)1,0(N 有较大的差异,且对R t ∈?0有

{}}{0

0||||t X P t T P ≥≥≥,其中)1,0(~N X 。

即t 分布的尾部比)1,0(N 的尾部具有更大的概率。

VI 、若)(~n t T ,则1>n 时,2

)(,2;0)(-=

>=n n

T D n T E 时 3)结论:

I)设(n X X X ,,,21 )是来自总体),(~2

σμN X 的一个样本,则统计量:

)1(~)

(--=

n t n s

X T μ,

事实上,由)1,0(~),

(~2

N X n

N X n

σ

μ

σμ-?

,又)1(~)1(2

2

2-χσ-n S n ,且X 与2

S 相互独立,则

n X σ

μ

-与

2

2

)1(S n σ-相互独立,由t 分布的定

义,所以

)1(~)

(1

2

2

)1(--=

-=

--n t n S

X n n

T S n X μσσμ

II)设(m X X X ,,,21 )是来自总体2

11~(,)X N μσ的一个样本,

(),,,21n Y Y Y 是来自总体222~(,)Y N μσ的一个样本,

且X 与Y 相互独立,当22212σσσ==时,则统计量

)2(~)

2()1()1()

()(2

221-++-+-+-μ-μ--=

n m t n

m n m mn S n S m Y X T n

m ,

其中,∑==m i i X m X 11,∑=--=m i i m X X m S 1

22

)(11 ∑==n i i Y n Y 11, ∑=--=n i i n Y Y n S 1

22

)(11 事实上,),(~2

1m

N X σμ,),

(~2

2n

N Y σμ,且X 与Y 相互独立,所

以:

),

(~2

2

21n m

N Y X σσμμ+

--,即:)1,0(~)

()(1121N Y X n

m +---σμμ;

又)1(~)1(2

22-χσ-m S m m ,)1(~)1(22

2

-χσ

-n S n n ,且它们相互独立,

由2

χ分布的可加性,则)2(~)1()1(22

2

22-+χσ

-+σ-n m S n S m n

m 。由t 分布的定义:

n

m n m mn S n S m Y X n m Y X n

m S n S m n

m n

m +-+-+----=

-++----+-)

2()1()1()

()(2

)

()(2

221)1()1(11

212

2

2μμσ

μμσ

服从 )2(-+n m t

例5 假设总体X 服从)9,0(N ,821,,,X X X 是来自总体的简单随机抽

样,求统计量:28

27

26

25

4321X

X X X X X X X Y ++++++=

的概率分布

4、F -分布

1)定义:设)(~2m X χ,)(~2n Y χ,且X 与Y 相互独立,则称统计量

n

Y m X F =

服从自由度为),(n m 的F 分布,记作:),(~n m F F ,其中:m 为

第一自由度,n 为第二自由度。

由定义,若)n (t ~T ,则),1(~2

n F T 。

),(n m F 的概率密度函数为:

??

???+ΓΓΓ=+--+0)1())(()()()(),;(22

1222n m m x n m x n m n

m n m x f n m

n

m 00≤>x x 说明:先求出),(Y X 的联合密度函数),(y x f ,再令

m

n

Y X

V Y X U ?=

+=,,求出(V U ,)的联合),(v u f ,注意到V U ,独立,所以V 的边缘密度函数,也即F 的密度函数。 2)F 分布的性质(特点) Ⅰ.密度曲线不对称(偏态)

Ⅱ.若),(~n m F F ,则

),(~1

m n F F

Ⅲ.当2>n 时,2

-=

n n

E F 当4>n 时,)4)(2()2(22

--+=n n m n E F ,)

4()2()

422(2

2---+=n n m n m n D F 注:(利用)1()1(-ααΓ-α=Γ) 3)结论:

设(m X X X ,,,21 )是来自总体),(~2

11σμN X 的一个样本,

(),,,21n Y Y Y 是来自总体),(~2

22σμN Y 的一个样本,且X 与Y 相互独

立,则)1,1(~22

212

12

2--σσ=n m F S S F 。

事实上,

2

2

121

(1)~(1)m S m χσ

--,

2

22

2

2

(1)~(1)n S n χσ--,

由F 分布的定义,可得

)1,1(~)1/()

1/(22

212

1

22)1()1(22

2

2

12

1--σσ=--=

σ-σ-n m F S S n m F S n S m ,

其中,∑=--=n i i X X m S 122

1

)(11;∑=--=n i i Y Y n S 1

22

2)(11 三、分位数 1. 定义:

设随机变量X 的分布函数为)(x F ,对于给定的正数α)10(<α<,若有αx 满足α=≤=αα}{)(x X P x F ,则称αx 为X 的(下侧)α分位数(或α分位点)。 2.表示方法:

①.)1,0(N 的α分位数αμ满足:

?

α

μ∞

--α=π

dx e

x 2

2

21。

由标准正态分布的对称性可知:1α-α-μ=μ。 ②.)(2

n χ分布的α分位数)(2n α

χ 满足:

?

-=)

(2)(n dx x f αχα,

或定义:

?∞

=)

(2

)(n dx x f α

χ

α,即αχχα=≥}{2

,2n P 由附表查其值

当45≥n 时,22

)12(2

1

)(-+≈

χααn u n 或αu n n ?+≈2。 例如:307.1810,05.02=χ 94.310,95.02=χ

③.)(n t 分布的α分位数)(n t α满足:

?

α∞

-α=)

(),(n t dx n x t ,即

αα=≤}{,n t t P 由附表5可查出其值。由于30>n 时,)(n t 分布接近于

)1,0(N ,所以当45>n 时,可查)1,0(N 分布分位数表。由t 分布的对称性

可知:αα-=-1t t 。

它的双侧分位点n t ,α(即满足αα=≥}{,n t t P )与上侧分位点)(n t α的关系:

)()(2

,,2n t t t n t n n αααα==

例如:

④.),(n m F 分布的α分位数),(n m F α满足:

?

=)

,(0

),;(n m F dx n m x f αα,

由),(n m F 分布性质,有:),(n m F α=

11

(,)

F n m α-。

事实上,

α-=≤ξ?α=≥ξ?α=≤ξααα11111})

n ,m (F {P })n ,m (F {

P )n ,m (F {P

α-=≤ξ

?α-11

1)}m ,n (F {

P 。 ⑤.分位数的其它表示法。

1)若?λ使α=λ>}{X p ,则λ称为X 的上侧α分位数,显然:λ为原分布的1-α分位数,这是因为α-=λ≤1}{X P 。 例:若)1,0(~N X ,λ满足:01.0}{=λ>X P ,则

326.299.001.01===λ-u u

2)若?21,λλ,使2

}{1α

=

λ≤X P ,2}{2α=λ>X P ;则称

21,λλ为X 的双侧α分位数,显然,1λ为X 的2α分位数,2λ为X 的1-2

α

分位数。

例:设),(~n m F F ,求21,λλ,使得01.0}{1=λ≤X P ,

01.0}{2=λ>X P

解: ),(),,(99.0201.01n m F n m F =λ=λ

统计学中的基本概念

1、2 统计学得几个基本概念 1、2、1 总体与总体单位 1、总体 (1)总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计研究过程当中,统计研究得目得与任务居于支配与主导得地位,有什么样得研究目得就应该有什么样得统计总体与之相适应。例如:要研究我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 (2)总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体: ★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必要得,这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数等等。 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合

则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性就是构成统计总体得前提条件。 ★变异性:即构成总体得各个单位除了至少在某一方面具有共同性质外,在其她方面具有一定得差异。差异性就是统计研究得主要内容。 如以一个班级得所有学生作为一个总体,则“专业”就是该总体得同质性,而“性别”、“籍贯”等则就是个体之间得变异性;以我院全体教师为一个总体,则“工作单位”就是其同质性,而“学历”、“月工资”等则就是它得变异性。 需要特别说明得三个问题: ★变异就是客观存在得,没有变异得事物就是不存在得; ★变异对于统计非常重要,没有变异就没有统计。这就是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位得资料就可以推断总体情况了; ★变异性与同质性之间相互联系、相互补充,就是辩证统一得关系。用同质性否定变异性或用变异性否定同质性都就是错误得。 2、总体单位 就是构成总体得每一个个体。 【思维动起来】 对2015年10月份某市小学生得近视情况进行调查: 统计总体就是什么?总体单位就是什么? 总体得同质性就是什么?变异性就是什么? 3、总体与总体单位得关系 在统计研究中,确定统计总体与总体单位就是十分重要得,它决定于统计研究目得与认识对象得性质。在一次特定范围、目得得统计研究中,统计总体与总体单位就是不容混淆得,二者得含义就是确切得,

统计学基本概念

基本概念 1、统计的含义:统计工作、统计资料、统计学 2、社会经济统计学的特点:数量性、社会性、综合性 3、统计工作的职能:统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程:统计调查、统计整理、统计分析 5、统计调查的质量要求:准确性、全面性、及时性、有效性 6、专门调查的方法:普查、重点调查、典型调查、抽样调查 7、统计调查的方法:直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型:钟型分布、U型分布、J型分布 9、统计表的结构,从组成要素看,由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构,从内容上看,由主词、宾词两部分构成 11、统计分析方法:综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标 13、相对指标的种类:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类:算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法:全距、四分位差、平均差、标准差、离散系数 16、动态数列按构成其指标数值的性质不同分为:绝对数动态数列、相对数动态数列、平均数动态数列

17、动态数列的水平分析指标:发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标:发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法:间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为:数量指标指数和质量指标指数 21、指数按其表现形式不同分为:综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为:单相关和复相关 24、相关关系按其形式不同分为:直线相关和曲线相关 25、抽样调查的组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。 统计分析 1.某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨,假定每天产量相等,实际生产情况如下表所示(单位:万吨)。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。 第一年第二年第三年 56 58 62 第四年一季二季三季四季 16 17 18 18 第五年一季二季三季四季 19 19 20 23

应用统计学概念整理

并根据样本调查结果来推断总体特征 自下而上地逐级提供基本数据的调查方 应用统计学概念整理 第一章:导论 1. 只能归类于某一类别的非数字型数据称为分类数据 2. 只能归于某一有序类别的非数字型数据称为顺序数据 3. 按数字尺度测量的观测值称为数值型数据 4. 包含所研究的全部个体的集合称为总体 5. 从总体中抽取的一部分的元素的集合称为样本 6. 用来描述总体特征的的概括性数字度量称为参数 7. 用来描述样本特征的概括性数字度量称为统计量 8. 说明事物类别的一个名称称为分类变量 9. 说明事物有序类别的一个名称称为顺序变量 10. 说明事物数字特征的一个名称称为数值型变量 11. 只能取可数值的变量称为离散型变量 12. 可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1. 从总体中随机抽取一部分单位作为样本进行调查, 的数据收集方法,称为抽样调查。 2. 为特定目的而专门组织的全面调查称为普查 3. 按照国家有关法律规定, 自上而下地统一布置, 式 称为统计报表 第三章:数据的图表展示 1. 落在某一特定类别或组中的数据个数,称为频数 2. 把各个类别及其落在其中的相应频数全部列出, 并用表格形式表示出来, 称为频数分布 3. 一个样本或总体中各个部分的数据与全部数据之比,称为比例 4. 将比例乘以 100 得到的数值,称为百分比或百分数,用 %表示 5. 样本或总体中各不同类别数值之间的比值,称为比率 6. 分类数据的图示:条形图, pareto 图,对比条形图,饼图 7. 将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8. 将各有序类别或组的百分比逐级累加起来称为累计频率 9. 顺序数据的图示:累计频数分布图,环形图 10. 根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11. 分组后的数据称为分组数据 12. 把变量值作为一组称为单变量值分组 13. 将全部变量值一次划分为若干个区间, 并将这一区间的变量值作为一组, 称为组距分组 14. 在组距分组中,一个组的最小值称为下限,最大值称为上限 15. 一个组的上限与下限的差称为组距 16. 各组组距相等的组距分组称为等距分组 17. 各组组距不相等的组距分组称为不等距分组 18. 每一组的下限和上限之间的重点值称为组中值 19. 用矩形的宽度和高度即面积来表示频数分布的图形称为直方图

统计学中的基本概念讲课讲稿

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率

函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的 一个样本,是一个n 元函数,如果中不含任何总体的未知参数,则称 为一个统计量,经过抽样后得到一组样本观测值 ,则称 为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k 阶)原点矩 1 1,1,2,n k k i i A X k n ===∑L (5)样本(k 阶)中心矩 1 1(),2,3,n k k i i B X X k n ==-=∑L 其中样本二阶中心矩21 1(),n k i i B X X n ==-∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤L 则称(1)(2)(),,n X X X L 为样本顺序统计量,()(1)n X X -为样本的极差。 (7)样本相关系数: 1 1 2 211 ()()()() 11()()n n i i i i i i xy n n x y i i i i x x y y x x y y r S S x x y y n n ====----= = --∑∑∑∑

统计学基本概念

日志吕品吕品的日志当前日志返回日志首页? 较新一篇/ 较旧一篇 分享 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数... 如果你也考统计学~~~~~网上搜索到的统计学基本概念~~~~~ 2011-05-28 12:06 | (分类:默认分类) 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。 9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。 11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。

统计学的几个基本概念汇总

统计学的几个基本概念 总体(population)nbsp;nbsp;指同质的研究对象中所有观察单位研究指标变量值的集合。总体通常限定于特定的时间与空间范围之内,且为有限数量的观察单位,称为有限总体;有时总体是假设的,没有时间和空间限制,观察 ? 总体(population)指同质的研究对象中所有观察单位研究指标变量值的集合。总体通常限定于特定的时间与空间范围之内,且为有限数量的观察单位,称为有限总体;有时总体是假设的,没有时间和空间限制,观察单位数是无限的,称为无限总体。?样本(sample)医学实践与研究中,要直接研究无限总体通常是不可能的,即使是有限总体,由于人力、物力、时间、条件等限制,要对其中每个观察单位进行研究或观察,有时也是不可能的,也不必要。而只是从总体中随机抽取部分观察单位,其变量实测值构成样本,目的用样本指标推断总体特征。这种推断不要经过严谨的实验设计,以样本的可靠性和代表性为基础。样本的可靠性:主要是使样本中每一观察单位确属同质总体。样本的代表性:使样本能充分反映总体的实际情况,要求抽样遵循随机化原则,目的是使每个观察单位被抽得的机会相等,避免主观取舍及偏性;还要保证足够的样本量,即保证足够的观察单位个数。? 参数(parameter)统计学上描述总体变量的特征称为参数。如总体均数、描述总体的中心位置或集中趋势;总体标准差、极差等描述总体的离散趋势等。?误差(error)泛指实测值与真值之差,按其产生的原因和性质可粗分为随机误差(random error)与非随机误差(nonrandom error)两大类,后者又可分为系统误差(systematic error)与非系统误差(nonsystematic error)两类。?随机误差是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。例如,在实验过程中,在同一条件下对同一对象反复进行测量,虽极力控制或消除系统误差后,每次测量结果仍会出现一些随机变化即随机测量误差,以及在抽样过程中由于抽样的偶然性而出现的抽样误差。随机误差是不可避免的,在大量重复测量中,它可出现或大或小、或正或负的呈一定规律性的变化。但由于造成随机误差的影响因素太多、太复杂,以至无法掌握其具体规律。随着科学的发展与社会进步,有些随机误差可能会逐渐被认识而得以控制。随机误差呈正态分布,可用医学统计学的方法进行分析。?系统误差是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。例如,可能来自于受试者抽样不均匀,分配不随机,可能来自于不同实验者个人感觉或操作上的差异,可能来自于不标准的仪器,也可能来自于外环境非实验因素的不平衡等。因而应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施加以消除或控制。?非系统误差在实验过程中由研究者偶然的失误而造成的误差。例如,仪器失灵、超错数字、电错小数点、写错单位等,亦称为过失误差(gross error)。这类误差应当通过认真检查核对予以清除,否则将会影响研究结果的准确性。?频率(relative frequency)一个随机试验有几种可能的结果,在重复进行试验时,个别结果看来是偶然发生的,但当重复试验次数相当大时,总有某种规律性出现。在重复多次后,出现某种结果的比例称之为频率。?概率(probability)概率是描述随机事件发生的可能性大

统计学中的基本概念

1、2统计学得几个基本概念 1. 2. 1总体与总体单位 1、总体 ⑴总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计硏究过程当中,统计研究得目得与任务居于支配与主导得地位, 有什么样得硏究目得就应该有什么样得统计总体与之相适应。例如:要硏究 我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位 教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 ⑵总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体:★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必受寻这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进 行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位 进行非全面调查,据以推断总体。 ⑶总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。

关于生物统计学基本概念及公式

是以概率理论为基础,研究生命科学中随机现象规律性的应用数学科学。涉及到医学科学研究的设计、资料搜集、归纳、分析与解释的一门应用性基础学科、 二、科学研究的基本程序 1、提出一个欲待研究的问题: 2、科学研究设计:专业设计、统计学设计: 确定研究对象,拟定研究因素及其分配,如何执行随机、对照与重复的统计学原则,如何观察与度量效应,以及数据收集、整理与分析的方法,通过合理的、系统的安排,达到控制系统误差,以尽可能少的资源消耗(最小的人力、物力、财力和时间)获取准确可靠的信息资料及可信的结论,使效益最大化。 3、获取试验与观察的资料,又称为搜集资料 4、数据审核与计算机录入 5、分析资料 规律进行检测与描述。 (confidence interval)估计与统计学假设检验(hypothesis test)。统计学分析过程按变量的多寡可分为单变量分析与多重变量分析。 6、分析结果的合理解释(Explication of results): 研究中应注意的问题 1、统计学结论的正确与否取决于统计学分析数据的真实性、准确性以及研究样本对研究总体的代表性。 2、尽可能地控制系统误差是统计分析数据真实性、准确性的保证。 3、随机化抽样是确保样本数据对研究总体具有代表性的重要过程。 ,个体的许多属性(如年龄、性别、血浆胆固醇等)存在变异性,统计学上将反 ; 针对不同类型的属性,需采用不同类型的变量,因而产生不同类型的资料。 根据研究目的所确定的具有相同性质的观察单位的集合成为总体(母体)。从同一总体中通过随机化过程抽取的部分观察单位称为样本(子样)。 组与对照组的过程。 与总体的参数不等,或多个样本的统计量存在差异性称为抽样误差。 A的发生概率记为P(A)。 概率的取值在0 到1之间,若P=1或P=0的事件称为必然事件,若0

统计学基本概念和步骤

统计学基本概念和步骤一、统计学中的几个基本概念 总体根据研究目的确定的、同质的全部研究对象(严格地讲,是某项观察值的集合)如研究2008年中国60岁以上的老人血清总胆固醇含量,测定值的全部构成了一个总体 样本随机化的原则从总体中抽出的有代表性的观察单位组成的子集称作样本,如DM患者中随机抽取有代表性一组患者构成样本 抽样误 差 由于随机抽样所造成的某变量值的统计量和总体参数之间存在的差异 变量数值变 量 变量值是定量的,表现为数值大小的变化,有度量衡单位。(计量 资料)如:身高(cm)、体重(kg) 分类变 量 变量值是定性的,表现为互不相容的类别或属性。(计数资料) 如:性别分男女两类 有序数 据 半定量数据或等级资料,临床疗效可分为治愈、显效、好转、无效 四级,尿糖(-、+、++、+++) 概率描述随机事件(如发病)发生可能性大小的度量为概率,常用P表示。在0和1之间,P≤0.05的随机事件,通常称作小概率事件,即事件发生的可能性很小 同质和变异同质除了实验因素外,影响被研究指标的非实验因素相同变异是在同质的基础上被观察个体之间的差异 参数和统计 量 总体的统计指标称为参数,样本的统计指标称为统计量统计设计统计工作最关键的一步,整个研究工作的基础 数据整理对数据质量进行的检查,考虑数据分布及变量转换,检查异常值和数据是否符合特定的统计分析方法要求等

统计描述描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析 统计推断由样本数据的特征推断总体特征的方法 A.等级资料 B.计数资料 C.计量资料 D.分别变量 E.参数因素 在统计学中,数值变量构成 在统计学中,分类变量构成 在统计学中,有序数据构成 『正确答案』C;B;A 下列不属于计量资料的是 A.体重(kg) B.血型(A、B、O、AB型) C.身高(cm) D.每天吸烟量(1-5支) E.白细胞(个/L) 『正确答案』B 定量资料的统计描述 (一)考什么? (1)集中趋势指标 (2)离散趋势指标 (3)正态分布的特点与面积分布规律 (二)最重点是什么? 正态分布的集中趋势和离散趋势的指标 (三)最难点的是什么? 概念和正态分布的特点与面积分布规律

统计学 概念定义

1.统计学是收集,处理,分析,解释数据并且从数据中得到结论的科学。2数据分析:描述统计研究数据收集,处理,汇总,图表描述,概括与分析等的统计方法;推断统计研究如何利用样本数据来推断总体特征的统计方法。3.统计数据类型:分类数据,顺序数据,数值型数据。4.参数是用来描述总体特征的概括性数字度量,他是研究者想了解的总体的特征值。 5.统计量是用来描述样本的特征的概括性的数字度量。6概率抽样是遵循随机原则进行的抽样,总体中的与每个单位都要一定的机会被选入样本。7非概率抽样指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。8.抽样误差是由于抽样的随机性引进的样本结果与总体真值之间的误差。9.非样本误差指除了样本误差之外的,由于其他原因引起的样本的观察结果与总体真值之间的差异。10.条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。11.饼图是用圆形及圆内扇形的角度来表示数值的大小的图形。12.茎叶图是反映原始数据分布的图形,它是由茎和叶两部分构成的,其图形是有数子组成的,通过茎叶图,可以看出数据的分布形状及数据的离散状况。13.集中趋势指一组数据向某一中心靠拢的程度,它反映了一组数据中心的位置所在。14.众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势,也可用于作为顺序数据以及数值型数据集中趋势的测度值。15.平均数也称为均数,它是一组数据相加后除以数据的个数得到的结果。16异中比率指非众数数组的频数占总频数的比例。17.方差是各变量值与其平均数离差平方的平均数。18.离散系数也称变异系数,它是一组数据的标准差与其相对应的平均数之比。19. 概率古典定义:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值。20.概率的统计定义:在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。21.主观概率定义:对一些无法重复的验,确定其结果的概率只能根据以往的经验,人为确定这个时间的概率。22.当某一事件B已经发生时,求时间A发生的概率,称这种概率为时间B发生条件下事件A发生的条件概率。23.统计量概念:设X1,X2.。。。。。Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…Xn),不依赖于任何未知参数,则称函数T(X1,X2,…Xn)是一个统计量。24.在参数估计中,用来估计总体参数的统计量的名称称为估计量。25.点估计就是用样本统计量的某个取值直接作为总体参数的估计值。2 6.区间估计就是点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。2 7.如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称置信度或置信系数。2 8.评价估计量的标准:无偏性是指估计量抽样分布的数学期望等于被估计的总体参数:有效性指对同一总体参数的两个无偏估计量,有更小标准的估计量更有效:一致性指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。2 9.原假设Ho为真却被我们拒绝了,犯这种错误的概率用a表示,称a错误或弃真错误:原假设为伪我们却没有拒绝,犯这种错误的概率用B表示,称B错误或取伪错误。30.如果样本是从总体的不同类别中分别抽取,研究目的是对不同的目标量之间是否存在显著性差异进行检验,称为拟合优度检验也称一致性检验。31.在研究问题时有时会遇到要求判断两个分类之间是否存在联系的问题,使用X2检验,判断两组或多组的资料是否相互关联,如果不相互关联,就称为独立,对这类问题的处理成文独立性检验。32.方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。33.当方差分析只涉及到一个分类自变量时称为单因素方差分析。34. 当方差分析只涉及两个分类自变量时称为双因素方差分析。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学中的基本概念

统计学的几个基本概念 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么总体单位是什么 总体的同质性是什么变异性是什么 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计学若干基本概念及解释

1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。

9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。 11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。 12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度

量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。 23. 连续型变量:可以在一个或多个区间中取任何值的变量。 24. 调查数据:通过调查方法获得的数据 25. 实验数据:通过实验方法获得的数据

26. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。 27. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 28. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。 29. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺 30. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。 31. 整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

统计学主要概念

1.统计理论发展的四个学派的代表人物? ①政治算术学派威廉.配第约翰.格朗特 ②国势学派(也叫记述学派)海尔曼.康令高特弗里特.阿亨瓦尔 ③数理统计学派阿道夫.凯特勒高尔登卡尔.皮尔逊费歇尔 ④社会经济统计学派克尼斯乔治·逢·梅尔恩格尔库兹涅茨 2.统计的含义?P1 3.统计研究对象的特点?P2 4 、统计推断的目的? 对总体特征作出推断 5.统计学理论基本概念P 6-9 一、总体和样本 二、标志与变量 三、统计指标 6.标志、变量、指标的概念及分类例:某企业劳动生产率为52%:是一个质量指标 7标志与指标的区别和联系P9(简答) 8.统计数据的来源?P15(简答) 9.统计调查方案涉及的内容?见资料P3 (简答) 10.调查对象、调查单位、报告单位的区别? 调查对象;调查单位含义P22 注意区分调查单位和报告单位 ?调查单位是调查对象的具体单位,是统计总体中的每个个体; ?报告单位是提交调查资料的单位。 ?两者有时一致,有时不一致。 如调查目的是了解所有工业企业的生产情况,每个工业企业既是调查单位也是报告单位;如果进行工业企业设备普查,调查单位是各种单台设备,而报告单位则是各工业企业。 11.调查的时间和期限P23 12.调查的组织形式P18 13.统计报表资料的来源 1.原始记录 2.统计台帐 3.企业内部报表 14.普查、典型调查、重点调查、抽样调查的理解基本特点(选择题)P18 15、抽样调查的概念和特点P19 16、统计分组的含义P25 17、统计分组的原则P26 18、统计分组的核心:标志的选择 20、组距式分组、单项式分组、组中值的计算(缺上限、缺下限) 21、洛伦兹曲线P48 基尼系数P49 22、统计表设计的基本原则P44 23、均值、几何平均数、调和平均数、众数、加权平均数的计算 24、众数的基本概念中位数的基本概念(选择哪些是众数哪些是中数) 25、分布离散程度的测试:极差、内距、方差和标准差、离散系数的计算 26、箱线图P79

相关文档
最新文档