《教育和心理统计学》章读书笔记

《教育和心理统计学》章读书笔记
《教育和心理统计学》章读书笔记

《绪论》

1.什么是教育与心理统计学

2.教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一

门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。

3.教育与心理统计学的基本内容及本书体系。

4.1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。

5.例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。

6.计算标准差、方差等,以这些参数来反映观测数据的离散趋势。

7.描述统计学主要是描述事务的典型性、波动范围以及相互关系,提示事物的内部规

律。

8.2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。推断统计

学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、对教育与心理研究或实验作出预测和规划的有力工具。推断统计学的主要内容有:统计检验、统计分析和非参数统计法。

9.3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。

10.多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。

11.多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、

多元回归分析等。

12.教育与心理统计学的昨天、今天和明天

13.1)与心理统计学的昨天:1904年美国人桑代克写的《心理与社会测量导论》

14.2)教育与心理统计学的今天:叶佩华主编的《教育统计学》,张厚粲主编的《心理

与教育统计》等。

15.预备知识

16.1)概念与术语

17.<1> 随机变量:

18.教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所

得到的数据,事先无法确定,这类现象称为随机现象。因为可以用数字来表现,则称这些数字为随机变量。

19.它的特点是:离散性、变异性和规律性。

20.依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种

21.称名变量:用于说明一事物与其它事物在属性上的不同或类别上的差异,但不说明

事物与事物之间差异的大小。

22.顺序变量:指可以按事物的某一属性,把它们按多少或大小顺序加以排列的变量。

23.等距变量:指变量之间具有相等的距离。它除了有量的大小外,还具有相等的单位。

24.比率变量:除了有量的大小、相等单位之外,还有绝对零点。

25.变量依其相互关系可分为自变量(一般将相互关系中作为原因的称为自变量)与因

变量(作为结果的称为因变量)。函数关系式y=f(x)表示,y为因变量,x为自变量。

26.<2>总体、样本、个体

27.总体是指具有某一种特征的一类事物的全体。

28.个体是指构成总体的每一个基本元素。

29.样本是在总体中按一定规则抽取的一部分个体,称为总体的一个样本。

30.2)常用的符号与计算

31.<1>连加号及运算法则

32.∑表示连加符号,同时表示想加的观测数值共有n个,这些数值的下标编号i从1

起至n止。运算法则如下:

33.①若c是一个常数,而x

i

是观测变量,则常与变量的乘积的连加和等于变量连加和与常数的乘积。

34.②设c是一个常数,则连加和竺于nc.

35.③若x

I 和y

i

都是变量,则变量和的连加和等于各个变量连加和的和。

36.<2>几个常用符号。

37.①变量一般以大写英文字母表示,而变量中的元素则以小写英文字母表示。

38.②变量平均数、变量标准差、方差,一般都用大写英文字母表示。

39.

第1章

第1节次数分布表与图(适用于描述一元连续变量的观测数据)

1.次数分布及其表达方式概述

2.次数分布指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在

量各等距区组所出现的次数情况。

3.次数分布表:我们通常是对数据进行分组归类,考察这批数据在量尺上各等距区内

的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表,若用图形来表达,那就叫做次数分布图。

4.次数分布表的编制

5.1)简单次数分布表

6.简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内

的次数分布结构。其编制的主要步骤为:

7.①求全距,字母R表示。全距等于最大值减最小值,公式为:R=Max-Min

8.②定组数,字母K表示。把整批数据划分为多少个等距的区组。公式:K=(N-1)2/5

9.③定组距,字母i表示。I=R/K

10.④写出组限。(表述组限与实际两个不同的概念,但它们之间有规律性的联系;当

各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限

统一起来,且不管这里表述的实下限与实上限是整数还是小数;按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达方法统一起来。

11.⑤求组中值。组中值=(组实上限+组实下限)/2.

12.⑥归类划记

13.⑦登记次数

14.次数分布图的绘制

15.次数分布图有次数直方图和次数多边图两种表达方式。

16.1)次数直方图(是由若干宽度、高度不一的直方条紧密排列在同一基线上构成的

图形)

17.绘制步骤:

18.①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交;

19.②每一直方条的宽度由组距i确定并已体现在横轴的等距刻度上;

20.③在直方图横轴下边标上图的编号和图的题目,并检查一下图形结构的完整性。

21.2)次数多边图(利用闭合的折线构成多边形以反映次数变化情况的一种图示方法)

22.3)相对次数直方图与多边图

23.4)累积次数分布图

24.(有直方图式和曲线图式两种,曲线图式常用,它是根据累积次数分布或累积相对

次数分布制作而成。)

25.5)累积相对次数曲线图与累积百分数曲线图

26.

第2节几种常用的统计分析图(散点图、折线图、条形图和圆形图)

1.散点图(适合于描述二元变量的观测数据)

2.散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模

式。

3.绘制散点图注意:①在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因

变量;横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺;②点的描绘依二元观测数据而定,但在具体描绘时应注意用细线画坐标轴,用稍粗黑点描绘各个坐标点,点位置的确定按平面解析几何学中的方法;③注意图形的调和比例和必要的图注说明。

4.线形图(是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。)

5.适用于描述某种事物在时间序列上的变化趋势、描述一种事物随另一事物发展变化

的趋势模式、比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。

6.条形图(是用宽度相同的长条来表示各个统计事项之间的数量关系。)

7.通常用于描述离散性变量的统计事项。

8.1)简单条形图(它适用于统计事项按一种特征进行分类的情况)

9.2)复合条形图(用两类或三类不同色调的直方长条来表示多特征分类下的统计事项

之间数量关系的一种图示方法)

10.圆形图(是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在

其总体中所占相应比例的一种图示方法。)特别适用于描述具有百分比结构的分类数据。

11.

第1章自测练习

【练习1】试比较简单条形图与简单次数直方图在制作和应用方面的异同点。

解答:条形图和直方图都是次数分布图,但前者适用于离散型随机变量的次数分布描述,其所依据的次数分布表是离散型次数分布表。后者则适用于连续型随机变量的次数分布描述,其所依据的次数分布表是连续型次数分布表。这一区别决定了它们在制作上的不同。即相应于不同类型的次数分布表,条形图中的直条对应离散变量各类别,因而直条没有宽度的要求,直条之间是间隔排列的;而直方图的直条则对应连续变量次数分布的各取值区间,宽度即组距,直条比较相连排列。具体参照教材有关内容。

【练习2】简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。

解答:如上题所述,

①条形图适用于离散型变量的次数分布,是一种次数分布图;

②圆形图的适用条件与之相同。所不同的是,圆形图使用圆中的扇面弧度来替代直条表达次数或相对次数,所有扇面组成整个圆周。因而圆形图本身就包含有相对次数信息。

③散点图是专用于分析两个连续变量或至少是等级变量间相关关系的统计图,它用两个相关变量的配对数据分别作为散点的横、纵坐标在平面直角坐标系中描点,根据散点分布的区域的形状就可以大致判断两变量间的相关关系。例如如果散点区域形状是一个椭圆,则变量为直线性相关,椭圆长轴的方向还可以表达相关的方向。

④折线图在教材中之牵涉到所谓的均值图,即描述某个因变量(指标)在一个离散型自变量的各水平上取值均值的统计图,将指标在自变量各水平上取值的均值作为纵坐标先描出散点,然后用线段连接这些散点构成折线,故而叫折线图。折线图通常用在组间均值比较中帮助直观分析各均值间的差异。

第2章常用统计参数

中心位置:用以度量一级数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为置度量数或集中量数。

离散性:反映一组数据的分散程度,即次数分布的离散程度。对其数量化描述称为次数分布变异特性的度量或差异量数。

参数:总体统计特征的量数。

统计量:样本统计特征的量数。

第1节集中量数(描述数据集中趋势的统计量。包括:算术平均数、加权平均数、几何平均数、中数,等。它们的作用都是试题次数分布的集中趋势。)

1.算术平均数

2.只有在与其他几种集中量数相区别时,才称它为算术平均数。

3.算术平均数是用以度量连续变量次数分布集中趋势的最常用的集中量数。

4.公式:

5.

6.

7.

8.1)总体平均数与样本平均数。

9.2)加权平均数

10.

11.

12.

13.3)算术平均数具有以下性质:

14.①每一个观测值都加上一个相同常数C后,计算得到的平均数等于原平均数加上这

个常数;

15.

16.

17.②每一个观测值都乘以一个相同常数C后,计算得到的平均数等于原平均数乘以这

个常数;

18.

19.

20.③每一个观测值都乘以一个相同常数C后,再加上一个常数d后,计算得到的平均

数等于原平均数乘以这个常数c再加上常数d.

21.④观测值与平均数离差的总和为零

22.

23.⑤观测值与任意常数c的离差平方和,不小于观测值与平均数的离着平方和。

24.

25.4)算术平均数的优点:

26.反应灵敏、确定严密、简明易解、计算简便并能作进一步的代数演算等优点,是应

用最普遍的一种集中量数。

27.5)算术平均数的缺点:

28.易受极端数据影响、出现模糊数据和存在不等质数据时无法计算算术平均数的缺

点。

29. 几何平均数(Mg)

30. 当出现以下两种情况时需用几何平均数:

31. ①一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化。在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验的数据处理;

32. ②当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好的反映数据的33. 公式:34. 35. 公式变形:

36. 未来情况的预测数X= x ′·( )n 37. x ′表示预测的基础。

38. 中数(又称中位数,Mdn )

39. 1)中数是指位于一组数据数列中间位置的那个数。中数可能是观测数据中的某一个,也可能根本不是原有的数。中位数的位置nMdn=(n+1)/2

40. 2)当一组观测数据中出现极端数据时,或一组数据的两端有模糊数据出,此时不能用算术平均数来作为这组数据的代表值,而应求中数。

41. 3)中数的优缺点是:具有计算简单、不受极端数据的特点,但由于中数是根据数

据的相对位置来确定的,在计算时不是每个数据都加入计算,从而有较磊的抽样误差,不如平均数稳定;同时,由于中数难以作进一步的代数运算,故而在多数情况下,中数不如平均数应用广泛。

42. 众数(M 0 指次数分布中出现最多的那个数的数值)

43. 当一组数据出现不同质的情况,或分布中出现极端数据时,也用众数作为集中量数

的粗略估计。皮尔逊计算方法:M 0=3Mdn-2

第2节 差异量数

次数分布数据间彼此差异的程度称作数据的离中趋势。它反映了次数分布的变异性。

集中量数反映次数分布的典型情况,差异量数则反映次数分布的特殊性。 1. 平均差(AD ) 2.

3. 4.

5. 方差与总体标准差

6. 1)(Variance ):也叫变异数、均方,是每个观测值与该组数据的平均数之差平方后和的均值,即离均差平方和的平均数。

7. 2)样本方差和总体方差的计算方法和含义是一致的,但符号不同,前者用S 2表示,

n g n

g M x =??=1

12n

i

i g n

=112lg 1

lg (lg lg lg )n i i g n x

M x x x n

n

==+++=∑g X X n

x n

X

X AD i

i

∑∑=

-=

后者用σ2

表示。 8.

9. 3)标准差(Standard deviation ):即方差的平方根,样本方差常用符号S 或SD 表示,总体方差则用σ表示。

10.

11. 标准差的合成。 12. 13. 14.

15.

16. 标准差的性质

17. 1)一组数据的每一个观测值都加上一个常数C ,其标准差不变。即 Y i =X i +C 18. 2)一组数据的每一个观测值都乘以一个常数C ,其标准差为原标准差乘以常数C 。即Y i =X i · C

19. 3)每个观测值都乘以同一个常数C(C ≠0),再加上一个常数d ,所以标准差等于原

标准差乘以这个常数C 。即S y =C ·S x

20. 方差(推断统计最常用的统计量数)和标准差的意义

21. 方差与标准差是表示一组数据离散程度的最好指标,值越大说明离散程度越大,反之亦然。 22. 具有以下优点:

23. 1)反应灵敏,每个数据取值的变化,方差与标准差都会随之变化; 24. 2)有一定的计算公式严密确定; 25. 3)容易计算并适合代数运算; 26. 4)受抽样变动的影响小;

27. 5)具有可加性,因此可以分解并确定出属于不同来源的变异性,并可进一步说明

每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。 28. 差异系数(CV )

29. CV=S/ *100% 第3节 地位量数

原始变量在其所处分布中地位的量数,称为地位量数。地位量数常被用来表示各种常模。 种类:百分位分数、百分等级分数、标准分数、T 分数

1. 百分位数(Pm )。计算公式如下:

2.

3.

4.

5.

X

i

f

F N m U P i

f F N m

L P a

m

b

m

?-?--=?-?+=)1001(100的累积累积

U 大于F 的累积累积L 小于F 所在组在组的P f 所在组在组的组P U 所在组在组的组P L 第m百分位分数P :

其中a b m m m m →→→→→→

6.

7.

8.百分等级分数(PR某个已知原始分数在其所处分布中的相对位置叫百分等级分数。)

9.计算公式如下:

10.

百分等级越小,原始数据在分布中的相对位置越低

11.百分等级越大,则越高。

12.百分位分数和百分等级分数称为百分位量表。

13.优点是:计算简便,意义明确,对各种测验普遍适用。

14.缺点是:它是一个顺序量表,不具相等单位,从而不能作进

15.一步的运算,无法作进一步的统计分析,另外,由于百分位

16.量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大

分布中间的原始分数的差异而缩小分布两端的原始分数的差异。

第4节相关分析

1.相关

2.相关:即两类现象在发展变化的方向与大小方面存在一定的关系。

3.相关分析:用一些合理的指标对相关事物的观测值进行统计分析,以判断两事物相

关的程度,称为相关分析。

4.相关散点图:1)呈曲线趋势,称曲线相关或非线性相关。

5. 2)直线称线性相关

6. 3)X和Y正相关

7. 4)X和Y负相关

8.相关系数及其解释

9.相关系数:用来表示两个具有相关关系的变量之间相关程度的数值。

10.通常样本的相关系数用r(relationship)表示。

11.总体的相关系数用ρ表示。

12.相关系数取值范围介于至+之间,即≤ r ≤ + (零相关、完全相关)

13.常用相关分析方法及其计算

14.1)积差相关系数

15.英国的统计学家皮尔逊(Pearson)于20世纪初提出了积差相关概念,用来计算线

性关系的两列变量的相关程度。计算公式如下:

16.2)积差相关系数(r

XY

的计算

17.

18.

19.

20.

3)等级相关(r

R)等级相关是积差相关的特例

21.二者可以互相推导,等级相关引进了计算误差,没有积差相关精确,能够用积差相关计算的数据一定不能用等级相关计算。

的累积累积

小于

某特定原始分数

的次数

某特定原始分数所在组

的下限

某特定原始分数所在组

:

其中

100

]

)

(

[

L

F

x

f

L

N

i

f

L

x

F

PR

b

b

?

-

+

=

22.斯皮尔曼等级相关的基本公式:如不用对偶等级之差,而用原始等级序数计算:

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

33.4)肯德尔W系数(肯德尔和谐系数)

34.又叫肯德尔和谐系数(the Kendall coefficient of concordance),用r

W表示。在心理与教育研究中,肯德尔和谐系数常用来考察评分者的一致性程度。

35.评定有两种情况,即不同评定者对同一组个体的等级评定,或者同一评定者对同一个体等级的几次评定。

36.

37.

38.

39.

40.

41.

42.

43.

44.

45.

46.

47.

48.5)质量相关

49.

50.

51.

52.

53.

54.

55.

56.

57.

58.

59.

60.

61.

62.

63.

64.

65.

第1章练习

1.落在某一特定类别或组中的数据个数称为( )。

A.次数 B.频率 C.次数分布表 D.累积次数

【答案】A

【解析】次数是指某一特定类别或组中的数据个数;频率又称相对次数,是各组的次数f与总次数N之间的比值;次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现;累积次数是指某个数值以下或以上的数据的次数。

2.把各个类别及落在其中的相应次数全部列出,并用表格形式表现出来,称为( )。

A.次数 B.次数分布表C.频率 D.累积频率

【答案】B

【解析】对数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。

3.下面哪一个图形最适合描述结构性问题( )。

A.条形图 B.饼图 C.直方图 D.多边图

【答案】B

【解析】饼图又称圆形图,是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。在这里,整个圆代表所研究事物的总体,各扇形可用不同的色调加以区别,分别代表对总体事物进行分类后的统计事项;扇形的面积比例大小,完全依某一统计事项在其总体事物中的比例大小而定。因此,圆形图有其独特的功能,特别适用于描述具有百分比结构的分类数据。

4.下面图形中最适合描述一组数据分布的图形是( )。

A.散点图 B.直方图 C.条形图 D.圆形图

【答案】B

【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据;直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基线上构成的图形;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述离散性变量的统计事项;圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。

5.为描述身高与体重之间是否有某种关系,适合采用的图形是( )。

A.条形图 B.线形图 C.散点图 D.直方图

【答案】C

【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据。

6.对于时间序列数据,用于描述其变化趋势的图形通常是( )。

A.条形图 B.直方图 C.多边图 D.线形图

【答案】D

【解析】线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发

展变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。

7.下列不能用于描述某年级某班60名学生的期末测验成绩的是( )。

A.条形图 B.累积百分数图 C.相对次数表 D.散点图

【答案】D

【解析】散点图是用来表示两种事物之间的相关性及联系模式的点散布的图形,适用于描述二元变量的观测数据。

8.描述定性数据两种常用的图示法是( )。

A.条形图和饼图 B.散点图和饼图

C.散点图和条形图 D.条形图和茎叶图

【答案】A

【解析】定性数据包括分类数据和顺序数据两种类型,分类数据的取值是对事物的一种分类,而顺序数据的取值是对事物的分类排序。条形图和饼图可用于显示分类数据和顺序数据取值所对应的频数或频率分布。

9.特别适用于描述具有百分比结构的分类数据是( )。

A.散点图 B.线形图 C.条形图 D.圆形图

【答案】D

【解析】圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。

10.与直方图相比,茎叶图( )原始数据信息。

A.没保留 B.保留了 C.掩盖了 D.浪费了

【答案】B

【解析】茎叶图类似于横置的直方图,但又有不同:茎叶图既能给出数据的分布状况,又能给出每一个原始数据,从而保留了原始数据的信息,一般适用于小批量数据;直方图能够反映定性变量取值的分布,但不能保留原始的数据信息,通常适用于大批量数据。

11.一组数距的最大值与最小值之差称为( )。

A.标准差 B.方差 C.组距 D.全距

【答案】D

【解析】所谓全距是指一批数据中最大值与最小值之间的差距,在其他书中也称为两极差。

12.将各有序类别或组的次数逐级累加起来得到的次数称为( )。

A.次数 B.累积次数 C.比例 D.比率

【答案】B

【解析】累积次数是把各族的次数由下而上,或由上而下累加在一起。

13.对于小样本的数据,最适合描述其分布的图形是( )。

A.条形图 B.茎叶图 C.直方图 D.圆形图

【答案】B

【解析】茎叶图既能给出数据的分布状况,又能给出每一个原始数据,从而保留了原始数据的信息,一般适用于小批量数据。

14.由一组数据的最大值、最小值、中位数和两个四分位数五个特征值绘制而成,反映原始数据分布的图形,称为( )。

A.条形图 B.茎叶图 C.箱形图 D.直方图

【答案】C

【解析】箱形图主要用来反映原始数据的分布特征,由一组数据的最大值、最小值、中位数、上下四分位数这个五个特征数值组成。与茎叶图相比,箱形图不能够反映出每一个原始数据的信息,但却提供了简明有效的视图。

15.在一次考试中,依照成绩分了四个组,根据“上组限不在内”的原则,分数为60分的同学应归入下列哪一个组( )

A.60分以下 B.60~70分 C.70~80分D.80~90分

【答案】B

【解析】根据“上组限不在内”的原则,60分归入“60~70分”一组。

16.组距分组中,一个组的最小值称为( ),一个组的最大值称为( )。

【答案】下限;上限

【解析】

17.条形图适合应用于哪些场合

答:条形图通常用于描述离散性变量(如属性变量)的统计事项。其中,简单条形图是用同类的直方长条来比较若干统计事项之间数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分类的情况。复合条形图一般是用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法。

18.请使用SPSS软件,自编数据,绘制散点图、线形图、条形图和圆

形图。

【答案】略

【解析】

19.数据分组的基本要求是什么

答:在整理和描述定性变量时,需要根据分类变量和顺序变量的取值进行统计分组,同时计算每一组对应的频数;而对于定量变量,通常采用统计分组,得到每一组所对应的频数、频率或比例表,用来对数据特征进行描述。数据分组过程的要求如下:

(1)求全距

全距是一批数据中最大值与最小值之间的差距,以符号R表示,也称为两极差,其计算公式为:

(2)定组数

①定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号K表示。组数的大小要依数据的多少而定。组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信息。

②当一批数据的个数在200个以内时,组数可取8~18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:

公式中的N为数据个数。

③注意:事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。

(3)定组距

组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10……等。具体的取值过程可通过全距R与组数K的比值来取整确定。

(4)写出组限

组限是每个组的起始点界限。

(5)求组中值

组中值是各组的组中点在量尺上的数值,其计算公式为:

组中值=(组实上限+组实下限)÷2 。

(6)归类划记

具体方法可以类似唱票的方式依次把每个数据准确地划归所属的组别。

20.编制简单次数分布表的步骤有哪些

答:简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表的主要步骤如下:

(1)求全距

全距是一批数据中最大值与最小值之间的差距,以符号R表示,也称为两极差,其计算公式为:

(2)定组数

①定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号K表示。组数的大小要依数据的多少而定。组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信息。

②当一批数据的个数在200个以内时,组数可取8~18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:

公式中的N为数据个数。

③注意:事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。

(3)定组距

组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10……等。具体的取值过程可通过全距R与组数K的比值来取整确定。

(4)写出组限

组限是每个组的起始点界限。

(5)求组中值

组中值是各组的组中点在量尺上的数值,其计算公式为:

组中值=(组实上限+组实下限)÷2。

(6)归类划记

具体方法可以类似唱票的方式依次把每个数据准确地划归所属的组别,并以“正”号或“ ”号的记录方式体现在表中,便于计数检查。

(7)登记次数

根据划记结果,点计各组的次数f。

21.简述直方图与条形图的区别。

答:(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距,因此,其高度与宽度均有意义。

(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。

(3)条形图主要用于展示分类数据,而直方图主要用于展示数值型数据。

22.下面是40个人的血型资料:试编制其次数分布表,并绘制圆形图。

第1节概率

1.概率

2.1)随机现象

3.确定性现象:在一定条件下事先可以断言必然会发生某种结果的现象;(分必然现象

和不可能现象)

4.随机现象:在一定条件下,事先不能断言会出现哪种结果的现象。

5.随机现象具有两个特征:

6.①一次试验前,不能预言发生哪一种结果,这说明随机现象具有偶然性;

7. ②在相同条件下,进行大量次重复试验,呈现出统计规律性,这说明随机现象具有必然性。

8. 随机事件:随机现象中出现的各种可能的结果称为随机事件。 9. ①在每次实验中一定要发生的事件称为必然事件。 10. ②在每次实验中一定不发生的事件称为不可能事件。 11. 2)事件与概率

12. 频率(frequency ):在N 次实验中,某一事件出现的相对次数称为该事件的频率。即如果某一事件A 在N 次实验中出现了n 次,则事件A 发生的频率为:F (A )=n/N 。 13. 对于某一随机事件A ,当实验次数足够多时,其频率会趋向于某一个稳定的值,即频率具有稳定性。这个稳定的频率反映了事件A 发生的可能性的大小,即反映了事件A 发生的概率(probability)。

14. 频率是事件发生的外部表现,而概率才体现事件发现的内存实质。

15. 频率用符号F 表示,概率常用符号P 表示。如事件A 的概率用P (A )表示,事件B 的概率用P (B )表示,…。

16. ①概率的统计定义(后验概率):若实验满足两个条件,1是每次试验中某一事件发生的可能性不变。2是试验能大量重复,且每次试验相互独立。即某随机事件在n 次实验中出现m 次,其发生的频率m/n

率的计算:

17. ②概率的古典定义(先验概率): 18. 它要求满足两个条件,

19. 1是每次试验中所可能出现的结果的个数是有限的。这些结果叫作基本事件或样本点。

20. 2是每次试验中每个基本事件的出现是等可能的,

21. 即每个基本事件发生的概率相等。即若试验同n 个有限的基本事件组成,且每次试验中每个基本事件出现是等可能的,有利事件A 发生的次数为m ,则事件A 的概率为:P(A)=m/n 22. ③概率的性质

23. 必然事件的概率为1,记作P ()=1 24. 不可能事件的概率为0,记作P ()=0

25. 任何随机事件的概率P 满足: 0≤ P (A )≤ 1 26. 逆事件的概率:P(A)=1- P(A) 27. 3)概率的两个基本定理 28. ①概率加法定理

29. 两个互不相容事件A 、B 中至少有一个发生的概率等于两个事件概率之和: 30. P (A+B )=P (A )+P (B ) 互不相容:即A 事件发生则B 事件必不会发生。

)

()()()(2121n n A A A A A A P P P P +++=+++

=C m n

P m n P m

33. ②概率的乘法定理

34. 两独立事件同时出现的概率等于两事件概率的积。 35. P (AB )=P (A ) P (B )

36.独立事件:即事件A 出现的概率不影响事件B 出现的概率。

37. 二项式定理 38. 1)排列

39. ①当m ﹤n 时,所得排列为选排列。记作: 40. =n(n-1)(n-2)……(n-m+1)

41. ②当n=n 时,所得排列称全排列,记作:P n 42. P n = n(n-1)……3·2·1=n 43. 2)组合

44. 45.

46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66.

)

()()()(2121n n A A A A A A P P P P ???=????m P n

P

m

n

69.

70.

71.

72.

73.

74.

75.

76.

77.

78.

79.

80.

81.

82.

83.

第2节二项分布

1.二项分布

2.二项实验中成功事件发生概率的分布叫二项分布。

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.二项分布的均值、方差和标准差

14.

15.

16.

17.

18.

21.

22.

23.

24.

25.

26.

第3节正态分布

1.正态分布的基本性质

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

24.

25.

26.

27.

30.

31.

32.

33.

34.

35.标准正态分布

36.

37.

38.

39.

40.

41.

42.

43.

44.

45.正态分布的一些实际应用

46.

47.

48.

49.

50.

51.

52.

53.

54.

55.

56.

57.

58.

59.标准分数的性质:

60.例题:

61.

相关主题
相关文档
最新文档