教育统计学

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

教育统计学

▪教育统计与测量教育科学一门分支学科。它是将统计与测量学原理和方法应用于教育实践和研究领域而形成的一门应用性教育学科。属于工具性学科，具有基础性地位。

第一节什么是教育学

▪一、什么是教育统计学

教育统计学是运用数理统计的原理和方法，研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料，并以此为依据，进行科学推断，揭示教育现象所蕴含的客观规律。

▪例：我们可以通过调查把握近五年来某地区小学教师学历达标的比例、逐年变化的情况。通过调查我们也可以了解学校各种设施逐年改善的情况，了解学生的升学率、辍学率等等。

▪教育统计学与教育调查、教育试验的关系：

教育调查与教育试验会提出具体的研究任务，解决具体的问题。而教育统计学主要是对数据进行分析和处理。如果统计学不与一定的调查和试验联系起来，研究者就不知自己在干什么，说明什么问题。反过来，调查和试验不与统计联系起来，则它们会是杂乱无章的，这样教育的规律就显示不出来。

▪二、教育统计学的内容

从具体应用的角度来分，可以分成：

1.描述统计。就是对已获得的数据进行整理、概括，显现其分布特征的统计方法。

2.推断统计。根据样本提供的信息，运用概率理论进行分析论证，在一定可靠程度上，对总体分布特征进行估计、推测，这种统计方法称为推断统计。其内容包括总体参数估计和假设检验两部分。

第二节学习教育统计学的意义

▪首先，统计学是教育科学研究的工具。如教育者对随机因素的处理。

▪其次，是提高专业素养、专业水平的需要。如可以帮助你阅读大量统计说明的资料，否则就不能理解别人的研究。

▪再次，提高教育实际工作的效率和科学性。可以帮助了解现有的教育管理，从而在此基础上制定新的计划，提高教育实际工作的效率和科学性。同时，还可不断发现问题，提出调整的方法和方案，因而能够提高工作效率。

最后，是科学训练的需要。可以学会科学研究所需的推理和逻辑的能力训练。

第三节统计学中的几个基本概念

一、随机变量

试验结果数值不是恒定不变的量，我们把它称为变量。和它相反的量叫做常量，即数值保持恒定的量。表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。一般用X、Y、Z表示。

▪具有以下三个特性的现象，称为随机现象。

第一，一次试验有多种可能结果，其所有可能结果是已知的。

第二，试验之前不能预料哪一种结果会出现。

第三，在相同的条件下可以重复试验。

随机现象的每一个结果叫做一个随机事件。

二、总体和样本

总体是我们所研究的具有某种共同特征的个体的总和。

比如我们要了解全国初中生的英语水平，只有具有“全国的”“初中生”“英语”这些共同特征个体才构成一个总体。总体中的每个单位称为个体。

▪总体和样本的分类：

▪总体可以分为两种，一种为有限总体，另一种叫做无限总体。当总体所包含的个体数目有限时，这一总体称为有限总体。而总体所包含的个体数目无限时，则称为无限总体。

▪样本种包含的个体数目称为样本的容量，一般用n表示。样本中个体数目大于30称为大样本，等于或小于30称为小样本。

▪总体和样本的关系：具有相对性，即在一定的条件下可以相互转换。比如我们想研究目前南阳师院在校大学生的外语水平，那么目前在校大学生就可以构成一个整体。如果现在想研究全国大学生的外语水平，那么南阳师院在校大学生就是全国范围内的一个样本。在这种情况下，总体就变成样本。

▪总体，样本，与研究的目的相联系。

▪三、统计量和参数

▪样本上的数字特征是统计量。也就是说，根据教育调查或试验获得的数据所计算出来的能够描述这组数据各种特征的数量是统计量。

▪总体上的各种数字特征是参数。也即反映总体上各种特征的数量是参数。

第二章数据的初步整理

第一节数据的来源、种类及其分类

一、教育统计资料的来源

1．经常性资料（档案性资料）：如学生、家长和老师的资料等。

2．专题性资料：主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题，通过调查或实验的方法来搜集的。

二、数据的种类

数据就是随机变量的观察值。

1.按来源分：点计数据和度量数据。点计数据指计算个数的数据。它具有独立的分类单数，如人口数、学校数、男女数等，一般都取整数形式。

度量数据是指用一定的工具或一定的标准测量所获得的数据。如身高、体重、成绩分数。按测量数据是否等距和有绝对零，又可分三种水平：

①有相等单位又有绝对零的数据称为比率变量数据，如身高、体重、反应时。

②有相等单位但无绝对零的数据，称为等距变量数据，如温度、各种能力分数、智商等。

③既无相等单位也无绝对零的数据称为顺序变量数据，如等级评定、品质评定、能力等级等。

计数数据常用百分比率的检验方法，χ2检验等，比率或等距变量常用T检验及方差分析，顺序变量常用等级相关、等级差异数分析等。

2.按随机变量取值是否具有连续性,分为间断型随机变量的数据和连续型随机变量。

取值个数有限的数据，称为间断型随机变量的数据。这种数据的单位是独立的，两个单位之间不能再划分成细小的单位，一般用整数表示。许多调查得来的数据属此类。

取值个数无限的数据，称为连续型随机变量的数据。它们可能的取值范围能连续充满某一个区间。数据的单位之间可以在划分成无限多个细小的单位。数据可以用小数表示。

第二节统计表

1.标题：表的名称。上方，简明扼要。

2.表号：表的序号。左方，时间顺序。

3.标目：表中对统计数据分类的项目。

4.线条：四条基本线条；不宜多。

5.数字：小数数位要一致，对齐；尽量不留空格；无数字可画横杠，可用省略号或问号表示。

6.表注：补充说明表的来源；字号不要大于表中的其它文字。简单明了、重点突出。

二、统计表的种类

1．简单表：只列出观察对象的名称、地点、时序或统计指标名称的统计表。

2．复合表：按两个或两个以上标志分组的统计表。

三、频数分布表列法

频数：某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。一般用f表示。频数分布：各种随机事件在n次试验种出现的次数分布称为频数分布，即把随机事件出现的次数都呈现出来。

频数分布表：把频数分布用表格的形式表示出来就是频数分布表。

频数分布表分类：

1.简单频数分布表（1）间断变量的频数分布表

（2）连续变量的频数分布表

第一步：求全距

R=最大值—最小值=128—81=47

第二步：决定组数和组距

k:一般分为10~15组。

i:一般定为1、2、3、5、10。

本例k=10,i=R/k=47/10 5

第三步：决定组限，即决定各组的上下限。