数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

合集下载

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)
1. 引言
本文旨在对数理统计的基本知识点进行归纳总结,帮助读者快速了解数理统计的核心概念和方法。

2. 概率论基础
- 概率的基本定义和性质
- 随机事件的运算规则
- 条件概率和独立性
- 贝叶斯定理
3. 随机变量和分布
- 随机变量的定义和分类
- 离散型随机变量和连续型随机变量
- 常见离散型分布(如伯努利分布、二项分布、泊松分布)
- 常见连续型分布(如均匀分布、正态分布、指数分布)
4. 数理统计的基本概念
- 总体和样本的概念
- 估计与抽样分布
- 统计量和抽样分布
5. 参数估计
- 点估计的定义和性质
- 常见的点估计方法(如最大似然估计、矩估计)
- 区间估计的基本原理和方法
6. 假设检验
- 假设检验的基本思想和步骤
- 单侧检验和双侧检验
- 假设检验中的错误类型和显著性水平
- 常见的假设检验方法(如正态总体均值的检验、两样本均值的检验)
7. 相关分析
- 相关系数的定义和计算方法
- 相关分析的假设检验
- 线性回归分析的基本原理和方法
8. 统计软件的应用
- 常见的统计软件介绍(如SPSS、R、Python)
- 统计软件的基本操作(如数据导入、数据处理、统计分析)
9. 结语
本文对数理统计的核心知识点进行了简要的概括,供读者参考和研究。

通过研究数理统计,读者可以更好地理解和应用统计学在实际问题中的作用,提高数据分析和决策能力。

以上是根据数理统计知识点的归纳总结,希望有助于您对数理统计的理解和学习。

如需深入了解各个知识点的具体内容,请参考相关教材或课程。

数理统计总结讲义

数理统计总结讲义

最大次序统计量X(n) = max {Xi }的密度函数为
1<i≤n ∗ fk (y ) = nf (y )[F (y )]n−1
Mathematics Statistics (College of Info. Science and Eng., at SDUST)
数理统计总结
2011.12.21
4 / 44
1 n
n
¯ )2 (Xi − X
i−1
3. 顺序统计量 X(1) ≤ X(2) ≤ ... ≤ X(n−1) ≤ X(n) 当总体X的分布函数为F (x)、密度函数为f (x)时,最小次序统计 量X(1) = min {Xi }的密度函数为
1<i≤n ∗ f1 (y ) = nf (y )[1 − F (y )]n−1
数理统计总结
Mathematics Statistics
山东科技大学 信息科学与工程学院
2011年12月
数理统计总结
第一部分 数理统计
Mathematics Statistics 一、 二、 三、 四、 五、 基本概念 参数估计 假设检验 回归分析 方差分析
1
一、 基本概念 二、 参数估计 三、 假设检验 四、 回归分析 五、 方差分析
Mathematics Statistics (College of Info. Science and Eng., at SDUST) 数理统计总结 2011.12.21 6 / 44
1 1 = F0.95 (6, 4) 6.16
一、 基本概念 V
n
数理统计总结
(1) X1 , ..., Xn iid N (0, 1), 则 Y =
1. 经验分布函数的求法

数理统计知识梳理

数理统计知识梳理

2、步骤
( 1) 提 出 原 假 设 H 0 ( 2) 选 择 检 验 的 统 计 量 并 找 出 在 假 设 H 0 成 立 的 条 件 下 , 该 统 计 量 所服从的概率分布 ( 3) 根 据 所 给 的 显 著 水 平 , 查 概 率 分 布 临 界 值 表 , 找 出 检 验 统 计 量 的 临 界 值 , 并 确 定 否 定 域 ( 4) 用 样 本 值 计 算 统 计 量 的 值 , 将 其 与 临 界 值 比 较 , 根 据 比 较 结 果 , 确 定 样 本 值 是 否 落 入 否 定 域 , 最 后 对 H 0作 出 结 论
( X 1 , X 2 ,… , X n )
是n次试验的结果,因此它们是
n个随机变量。但做了试验后,记录下来的是它们在试 验中所取得的数值,得到一串数据
( x1 , x 2 , … , x n )
这串数据称为样本的观察值。
样本的观察值就是指样本的一次实现, 是一个常数向量

有时样本观察值也称为样本,因此样本一词 具有二重性
服 从 自 由 度 为 ( k 1, k 2) 的 F 分 布 , 记 F ( k 1, k 2) 。

F分布一个重要特点
F1( k 1, k 2) =
1 F( k 2, k 1)
3、统计量
设 X 1 , X 2 , … , X n 是 来 自 总 体 X 的 一 个 样 本 , g( x1 , x 2 , … , x n ) 是 一 个 连 续 函 数 。 如 果 g中 不 包 涵 任 何 未 知 数 参 数 , 则 称 g(X 1 , X 2 , … , X n )为 统 计 量 。
2分 布 的 重 要 性 质
X 1 ~ ( m ) , X 2 ~ ( n ) ; n )

数理统计--参数估计、假设检验、方差分析(李志强) (3)

数理统计--参数估计、假设检验、方差分析(李志强) (3)

教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。

数理统计关键知识点汇总

数理统计关键知识点汇总

数理统计关键知识点汇总数理统计(Statistical Mathematics)是数学的一个分支,研究的是收集、分析和解释数据的方法。

在实际应用中,统计学被广泛运用于各个领域,包括经济学、社会学、医学和环境科学等。

本文将汇总并介绍数理统计的几个关键知识点。

一、总体和样本在统计学中,我们需要区分总体(Population)和样本(Sample)这两个概念。

总体是研究对象的全体,而样本是从总体中抽取的一部分。

通过对样本的研究,我们可以推断出总体的特征。

在实际应用中,由于总体往往过于庞大,难以直接进行统计分析,因此常常采用样本来代表总体。

二、概率分布概率分布是用来描述随机变量可能取值的概率的函数。

常见的概率分布包括正态分布、泊松分布和二项分布等。

正态分布是最重要的分布之一,它在自然界中广泛存在,被广泛应用于描述实验结果、人口统计数据和观测误差等。

三、抽样分布抽样分布是样本统计量的分布。

样本统计量是根据抽取的样本计算得到的数值指标,如样本均值和样本方差等。

抽样分布的中心极限定理表明,当样本容量足够大时,抽样分布可以近似地服从正态分布。

这对于进行统计推断提供了基础。

四、参数估计参数估计是根据样本数据来估计总体参数值的方法。

常见的参数估计方法包括点估计和区间估计。

点估计是根据样本估计得到总体参数的一个点估计值,如样本均值是对总体均值的一个点估计。

区间估计是根据样本数据构造一个总体参数的区间估计范围,如置信区间。

五、假设检验假设检验是用来检验关于总体参数的假设的方法。

通常,我们会提出一个原假设和一个备择假设,并进行假设检验来判断哪个假设更为合理。

假设检验的基本思想是计算一个统计量,并将其与一个临界值进行比较,从而得出对原假设的统计结论。

六、相关与回归分析相关和回归分析是用来研究变量之间关系的方法。

相关分析用于描述两个变量之间的相关程度,可以通过计算相关系数来衡量变量间的线性关系强度。

回归分析则用于建立一个变量与多个自变量之间的关系模型,从而进行预测和解释。

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。

2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。

2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。

(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。

考研数学数理统计基础知识点总结

考研数学数理统计基础知识点总结在准备考研数学的过程中,掌握数理统计基础知识是非常重要的。

本文将为您总结一些常见的数理统计基础知识点,帮助您更好地备考。

一、概率论基础知识1. 事件与样本空间:事件是指样本空间中的某个子集,样本空间则是指随机试验的所有可能结果的集合。

2. 概率的定义:概率是指事件发生的可能性大小,其取值范围在0到1之间。

3. 概率的运算:包括加法公式和乘法公式。

加法公式适用于互斥事件的概率计算,乘法公式则适用于独立事件的概率计算。

4. 条件概率:指在已知某一事件发生的条件下,另一事件发生的概率。

5. 贝叶斯定理:用于计算事件的后验概率,在已经得到一些信息的情况下,通过先验概率和条件概率计算出事件的后验概率。

二、随机变量与概率分布1. 随机变量的概念:随机变量是指随机试验结果的某个函数,可以是离散的或连续的。

2. 概率质量函数与概率密度函数:对于离散型随机变量,其概率可以通过概率质量函数来描述;对于连续型随机变量,则需要使用概率密度函数。

3. 常见的离散型随机变量:包括伯努利分布、二项分布、泊松分布等。

4. 常见的连续型随机变量:包括均匀分布、正态分布、指数分布等。

三、统计推断1. 抽样与抽样分布:抽样是指从总体中选取一部分个体进行研究,抽样分布则是指统计量在大量抽样下的分布情况。

2. 参数估计:根据样本数据对总体的某个参数进行估计,可以使用点估计和区间估计两种方法。

3. 假设检验:对总体参数的某个假设进行检验,包括设置原假设和备择假设,以及计算检验统计量和判断拒绝域。

4. 方差分析:一种用于比较两个或多个总体均值是否有显著差异的统计方法,适用于独立样本、配对样本和重复测量样本。

四、相关与回归分析1. 相关分析:用于判断两个变量之间的相关性强弱,包括计算相关系数和进行假设检验。

2. 简单线性回归分析:用于建立一个自变量与因变量之间的线性关系模型,通过最小二乘法来估计回归系数。

3. 多元线性回归分析:在简单线性回归的基础上,将多个自变量引入回归模型中进行分析,以探究多个变量对因变量的影响。

数理统计学中的参数估计和假设检验

数理统计学中的参数估计和假设检验在现代统计学中,参数估计和假设检验是非常重要的概念。

这些概念互相关联,但是又有不同的应用。

在此,我们将讨论这两个概念的基本原则以及它们在现实生活中的应用。

参数估计可以被描述为研究一组数据的基本特征。

通过这个过程,我们试图推断出这个数据集的平均值、标准差和其他的参数。

这些参数会充当我们对整个数据集的总体特征的代表,是基于样本数据和概率等数学方法来实现的。

数理统计学中有两种常见的参数估计方法:点估计和区间估计。

点估计法指的是通过现有的样本数据,确定整体数据集的一个参数值。

这个参数值是一个点,代表了这个总体数据的典型特征。

例如,一个统计学家可能会利用一个样本数据集的均值来估计整个数据集的均值。

这个方法非常简单,但是也有缺点,因为单个点可能不能完整地反映出整个总体的信息。

相对于点估计方法,区间估计法则是根据样本数据并结合概率论提供一个充分范围内的参数估计值。

以信心水平的方式,给出估计结果的范围和信心度。

这样的区间被称为可信区间,其中的参数值处于一定的置信度内,一般用百分之几的置信度表示。

例如,一个样本数据的均值在一定的置信度下是x到y之间的。

区间估计法是一种更加准确的方法,因为它允许我们知道参数值的变化范围,而不仅仅是一个单点。

但是,这种技术会带来更多的复杂性,需要一些基本的统计技能。

另一方面,假设检验则是一种帮助我们确定一个假设是否正确的方法。

这个方法通常用于对两个数据组的统计分析中,并且可以用于比较一个数据集的平均值是否等于一个已知的值。

简单说就是,假设检验能够让我们确定样本数据是否足够代表总体,并且也让我们确认样本数据能否代表以前的观测和研究。

在假设检验中,我们制定一个假设被称为研究假设,并组对比之前已知的信息,提出一个对立假设。

之后,我们会挑选一个随机样本并采取测量行动。

我们利用这个测量行动来确定样本数据是否属于已知的总体比例,或者是否对研究假设做出了支持。

如果样本数据足够代表总体,并且不同于已知的比例,则我们可以拒绝研究假设并接受对立假设。

数理统计与数据分析第三版答案 (2)

数理统计与数据分析第三版答案第一章简介1.1 概述本章主要介绍了数理统计与数据分析的基本概念和作用。

数理统计是对数据进行收集、整理和分析的方法,数据分析则是从数据中提取有用的信息和结论。

1.2 数理统计的基本概念与分析步骤数理统计的基本概念包括总体、样本、参数和统计量等。

分析步骤包括收集数据、描述性统计、概率分布、参数估计和假设检验等。

1.3 数据分析的基本方法数据分析的基本方法包括描述统计和推断统计。

描述统计主要是对数据的总体特征进行描述,推断统计则是通过样本数据对总体进行推断。

第二章概率分布2.1 离散型随机变量离散型随机变量是在有限个或可列无限个数值中取值的随机变量。

本节介绍了离散型随机变量的概率质量函数、分布函数、期望和方差等。

2.2 连续型随机变量连续型随机变量是在某个区间内取值的随机变量。

本节介绍了连续型随机变量的概率密度函数、分布函数、期望和方差等。

第三章参数估计3.1 点估计点估计是用样本数据估计总体参数的方法。

本节介绍了点估计的基本原理和常用的点估计方法,包括最大似然估计和矩估计。

3.2 区间估计区间估计是通过样本数据估计总体参数的范围。

本节介绍了区间估计的基本原理和常用的区间估计方法,包括置信区间和预测区间。

第四章假设检验4.1 基本概念假设检验是用样本数据对总体参数的假设进行检验的方法。

本节介绍了假设检验的基本概念,包括原假设、备择假设、显著性水平和拒绝域等。

4.2 单样本均值检验单样本均值检验是对总体均值是否等于某个给定值进行检验的方法。

本节介绍了单样本均值检验的假设检验步骤和常用的检验方法,包括正态总体和非正态总体的检验。

第五章方差分析5.1 单因素方差分析单因素方差分析是对一个因素的影响进行分析的方法。

本节介绍了单因素方差分析的基本原理和常用的分析方法,包括单因素方差分析的假设检验和效应大小的度量。

5.2 多因素方差分析多因素方差分析是对多个因素的交互作用进行分析的方法。

高考统计知识点总结

高考统计知识点总结高考统计学是数学中的一个重要分支,它主要研究数据的搜集、整理、描述与分析。

高考统计学常考的知识点主要包括概率、抽样与中心极限定理、参数估计与假设检验等。

下面是关于这些知识点的详细总结。

一、概率1.基本概念:样本空间、事件、随机试验、等可能事件等。

2.事件关系:互斥事件、对立事件、相等事件等。

3.概率基本定理:概率的性质、概率的计算、概率的加法定理和乘法定理等。

4.排列与组合:排列的计算、组合的计算、二项式定理等。

5.条件概率与独立性:条件概率的计算、乘法定理的条件概率形式、事件的独立性等。

6.贝叶斯定理:完全事件组、贝叶斯定理的推导与应用等。

二、抽样与中心极限定理1.总体与样本:总体、样本的概念、总体参数与样本统计量的关系等。

2.抽样分布:简单随机抽样、大小为n的简单随机样本、比例估计等。

3.中心极限定理:中心极限定理的条件、正态分布的基本性质、用中心极限定理进行估计等。

三、参数估计与假设检验1.点估计:估计量的性质、最大似然估计、样本均值、样本方差等。

2.区间估计:区间估计的基本思想、正态总体参数的区间估计、大样本的区间估计等。

3.假设检验:假设检验的基本思想、单侧假设检验、双侧假设检验、P值的应用等。

4.卡方检验:观察频数与期望频数的差异、卡方统计量、卡方分布等。

以上是高考统计学的部分重点知识点总结,希望能够对你的学习有所帮助。

需要注意的是,统计学是一门理论实践相结合的学科,掌握理论知识的同时,更要注重实际应用,多做习题和真题,加强对知识点的理解和应用能力。

祝你高考取得好成绩!。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。

如果ϕ中不包含任何未知参数,则称ϕ(n x x x ,,,21 )为一个统计量。

2、统计量(1)常用统计量样本均值.11∑==ni i x n x样本方差∑=--=ni ix x n S 122.)(11 (与概率论中的方差定义不同)样本标准差.)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i ki k k x n M 1.,2,1,1样本k 阶中心矩∑==-='ni k i kk x x n M 1.,3,2,)(1 (二阶中心矩∑=-=n i i X X n S 122)(1*与概率论中的方差定义相同)例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,1275,求统计计量X ,S 2和S 的观察值.,,2s s x 和(2)统计量的期望和方差μ=)(X E ,nX D 2)(σ=,22)(σ=S E ,221)*(σnn S E -=, 其中∑=-=n i i X X n S 122)(1*,为二阶中心矩。

)(~,,,21x F X X X n ,i.i.d ,独立同分布。

无限总体抽样。

(3) 随机数生成在Matlab 中各种随机数可以认为是独立同分布的,即简单随机样本。

以下罗列在Matlab 中的实现方法。

)1,0U(~,,,21n X X X ,均匀分布样本n=10;x=rand(1,n)),U(~,,,21b a X X X nn=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a)1,0N(~,,,21n X X X ,正态分布样本n=10;x=randn(1,n)),N(~,,,221b a X X X nmu=80.2;sigma=7.6;m=1;n=10; x=normrnd(mu,sigma,m,n)上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab 自带的函数normrnd 生成正态分布的随机数。

类似地可生成m 行n 列的随机矩阵,服从指定的分布。

生成随机数的函数后缀都是rnd ,前缀为分布的名称。

常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。

x=betarnd(a,b,m,n) 参数为a,b 的beta 分布; x=binornd(N,p,m,n) 参数为N,p 的二项分布; x=chi2rnd(N,m,n) 自由度为N 的2χ分布; x=exprnd(mu,m,n) 总体期望为mu 的指数分布; x=frnd(n1,n2,m,n) 自由度为n1与n2的F 分布; x=gamrnd(a,b,m,n) 参数为a,b 的Γ分布;x=lognrnd(mu,sigma,m,n) 参数为mu 与sigma 的对数正态分布; x=poissrnd(mu,m,n) 总体均值为mu 的Poisson 分布; x=trnd(N,m,n) 自由度为N 的T 分布; Matlab 统计工具箱中还有一些其它分布,不再一一列举。

3、三个抽样分布(χ2、t 、F 分布)1.3 三个常用分布以下罗列出数理统计中三个重要分布的概念与性质。

1.3.1 2χ分布定义1.2 设一维连续型随机变量X 的密度函数为⎪⎩⎪⎨⎧≤>Γ=--0,00,e )2/(21)(2122/x x x n x f x n n n (1-2)则称X 服从自由度为n 的2χ分布,记为)(~2n X χ。

05101520253035400.020.040.060.080.10.120.14图1-2 2χ分布密度函数示意图(1)期望与方差:n X =E ,n X 2=D(2)来源:若)1,0N(~,,,21n X X X 独立同分布,则)(~222221n X X X n χ+++(3)可加性:若)(~121n Y χ,)(~222n Y χ,且两者独立,则有)(~21221n n Y Y ++χ(4)重要结论:若),N(~,,,221σμn X X X ,则)1(~)()1(221222--=-∑=n X XS n ni iχσσ以下给出了自由度为5,10,20的2χ分布的密度函数,如图1-2所示。

1.3.2 t 分布定义1.3 设一维连续型随机变量X 的密度函数为2121)2()21()(+-⎪⎪⎭⎫ ⎝⎛+Γ+Γ=n n n x n nn x f π (1-3)则称X 服从自由度为n 的t 分布,记为)(~n t X 。

-3-2-1012300.050.10.150.20.250.30.350.4图1-3 t 分布密度函数与标准正态分布密度函数(1)密度函数特点:与标准正态分布类似,方差较大。

∞→n 时,22e21)(x n x f -=→πϕ(标准正态分布密度函数)(2)来源:设)1,0N(~X ,)(~2n Y χ,且两者独立,则)(~/n t nY X(3)重要结论:设),N(~,,,221σμn X X X ,则)1(~/--=n t nS X T μ1.3.3 F 分布定义1.4 设一维连续型随机变量X 的密度函数为⎪⎪⎩⎪⎪⎨⎧≤>⎪⎪⎭⎫ ⎝⎛+=+--0,00,1)(22112211x x x n n cx x f n n n (1-4) 其中常数22121211)2()2()2(nnn n n n n c ⎪⎪⎭⎫ ⎝⎛ΓΓ+Γ= 则称X 服从第一自由度1n ,第二自由度2n 的F 分布,记为),(~21n n F X 。

(1)密度函数特点:在1=x 附近密度函数取值较大,为单峰非对称的。

当两个自由度都很大时,X 取值以较大概率集中在1=x 附近。

以下画出了)12,8(F 的密度函数00.51 1.52 2.53图1-4 F 分布密度函数(2)来源:设)(~12n X χ,)(~22n Y χ,且两者独立,则),(~//2121n n F n Y n X F =(3)重要结论:设1,,21n X X X 为来自总体),(211σμN 的简单随机样本,2,,,21n Y Y Y 为来自总体),(222σμN 的简单随机样本,且两者独立。

又设两个样本方差分别为21S 与22S ,则)1,1(~//2122212221--=n n F S S F σσ三、点估计的两种方法(1)矩法所谓矩法就是利用样本各阶原点矩代替相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布函数可以表成).,,,;(21m x F θθθ 显示它的k 阶原点矩),,2,1)((m k X E v k k ==中也包含了未知参数m θθθ,,,21 ,即),,,(21m k k v v θθθ =。

相关文档
最新文档