第五章数理统计的基本概念与抽样分布

第五章数理统计的基本概念与抽样分布
第五章数理统计的基本概念与抽样分布

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

抽样检验方法

抽样检验方法 1 、抽样检验的来源 2 、抽样检验的定义 3 、抽样检验的分类 4 、抽样检验和全检的区别 5 、抽样检验的基本概念 6 、计数调整型抽样方案简介 7 、一次正常抽样方案使用简介 附录一、样本大小字码表 附录二、一次正常抽样方案表 1.抽样检验的来源 二次世界大战刚开始时,美国迫切需要把平时产业转变成战时产业,造成了大量的军需品的生产和检验,但当时检查员又非常缺乏,同时军需品不可能进行全检,故不得不采取经济又适用的抽检方法,在此背景之下就产生了抽样检验标准: MIL —STD —105A 。 (1945年产生,1950年正式发布) 2.抽样检验的定义 从群体中,随机抽出一定数量的样本,经过检验、试验或测量以后,以其结果与判定基准作比较,然后利用统计方法,判定此群体是合格还是不合格的检验过程,称之为抽样检验。 3.抽样检验的分类 按抽样检验的方式可分为如下四类: 一、标准型抽样检验 是在同时考虑生产方和顾客风险的情况下,对孤立批所进行的一种抽案,以判断群体的合格与不合格为目的。 二、挑选型抽样检验 对按一定抽样方案拒收的产品,不是一退了之,而是对不合格批采取全数检验,退全检后的不良品并要求退换。 三、调整型抽样检验 根据以往交验批的信息,按一定的转换规则,对检验方案的宽严程度进行调整的一种抽样 不良品 X >C 拒收 X ≦C 允收

方案。适用于连续生产批的检验,一般分为:(1)正常检验; (2)加严检验; (3)放宽检验。 四、链式抽样检验 从检验批中抽出很小的样本,并规定样本中不允许有不合格。适用于费用高、批量小及客观条件不允许抽取较多产品的情况。 4.抽样检验和全检的区别 一、抽样检验和全检的适用场合 抽样检验并非任何场合都适用,有些可以做抽样检验,有些必须进行全检。这主要依据检验群体的性质、数量、体积大小或检验所产生的经费或者检验方式而定。但全检不一定就比抽检好。 (1) 适用于抽样检验的场合 ——属于破坏性试验,如材料强度。 ——检验群体数量非常多,如螺丝。 ——检验群体体积非常大,如原棉。 ——产品属于连续的物品,如纱绒。 (2) 适用于全数检验的场合 ——检验很快,且费用少,如灯泡点火检验。 ——产品必须全数良品,如手表、照像机等。 ——产品中只要有少许不良品,就会严重影响人身或财产安。 全,如高压气筒。 二、抽样检验与全检的优劣比较 (1) 优点 ——抽检费用远比全检少。 ——抽检数少,可较详细。 ——判断为不合格则全批退货,可加强供货商的质量管理。 (2) 缺点 ——虽然判定为合格,也难免存在一些不良品。 ——可能把不合格批误判为合格批,也可能把合格批误判为 不合格批。 5.抽样检验的基本概念 一、检验群体(N) 、检验批(Lot) 一般来说,一个生产批即为一个检验批。但若批量很大、连续生产、周期较长,且过程在受控状态下,可以将一个生产批分成若干检验批,但一个检验批不可能包含多个生产批,也不能随意组合检验批。 二、单位产品 通常将用来检验群体中的每个样品单位称为“单位产品”,对大多数产品而言,一个产品就是一个单位产品,但对流程性材料,以其包装容器为一个单位产品,对纺织品则以长度(米、匹等)为单位产品。 三、单位产品质量 质量特性可分为计量型和计数型两种。计量型特性是可通过测量仪器测试的,如轴承的尺寸、钢的含碳量等。计数型特性是离散的,如铸件的汽孔数、纺织品上的疵点数等。 四、样本(n) 从群体(检验批)中随机抽取部份的单位产品称之为样本。 五、合格判定数(C) 作为判定群体是否合格的基准不良数称为合格判定数。 六、缺点

第五章 抽样分布

第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

什么是抽样抽样的基本术语及其含义是什么

24什么是抽样?抽样的基本术语及其含义是什么? 24(什么是抽样,抽样的基本术语及其含义是什么, 答:前一问见名词简释。抽样的常用基本术语有: 1(总体。它是构成事物的所有元素、也就是最基本单位的集合。 (样本。它是从总体中按照一定方式抽取出的一部分元素的集合。一个样本是总体的 2 一个子集,一个总体中可以抽取出若干个不同的样本。 3(抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。社会调查研究中最常用的抽样元素是单个的人,但也可以是家庭、学校、企业、商店等。 4(抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 5(抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 6(参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 7(统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。 8(抽样误差。它是用样本统计值去估计总体参数值时所出现的误差。这种误差是因为抽样本身的特点而引起的。由于无论采取什么样的抽样方式,所抽取的样本

有多大,都无法涵盖总体,所以抽样误差是不可避免的。但是,抽样误差的大小是可以在样本设计中事先进行控制的。 25(在社会调查中,如何确定样本规模, 答:具体每一个社会调查研究究竟应当选择多大规模的样本,主要取决于以下几点: (1)总体规模:根据抽样原理,样本规模与总体规模越接近,样本值与总体值就越一致,抽样误差就越小,样本的代表性也越强。但是当总体规模大到一定程度以后,样本规模的加大就不是那么必要了。因此,对于10 000个单位以下的总体来说,样本规模应尽可能大;而对于那些超大型的总体,则可以按照一两万个单位的总体规模来确定样本规模,以避免不必要的浪费。 (2)抽样的精确性:从理论上说,样本的精确度越高越好,但相应的样本规模也要越来越大,这就意味着调查者的时间和人财物力的消耗也要增加好几倍。而对于大多数社会调查研究来说,实际上并不要求太高的精确度。因此,调查者应当根据必要性和可能性,适当地确定样本精确度,决不能因一味追求精确度的提高而拼命扩大样本规模,否则将导致巨大的浪费。 (3)总体的异质性程度:要达到同样的精确度,在同质性较高的总体中抽样时,样本规模可以小一些;在异质性较高的总体中,样本规模则应该大一些。为了提高了样本反映总体的精确度,人们通常用分类抽样的方法将总体划分为不同的类别或层次,让这些不同类别或层次在样本中都有代表,并使得抽样误差中基本不存在类与类之间的误差成分,而只存在类内各单位之间的误差成分,其效果相当于缩小了总体的异质性程度和单位分布的不均匀状态。 (4)调查者所拥有的经费、人力、物力和时间:尽管从样本的代表性、抽样的精确性考虑,样本规模应尽可能大,但一般调查的经费、人力、物力和时间总是有限

第5章 样本及抽样分布课后习题答案(高教出版社,浙江大学)

第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<x ,所以 (1) 联合概率密度为)()()()(),,,(43214321x f x f x f x f x x x x g = )(2432116x x x x e +++-=,(0,,,4321>X X X X ) (2)2 1,X X 的联合概率密度为) (2212x x e +-,所以 ????----== <<<<2 .17 .0221 5 .01215.02 .17 .021222121 2 1224}2.17.0,15.0{dx e dx e dx dx e X X P x x x x ))((4.24.121------=e e e e (3),21)(41)(41==∑=i i X E X E 16 1 2141)(161)(2 41=? ?? ???==∑=i i X D X D ; (4)4 1 )()()(2121==X E X E X X E ,(由独立性) ]4 1)()([21]41[21])5.0[()(])5.0([22 2222221221+-=+-= -=-X E X E X X E X E X E X X E 8 1]412141[21]4121)()([212 222=-??? ??+=+-+=X E X D ; (5)2 2 22 12122212141)()()(])[()(?? ? ??-=-=X E X E X X E X X E X X D 16 3161)4141)(4141(161)]()()][()([222121=-++=- ++=X E X D X E X D 。

第5章抽样与参数统计。分析

第五章抽样与参数估计 学习内容 一、抽样推断概述 二、抽样分布及其应用 三、常见的抽样分布 四、参数估计 五、区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念。 2. 理解抽样分布与总体分布的关系。 3. 了解点估计的概念和估计量的优良标准。 4. 掌握总体均值、总体比例和总体方差的区间估计。 一、抽样推断概述 ①推断统计的内容 ②抽样推断的过程 统计推断的基本假定 a)总体看作是一个随机变量X,其概率分布为f(x)。 b)样本看作是n个独立的随机变量(X1, X2, …, X n),每个都具有与总体X相同的分布。 c)样本中每个个体必须取自同一总体, X1, X2, …, X n相互独立。

统计推断涉及的概念 参数与统计量 –参数:描述总体分布特征的量,如平均数μ,标准差σ。 –统计量:由样本观察值算出的量,如,S2,S。 –统计量是随机变量。 ③抽样分布及其形成过程 抽样分布(概念要点) 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布。 抽样分布是一种理论概率的分布。 抽样分布的结果来自容量相同的所有可能样本。 单选题 样本平均数和总体平均数() – A、前者是一个确定值,后者是随机变量 – B、前者是随机变量,后者是一个确定值 – C、两者都是随机变量 – D、两者都是确定值 ④抽样推断的理论基础 (1)大数定律 a)大数定律在统计中是指一切关于大量随机现象之平均结果稳定性的定理。 –尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋 于稳定。 b)为整个推断统计提供了最基本的理论依据。 猜硬币赌局 赌局1:–掷10次硬币,赌正面朝上的频率为0.4到0.6次。 赌局2:–掷100次硬币,赌正面朝上的频率0.4到0.6次。 赌局3:–掷1000次硬币,赌正面朝上的频率0.4到0.6次。

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

I 基本概念与抽样分布1-8#

应用数理统计概述 不确定性数学:1 . 概率论、数理统计),,(P F Ω 2 . 模糊数学 )}(,{x x ?M 3 . 灰色数学 ],[b a H 4 . 未确知数学 )}(],,{[x F b a 对于上述各个数学分支,各自有相应的运算法则和适用范围。 (一) 概率论: 1.),,(P F Ω: E 是一个随机试验,Ω 为E 的全体基本事件的集合 F 由Ω的一些子集为元素 所构成的集合 人们通过对某事件A 的频率)(A f 的研究,发现了概率 )(A P 和性质及运算 2.讨论的一般方法: 随机变量 → 分布 → 数学期望、方差等(宏观指标) ① 对于一维 : )(ωξξ= )(i i x ωξ= ∑ <= <=x x i i p x P x F }{)(ξ, i i p x P ==}{ξ ; ? ∞ -= <=x dt t p x P x F )(}{)(ξ, 0)(≥x p . ? ∑ ∞ +∞ -∞ == dx x xp p x E i i i )(1 或 ξ; 2)(ξξξE E D -= ② 对于n 维 : 随机变量),,,(21n ξξξ → 实数),,,(21n x x x },{})({),,(22111 21n n n i i i n x x x P x p x x x F <<<=<==ξξξωξω ; (二) 数理统计: 1.基础:统计量?? ?? ? =∑=数据分区间处理经验型,如:公式型,n i i n 11ξξ 及其分布 ???经验分布(直方图) 分布 如:统计分布2 χ 2. 样本的处理:① 参数估计; ② 假设检验(参数假设检验<本科>、非参数假设检 验<分布拟合 与 两总体相等性检验>); ③ 回归分析; ④ 方差分析 与 正交试验设计.

本章提出了抽样的基本概念和基本术语.doc

第四章抽样讲课稿 本章提出了抽样的基本概念和基本术语,阐释了抽样在社会调查研究中的作用,介绍了不同种类的抽样方法,特别说明了每一种方法的适用范围和操作程序,并对它们做了简要评价。同时,为了更好地应用抽样方法,还简要介绍了样本规模和抽样误差问题。其中最重要的就是要联系实际认识和掌握各种抽样方法。 一、抽样的概念和基本术语 当今社会最主要和最常用的调查类型是抽样调查,它的前提条件就是抽样。因此,抽样是在许多社会调查研究的准备阶段必须完成的一项重要工作。 (一)抽样的概念 抽样指的是从组成某个总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法,或者说是从总体中按照一定方式选择或抽取样本的过程和方法。 抽样存在的必要性缘于总体本身所具有的异质性。如果某个总体中的每一个成员在所有方面都相同,即具有百分之百的同质性,那么抽样也就没有必要了。 抽样存在的合理性是由辩证唯物主义个别与一般的理论和建立在概率论基础上的大数定律和中心极限定律决定的。这些理论与定律证明,尽管总体所包含的每一个个体都不能完全地反映总体的性质和特征,却都具有不同程度的总体的性质和特征的因素,所以一定数量个体的因素的集合,就可以等同或接近总体的性质和特征。 在社会调查研究中,抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。关于抽样的作用,有两个相关的问题需要特别明确:第一,抽样和抽样调查不能混为一谈。抽样只是抽样调查的前提和一部分,只解决抽样调查过程中的选取调查对象这一个问题,抽样调查的其它所有问题都是靠另外的方法来解决的。 第二,抽样只是抽取样本的方法,而不是调查方法或者说资料收集方法。 (二)抽样的基本术语和抽样的基本程序 1.基本术语 在抽样中,有一些常用的基本术语: (1)总体。它是构成事物的所有元素、也就是最基本单位的集合。 (2)样本。它是从总体中按照一定方式抽取出的一部分元素的集合。 (3)抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。 (4)抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 (5)抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 (6)参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 (7)统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。 (8)抽样误差。它是用样本统计值去估计总体参数值时所出现的误差 2.基本程序 虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样几个步骤:1.界定总体

抽样检验的基本概念和策划方案

统计抽样检验 抽样检验培训目的 掌握统计抽样检验的差不多原理和方案检索,正确操作统计抽样 检验。 一:抽样检验的差不多概念 1、 抽样检验的概念 (1)所谓抽样检验是指从交验的一批产品(批量为N )中,抽 取一个样本(由n 个单位产品组成)进行检验,从而对批产品质 量作用推断的过程。 检验 X<=Ac 允收 (2)抽样检验的目的是“通过样本推断总体”,而其期望则在于 “用尽量少的样本量来尽可能准确地判定总体(批)的质量。” 从而达到这一目的和期望,传统的“百分比抽样”是不科学的、

不合理的。通过多青年来的理论研究和实践,证明只有采纳“统计抽样检验”才能保证科学、合理地实现这一目的和期望。(3)抽样检验的步骤 a.抽样:需要研究的是如何样抽和抽多少的问题。 b.检验:是在统计抽样检验理论的指导下,采纳具有一定测量能力的设备和正确的方法进行检验。 c.推断:是用对样本的检验结果来推断总体(批)的质量水平。 其中抽样和推断状况就构成了抽样方案。即抽多少和如何样推断。 2、统计抽样检验 1)统计抽样检验的概念 (1)所谓统计抽样检验,是指抽样方案完全由统计技术所确定的抽样检验。 (2)统计抽样检验的优越性体现在能够用尽可能低的检验费用(经济性),有效地保证产品质量水平(科学性),且对产品质量检验或评估结论可靠(可靠性),而事实上施又专门简便(可用性)。 二、抽样检验方案

一个批的产品数量即批量用N表示,对那个产品批规定一个不合格品率,假如批不合格品率超过那个规定值,该批产品将被拒收,那个不合格品率就称为“该允收不合格品率”,以P1表示。抽样检验确实是从批N里抽取一小部分单位产品作为样本进行检验,用样本的质量对产品批质量进行推断。样本中所包含的单位产品数称为样本大小,或叫样本容量,用n来表示,样本中的不合格品数用d表示,样本的不合格品率为d/n。因为是抽样检验,我们无法保证样本的不合格品率d/n恰恰等于批不合格品频率D/N,因此只有用d/n与P1比较而作出同意依旧拒收的决定。对计数值抽样检验,实际作法并不是直接用d/n与P1作比较,而是规定一个合格判定数Ac和一个不合格判定数Re,若样本不合格品数d小于或等于那个合格判定数Ac,就接收该批产品;若d等于或大于不合格判定数Re,则拒收该批产品。那个抽样检验过程就称为计数型抽样检验方案。由此看出,抽样方案确实是为了决定样本大小和判定检验批是否合格而规定的一组规则。 在一个最简单的抽样方案中要确定两个参数,一个是抽取的样本大小n,一个是判定数Ac和Re,通常用(n, Ac)表示一个抽样方案,简写为(n, c);有了n和Ac之后就能够专门容易地进行抽样检验了。

抽样检验的基本概念与分类(doc 12页)(完美版)

抽样与检验 一、抽样检验基本概念 1.在质量管理中,一般有来料检验、过程检验、成品检验、出货检验四部分,每一部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到一群相同规格的产品,可称为一个批,这样的批也可给予一个名字叫“制造批”。一个制造批中的质量变异具有一个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此一批可能根据需要可以区分为几个检验批,但必须注意避免将几个批合并为一个检验批。 (2)检验批 在统计学中,可以称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的一个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本

是指从检验批中所抽出的以一个以上单位组成的产品,样本中的各个样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它一定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,并将检验的结果与预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定一批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点一般可分为:(a)严重缺陷(Critical defect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷; (b)主要缺陷(Major defect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷; (c)次要缺陷(Minor defect),实际上不影响产品的使用功能或

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

相关文档
最新文档