第四章抽样和抽样分布
统计学1-7章的填空、判断题 4

第四章抽样与抽样分布一、单项选择题1.抽样调查的目的在于(a )。
A、了解总体的基本情况B、用样本指标推断总体指标C、对样本进行全面调查D、了解样本的基本情况2.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽.样方法抽取本国的1%人口计算平均年龄,则抽样误差(c)。
A、两者相等B、前者大于后者C、前者小于后者D、不能确定3、抽样调查,随着样本量的增加,调查的误差(a)A、减小B、不变C、扩大D、不确定4、对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差为2%,当概率为95.45%(Z=2)时,该单位职工中具有高中文化程度的比重是( c )A、等于78%B、大于84%C、在76%与84%之间D、小于76%5、某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本存折抽出一本登记其余额。
这样的抽样组织形式是( c )A、类型抽样B、整群抽样C、机械抽样D、纯随机抽样6、农户家计调查中,按地理区域划分所进行的区域抽样,其抽样组织方式属于(d)A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样7、抽样平均误差是指样本平均数或样本成数的( c )A、平均数B、平均差C、标准差D、标准差系数8、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( c )。
A、增加39.7%B、增加约3/5C、减少约3/5D、没有什么变化9、(甲)某高校新生1000人,从理科中随机抽取60人,文科中随机抽取40人,进行英语水平测试;(乙)从麦地总垅长中每3000市尺测竿落点处前后5尺长垅的产量进行实割实测;(丙)为研究城市青年业余时间活动情况,某城市每第10个居委会被抽取,并询问住在那里所有从16岁到30岁的青年人。
上述哪项属于类型抽样?( a )A、甲B、乙C、乙、丙D、甲、乙、丙10、抽样调查所遵循的基本原则是( b )A、准确性原则B、随机性原则C、可靠性原则】D、灵活性原则11、在其它条件不变的情况下,如果允许误差范围缩小为原来的1/2,则样本容量(a )A、扩大为原来的4倍B、扩大为原来的2倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍12、对一批产品按不重复抽样方法抽取200件进行调查,其中废品8件,已知样本容量是产品总量的1/20,当F(Z)=95.45%时,不合格率的抽样极限误差是( d )A、1.35%B、1.39%C、2.70%D、2.78%13、抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的( b)。
抽样与抽样分布

抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
教育与心理统计学 第四章 抽样理论与参数估计考研笔记-精品

第四章抽样理论与参数估计第一节抽样理论的基本知识分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]总体:又称母全体、全域,指具有某种特征的一类事物的全体。
第四章抽样与抽样分布12节

X:在n重贝努里试验中,出现“成功”的次 数
P (Xk)C n kpkqnk
X ~B(n,p)
变量的数字特征
• μ = E(X)= np ,
• б2 = D(X)=n pq
2.泊松分布的概率分布 函数
• 随机变量的概率分布 函数 • 随机变量的数字特征 • 现实中符合泊松分布的随机变量举例 • 泊松分布与二项分布 关系
• k =0,1,…,min(M,n)
练习题
• 【例4-9】 P78 • 【例4-10】 P79
练习题
• 改编P79 例4-10练习题• 编一个超几何分布 的例题
三、连续型随机变量的概率分布
• 折线图 频数折线图 频率折线图
随机变量
• 曲线图
• 概率密度曲线图
(一)概率密度函数(Probability density function)
• P80 定义 f(x)
• 条件
(二)X的累计分布函数(分布函数)
• F(x) • F(x)= P(X ≤ x )=
-∞< x <+∞
x
f (x)dx
b
P(a<X<b)= f ( x )d x
= F(b)-F(a)
a
连续型随机变量的数学期望和方差
• μ = E(X)=
xf ( x)dx
• μ = E(X)=
xipi
i1
(4.17)
(二)离散型随机变量的数学期望(均值)
与方差
• 表4-2, 计算X的方差(练习)
• б2=D(X)= xi E(xi )2pi
i 1
(4.18)
(三)几种常用的离散型概率分布
(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
统计学04第四章抽样与抽样分布

1. 从总体中抽取样本容量相同的所有样 本 — 样本空间;
2. 计算每个样本的样本统计量的取值; 3. 根据样本统计量的所有取值计算相应
的概率; 4. 样本统计量的概率分布 — 抽样分布。
2020/3/2
第四章 抽样和抽样分布
18
3.2 重置抽样下的抽样分布
总体样变本量平的均分数布的:抽样分X 布 100元 2 200 某施工小组X5个员工的 1日0 2工元 资为80、X1 9X02 、X 3 1X040、X5 110、120
N
标准差: σ X X i E X 2 Pi i 1
2020/3/2
第四章 抽样和抽样分布
11
2.3 随机变量的数字特征
概 数学期望
率
N
论 EX X i Pi
i 1
方差
N
σ 2 X X i E X 2 Pi i 1
基本问题
❖ 抽样 ❖ 样本(样本点) ❖ 样本空间 ❖ 随机原则 ❖ 随机抽样 ❖ 重置抽样 ❖ 不重置抽样
2020/3/2
第四章 抽样和抽样分布
15
基本问题
样本点个数
设:总体单位数 N ,样本容量 n : 样本空间的样本点数为:
重置
不讲
重 顺序
置
不讲 顺序
ANn N n
PNn
N N
1
F x P X x P X X i Pi
Xi x
Xi x
概率分布函数的性质:
P x1 X x2 P X x2 P X x1
F x2 F x1
第四章 抽样与抽样分布习题及答案
5.参数是总体的某种特征值,而统计量是一个不含未知参数的样本函数。
答案:对
6.在计算样本容量时,成数方差P(1-P)在完全缺乏资料的情况下,可用成数方差P(1-P)的极大值0.5 0.5来代替。
答案:对
A.前者高说明后者小
B.前者高说明后者大
C.前者变化而后者不变
D.两者没有关系
答案:a
6.在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。
A.增加8倍
B.增加9倍
C.增加倍
D.增加2.25倍
答案:b
7.当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )。
3.抽样极限误差是( )。
A.调查性误差
B.一定可靠程度下的抽样误差可能范围
C.最小抽样误差
D.等于抽样平均误差
答案:b
4.在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比( )。
A.前者一定大于后者
B.前者一定小于后者
C.两者相等
D.前者可能大于、也可能小于后者
答案:a
5.抽样推断的精确度和极限误差的关系是( )。
抽样与抽样分布习题及答案
单选题
1.抽样调查抽选样本时,遵循的原则是( )。
A.随机原则
B.同质性原则
C.系统原则
D.主观性原则
答案:a
2.抽样误差是指( )。
A.在调查过程中由于观察、测量等差错所引起的误差
B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差
D.人为原因所造成的误差
答案:c
A.51%
B.49%
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
抽样及抽样分布
分层抽样 概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的方 法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调
查,所以分层时应该尽量让每层内的变异程度小,
而层间的变异程度大。分层抽样的抽样误差较简单 随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
z
(
X 1
X
)
2
( 1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
如果: X1 和 X2 是两个非正态总体,当和样本容
量足够大,
z
(
X1
X
2
)
(1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
NEXT
二、样本成数及成数差的抽样 分布
成数的概念 样本成数的分布 两个总体样本成数差的分布
,则样本的成数为p n1
n
。
例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
假设A、B、C、D、E5位同学的统计学成绩分别为: 80、 86、90、92、96。可计算得总体均值为88.8,总体方 差为29.76。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85
86 88
样本 (BA)(BB) (BC) (BD)(BE)
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章SPSS的应用一、简单随机抽样:例如,用SPSS不重复选取容量为10的简单随机样本,在数据编辑器窗口打开目标数据文件,在数据菜单中点击选择个案子菜单,打开如下对话框:左面是变量列表,先选择目标变量会变灰色,然后再对话框中间选择处选择抽样方法。
共有五种方法可供选择,默认选择是全部个案(A),表示所有个案所代表的的个体均被选择作为样本;如果条件满足(C)是要设置一些选择条件,可以自行设定一些条件(包括函数);随机个案样本(D)是作简单随机抽样,点击样本会跳出如下对话框;基于时间或个案全距(B),表示需要指定选样范围,个案从哪个开始到结束,此项不是随机抽样;使用筛选器变量(U), 表示要指定一个变量作为抽样变量。
图4-5按照图中操作,选择随机个案样本,在点击样本会跳出对话框,如下图4-6:图4-6在选择个案随机样本对话框中有两个抽样方法:默认是大约(A)□所有个案的%,要指定一个抽样比例;精确(E),□从第一个开始的个案(F)□个案,前一个□表示确定样本容量数目,后一个□表示抽样范围。
按照图中操作,填写对话框,点击继续返回上级菜单,再点击确定执行操作即可。
下图4-7中数据记录未被画斜线的个案即被选中作为随机抽样的样本单位,如标号46,51,56……,实际上样本单位的选取还可以通过过滤变量Filter-S的取值得到,如取值为1的数据所代表的单元即是抽中的样本单位部分。
图4-7二、对于复杂抽样方法,可以利用SPSS中复杂抽样子模块来,按成过程比较复杂。
在分析主菜单中选择复杂抽样子菜单:执行抽样向导按照指示操作即可。
利用抽样向导可以完成创建、修改或执行抽样计划文件的步骤,使用前应该构思好定义明确的目标总体、抽样单元列表和适当的样本设计。
如图4-8图4-8创建新样本计划:从菜单中选择→分析→复杂样本→选择设计样本。
→选择设计样本并建立一个计划文件,点击下一步继续向导。
→或者在设计变量步骤中,定义层次、聚类和输入样本权重等内容后,单击下一步。
→或者,在抽样方法步骤中,可以选择一个方法用于选择样本。
如果选择PPS Brewer 或PPS Murthy,可以单击完成抽取样本。
否则,单击下一步继续。
→在样本大小步骤中,制定要抽样的单元数或单元比例,单击完成抽取样本。
→或者可以进一步执行以下步骤:选择要保存的输出变量;向设计添加第二或第三阶段;设置各选择项,包括抽取样本的阶段、随机种子数,以及是否将用户缺失值视为设计变量的有效值;选择输出数据的保存位置。
STEP 1、设计变量在这个步骤中,可以选择层次变量和聚类变量,可以定义输入样本权重。
还可指定阶段的标签。
如图4-9分层依据。
分层变量的交叉分类定义了不同的层次,分别为各层获取了不同的样本,要提高估计值的精度,层内单元的特征应尽量一致。
分群。
分群变量定义了观察单元组,即分群。
要提高估计值的精度,子群单元的特征应尽量一致。
输入样本权重。
可以用以前阶段样本母体的权重作参考,也可以指定一个包含这些权重的数值型变量。
阶段标签。
为每个阶段指定一个字符标签,用于在输出中以帮助识别分阶段信息。
在抽样向导的每一步骤中,左侧都是所有步骤的概要。
单击已启用步骤的名称可以浏览该向导。
只要之前的所有步骤有效,达到步骤最低要求的指定项,那么步骤为启用状态。
图4-9 STEP 2、抽样方法。
图4-10在此步骤中,可以指定从活动数据集中选择个案的方式。
如上图4-10。
方法。
该组选项用于选择取样方法。
某些抽样类型允许选择放回(WR)或不放回(WOR)。
注意:所有PPS类型只在设计的第一阶段才可用,某些与大小成比例的概率PPS类型只在定义聚类之后才可以使用。
WR方法只在设计的最后阶段才可用。
简单随机抽样。
以等概率选择样本单元,单元可以采用(WR)或不放回(WOR)方式选择。
系统抽样,在整个抽样框或层次(如果已指定),采用不放回(WOR)方式以固定间隔抽取单元。
在第一个区间内随机选择单元作为起始点。
简单顺序。
采用采用不放回(WOR)方式以等概率顺序地选择单元。
PPS。
不等概率抽样。
这是第一阶段采用的方法,用与规模大小成正比的概率随机选择单元,采用放回的方式,只有聚类可以采用不放回的方式。
PPS系统。
这是第一阶段采用的方法,用与大小成正比的概率系统地选择单元,采用不放回的方式。
PPS顺序。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式顺序地选择单元。
PPS Brewer。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式从每一个层次选择两个聚类。
使用该方法,要指定聚类变量。
PPS Murthy。
这是第一阶段采用的方法,用与聚类大小成正比的概率采用不放回方式从每一个层次选择两个聚类。
使用该方法,要指定聚类变量。
PPS Sampford。
这是第一阶段采用的方法,用与聚类大小成正比的概率从每个层次采用不放回方式选择两个以上聚类。
它是Brewer方法的扩展。
使用该方法,要指定聚类变量。
在分析中使用WR估计。
缺省情况下,估计方法是在计划文件中指定的,与所选抽样方法一致。
这样,及时抽样方法意味着WOR估计,也可以使用放回方式估计。
此选项只在第一阶段可用。
大小测量(MOS)。
如果选择PPS方法,则必须指定定义每个单元大小的规模度量。
这些规模可以在一个变量中显示定义,也可以根据数据计算。
或者,可以设置MOS的上限和下限,覆盖所有MOS变量中的值或根据数据计算的值。
这些选项只在第一阶段可用。
STEP 3、样本大小图4-11在这一步骤中,可以指定当前阶段中药抽样的单元数或单元比例。
样本大小可以是固定的,也可以各层不同。
为了指定样本大小,前面阶段中选择的聚类可用于定义层次。
如上图4-11单位。
可以指定要抽样的单元的确切样本大小或比例。
如果选择比例,则可以设置抽样单元数的上限和下限。
值。
应用于所有层次的单个值。
如果将计数选作单元度量,则应输入一个正整数。
如果选择比例,则应输入一个非负值。
除非是放回抽样,否则比例值也应该不大于1。
各层不相等的值。
允许通过“定义不等大小”对话框逐层输入大小值。
从变量中读取值。
允许选择包含层次大小值的数值变量。
定义大小不等的对话框,如下图4-12在定义大小不等对话框中,可以逐层输入大小值。
“指定大小”网格。
该网格最多显示五个层次变量或聚类变量的交叉分类——即每行一个层次/聚类组合。
符合的变量包括当前和以前阶段的所有分层变量,以及以前阶段的所有聚类变量。
变量可在网格内重新排序,或者移到排除列表。
在最右列中输入大小。
单击标签或值,在网格单元格中分层变量和聚类变量的值标签和数据值的显示之间切换。
包含未标注值的单元格始终显示值。
单击刷新层,用网格中变量的标注数据值的每个组合重新填充网格。
排除。
要指定层次/聚类组合子集的大小,将一个或多个变量移到“排除”列表。
这些变量不用于定义样本大小。
STEP4 输出变量在这一步骤中,可以选择抽取样本时要保存的变量。
如上图4-13群体大小。
给定阶段估计的总体单元数。
保存变量的根名为PopulationSize样本比例。
给定阶段的抽样率。
保存变量的根名为SamplingRate样本大小。
给定阶段抽取的单元数。
保存变量的根名为SampleSize样本权重,包含概率的逆。
保存变量的根名为SampleWeight某些分阶段变量是自动生成的。
其中包括:包含概率。
给定阶段抽取的单元比例。
保存变量的根名为InclusionProbability累积权重。
此阶段之前(含当前阶段)的累积样本权重。
保存变量的根名为SampleWeightCumulative指标。
表示给定阶段中多次选择的单元。
保存变量的根名为index注意:保存变量根名称包含一个整数后缀,它反映阶段序号。
例如PopulationSize 1 用于阶段1保存的总体大小。
STEP5 摘要图4-14这是每个阶段的最后一步,提供整个当前阶段的样本设计指定项的摘要,在此处,可以继续下一个阶段(必要时创建阶段),也可以设置抽取样本的选项。
如图4-15图4-15在这一步骤中,可以选择是否抽取样本。
还可以控制其他抽样选项,如随机种子和缺失值处理。
.是否抽取样本。
除了选择是否样本之外,还可以选择执行部分抽样设计。
必须按照顺序抽取阶段——即抽取阶段1之后才能抽取阶段2。
编辑或执行计划时,不能重新抽取锁定的阶段。
种子。
它是用来选择生成随机数的种子值。
包括用户缺失值。
可确定用户缺失值是否有效。
如果有效,则将用户缺失值视为单独的类别。
数据已排序。
如果样本框架按照分层变量值预先排序,使用此选项可以加快选择过程。
在这一步骤中,可以选择抽样个案、权重变量、联合概率和个案选择规则的定向位置。
见上图4-16样本数据保存位置。
使用这些选项可以确定样本输出的写入位置。
样本输出可以添加到活动数据集,也可以写入新数据集,还可以保存到外部SPSS数据文件中。
数据集名称必须符合变量命名规则。
如果指定外部文件或新数据集,则写入所选个案的抽样输出变量和活动数据集中的变量。
一般不必麻烦,直接写入SPSS数据文件。
联合概率保存位置。
使用该选项可以确定联合概率的写入位置。
联合概率保存到外部SPSS的数据文件,如果选择PPS、WOR、PPS Brewer、PPS Samford或PPS Murthy方法,并且未指定WR估计,则会生成联合概率。
个案选择规则。
如果要一次在一个阶段构造样本,可以将个案选择规则保存早文本文件中。
个案选择规则对于构造后续阶段的子框架是非常有用的。
STEP5 完成抽样向导这是最后一步,保存计划文件并抽取样本,或者将选择内容粘贴到语法编辑器窗口中。
在对现有计划文件中的阶段进行更改时,可以将已编辑的计划另存为新文件或覆盖现有文件。
如果添加阶段而不更改现有阶段,则向导将自动覆盖现有计划文件。
如果要将计划保存为新文件,要选择将向导生成的语法粘贴到语法窗口,并在语法命令中更改文件名。
如图4-17如果要修改现有的样本计划可以如下操作:从菜单中选择分析→复杂样本→选择样本…。
选择编辑样本设计,并选择要编辑的计划文件。
单击下一步使用向导继续。
在计划摘要步骤中复查抽样计划,然后单击下一步。
后续步骤与新设计大体相同。
浏览到完成步骤,为编辑过的计划文件指定新名称,或选择覆盖现有的计划文件。
根据自己的需要,还可以执行以下操作:指定已进行抽样的阶段。
从计划中删除某些阶段。
见下图4-18在这一步骤中,可以复查抽样计划,确定已进行了抽样的阶段。
如果编辑抽样计划,还可以从计划中删除阶段。
以前抽样的阶段。
要扩展抽样框架不可以,必须一次在一个阶段执行多阶段抽样设计。
从下拉列表中选择那些阶段已经进行了抽样。
所有执行过的阶段都是锁定的;它们在抽取样本选择项步骤不可用,并且不能在编辑计划时更改。
删除阶段。
可以从多阶段设计中删除阶段2和3。