抽样组合公式
统计学随机分组公式

统计学随机分组公式
统计学中常见的随机分组公式包括简单随机抽样、分层抽样、
系统抽样和整群抽样等。
这些公式可以帮助研究人员在进行实验或
调查时,以一定的概率方法来确保样本的代表性和随机性。
1. 简单随机抽样公式:在总体N个单位中随机抽取n个单位作
为样本,每个单位被抽中的概率相等。
简单随机抽样公式可以用以
下步骤来实现:
a. 从总体中随机选择一个单位作为初始样本单位。
b. 以后每次选择的单位都是在剩余单位中随机选择的,直
到达到所需的样本容量。
2. 分层抽样公式:将总体分为若干个层,然后在每一层内进行
简单随机抽样。
分层抽样公式可以表示为:
n_h = (N_h / N) n.
其中,n_h是第h层的样本容量,N_h是第h层的总体容量,
N是总体容量,n是总体的样本容量。
3. 系统抽样公式:按照一定的间隔从总体中选取样本单位。
系统抽样公式可以表示为:
k = N / n.
其中,k是抽样间隔,N是总体容量,n是样本容量。
4. 整群抽样公式:将总体分为若干个群体,然后随机选择部分群体作为样本。
整群抽样公式可以表示为:
n_c = (N_c / N) n.
其中,n_c是第c个群体的样本容量,N_c是第c个群体的总体容量,N是总体容量,n是总体的样本容量。
以上是统计学中常见的随机分组公式,研究人员可以根据具体的研究目的和总体特点选择合适的抽样方法和公式来进行样本的随机分组。
统计学抽样公式总结

(一)
∑ yi
(6.9)
估计量的方差
ˆ ) = V ( y ) = S (1 − n ) V (Y n N
2
(6.10)
式中
S =
2
1
N
N − 1 i =1
∑ ( yi − Y )
2
(6.11)
估计量的估计方差
ˆ ) = υ ( p) = υ (π
p (1 − p ) n −1
(6.35)
当 n 充分大,且 0.1≤ p ≤0.9 时, π 的置信区间可以近似地表示为
( p − zα
2
p(1 − p) n −1
, p + zα
2
p(1 − P ) ) n −1
(6.36)
28
ˆ ) = υ ( y ) = s (1 − n ) υ (Y n N
2
(6.12)
式中,s2 是样本方差。它的定义及便于计算的表达式为 1 n 2 2 s = ∑ ( yi − y ) i = 1 n −1 1 n 2 = ∑ ( yi − y ) n − 1 i =1 (二)总体总值的估计 估计量
ˆ=N1 Y n
n i =1
(6.13)
∑ yi
(6.14)
ˆ 是 Y 的无偏估计量。 显然,由式(6.14)构造的估计量 Y
估计量的方差
ˆ ) = N 2V ( y ) = N 2 S (1 − n ) V (Y n N
2
(6.15)
式中,S 2 由式(6.11)定义。 估计量的估计方差 同理有
ˆ) = N υ( y) = N υ (Y
( x − zα
2
交流采样常用计算公式

交流采样常用计算公式交流采样是指在一定的时间和空间范围内对目标人群进行调查或观察,并通过样本来了解整体人群特征或问题的一种方法。
在进行交流采样时,常常需要使用一些计算公式来确定样本量、样本比例等问题。
下面将介绍一些常用的交流采样计算公式。
1.简单随机抽样的样本量计算公式:样本量(n)=(Z*Z*P*(1-P))/E*E其中,Z为置信水平对应的Z值(如95%置信水平对应的Z值为1.96),P为样本总体比例估计值,E为误差允许值。
2.分层抽样的样本量计算公式:样本量(n) = ∑ (Nh * nh / N)其中,Nh为第h层的总体规模,nh为第h层抽样的样本量,N为总体规模。
3.系统抽样的样本量计算公式:样本量(n)=N/K其中,N为总体规模,K为设定的抽样比例。
4.分级抽样的样本量计算公式:样本量(n)=Σ((Nh*Nl)/(Nh+Nl))其中,Nh为第h层的总体规模,Nl为第l层的总体规模。
5.要素抽样的样本量计算公式:样本量(n)=(Z*Z*P*(1-P))/E*E其中,Z为置信水平对应的Z值(如95%置信水平对应的Z值为1.96),P为总体中具有特定要素的比例估计值,E为误差允许值。
6.多阶段抽样的样本量计算公式:样本量(n) = ∑(n1 + n2 + … + nh)其中,n1、n2、…、nh分别为每个阶段的样本量。
除了样本量的计算公式外,还有一些常用的统计公式可以用来计算样本特征的估计值和置信区间,比如样本均值的标准误差公式、样本比例的标准误差公式等。
这些公式通常使用统计软件或在线工具进行计算,并结合抽样方法和样本设计的原则进行实际操作。
不同的采样方法和研究问题可能需要不同的计算公式,上述公式只是一些常见的示例。
在实际应用中,应根据具体的研究问题、样本设计和统计要求来选择合适的计算公式,并结合经验和专家意见进行合理调整。
抽样率计算公式

抽样率计算公式是一种统计学中常用的基本公式,它用于计算抽样时所需要的样本大小。
抽样率计算公式是一个简单而又有效的方法,可以帮助研究者设计抽样计划,以便从总体中抽取有代表性的样本。
抽样率计算公式的基本原理是:根据抽样的目的,确定抽样的精度要求,然后根据精度要求,计算出抽样时所需要的样本数。
抽样率计算公式可以表示为:
n = N * (z^2 * p * (1-p)) / (E^2 * (N-1) + z^2 * p * (1-p))
其中:
n:抽样时所需要的样本大小
N:总体样本数
z:抽样精度要求,通常设定为1.96
p:总体中某一特征的比例,即某一特征在总体中的比例
E:抽样误差允许范围,通常设定为0.05
此外,抽样率计算公式还可以根据不同的研究目的进行修改,以满足不同的研究需求。
抽样率计算公式的应用非常广泛,它可以用于市场调研、社会调查、民意调查、实验研究等多种研究领域。
它可以帮助研究者有效地从总体中抽取样本,从而更好地掌握总体的基本特征,从而更好地分析研究结果。
抽样率计算公式的应用不仅可以提高研究的准确性,而且可以提高研究的效率,节省研究的时间和成本,使研究者能够更好地完成研究任务。
总之,抽样率计算公式是一种简单而又有效的方法,可以帮助研究者有效地从总体中抽取样本,从而更好地掌握总体的基本特征,从而更好地分析研究结果。
抽样概率计算公式

抽样概率计算公式
今天,我们来谈谈抽样概率计算公式。
说到抽样概率,也就是指抽取抽样前每个总体元素的可能性相同的抽样,但实际上,抽样概率却不完全相同,因此,就需要一种公式来计算抽样概率。
抽样概率计算公式是指根据给定的抽样理论,结合单位抽样点的概率权重,结合总体元素的概率分布,每个总体元素抽样概率的统计计算公式。
首先,我们来看看其计算抽样概率的基本公式,其公式如下:
P(xi)= wi Ni /wi xi
其中,P(Xi)表示某一元素Xi的抽样概率;wi表示某一单位抽样点的概率权重;Ni表示某一元素在总体中的概率分布;Σwi xi 表示总体元素的概率权重的累加和。
当然,上边的公式只是一种简化的抽样概率的计算公式,实际上,在计算抽样概率时,还有许多复杂的计算公式,比如均匀抽样概率计算公式、系统抽样概率计算公式等等。
而且,在多次抽样时,往往会出现同一个元素多次被抽中、其它元素没有被抽中等现象,因此,根据不同的抽样方式,在计算抽样概率时,仍需要根据具体情况进行相应的计算。
总的来说,抽样概率计算公式在统计学中是一个非常重要的统计概率公式,它可以帮助我们精确计算每个总体元素抽样概率,从而更好地了解、掌握抽样概率。
- 1 -。
choose公式的用法(一)

choose公式的用法(一)choose公式用法详解什么是choose公式?choose公式,也称为组合公式或二项式系数,是数学中常见且实用的公式。
它用于计算从n个不同元素中选择r个元素的组合数。
计算组合数•choose公式的数学表达式为:C(n, r) = n! / (r! * (n-r)!) –n代表元素的个数–r代表选择的元素个数–!代表阶乘运算,即n!表示n的阶乘•举个例子:–假设有5个不同的球,现在要从中选择3个球的组合数。
–根据choose公式,可以计算出C(5, 3) = 5! / (3! * (5-3)!) = 10。
–因此,从5个球中选择3个球的组合数为10种。
choose公式的应用下面列举了choose公式在实际应用中的几个常见用法。
1. 统计学中的抽样•在统计学中,choose公式被广泛用于计算抽样中的组合数。
•例如,假设有一群人中需要选择5个人作为样本进行调查,那么可以使用choose公式来计算出从这群人中选择样本的组合数目。
2. 概率与组合的计算•在概率论中,choose公式也有着重要的应用。
•例如,当计算一个事件发生的概率时,可能需要计算特定组合的个数。
•choose公式可以帮助我们计算出某个事件的可能组合数,从而进一步计算其概率。
3. 计算排列组合•choose公式可以用于计算排列组合中的不同情况。
•例如,在一场比赛中,有10个运动员参与。
如果要计算第一名、第二名和第三名的组合可能性,可以使用choose公式来计算。
•C(10, 3) = 10! / (3! * (10-3)!) = 120,因此共有120种可能的组合。
总结choose公式在各个领域中都有广泛的应用。
它能够帮助我们快速计算组合数,从而解决一些涉及排列组合的问题。
无论是统计学、概率论还是其他领域的计算,选择choose公式都是一个不错的选择。
分配抽样计算公式

分配抽样计算公式分配抽样是一种统计抽样方法,用于从总体中选择样本。
在进行分配抽样时,需要考虑总体的分布情况,以保证样本的代表性。
为了确定分配抽样的样本量,需要使用特定的计算公式。
本文将介绍分配抽样计算公式的使用方法,并探讨其在实际应用中的意义。
分配抽样计算公式的基本形式如下:n = (Z^2 p q) / E^2。
其中,n代表样本量,Z代表置信水平对应的Z值,p代表总体的预期比例,q代表总体的预期比例的补数,E代表误差限。
在使用分配抽样计算公式时,需要根据具体的研究目的和总体特征确定各个参数的数值。
下面将详细介绍各个参数的含义和确定方法。
首先是置信水平对应的Z值。
置信水平是指在抽样过程中得到的样本统计量与总体参数之间的关系的确定程度。
常用的置信水平包括90%、95%和99%。
对于不同的置信水平,对应的Z值也不同。
一般来说,可以通过标准正态分布表或统计软件来确定置信水平对应的Z值。
其次是总体的预期比例。
总体的预期比例是指在总体中具有某一特征的个体所占的比例。
在实际应用中,可以通过历史数据或者专家判断来确定总体的预期比例。
需要注意的是,总体的预期比例是直接影响样本量的重要因素,因此在确定时需要尽量准确。
再次是误差限。
误差限是指样本统计量与总体参数之间的最大允许误差。
通常情况下,误差限的确定需要结合实际情况和研究目的来进行。
一般来说,误差限越小,样本量就需要越大,反之亦然。
最后是样本量。
通过分配抽样计算公式计算得到的样本量是保证在一定置信水平下,总体参数的估计值与样本统计量之间的关系达到一定程度的最小样本量。
在实际应用中,需要根据计算得到的样本量进行抽样,以保证样本的代表性和可靠性。
分配抽样计算公式在实际应用中具有重要的意义。
通过合理地确定各个参数的数值,并应用分配抽样计算公式,可以有效地确定样本量,保证样本的代表性和可靠性。
在进行统计抽样时,研究人员可以根据具体情况灵活运用分配抽样计算公式,以满足研究的需要。
随机取样c计算公式

随机取样c计算公式随机取样是一种常用的统计方法,它在科学研究、市场调查、社会调查等领域广泛应用。
通过随机取样可以从总体中抽取一部分样本,然后利用这些样本得出对总体的推断或估计。
本文将介绍随机取样的计算公式,以及该公式的应用。
随机取样的计算公式可以简单地表示为C = N/n,其中C表示每个样本的容量,N表示总体的容量,n表示抽取的样本数量。
这个公式可以帮助我们确定每个样本的大小,即每次抽样时需要抽取多少个样本。
随机取样的过程是一个随机的过程,每个样本被选中的概率应该是相等的。
为了实现这个要求,我们可以使用随机数生成器来进行抽样。
随机数生成器可以产生一个介于0和1之间的随机数,我们可以将这个随机数与总体容量N相乘,然后取整得到一个整数,这个整数就是我们要抽取的样本的位置。
在进行随机取样之前,我们需要确定总体的容量N和抽取的样本数量n。
总体的容量可以是一个已知的值,也可以是一个未知的值。
如果总体的容量已知,那么我们可以直接将其代入公式中进行计算。
如果总体的容量未知,那么我们可以使用估计值或预估值来代替。
一旦得到了每个样本的容量C,我们就可以开始进行随机取样了。
在随机取样的过程中,我们需要保证每个样本被选中的概率相等。
为了实现这一点,我们可以使用随机数生成器来产生随机数,然后将这个随机数与总体容量N相乘,再取整得到一个整数。
这个整数就是我们要抽取的样本的位置。
重复这个过程n次,我们就可以得到n个样本。
随机取样的结果可以用来进行统计分析。
通过对样本数据的分析,我们可以得出对总体的推断或估计。
在进行统计分析时,我们需要注意样本的代表性和样本的大小。
样本的代表性指的是样本能否准确地反映出总体的特征。
样本的大小则直接影响了推断或估计的准确性。
通常情况下,样本的大小越大,推断或估计的准确性就越高。
除了随机取样的计算公式,还有一些其他的取样方法,如系统取样、分层取样等。
这些取样方法在不同的情况下有不同的应用。
随机取样是最常用的取样方法,它可以保证样本的代表性和推断或估计的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样组合公式抽样组合(how)。
一般来说,方案分为概率抽样(随机抽样)和非概率抽样两大类。
两者的根本区别就是前者完全是经“上帝的手”在选择,比较公平、公正、公开;后者还有“凡人的手”在帮忙,当然有时是帮倒忙。
因为概率抽样中的每个个体都有一个确定的可能性(概率)被抽中,所以概率和统计技术就有了用武之地,我们可以计算出抽样带来的误差,对总体给出相当准确的推断。
01 非概率抽样(Non-probability sampling)又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。
其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。
当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。
常用的非概率抽样方法有以下四类:▷方便抽样(Convenience sampling)指根据调查者的方便选取的样本,以无目标、随意的方式进行。
例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。
优点:适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。
缺点:抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。
▷判断抽样(Judgment sampling)指由专家判断而有目的地抽取他认为“有代表性的样本”。
例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。
优点:适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。
缺点:该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。
▷配额抽样(Quota sampling)指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。
相当于包括两个阶段的加限制的判断抽样。
在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。
在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。
例如:定点街访中的配额抽样。
优点:适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
缺点:容易掩盖不可忽略的偏差。
▷滚雪球抽样(Snowball sampling)指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。
第一批被访者是采用概率抽样得来的,之后的被访者都属于非概率抽样,此类被访者彼此之间较为相似。
例如:如在目前中国的小轿车车主等。
优点:可以根据某些样本特征对样本进行控制,适用寻找一些在总体中十分稀少的人物。
缺点:有选择偏差,不能保证代表性。
02 概率抽样(Probability sampling)又称随机抽样,指在总体中排除人的主观因素,给予每一个体一定的抽取机会的抽样。
其特点为,抽取样本具有一定的代表性,可以从调查结果推断总体;操作比较复杂,需要更多的时间,而且往往需要更多的费用。
常用的有以下六种类型:▷简单抽样(Simple sampling)简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。
它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。
常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。
这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。
比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出60人进行调查。
为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)。
抽样框编好后,他们又用300张小纸条分别写上001,002,…,300。
他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。
然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。
这60位同学就构成了他们本次的样本。
这种方法简便易学。
但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。
对于总体元素很多的情形,我们则采用随机数表来抽样。
本书后就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数表)。
利用随机数表进行抽样的具体步骤是:1.先取得一份总体所有元素的名单(即抽样框);2.将总体中所有元素一一按顺序编号;3.根据总体规模是几位数来确定从随机数表中选几位数码;4.以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;5.根据样本规模的要求选择出足够的数码个数;6.依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。
▷系统抽样(Systematic random sampling)将总体中的各单元先按一定顺序排列,并编号,然后按照不一定的规则抽样。
其中最常采用的是等距离抽样,即根据总体单位数和样本单位计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。
例如:从1000个电话号码中抽取10个访问号码,间距为100,确定起点(起点<间距)后每100号码抽一访问号码。
系统抽样的具体步骤是:1.给总体中的每一个个体按顺序编号,即制定出抽样框。
2.计算出抽样间距。
计算方法是用总体的规模除以样本的规模。
假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得:3.K(抽样间距)=N(总体规模)n(样本规模)4.在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点。
5.在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,…,A+(n-1)K。
6.将这n个个体合起来,就构成了该总体的一个样本。
优点:兼具操作的简便性和统计推断功能,是目前最为广泛运用的一种抽样方法。
如果起点是随机确定的,总体中单元排列是随机的,等距抽样的效果近似简单抽样;与简单抽样相比,在一定条件下,样本的分布较好。
缺点:抽样间隔可能遇到总体中某种未知的周期性,导致“差”的样本;未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率低。
▷分层抽样(Stratified random sampling)是把调查总体分为同质的、互不交叉的层(或类型),然后在各层(或类型)中独立抽取样本。
例如:调查零售店时,按照其规模大小或库存额大小分层,然后在每层中按简单随机方法抽取大型零售店若干、中型若干、小型若干;调查城市时,按城市总人口或工业生产额分出超大型城市、中型城市、小型城市等,再抽出具体的各类型城市若干。
优点:适用于层间有较大的异质性,而每层内的个体具有同质性的总体,能提高总体估计的精确度,在样本量相同的情况下,其精度高于简单抽样和系统抽样;能保证“层”的代表性,避免抽到“差”的样本;同时,不同层可以依据情况采用不同的抽样框和抽样方法。
缺点:要求有高质量的、能用于分层的辅助信息;由于需要辅助信息,抽样框的创建需要更多的费用,更为复杂;抽样误差估计比简单抽样和系统抽样更复杂。
在实际运用分层抽样的方法时,研究者需要考虑下列两个方面的问题(1)分层的标准问题。
同一个总体可以按照不同的标准进行分层,或者说,根据不同的标准可以将一个总体分成不同的类别或层次。
那么,在实际抽样中究竟应该按什么标准来分层呢?通常采用的原则有:第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。
比如,若要研究居民的消费状况和消费趋向,可以以居民家庭人均收入作为分层标准;又如,要了解社会研究中不同职业的人员对社会经济改革的看法,就可以以人们的职业作为分层的标准。
第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。
比如在工厂进行,可以以工作性质作为分层标准,将全厂职工分为干部、工人、技术人员、勤杂人员等几类来进行抽样。
第三,以那些已有明显层次区分的变量作为分层变量。
比如在社会研究中,性别、年龄(当然是分段以后,如老、中、青)、文化程度、职业等等,就经常被用作分层的标准;其他如学生按年级、专业、学校类型分层,城市按人口规模分层等等。
(2)分层的比例问题。
分层抽样中有按比例和不按比例分层两种方法。
按比例分层抽样是指按总体中各种类型或层次的比例来抽取子样本的方法。
即在单位多的类型或层次中所抽的子样本就大一些,在单位少的类型或层次中所抽的子样本就小一些。
比如,某厂有工人600人,按性别分层则有男工500人,女工100人。
总体中两类工人人数的比例为5∶1。
因此,若要抽60人作样本,那么,按比例的抽法就是根据上述比例,分别从500名男工中随机抽取50人,而从100名女工中随机抽取10人。
这样,样本中男女工人之比与总体中男女工人之比完全相同,均为5∶1。
可以说,样本的性别结构是总体中性别结构的一种缩影。
采取按比例分层抽样的方法,可以确保得到一个在某种特征上与总体结构完全一样的样本。
但是,在有些情况下,又不宜采用这种方法。
例如,有时总体中有的类型或层次的单位数目太少,若以按比例分层的方法抽样,则有的层次在样本中个案太少,不便于了解各个层次的情况,这时往往要采取不按比例抽样的方法。
比如上例中,样本中女工人数过少,此时我们可以采取不按比例抽样的方法,在500名男工中抽30人,在100名女工中也抽30人。
这样,样本就能较好地反映出男女两类工人的一般状况,我们也能很好地对男女两类工人的情况进行比较和分析。
需要但注意的是,我们采用不按比例分层抽样的方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较,但若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,即通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。