统计学之样本大小

合集下载

统计学中的统计学原则

统计学中的统计学原则

统计学中的统计学原则统计学是一门研究数据收集、分析和解释的学科,它在经济学、社会学、医学等领域发挥着重要作用。

在统计学中,有一些基本的原则被广泛运用,以确保数据的有效性和可信度。

本文将介绍统计学中的三个重要原则:样本代表性、随机性和样本大小。

样本代表性样本代表性是指从总体中选取的样本应该能够准确地反映出总体的特征。

在统计学中,总体是指我们感兴趣的所有个体或现象的集合,而样本是从总体中选取的部分个体或现象的集合。

通过分析样本数据,我们可以对总体的特征进行推断。

为了确保样本代表性,我们需要采用随机抽样方法。

随机抽样是一种无偏的抽样方法,每个个体或现象都有相同的被选中的机会。

通过随机抽样,我们可以避免个人主观因素的干扰,并且能够更好地推断总体的特征。

此外,还可以使用分层抽样方法,将总体划分为不同的层次,并在每个层次中进行随机抽样,以确保各层次的代表性。

随机性随机性是统计学中的一个重要原则,它要求我们在数据收集和分析过程中遵循随机的原则。

具体来说,随机性要求我们避免对数据的选择性偏见,以及避免人为干扰。

在数据收集过程中,我们需要使用随机化方法来选择样本或实验单位。

例如,在实验设计中,可以通过随机分组来避免实验组和对照组之间的差异。

在调查研究中,可以使用随机次序来避免顺序效应的影响。

通过随机化,我们可以减少系统性误差,并提高数据的可信度。

样本大小样本大小是指我们从总体中选取的样本的个数。

在统计学中,样本大小对于数据分析的可靠性和推断的精度至关重要。

一般而言,样本大小越大,数据分析的结果越可靠,推断的精度越高。

为了确定合适的样本大小,我们可以使用统计学中的抽样技术和样本大小计算方法。

根据总体的大小、预计误差、置信水平等因素,可以计算出所需的样本大小。

通过合理选择样本大小,我们可以在保证分析结果可信的前提下,降低调查成本和研究时间。

总结在统计学中,样本代表性、随机性和样本大小是三个基本的统计学原则。

遵循这些原则可以确保数据的有效性和可信度,提高数据分析的准确性和推断的精度。

统计学中的抽样方法和样本容量

统计学中的抽样方法和样本容量

统计学中的抽样方法和样本容量在统计学中,抽样方法和样本容量的选择对于获取准确的研究结果至关重要。

本文将介绍常用的抽样方法并探讨如何确定合适的样本容量。

一、抽样方法抽样方法是指从总体中选择一部分个体进行研究,以便通过对样本的观察和分析来推断总体的特征。

常见的抽样方法包括:1. 简单随机抽样:简单随机抽样是指从总体中随机选择个体,使每个个体被选中的概率相等。

这样可以确保样本具有代表性,并且每个个体都有被选中的机会。

2. 系统抽样:系统抽样是按照一定的规则从总体中选择样本。

例如,每隔一定间隔选择一个个体作为样本。

这种方法适用于总体有序的情况下,能够保证样本的分布与总体的分布相似。

3. 分层抽样:分层抽样是将总体划分为若干层,然后从每层中分别进行随机抽样。

这样可以保证每个层次都能被充分代表,提高样本的多样性。

4. 整群抽样:整群抽样是将总体划分为若干群,然后随机选择部分群体作为样本,再从每个选中的群体中选择个体进行观察。

这种方法节省了时间和成本,适用于总体分布不均匀的情况。

二、样本容量的确定样本容量的确定需要考虑以下几个因素:1. 总体大小:总体大小是影响样本容量的重要因素。

当总体较大时,相对较小的样本容量就可以提供足够的信息来进行统计推断。

但如果总体较小,可能需要选择较大的样本容量以达到准确性要求。

2. 总体变异程度:总体的变异程度越大,需要选择更大的样本容量来减小抽样误差。

因为变异程度大意味着样本数据的离散度较高,需要更多的样本来保证统计结果的可靠性。

3. 置信水平和置信区间:置信水平和置信区间是指统计推断中的置信程度和变异范围。

较高的置信水平和较窄的置信区间要求选择更大的样本容量,以提高推断的准确性和精确度。

4. 研究目的和资源限制:研究目的和资源限制也是决定样本容量的重要因素。

如果研究目的是获取准确的统计结果,就需要选择较大的样本容量。

但在现实情况下,资源有限可能会限制样本容量的选择。

综上所述,统计学中的抽样方法和样本容量的选择是保证研究结果可靠性和准确性的关键步骤。

大样本与小样本理论在统计学中的区别与应用

大样本与小样本理论在统计学中的区别与应用

大样本与小样本理论在统计学中的区别与应用统计学是一门研究数据收集、分析和解释的学科。

在统计学中,样本是指从总体中选取的一部分个体或观测值。

根据样本的大小,我们可以将样本分为大样本和小样本。

大样本通常指的是样本容量较大,而小样本则相对较小。

在统计学中,大样本和小样本理论有着不同的应用和区别。

一、大样本理论大样本理论是指在样本容量足够大的情况下,对总体参数进行推断的一种方法。

大样本理论的基本原理是当样本容量足够大时,样本统计量的分布会趋近于正态分布。

这是由于大样本的中心极限定理保证的。

根据中心极限定理,当样本容量足够大时,无论总体分布是什么样的,样本均值的分布都会接近于正态分布。

大样本理论的一个重要应用是在总体均值的估计上。

通过计算样本均值和标准差,可以利用大样本理论来估计总体均值的置信区间。

置信区间是指对总体参数的估计范围,给出了一个包含真实总体参数的区间范围。

大样本理论的应用使得我们可以通过样本数据对总体参数进行推断,并给出估计的可信度。

此外,大样本理论还可以用于假设检验。

假设检验是统计学中常用的一种方法,用于判断某个假设是否成立。

通过计算样本均值和标准差,可以利用大样本理论来进行假设检验。

假设检验的结果可以帮助我们判断某个假设是否成立,并对实际问题做出相应的决策。

二、小样本理论与大样本理论相比,小样本理论更适用于样本容量较小的情况。

在小样本情况下,样本统计量的分布不一定服从正态分布。

因此,小样本理论需要对样本分布进行更加精确的推断。

小样本理论的一个重要应用是在总体均值的估计上。

与大样本理论不同,小样本理论需要考虑样本的分布情况。

当样本容量较小时,我们通常会假设样本来自于正态分布总体。

通过计算样本均值和标准差,可以利用小样本理论来估计总体均值的置信区间。

小样本理论的应用使得我们可以在样本容量较小的情况下对总体参数进行推断。

此外,小样本理论还可以用于方差分析。

方差分析是一种用于比较多个总体均值是否相等的方法。

统计学小样本概念的理解

统计学小样本概念的理解

统计学小样本概念的理解统计学中的小样本概念是指在统计分析中,所使用的样本的数量相对较少的情况下所进行的分析和推断。

小样本通常定义为样本容量在30或更少的情况。

相对于大样本来说,小样本的数据量较少,因此在进行统计分析时需要特别注意样本带来的不确定性和偏差。

小样本在统计学中有着重要的应用和意义。

首先,小样本是一种常见的研究方法,在某些领域和条件下难以获得大样本。

例如在医学和心理学研究中,由于时间、成本和伦理等因素的限制,往往只能使用小样本进行研究。

其次,小样本在某些特殊情况下也具有一定的优势。

在一些稀有事件或特定群体的研究中,由于样本数量较少,可以更容易地获得研究对象,并进行深入的研究和分析。

此外,在一些特定的实验设计中,小样本也可以提供有关因果关系的初步证据。

然而,小样本也存在一些问题和限制。

首先,小样本容易引发样本选择偏差,从而使得结果的泛化能力较弱。

由于样本的数量较少,很难保证样本的代表性和随机性,因此得到的结论通常只能适用于当前样本所代表的特定群体或条件。

其次,小样本容易受到异常值和噪声的影响,从而导致结果的不稳定性和误差性。

由于样本的数量有限,即使出现极个别的异常值或噪声,都可能对结果产生较大的影响。

此外,小样本的数据也往往无法满足统计分析的假设条件,如正态性或方差齐性等,这增加了结果的不确定性和偏差。

在进行小样本分析时,需要采用一些特殊的统计方法和技术来解决上述问题。

首先,可以使用非参数统计方法来避免对数据分布的假设。

非参数方法主要基于数据的秩次而非具体数值,在一定程度上减少了对数据分布的依赖,提高了统计推断的可靠性。

其次,可以使用交叉验证等技术来评估预测模型的准确性和稳定性。

在小样本情况下,直接将数据分为训练集和测试集可能导致结果的不稳定,因此可以使用交叉验证将数据多次划分为训练集和测试集,从而得到更稳定和可靠的结果。

此外,还可以使用贝叶斯统计方法来引入先验知识,从而减少样本数量的限制。

统计学计算最小样本量

统计学计算最小样本量

统计学计算最小样本量在统计学中,样本量是非常重要的一个概念。

样本量的大小直接关系到统计推断的精确性和可靠性。

因此,在进行统计研究时,我们需要合理地确定样本量的大小,以确保我们能够得出准确的结论。

那么,如何计算最小样本量呢?我们需要确定研究的目的和假设。

根据研究的目的和假设,我们可以选择适当的统计方法,并确定所需的显著性水平和效应大小。

显著性水平是我们接受或拒绝原假设的标准,通常取0.05或0.01。

效应大小是指我们希望检测到的实际差异的大小,通常根据经验或先前的研究来确定。

我们需要选择适当的统计检验。

常见的统计检验包括t检验、方差分析、卡方检验等。

每种统计检验都有其适用的条件和假设,我们需要根据研究的具体情况来选择适当的检验方法。

接下来,我们可以利用统计软件或在线计算工具来计算最小样本量。

以t检验为例,我们需要输入显著性水平、效应大小和所需的统计功效。

统计功效是我们希望能够检测到实际差异的概率,通常取0.8或0.9。

计算得出的结果即为最小样本量。

需要注意的是,计算得到的最小样本量是理论上的估计值,实际研究中可能存在其他因素的影响,如样本的可获得性、研究的时间和资源限制等。

因此,在确定最终的样本量时,我们需要综合考虑这些因素,并且在可行的范围内尽量接近计算得到的最小样本量。

我们还可以进行样本量的后续计算和调整。

在实际研究中,我们可能会遇到一些不可预见的情况,如样本的失效、数据的缺失等。

这时,我们可以根据实际情况进行样本量的修正和重新计算,以保证研究的可靠性和有效性。

除了计算最小样本量,我们还可以通过其他方法来评估样本量的合理性。

例如,我们可以进行样本量的敏感性分析,通过改变显著性水平、效应大小和统计功效等参数,来观察样本量的变化情况。

这样可以帮助我们了解样本量的稳定性和健壮性。

统计学计算最小样本量是一项重要的工作,它可以帮助我们合理地确定研究的样本量,从而保证研究结果的可靠性和准确性。

在进行样本量计算时,我们需要明确研究的目的和假设,选择适当的统计方法和检验,利用统计软件或在线工具进行计算,并综合考虑其他因素进行样本量的调整。

统计学中的样本大小与功效分析

统计学中的样本大小与功效分析

统计学中的样本大小与功效分析统计学是一门研究数据收集、分析和解释的学科。

在统计学中,样本大小和功效分析是两个重要的概念。

样本大小是指在进行统计研究时所需要的样本数量,而功效分析则是评估研究结果的可靠性和有效性。

本文将探讨统计学中的样本大小与功效分析的相关内容。

一、样本大小的重要性样本大小在统计研究中起着至关重要的作用。

一个合适的样本大小可以保证研究结果的可靠性和有效性。

如果样本大小过小,可能导致研究结果的偏差和不准确性。

相反,如果样本大小过大,不仅会浪费研究资源,还可能增加研究的成本和时间。

因此,确定一个合适的样本大小是进行统计研究的基础。

二、样本大小的确定方法确定样本大小的方法有多种,其中常用的方法包括效应大小、置信水平、功效和预计的样本方差。

效应大小是指研究中所期望观察到的效果的大小。

置信水平是指对于研究结果的置信程度。

功效是指在给定的效应大小和置信水平下,研究能够检测到该效应的能力。

预计的样本方差是指在样本中观察到的变异程度。

根据这些因素,研究者可以使用统计软件或公式来计算出所需的样本大小。

通过合理的样本大小计算,可以确保研究结果的准确性和可靠性。

三、功效分析的意义功效分析是评估研究结果的可靠性和有效性的方法。

在进行统计研究时,通过计算功效可以确定研究是否具有足够的样本大小来检测到所期望的效应。

功效分析可以帮助研究者评估研究结果的可靠性,并决定是否需要增加样本大小以提高研究的有效性。

功效分析还可以帮助研究者设计合理的研究方案。

通过计算功效,研究者可以确定所需的样本大小和实验设计,以确保研究结果具有统计学上的显著性和实际意义。

四、样本大小与功效分析的应用样本大小和功效分析广泛应用于各个领域的统计研究中。

在医学研究中,确定合适的样本大小可以确保临床试验的结果具有统计学上的意义,并为临床实践提供可靠的依据。

在市场调研中,样本大小和功效分析可以帮助企业确定样本数量,以评估市场需求和消费者行为。

在社会科学研究中,样本大小和功效分析可以帮助研究者确定样本数量,以评估社会问题和行为模式。

样本小 非参数统计

样本小 非参数统计

样本小非参数统计
样本小和非参数统计是统计学中的两个重要概念,它们在数据分析和推断中起着关键作用。

首先,让我们来看看样本小的概念。

样本小通常指的是从总体中抽取的样本容量相对较小的情况。

在统计学中,样本大小对于数据分析和推断的可靠性至关重要。

当样本容量较小时,统计推断的可靠性会降低,因为样本的代表性可能受到影响,从而导致推断结果的不确定性增加。

此时需要谨慎对待统计分析的结果,可能需要采取更保守的方法进行推断。

接下来,让我们来谈谈非参数统计。

非参数统计是一种统计推断的方法,它不依赖于总体分布的具体形式。

与参数统计相对,非参数统计不对总体分布做出具体的假设,因此更加灵活。

非参数统计方法通常用于样本容量较小或总体分布未知的情况下,它们能够提供一种更加普适和稳健的统计推断方式。

从样本小和非参数统计的角度来看,我们可以探讨它们在实际应用中的重要性和影响。

首先,样本小可能会导致统计推断的不确定性增加,因此在实际数据分析中,需要对样本小的情况进行特殊
处理,可能需要采用非参数统计方法来进行推断。

非参数统计方法
的灵活性和普适性使得它们在样本小的情况下能够提供可靠的推断
结果,因此在实际应用中非参数统计具有重要意义。

总的来说,样本小和非参数统计都是统计学中非常重要的概念,它们对于数据分析和推断具有重要影响。

在实际应用中,我们需要
根据样本大小和数据特点选择合适的统计方法,以确保推断结果的
可靠性和准确性。

统计学中的样本量的计算公式

统计学中的样本量的计算公式

统计学中的样本量的计算公式在统计学中,样本量是指用来进行统计推断的样本的大小。

样本量的确定对于统计分析的准确性和可靠性至关重要。

样本量的计算公式是根据统计学原理和假设推导出来的,通过计算得到合适的样本量可以提高统计推断的精确性。

样本量的计算公式主要基于以下几个因素:总体大小、置信水平、置信区间、总体方差、误差限、显著水平、样本误差和效应大小等。

下面将逐一介绍这些因素对样本量计算的影响。

1. 总体大小:总体大小是指所研究的总体中个体的数量。

总体大小对样本量的要求有一定的影响,总体越大,所需的样本量相对较小;总体越小,所需的样本量相对较大。

这是因为总体大小的增加可以提高总体的代表性,从而减少样本误差。

2. 置信水平:置信水平是指统计推断的可信程度,通常表示为1-α,其中α为显著性水平。

常见的置信水平为95%或99%。

置信水平越高,要求的样本量相对较大,因为需要更高的置信度来保证统计推断的准确性。

3. 置信区间:置信区间是指估计总体参数的范围。

置信区间的宽度与样本量有关,置信区间越窄,要求的样本量相对较大。

这是因为较小的置信区间可以提供更精确的估计结果。

4. 总体方差:总体方差是指所研究总体的变异程度。

总体方差越大,要求的样本量相对较大;总体方差越小,要求的样本量相对较小。

这是因为较大的总体方差需要更大的样本量来减少抽样误差。

5. 误差限:误差限是指估计结果与真实值之间的差异。

误差限越小,要求的样本量相对较大;误差限越大,要求的样本量相对较小。

较小的误差限可以提供更精确的估计结果。

6. 显著水平:显著水平是指拒绝零假设的临界值。

显著水平越小,要求的样本量相对较大;显著水平越大,要求的样本量相对较小。

较小的显著水平可以提高统计推断的严谨性。

7. 样本误差:样本误差是指样本统计量与总体参数之间的差异。

样本误差越小,要求的样本量相对较大;样本误差越大,要求的样本量相对较小。

较小的样本误差可以提供更准确的估计结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
如要查負值之部份, 仍以正值查表。然後, 以0.5減 去表內之累計機率即可。如:Z值-1.96, 查得1.96 之0.475, 以0.5-0.475=0.025, 即是自左尾開始 累計到Z值為-1.96的機率。
相反地, 若要計算由Z值為-1.96開始累計到右尾的 機率, 則將查得之值(0.475)加上0.5, 即0.975。 通常, α=0.05時, 如要查Zα/2值, 是找尋右尾機率為 0.025時之Z值, 即找出由左尾累積得0.975之Z值 1.96。若用Excel之NORMSINV()函數來求算, 其 公式應為:(詳範例光碟Ch04.xlsx『依α査Z值』 工作表) =NORMSINV(1-0.05/2)
先別忙著計算樣本數, 由於本書是介紹Excel之書籍, 故得對所使用到的各相關函數先介紹一下。
4
基本定義
標準差 變異數 標準隨機變數 平均值 m
5
常態分配之Z值
一般統計學之常態數值(Z), 係利用查常態分配 表(附錄二)來得知。如:Z0.025為1.96、Z0.05為 1.645。但於Excel下, 則可利用NORMSINV()標 準常態分配反函數來查得;而若知道Z值, 也可以 NORMSDIST()函數來求得其機率。
=NORMSINV(0.025) 為-1.96
=NORMSINV(0.05) 為-1.645
=NORMSINV(0.5) 為0
=NORMSINV(0.95) 為1.645
=NORMSINV(0.975) 為1.96
10
標準常態分配表
一般統計學之教科書, 均會附有標準常態分配表( 如:附錄二), 以利查常態數值(Z)。由於, 常態 分配是對稱的分配, 故一般僅附上正值之部分, 表 內之累計機率, 是由Z值為0時開始累計。如:Z值 1.96, 查得1.96之0.475, 表示由標準常態分配中 央(Z=0)開始, 累計到Z=1.96的機率。即, 下圖 之陰影部份:
3. 拖曳A3:A4右下角之複製控點, 拉到A33位置, 複製出 0.0、0.1、0.2、…、2.9、3.0等數值
13
4. 於B1輸入『Z值的小數第二位』字串
5. 於B2輸入0.00(僅顯示0), C2輸入0.01
6. 選取B2:C2, 按『數值』群組之 使兩數均可擁有2位小數
『增加小數位』鈕,
7. 拖曳B2:C2右下角之複製控點, 拉到K2位置, 複製出 0.00、0.01、0.02、…、0.08、0.09等數值
樣本變異數(S2)的計算公式為:
其值恰為樣本標準差(S)之平方, 也是用來衡量觀測值與 平均值間的離散程度。
26
由於, 母體變異數未知。故舉行一次試訪, 以範例光碟 Ch04.xlsx『估計均數樣本數σ未知』工作表, 取得120位大 學生之手機平均月費。計算出其樣本變異數(S2)為 109,593、於顯著水準α=0.05(Zα/2=1.96)的情況下, 希 望對母體手機平均月費μ的估計誤差不超過30元, 其樣本數應 為多大?
32
可發現, 其樣本數的極大值1067係發生於母體比率為 0.5時。母體比率<0.5時, 隨母體比率逐漸增加, 樣本數 也逐步增加。母體比率>0.5時, 隨母體比率逐漸增加, 樣本數則逐步減少。
故而, 若我們無法得知母體真正比率p, 要計算樣本數時, 可以採取最保守的估計, 將母體比率設定為0.5。這樣, 由於其樣本數最大, 所獲得之結果也將是各種情況下最正 確的。
將相關值代入公式:
至少應取得1006個樣本, 才有95%的信心, 保證其調查結 果的支持率之誤差不超過±3%。
30
以Excel來安排相關之數字與公式, 將為:(詳範例光碟 Ch04.xlsx『以母體比率求樣本數』工作表)
31
保守估計母體比率
於將前面之抽樣中, 若將不同之p值分別代入, 其樣 本數勢必不同。茲將各種結果彙集成下表來比較: (詳範例光碟Ch04.xlsx『以母體比率求樣本數』 工作表)
將σ=2.5與Zα/2=1.96代入公式
至少應取得267個樣本, 才能有95%的保證其誤差不超 過0.3。 以ChE0x4c.exlB母l來s欄x體安『各標排估儲準相計存差關均格σ之數之=數樣S公Q字本式R與T數分(B公σ別1已式) 為知, :將』為工:作(表詳)範例光碟
Zα/2 =NORMSINV(1-B3/2) 樣本數n =((B4*B2)/B5)^2
將相關之數字輸入Excel, 即可算出, 至少應取得468個樣本, 才能有95%的保證其估計誤差不超過30元:
27
馬上練習
由於, 母體變異數未知。故舉行了一次試訪, 取得40位 大學生之信用卡每月平均簽帳金額。(詳範例 Ch04.xlsx『信用卡問卷樣本數』工作表)於風險顯著 水準α=0.05(Zα/2=1.96)的情況下, 希望對母體信用 卡每月平均簽帳金額μ的估計誤差不超過50元, 其樣本 數應為多大?
17
母體變異數已知時的樣本大小
學過所需之幾個函數後, 現在, 可以
來計算於母體變異數(σ2)已知之情況下的樣本數 (n)。式中: α為顯著水準或風險水準, (1-α)即信賴係數
或信賴水準 e為可容忍誤差 σ為母體標準差
18
假定, 母體變異數σ2=6.25(σ=2.5), 於風險顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體均數μ的 估計誤差e不超過0.3, 其樣本數應為多大?
33
馬上練習
以範例Ch04.xlsx『以保守估計求樣本數』工作表 進行計算, 保守估計執政黨的支持度為50%。要以 90%之信賴水準(風險顯著水準α=0.1), 希望調 查結果之支持率的誤差為±3%, 應取樣多少?
统计学之样本大小
第四章 樣本大小
2
樣本大小之選擇
樣本不要過大, 過大浪費成本;但也不要過小, 過 小則會有太大的抽樣誤差。如何決定適當的樣本大 小?在機率抽樣的情況下, 有關樣本大小的決定及 樣本統計顯著性的判斷, 可藉由機率法則的運用。 (也就是說, 有公式可供計算啦!)
但在非機率抽樣的情況下, 除了依靠抽樣人員的主 觀判斷或假設外, 實無客觀之科學方法可資應用。
異數為4202500。至少應取得多少樣本?才能有 9X%(X為學號最後一位數字)的信賴水準, 保證其 估計誤差不超過1000元
22
平方根SQRT()函數
SQRT(數值) SQRT(number) 本函數是用來求某數值的平方根, 若數值為負值, 本
函數將回應#NUM!之錯誤。如:(詳範例光碟 Ch04.xlsx『平方根』工作表)
=NORMSDIST(-1.96) 為0.025
=NORMSDIST(-1.645) 為0.05
=NORMSDIST(0) 為0.5
=NORMSDIST(1.96)
為0.975
8
常態分配(normal distribution)是次數分配呈中間集 中, 而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中 央極限定理, 不論原母體的分配為何?只要樣本數夠大( n>=30), 樣本平均數 的分配, 會趨近於常態分配。
19
假定, 電力公司根據過去之調查經驗, 知道用戶用電度數 的母體變異數為48000(σ2=48000)、於顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體平均用電 度數μ的估計誤差不超過5度, 其樣本數應為多大?
將相關之數字輸入Excel即可算出, 至少應取得7376個 樣本, 才能有95%的保證其估計誤差不超過5度:(詳範 例光碟Ch04.xlsx『估計均數樣本數σ已知1』工作表)
式中:
α為顯著水準或風險水準, (1-α)即信賴係數或信 賴水準
e為可容忍誤差
S為樣本標準差
25
於Excel中, 樣本變異數可以VAR()函數來求得, 其語法為 : VAR(數值1,[數值2],...) VAR(number1,[number2],...) 數值1,[數值2],...為要計算變異數之儲存格或範圍引數, 它是對應於某母體抽樣選出的1到255個數字引數樣本, 方 括號包圍之部份可省略。
3
估計平均數時的樣本大小 母體變異數已知
於母體變異數(σ2)已知之情況下, 樣本數(n)之 求算公式為:
α為顯著水準或風險水準, (1-α)即信賴係數或 信賴水準;顯著水準表示檢定者主觀認定統計量
出現「極端數值」的機率。信賴係數愈高愈好, 表示估計精準。
e為可容忍誤差
σ為母體標準差:是用來衡量觀測值與平均值間的 離散程度。
9
標準常態分配反函數NORMSINV()
NORMSINV(累計機率) :由機率求z值
NORMSINV(probability)
其作用為於標準常態分配(μ = 0, σ = 1), 求某 累計機率所對應之Z值。有了此函數, 即可省去查常 態分配表之Z值的麻煩。如:(詳範例光碟 Ch04.xlsx『NORMSINV』工作表)
28
估計比率時的樣本大小
若研究目的是在估計比率(p, proportion), 其樣 本數(n)之求算公式為:
p為母體的真正比率 α為風險顯著水準, (1-α)即信賴係數 e為可容忍誤差 σp為母體標準差, 其運算公式為:
29
將其代入上式, 即可獲致新的樣本數(n)公式:
不過, 通常我們是無法得知母體之真正比率p, 要計算樣本 數時, 則以過去之調查結果替代。假定, 上個月支持執政黨 之比率為38%(p)。這個月, 於95%的信賴水準下( α=0.05), 希望調查結果之支持率的允許誤差(e)為 3%, 應取樣多少?
23
事實上, 有無此函數並不很重要。利用 ^ 運算符號也可 達成開方之動作。如:=64^(1/2)之結果即 =SQRT(64);但若要求開三方, 那SQRT()可就無能為 力了。但仍可利用 ^ 運算符號來解決(乘冪為1/3即等 於開三方):
相关文档
最新文档