统计学第六章统计量与抽样分布习题附参考答案
抽样分布习题及答案

抽样分布习题及答案抽样分布习题及答案抽样分布是统计学中一个重要的概念,它描述了从总体中抽取样本后,样本统计量的分布情况。
在实际应用中,我们经常需要利用抽样分布来进行统计推断,因此对于抽样分布的理解和掌握是十分必要的。
本文将介绍一些常见的抽样分布习题,并提供相应的答案。
1. 问题:某公司有1000名员工,其中400人是女性。
现从中随机抽取100人,求抽取样本中女性人数的抽样分布。
解答:在这个问题中,我们可以将女性的出现看作是一个二项分布的实验,成功的概率为0.4。
因此,抽取样本中女性人数的抽样分布是一个二项分布。
根据二项分布的性质,我们可以计算出不同女性人数的概率。
2. 问题:某电商平台有1000个用户,他们的购买金额服从均值为100元,标准差为20元的正态分布。
现从中随机抽取50个用户,求抽取样本的平均购买金额的抽样分布。
解答:在这个问题中,样本的平均购买金额的抽样分布是一个服从均值为100元,标准差为20/√50元的正态分布。
根据正态分布的性质,我们可以计算出不同平均购买金额的概率。
3. 问题:某城市的居民年收入服从均值为50000元,标准差为10000元的正态分布。
现从中随机抽取200个居民,求抽取样本的平均年收入的抽样分布。
解答:在这个问题中,样本的平均年收入的抽样分布是一个服从均值为50000元,标准差为10000/√200元的正态分布。
根据正态分布的性质,我们可以计算出不同平均年收入的概率。
4. 问题:某医院每天接诊的患者数服从均值为50人,标准差为10人的泊松分布。
现从中随机抽取30天,求抽取样本的平均每天接诊的患者数的抽样分布。
解答:在这个问题中,样本的平均每天接诊的患者数的抽样分布是一个服从均值为50人,标准差为10/√30人的正态分布。
根据正态分布的性质,我们可以计算出不同平均每天接诊的患者数的概率。
通过以上几个习题的解答,我们可以看到不同问题中抽样分布的情况是不同的,需要根据具体的问题来确定抽样分布的类型和参数。
统计学第6章统计量及其抽样分布

整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】

第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
统计量及其抽样分布习题答案

第六章 统计量及其抽样分布6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,Nn σμ的正态分布,由正态分布,标准化得到标准正态分布:x ()0,1N ,因此,样本均值不超过总体均值的概率P 为: ()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤ =()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.6318 6.2 ()0.3P Y μ-≤=P ⎫≤=x P ⎛⎫≤≤=(||P z ≤=(21φ-=0.95查表得: 1.96= 因此n=436.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的:设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z 服从自由度为n 的χ2分布,记为χ2~ χ2(n )因此,令6221i i Z χ==∑,则()622216i i Z χχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知: b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ-- 此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==- 根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-=()()()()2222121999191P b S b P n S n ααχχ-⇒≤≤=-≤≤-()()()2220.950.059990.90P S χχ=≤≤=则:()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则 ()20.95199b χ==0.369,()20.05299b χ==1.88。
贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?答:(1)设12n X X X ,,…,是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。
3.什么是次序统计量?答:设12n X X X ,,…,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序(1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
概率论与数理统计 第六章抽样分布 练习题与答案详解
概率论与数理统计 第六章 抽样分布练习题与答案详解(答案在最后)1.设n X X X ,,,21 为取自总体X 的样本,总体方差2σ=DX 为已知,X和2S 分别为样本均值,样本方差,则下列各式中( )为统计量.(A)21)(∑=-ni iEX X(B) 22)1(σS n - (C) i EX X - (D) 12+nX2.设总体) ,(~2σμN X ,其中μ已知,2σ未知,n X X X ,,,21 是来自X的样本,判断下列样本的函数中,( )是统计量.(A) σ++21X X (B) 221)(S X ni i∑=-μ(C) ),,,min(21n X X X (D)212σ∑=ni iX3.今测得一组数据为12.06,12.44,15.91,8.15,8.75,12.50,13.42,15.78,17.23.试计算样本均值,样本方差及顺序统计量*1X ,*9X .4.设总体) ,(~2σμN X ,样本观测值为3.27,3.24,3.25,3.26,3.37,假设25.3=μ,22016.0=σ,试计算下列统计量的值:(1) nX U σμ-=,(2) 251221)(1∑=-=i iX Xσχ,(3) 251222)(1∑=-=i iXμσχ.5.某厂生产的电容器的使用寿命服从指数分布,但参数λ未知,为统计推断需要,任意抽查n 只电容器测其实际使用寿命.试问此题中的总体,样本及其分布各是什么?6.某市抽样调查了一百户市民的人均月收入,试指出总体和样本. 7.某校学生的数学考试成绩服从正态分布) ,(2σμN .教委评审组从该校学生中随机抽取50人进行数学测试,问这题中总体,样本及其分布各是什么?8.设1621,,,X X X 是来自正态总体) ,2(~2σN X 的样本,X 是样本均值,则~1684-X ( ) (A) )15(t (B) )16(t (C) )15(2χ (D) 1) ,0(N9.设总体) ,0(~2σN X ,n X X X ,,,21 为其样本,∑==n i i X n X 11,212)(1∑=-=n i i n X X n S ,在下列样本函数中,服从)(2n χ分布的是( ). (A)σnX (B)∑=ni iX1221σ (C)22σnnS (D)nS n X 1- 10.设总体) ,(~2σμN X ,n X X X ,,,21 为X 的简单随机样本,X ,2nS 同上题,则服从)1(2-n χ分布的是( ).(A)nX σμ- (B)1--n S X nμ (C)22σnnS (D)212)(1∑=-ni iXμσ11.设总体) ,(~2σμN X ,n X X X ,,,21 是X 的样本,X ,2S 是样本均值和样本方差,则下列式子中不正确的有( )(A))1(~)(2212--∑=n X Xni iχσ (B))1 ,0(~N X σμ-(C) )1(~--n t nSX μ (D))(~)(2221n Xni iχσμ∑=-12.设n X X X ,,,21 和n Y Y Y ,,,21 分别取自正态总体) ,(~21σμN X 和) ,(~22σμN Y ,且X 和Y 相互独立,则以下统计量各服从什么分布?(1) 22221))(1(σS S n +-; (2)nS S Y X )()()(222121+---μμ;(3) 2221221)]()[(S S Y X n +---μμ. 其中X ,Y 是X ,Y 的样本均值,21S ,22S 是X ,Y 的样本方差.13.设n X X X ,,,21 是正态总体) ,(~2σμN X 的样本,记2121)(11∑=--=n i i X X n S , 2122)(1∑=-=n i i X X n S , 2123)(11∑=--=n i i X n S μ, 2124)(1∑=-=n i i X n S μ, 则服从自由度为1-n 的t 分布的随机变量有( )(A) 11--n S X μ (B) 12--n S X μ (C) n S X 3μ- (D) nS X 4μ-14.设321 , ,X X X 是来自正态总体)9 ,(~μN X 的样本,232212)()(μχ-+-=X b X X a ,则当=a ____,=b ____时,22~χχ(___).15.设921,,,X X X 和1621,,,Y Y Y 分别为来自总体)2 ,(~21μN X 和)2 ,(~22μN Y 的两个相互独立的样本,它们的样本均值和样本方差分别为X ,Y 和21S ,22S .求以下各式中的621,,,ααα .(1) 9.0})({91221=<-<∑=i i X X P αα;(2) 9.0}|{|31=<-αμX P ;(3) 9.0)(||416122=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<--∑=αμi i Y Y Y P ;(4) 9.0815621225=⎭⎬⎫⎩⎨⎧<<ααS S P . 16.在天平上重复称量一个重为a (未知)的物品.假设n 次称量结果是相互独立的,且每次称量结果均服从).20 ,(2a N .用n X 表示n 次称量结果的算术平均值.为使n X 与a 的差的绝对值小于0.1的概率不小于%95,问至少应进行多少次称量?17.根据以往情形,某校学生数学成绩)10 ,72(~2N X ,在一次抽考中,至少应让多少名学生参加考试,可以使参加考试的学生的平均成绩大于70分的概率达到0.9以上?18.在均值为80,方差为400的总体中,随机地抽取一容量为100的样本,X 表示样本均值,求概率}3|80{|>-X P 的值.19.设总体)5 ,40(~2N X ,从中抽取容量64=n 的样本,求概率}1|40{|<-X P 的值.20.设总体X 与Y 相互独立,且都服从)2 ,30(2N ,从这两总体中分别抽取了容量为201=n 与252=n 的样本,求4.0||>-Y X 的概率.21.设总体)2 ,0(~2N X ,而1521,,,X X X 是X 的样本,则)(221521121021X X X X Y ++++= 服从什么分布,参数是多少?又问当a 为何值时,215272621X X X X a F ++++= 服从)9 ,6(F ?22.设总体)4 ,0(~N X ,1021,,,X X X 是X 的样本,求(1) }13{1012≤∑=i i X P ;(2) }76)(3.13{2101≤-≤∑=i i X X P .23.从总体) ,(~2σμN X 中抽取容量为16的样本,2S 为样本方差,求}041.2{22≤σS P .24.从总体)2 ,12(~2N X 中随机抽取容量为5的样本521,,,X X X ,求} 284.44)12( {512>-∑=i i X P .答案详解1.B(A)中含总体期望EX 是未知参数,(C)中EX EX i =也是未知参数,都不是统计量,而(D)不是样本的函数,当然不是统计量.2.B ,C3.样本容量9=n ,利用计算器的统计功能键,算出92.12=x ,65.9)107.3(22==s ,观察921,,,x x x ,可得最小值15.8*1=x ,最大值23.17*=n x .注 上面得到的x ,2s ,*1x ,*nx 依次是统计量∑==ni i X n X 11,),,,max( ),,,,min( ,)(1121*21*1212n n n n i i X X X X X X X X X X n S ==--=∑=的观察值.注意统计量与统计量的观察值的区别,前者是随机变量,后者是具体的数值4.258.3=x ,00017.02=s (1) 118.1=u ; (2) 656.221=χ;(3) 906.322=χ,提示 为了计算22χ的值,先将其展开为)52(1251512222μμσχ+-=∑∑==i i i iX X ,其中,∑=512i iX ,∑=51i i X 均可由计算器的统计功能键求出来5.“电容器的使用寿命”是总体X ,其服从参数为λ的指数分布,即X 的概率密度为⎩⎨⎧≤>=-0.x , 0 0,x ,)(x X e x f λλ“抽查的n 只电容的使用寿命”是容量为n 的样本n X X X ,,,21 .由于n X X X ,,,21 相互独立且每个i X 与总体X 具有相同的分布,所以,样本的联合概率密度为⎩⎨⎧=>=∏=+++-=., 0,,,1 ,0,)(),,,()(12121其它n i x e x f x x x f i x x x n i X ni n n λλ 6.总体X 为该市市民户的人均月收入,容量为100的样本10021,,,X X X 为抽查的100户市民的人均月收入7.总体X 为该校学生的数学考试成绩,容量为50的样本5021,,,X X X 为抽取的50人的数学成绩总体) ,(~2σμN X ,即其概率密度为222)(21)(σμσπ--=x X ex f ,样本5021,,,X X X 的概率密度为∑⎪⎪⎭⎫⎝⎛==--50122)(2150502121),,,(i i x e x x x f μσσπ8.D因为) ,2(~2σN X ,根据正态总体的抽样分布),2(~2nN X σ,)1 ,0(~)2(4162222N X X n X U σσσ-=-=-=9.(A) 因) ,0(~2σN X ,由正态总体的抽样分布,有) ,0(~2nN X σ,所以)1 ,0(~2N nX nXU σσ==.(B) 因) ,0(~2σN X i ,得)1 ,0(~N X iσ,n i ,,1 =,且这n 个标准正态变量相互独立,所以由2χ分布的定义知,)(~1212122n X X ni i ni i χσσ∑∑==⎪⎭⎫⎝⎛=.(C) 2122)1()(S n X X nS ni i n-=-=∑=,由正态总体的抽样分布知)1(~)1()(22221222--=-=∑=n S n X XnSni iχσσσ.(D) ()nS X X n n n S n i i n 2122)1(11=--=-∑=,由正态分布的抽样分布知 )1(~11--=-=-=n t S n X n S X nSX T nnμ, 或者,由(A),(C)的结果,根据t 分布的定义有)1(~1)1(22--=-=n t S n X n nS n X T nn σσ.综上可知,应选B . 10.C 11.B12.(1) )22(2-n χ; (2) )22(-n t ; (3) )22 ,1(-n F 13.B 14.181=a ,91=b 时,)2(~22χχ 15.(1) 由正态总体的抽样分布得∑=-91222)8(~)(21i iX Xχ,因此,}44)(4{})({2912191221αααα<-<=<-<∑∑==i ii i X XP X X P9.0}4)8({}4)8({2212=>->=αχαχP P ,令95.0}4)8({12=>αχP ,05.0}4)8({22=>αχP ,根据2χ分布得上侧临界值的定义,查表可得,733.2)8(4295.01==χα,955.21)8(4205.02==χα,即932.104733.21=⨯=α,82.874955.212=⨯=α注 一般来说,满足条件{}αχ-=<<12B A P的数(临界值)A ,B 有很多对,这里我们采用的取法是使A ,B 满足{}{}222αχχ=≥=≤B P A P .通常认为这样的取法比较好,对于F 分布也类似(2) 由正态总体的抽样分布)1 ,0(~91N X σμ-,即)1 ,0(~321N X μ-, 得9.0}23||23{}|{|3131=<-=<-αμαμX P X P ,根据)1 ,0(N 分布得双侧临界值的定义,查表得645.1232/10.03==u α,所以097.132645.13=⨯=α.(3) 由正态总体的抽样分布)15(~1622t S Y μ-,即)15(~)(422t S Y μ-,得⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<--∑=422241612215||)(||αμαμS Y P Y Y Y P i i 9.0154)(4 422=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-=αμS Y P .根据t 分布的双侧临界值的定义,并查表得75.1)15(1542/10.04==t α,于是,113.015475.14==α.(4) 由正态总体得抽样分布)8 ,15(~222212222122F S S S S =,得90.005.095.0158158815621225621225=-=⎭⎬⎫⎩⎨⎧<<=⎭⎬⎫⎩⎨⎧<<ααααS S P S S P , 查F 分布上侧临界值表,得645.21)15 ,8(1)8 ,15(15805.095.05===F F α, 22.3)8 ,15(15805.06==F α, 所以,709.08645.2155=⨯=α,038.6709.081522.36==⨯=α 16.16≥n ,即至少应进行16次称量提示 对该物品进行独立重复称量的所有可能结果,看成总体X ,则n 次称量结果n X X X ,,,21 就是X 的一容量为n 的样本,n X 即样本均值.由题意知,).20 ,(~2a N X ,根据正态总体的抽样分布,)2.0 ,(~2na N X n ,按条件95.0}1.0 || {≥<-a X P n 来求出n17.至少要42个学生参加抽考18.0.1336提示 该总体并非正态总体,然而100=n 为大样本,所以)100400,80(~N X 19.0.8904 20.约等于0.3446 21.)5 ,10(~F Y ;23=a 22.(1) 因为)4 ,0(~N X i ,)10,,1( =i 且1021,,,X X X 相互独立,所以)10(~421012χ∑=i i X , }4134{}13{10121012∑∑==≤=≤i i i iX P X Pαχ-=>-=1}25.3)10({1 2P ,由于25.3)10(2=αχ,反查2χ分布表,得,975.0=α,故025.0975.01}13{1012=-=≤∑=i i X P .(2) 因为)9(~49)(2221012χσS X Xi i=-∑=,所以, }194932.3{}76)(3.13{21012≤≤=≤-≤∑=S P X X P i i 2122}19)9({}32.3)9({ ααχχ-=>->=P P , 由32.3)9(21=αχ及19)9(22=αχ,反查2χ分布表,得95.01=α及025.02=α,所以,925.0025.095.0}76)(3.13{1012=-=≤-≤∑=i i X X P23.0.99 24.0.05。
抽样分布习题及答案
抽样分布习题及答案1. 题目:从一个容器中随机取出30个样本,每个样本的体积服从正态分布,均值为150,标准差为10。
计算样本均值的抽样分布的标准差。
解答:我们知道,样本均值的抽样分布的标准差(也称为标准误差)可以通过总体标准差除以样本容量的平方根来计算。
标准误差 = 总体标准差/ √样本容量在本题中,总体标准差为10,样本容量为30,代入公式可得:标准误差= 10 / √30 ≈ 1.83因此,样本均值的抽样分布的标准差约为1.83。
2. 题目:某电视台进行了一项调查,随机抽取了500名观众,其中有380人表示喜欢该电视节目。
根据该样本数据,计算其样本比例的抽样分布的标准差。
解答:样本比例的抽样分布的标准差可以通过以下公式计算:标准误差= √((样本比例 × (1 - 样本比例)) / 样本容量)在本题中,样本比例为380/500 = 0.76,样本容量为500,代入公式可得:标准误差= √((0.76 × (1 - 0.76)) / 500) ≈ 0.018因此,样本比例的抽样分布的标准差约为0.018。
3. 题目:某商品的包装袋上注明每袋重量服从正态分布,均值为500克,标准差为10克。
为了确定该注明是否准确,随机抽取了100袋该商品,计算抽取样本的平均重量的抽样分布的标准差。
解答:抽取样本的平均重量的抽样分布的标准差可以通过总体标准差除以样本容量的平方根来计算。
标准误差 = 总体标准差/ √样本容量在本题中,总体标准差为10克,样本容量为100,代入公式可得:标准误差= 10 / √100 = 1因此,抽取样本的平均重量的抽样分布的标准差为1克。
4. 题目:某超市进行了一次促销活动,随机抽取了50个顾客进行调查,得知他们购买的平均金额为200元,标准差为50元。
计算该样本的平均金额的抽样分布的标准差。
解答:样本的平均金额的抽样分布的标准差可以通过总体标准差除以样本容量的平方根来计算。
管理统计学(李金林版教材)课后习题答案~~~第六章
管理统计学(李金林版教材)课后习题答案~~~第六章基础习题1. 解释总体分布、样本分布和抽样分布的含义。
答:总体分布:整体取值的概率分布规律,即随机变量X 服从的分布;样本分布:从总体中按照一定的抽样规则抽取的部分个体的分布,若从总体中简单随机抽取容量为n 的样本,则样本分布为(X 1,X 2,...,X n );抽样分布:样本统计量的分布。
2. 简述卡方分布、t 分布、F 分布及正态分布之间的关系,它们的概率密度曲线各有什么特征?答:若随机变量X 服从N(μ,σ2),则Z =X−μσ服从N(0,1);若随机变量X 服从N(0,1),则Y =∑(X i )2n i=1服从自由度为n 的χ2分布;若随机变量X~N(0,1),随机变量Y~χ2(n),且X 与Y 相互独立,则称随机变量T =√Y n⁄服从自由度为n 的t 分布;若随机变量X~χ2(n),若随机变量Y~χ2(m),且X 与Y 相互独立,则称随机变量F n,m =X n ⁄Y m ⁄服从第一自由度为n ,第二自由度为m 的F 分布,记为F n,m ~F(n,m)。
χ2分布的概率密度曲线分布在第一象限内,随着自由度n 的增大,曲线向正无穷方向延伸,并越来越低阔,越来越趋近于正态分布的曲线形态。
t 分布的概率密度曲线以0为中心,左右对称,随着自由度n 的增大,t 分布的概率密度曲线逐渐接近标准正态分布的概率密度曲线。
F 分布的概率密度曲线分布在第一象限内,当第一个自由度不变,第二个自由度增大时,曲线越来越向右聚拢,当两个自由度都增加时,F 分布概率密度曲线逐渐接近正态分布的概率密度曲线。
3. 解释中心极限定理的含义。
从均值为μ,方差为σ2的任意一个总体中抽取样本容量为n 的随机样本,则当n 充分大时,样本均值x̅的抽样分布近似服从均值为μ,方差为σ2n ⁄的正态分布,即x̅~N(μ, σ2n ⁄)。
4. 某公司有20名销售员,以下是他们每个人的销售量:3,2,2,3,4,3,2,5,3,2,7,3,4,5,3,3,2,3,3,4。
《统计学》习题集及答案
统计习题部分 (1)第1章导论 (2)第2章数据的搜集 (3)第3章数据的整理与显示 (4)第4章数据的概括性度量 (5)第5章概率与概率分布............................................................ 错误!未定义书签。
第6章统计量及其抽样分布 (7)第7章参数估计 (8)第8章假设检验 (9)第9章分类数据分析.............................................................. 错误!未定义书签。
第10章方差分析................................................................. 错误!未定义书签。
第11章一元线性回归 (10)第12章多元线性回归 (12)第13章时间序列分析和预测 (15)第14章指数 (17)答案部分 (21)第1章导论 (21)第2章数据的搜集 (21)第3章数据的图表展示 (21)第4章数据的概括性度量 (22)第5章概率与概率分布............................................................ 错误!未定义书签。
第6章统计量及其抽样分布 (23)第7章参数估计 (23)第8章假设检验 (24)第9章分类数据分析.............................................................. 错误!未定义书签。
第10章方差分析................................................................. 错误!未定义书签。
第11章一元线性回归 (25)第12章多元线性回归 (26)第13章时间序列分析和预测 (27)第14章指数 (28)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本极差 ;
样本中位数
样本的p分位数
其中 , 为不超过np的最大整数;
样本的切尾均值 ,样本的切尾均值是分别去掉k个最小的和k个最大的观测值后得到的均值。
§6.3 抽样分布及抽样分布定理
为了在正态分布假定下,得到样本统计量的精确分布,本节需要讨论几个十分重要的随机变量函数的分布,它们是 分布、 分布和 分布。在此基础上讨论抽样分布的重要定理。
经过上述讨论,完成了从“实物总体→数值总体→分布总体”的两次抽象,也完成了我们将统计学中“总体”与概率论中“分布”的衔接,这是统计推断对总体概念的延伸,也是概率论知识应用于统计推断的基础。以后在本章及以后统计推断的相关章节中,如无特别说明,总体均表示分布总体,给定一个总体,只需要给出总体的分布即可。
【例6-1】总体X服从两点分布,概率分布律如下:
,
从总体中抽取容量为n的样本,构造统计量 ,求此统计量的分布。
解:由于样本是独立的, 服从两点分布,统计量T为随机变量,其取值是0到n之间的所有整数,其分布恰好是二项分布:
,
从上面的例子中,可以看出抽样分布未必与总体的分布一致。
【例6-2】总体分布为 ,抽取容量为n的样本,构造如下三个统计量: , 和 。求此三个统计量的抽样分布。
统计推断中,把具有以下两个重要性质的样本称为简单随机样本:
1. 样本点与总体同分布
这一点很容易从数值总体的角度加以理解:由于采取随机原则抽取样本点,每个个体被抽中的可能性相同。假设总体容量为N,则每个个体被抽中的概率为1/N,假设对离散型总体取值等于x,或对连续型总体取值在区间(x,x+△x)中的个体总数为M,那么抽出样本点取值为x或在区间(x,x+△x)中的概率就是M/N,恰好等于总体X取值为x或取值在区间(x,x+△x)中的频率(或概率),从而可以看出样本点与总体分布相同。
统计量既然是随机变量,那么它应该有概率分布,统计量的分布称为抽样分布。抽样分布和统计推断有着密切的联系。统计量明确以后,必须要知道其抽样分布才能在统计推断中使用,因为只有知道了统计量的分布,才能利用概率论对总体的特征进行推断,并得到相应的推断置信度。所以在统计推断中,一项重要的工作就是寻找统计量和导出统计量的抽样分布或渐近抽样分布。
§6.3.1
分布是海尔墨特(Hermert)和卡.皮尔逊(K.Pearson)分别于1875年和1890年提出的,是统计推断中的重要分布。它主要应用于对总体方差的估计或检验以及对总体概率密度函数的检验等。
1. 分布的定义及其密度函数
定义6-1若随机变量 独立且同标准正态分布 ,则它们的平方和
(6.1)
如果实物总体中个体很多,则对应的数值总体其规模将非常大,而且往往其中重复的值会很多,即使没有重复值(变量取值连续时),在不同值周围的“密集程度”也会不相同。逐一研究每个变量值将会非常繁琐,当总体规模趋于无穷时,研究每个变量值更是变得不可能。若统计出变量的所有不同取值(或取值区间)及其出现的频率,编制变量的分布数列,则可以对变量的全部取值情况一览无遗。研究一个变量的全部数值,就转化为研究该变量的分布了。用变量及其分布来描述一个总体,可以称之为分布总体。例如研究某批麦子的出酒量X,这是个连续变量,可以统计出X在不同区间取值的频率,得到X的分布。对全部单位出酒量的数值的研究,就可转化研究出酒量X的分布了。这是对总体概念的第二次抽象。
在前面章节的学习中,我们已经发现:我们真正关心和收集研究的并不是这些总体中的个体本身,而是这些个体的某些特征及其数值,在前面我们将这些特征用变量来描述,对应的数值称为变量值。关心这批麦子,主要关心的是其酿酒的效果出酒量。此时出酒量成为需要研究的变量,每单位麦子出酒量的具体数值成为变量值。在研究这批麦子时,并不需要将全部这批麦子都收集过来,只需要记录这批麦子每单位出酒量的数值,再对这些数值进行研究就可以了。此时的总体实质是这批麦子的出酒量对应的若干个数值,总体已经从实物抽象到了数值,可以称之为数值总体。这是对总体概念的第一次抽象。
§6.2.2 常用统计量
1.样本均值和样本方差
设 是总体 中抽出的简单随机样本,则样本均值为 ,样本方差为 。
2.样本矩
称 为样本的原点矩,称 为样本的中心矩。特别当 时, 称为样本的未修正方差,常记 ,显然有 。
3.顺序统计量
设 是总体 中抽出的简单随机样本,把样本点排序为 ,则称 为顺序统计量,其中 称为第 个顺序统计量。基于顺序统计量计算的常用统计量有:
例如, 由 个独立的随机变量 构成,由于它们之间没有线性约束条件(即 ),所以它的自由度为 。 的自由度为 ,这是因为计算 时要用 , 满足限制条件 ,即相对于 的 个离差变量 ,只有 个可以任意确定,第 个失去了“自由”,所以能其自由度为 。
2. 样本点之间相互独立
从总体中抽取样本的方法有重复抽样和不重复抽样两种。采用重复抽样时,每次随机抽取一个样本点并记录其特征以后,又将它放回总体中参加下一次抽取,每次抽取样本点都是在总体的N个单位中进行的,前一次抽取的结果不会影响后一次抽取的结果,因此样本点之间相互独立。采用不重复抽样时,每次随机抽出一个样本点后不再将它放回总体中,下一次只能在其余个体中抽取,前面抽取的结果就会影响后面的抽取,因此样本点之间不是相互独立的。但通常实际工作中总体容量非常大,采用不重复抽样时也可以近似认为样本点之间相互独立。对于总体容量无限的情形,无论采取重复抽样还是不重复抽样,都可以认为样本点是相互独立的。
§
统计推断的重要任务是通过对总体中随机抽取的部分个体的观测结果来推断总体的特征。按照随机原则,通过观测或试验的方法所获得的总体中一部分个体的取值称为样本,每个个体的取值称为样本点或样品。抽出样本之前,由于总体中各个体有同等被抽中的可能,抽中那个个体不能确定,因此样本是一组随机变量,每个样本点都可以取总体中任意一个值;但是当样本被抽取并观测记录后,若干个体被抽出,各样本点的取值确定,样本成为是一组确定的数值。统计推断中为了区分此二重性,将抽取前具有随机性的样本称为样本,用大写字母表示;将抽取的一组确定的数值称为样本观测值,用小写字母表示。如要推断某种灯泡使用寿命总体X的特征,拟随机抽取n只灯泡进行测试,其使用寿命(X1,X2,…,Xn)称为灯泡使用寿命总体X的样本,一次具体抽样测试得到n个灯泡使用寿命的数值(x1,x2,…,xn),称为总体X的样本观察值。
, (6.3)
可见随着自由度的增大, 分布的期望和方差随之增大,自由度决定了 分布的形状。从密度函数定义可以看出, 分布是一种不对称偏峰分布,其取值区域为 ;随着自由度的逐渐增大, 分布曲线的最高点逐渐下降并向右移动,分布曲线趋于对称,如图6-1所示。
图6-1 的概率密度曲线
自由度为 的 分布上侧 分位数记为 , 满足
解:由于样本是独立的, 服从均值和方差都为1的正态分布,三个统计量都是样本的线性函数,由正态分布的性质,三个统计量仍服从正态分布,下面分别求解其均值和方差:
,
,
,
由上面计算可以得出,统计量 服从均值和方差都为1的正态分布,这和总体的分布相同;统计量 服从均值和方差都为2的正态分布,而统计量 服从均值为1,方差为1/n的正态得,附表给出了自由度 的 分布上侧 分位数。也可通过EXCEL的CHINV函数求得。
例如 , 。
(2) 分布的自由度
分布中 称为自由度。对于变量 ,如果存在一组不全为零的常数 ,使得 成立,则称变量 之间存在一个线性约束条件。如果变量 中存在 个独立的线性约束条件,则 中独立变量的个数为 ,称它为自由度。自由度也可粗略解释为可以自由选择数值的变量个数。
对于随机变量X,其取值是随机的,关注该变量的全部取值,也就是要关注其各个可能取值(或取值区间)及其相应概率,即关注该随机变量的概率分布。在统计推断中利用随机变量X及其概率分布来描述一个总体,应用起来非常有优势,尤其是当总体容量趋于无穷时,另外一个好处是可以利用概率论的理论和方法来研究总体。例如麦子出酒量的总体分布如果是正态分布,就可以利用正态分布的密度函数计算出酒量在各区间的概率。
设 是来自总体 的一个样本,如果 是样本 的函数, 中不含任何未知参数,则称 为一个统计量。如果 为样本 的观测值,则 为统计量 的观测值。统计量的观测值是确定的,没有随机性。
统计量有以下两个特征:统计量是样本的函数,统计量通常为随机变量;统计量不能含有未知的参数。例如,当从正态总体中抽出样本 时,考查随机变量 ,当总体均值 为已知时,该变量是统计量;当总体均值未知时,该变量就不是统计量。
在本书后面的叙述中,常常将以上两个性质一同简写为 “样本点独立同分布(i.i.d)”。没有特别说明的情况下,我们讨论的样本均指的是简单随机样本。
§6.2 统计量
§6.2.1 统计量的概念
在统计推断中,总体信息是未知的,但从总体中抽取的样本中含有总体的信息,统计推断就是利用样本的信息来推测总体的信息。然而样本的信息是隐蔽的、分散的,必须经过必要的加工对样本信息进行集中和提炼才能用来推断总体信息,构造样本统计量是集中和提炼样本信息来推断总体信息的有效手段之一。
§6.1 总体与样本的统计分布
总体与样本是统计推断中的两个基本概念。统计推断的目的是从样本信息出发,运用概率论的方法,推断总体的特征;因此如何将统计学的总体、样本和概率论的基础——随机变量与分布联系起来,就成为统计推断首先要解决的问题。
§6.1.1
第一章中已经明确统计所研究的是由同类事物构成的总体的数量特征,总体是根据一定的目的确定的所要研究的事物的全体,它是由客观存在的、具有某种共同性质的众多个体构成的。总体中的每个单位称为个体。比如前面引例中,每一批麦子的全体就是一个总体,而其中每单位的麦子就是个体。这是统计学中关于总体的概念,我们可以称其为实物总体。
服从自由度为 的 分布,记为 。
根据服从卡方分布随机变量的定义,我们可以根据求随机变量函数的概率分布的方法求出 分布的概率密度函数。如果随机变量 服从自由度为 的 分布,其概率密度为: