非参数统计部分课后习题参考答案
非参数统计答案范文

非参数统计答案范文1. 考察Mann-Whitney U检验:问题:对两组数据进行比较,数据不符合正态分布,要判断两组数据是否有显著差异。
如何选择合适的非参数检验方法?答案:Mann-Whitney U检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。
2. 考察Wilcoxon符号秩和检验:问题:对同一组数据进行配对比较,数据不符合正态分布,如何选择合适的非参数检验方法?答案:Wilcoxon符号秩和检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。
3. 考察Kruskal-Wallis检验:问题:有三组数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:Kruskal-Wallis检验是一种适用于比较多组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。
4. 考察Friedman检验:问题:有三组配对数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:Friedman检验是一种适用于比较多组配对样本的非参数检验方法,适用于数据不符合正态分布的情况。
5. 考察Mood's中位数差异检验:问题:有两组独立样本数据需要比较,数据不符合正态分布,如何选择合适的非参数检验方法?答案:Mood's中位数差异检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。
6.考察符号检验:问题:对一组配对数据进行比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:符号检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。
7.考察秩和检验:问题:有两组独立样本数据需要比较,如何选择合适的非参数检验方法?答案:秩和检验是一种适用于比较两组独立样本的非参数检验方法。
8. 考察Kolmogorov-Smirnov检验:问题:有一组数据需要验证其服从一些特定分布,如何进行检验?答案:Kolmogorov-Smirnov检验是一种非参数检验方法,可以用于验证数据是否符合一些特定分布。
非参数统计·王星_第二章课后习题答案

非参数统计 第 次作业第二章习题 2.1 解:(1)0110001000H :h H :h μ≥↔μ<建立的猜想应该与样本表现一致。
换句话说,正是样本表现使我们对总体的均值产生怀疑,进而才有了假设检验。
因此,0H 是我们就与样本想要推翻的假设,所以才要检验。
(2)由上一问,这样的假设脱离样本,样本呈现出落后于旧过程的情形,而非要用一种优于旧过程的假设,这样的假设是毫无意义的,也并不会带来好的结果。
2.2 解:(1)有问题。
假设检验在原假设条件成立下,得到拒绝域1645x .>,意思是拒绝0θ=,接受0θ≠。
而1000θ=只是其中的一种情况,故不能接受1000θ=。
改进方法:可直接提出假设对均值为1000进行检验。
即0110001000H :H :θ=↔θ≠(2)不合理。
样本2的样本量太小,不具备代表性,用其进行假设检验风险太大。
改进方法:若样本来自同一总体,独立观察,且需要对总体样本均值做出判断,可将两样本合并后再进行假设检验;若样本来自两个总体,需对两总体的均值做出比较,可取(12x x ---)作为检验统计量进行检验。
(3)t -=x -为样本均值,μ为总体均值,s 为样本标准差 01p Pr(t(n )t )=-≤,其中0t -=p 值是拒绝原假设0H 的最小显著水平。
若p α≥,则拒绝0H ;反之,接受0H(4)对总体均值进行双侧检验:00012112211111-H :|t(n )t (n )|(x t (n t (n α---αα--μ=μ↔μ≠μ⎧⎫->-⎨⎬⎩⎭α--+-拒绝域:故,置信区间为:(5)双侧检验:00101211221122''H :H :|u |u u u [x u ,x u α--αα----αα--μ=μ↔μ≠μ⎧⎫≥⎨⎬⎩⎭≤≤-+拒绝域:故置信区间为:- 当样本量很大时,依然可以用上法:222212211111_n i i _s (x x )[n(x (x ))]n n n [(x (x ))]n --=-=-=---=--∑由矩估计的相合性可知,2_x 是2E(x )的相合估计,2(x )-是2E(x )的相合估计 故2s 是2δ的相合估计。
非参数统计分析第六章课后答案

非参数统计分析第六章课后答案问题1:设有10个教师分别在两个学校中进行教学,分别记录了每位教师每日的教学小时数。
假设这两个学校的教学小时数分布不符合正态分布。
现在我们想要比较这两个学校的教学小时数平均值是否相等。
解答:对于这个问题,我们可以使用非参数统计方法-秩和检验。
首先将每个教师的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号,即用秩来代替实际的数值。
然后根据两个学校的秩之和来进行比较。
步骤如下:1.将每个学校的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号(秩)。
2.计算两个学校的秩和,并求出差值。
3.利用秩和差值来估计两个学校教学小时数平均值的差异性。
4.根据差异性的大小,进行假设检验,判断两个学校的教学小时数平均值是否相等。
问题2:某农场试验了两种肥料对苹果树生长的影响。
为此,从两个农场中随机选择了64棵苹果树,并给予不同的肥料进行处理。
试比较两种处理的效果是否相同。
解答:对于这个问题,我们可以使用非参数统计方法-符号检验。
符号检验是一种用于比较两个相关样本的方法,适用于样本量较小或者数据不符合正态分布的情况。
步骤如下:1.对于每棵苹果树,比较两种处理对树的生长效果,根据生长情况给予正或负的符号。
2.统计正负符号的个数,得到两种处理的得分。
3.根据得分判断两种处理的效果是否相同:如果得分大致相等,则说明两种处理的效果相同;如果得分明显偏向一种处理,则说明两种处理的效果不同。
问题3:某个城市公交车站每小时通过的乘客数量分别为:20、18、14、26、22、24、16、12、16、20。
我们想要推断乘客数量的中位数。
解答:对于这个问题,我们可以使用非参数统计方法-中位数检验。
中位数是一种非参数的统计量,它不受极端值的影响,适用于数据分布不符合正态分布的情况。
步骤如下:1.将数据按照从小到大的顺序排列。
2.根据数据的个数,找出中间位置的数值,即中位数的位置。
3.如果数据个数为奇数,则中位数即为中间位置的数值;如果数据个数为偶数,则计算中间位置两个数值的平均值作为中位数。
非参数统计(R软件)参考答案

⾮参数统计(R软件)参考答案内容:A.3, A.10, A.12A.3 上机实践:将MASS数据包⽤命令library(MASS)加载到R中,调⽤⾃带“⽼忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间⼤于70min喷泉的等待时间挑选出来。
解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满⾜条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)),1];#提取满⾜条件(waiting<70& (waiting!=57)的数据.Sub2geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以⽤[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满⾜条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 4.000000 4.383333 4.833333 5.450000 4.866667……原数据集的第2列为喷涌时间,所以⽤[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满⾜条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 80 71 80 75 77…….A.10如光盘⽂件student.txt中的数据,⼀个班有30名学⽣,每名学⽣有5门课程的成绩,编写函数实现下述要求:(1) 以data.frame的格式保存上述数据;(2) 计算每个学⽣各科平均分,并将该数据加⼊(1)数据集的最后⼀列;(3) 找出各科平均分的最⾼分所对应的学⽣和他所修课程的成绩;(4) 找出⾄少两门课程不及格的学⽣,输出他们的全部成绩和平均成绩;(5) ⽐较具有(4)特点学⽣的各科平均分与其余学⽣平均分之间是否存在差异。
最新第四版非参数统计第四章课后习题答案

第4章-3.一项关于销售茶叶的研究报告说明销售方式可能和售出率有关,三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶,对一组商店在一段时间的调查结果列在下表中(单位为购买者人数)。
销售方式购买率(%)商店内等待20 25 29 18 17 22 18 20 门口销售26 23 15 30 26 32 28 27 表演炒制53 47 48 43 52 57 49 56 利用检验回答下面的问题,是否购买率不同?存在单调趋势吗?如果只分成表演炒制和不表演炒制两种,结论又如何?N i: 8 8 8R i: 50 86 164R: 6.25 10.75 20.5iK-W检验即拒绝零假设。
J-T检验U12=7+6+0+8+7+8+7+7=50U13=64U23=64J=50+64+64=178n较大Ф(0.2295)=2.413>0.05拒绝零假设初中物理知识点复习填空第一章声现象复习一、基础过关1.声音是由物体的产生的,一切发声的物体都在,振动,发生才停止。
2.声音是以的形式在中传播,气体、液体和都可以传播声音,声音在中传播的最慢,15℃的空气中声音的传播速度是,但不能传播声音。
3.声音通过头骨、颌骨也能传到听觉神经,引起听觉。
声音的这种传导方式叫。
4.声音具有三个显著的特性,分别是、和。
其中,与振动的频率(每秒钟物体振动的次数)有关,且频率越大,越高;与物体振动的振幅有关,且振幅越大,越大,它还与距离发生体的有关;不同的发声体不同。
5.人耳的听觉频率是。
频率高于的声叫波,频率低于的声叫波,生活中用B超检查身体及胎儿的发育情况用的是波,地震、火山、台风、海啸及一些动物交流时用的是波。
6.物理学中,把发声体做____________振动时发出的声音叫做噪声;从环保的角度,凡是影响人们正常的、和的声音都是噪声,人们用为单位来表示声音强弱的等级,符号是。
7.对噪声的控制可以在三个阶段进行减弱,分别是在_________处减弱;在___________减弱;在____________减弱。
王静龙《非参数统计分析》课后计算题参考答案解析

王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a Mean Sample Statistics for xN Mean Std. Dev. Std. Error -------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0t Statistic Df Prob > t --------------------------------- 0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93 Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
非参数统计部分课后习题参考答案

课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
王静龙《非参数统计分析》课后计算题参考标准答案

王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120 N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
(10分) (3)找出基于符号检验的95%的中位数的置信区间。
(8分)解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。
如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。
(4分)(2)符号检验(5分)设假设组:H 0:M =M 0=5064H 1:M ≠M 0=5064符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3精确检验:二项分布b(14,0.5),∑=-=30287.0)2/1,14(n b ,双边p-值为0.0576,大于a=0.05,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=0.1,则样本数据可拒绝零假设。
查二项分布表得a=0.05的临界值为(3,11),同样不足以拒绝零假设。
正态近似:(5分)np=14/2=7,npq=14/4=3.5z=(3+0.5-7)/5.3≈-1.87>Z a/2=-1.96仍是在a=0.05的水平上无法拒绝零假设。
说明两年的中位数变化不大。
(3)中位数95%的置信区间:(5064,21240)(8分)7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。
能否说该信号是纯粹随机干扰?(10分)解:建立假设组: H 0:信号是纯粹的随机干扰H 1:信号不是纯粹的随机干扰(2分)游程检验:因为n 1=42,n 2=34,r=37。
(2分)根据正态近似公式得:U=33.18)13442()3442()344234422(3442258.3813442344222≈-++--⨯⨯⨯⨯=≈++⨯⨯σ (2分)086.033.1858.3837-≈-=Z (2分)取显著性水平a=0.05,则Za/2=-1.96,故接受零假设,可以认为信号是纯粹的随机干扰的。
(2分)第四章p91-941、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:A组:28, 20,20,27,3,29,25,19,16,24,29,16,29 B组:40,31, 25,29,30,25,16,30,39,25能否说A组学生比B组学生算得更快?利用所学的检验来得出你的结论.(12分)解、利用Wilcoxon 两个独立样本的秩和检验或Mann-Whitney U 检验法进行检验。
建立假设组:H 0:两组学生的快慢一致;H 1:A 组学生比B 组学生算得快。
(2分) 两组数据混合排序(在B 组数据下划线):3,16,16,16,19,20,20,24,25,25,25,25,27,28,29, 29, 29, 29,30, 30,31,39,40(2分)A 组秩和R A =1+3*2+5+6.5*2+8+10.5+13+14+16.5*3=120;B 组秩和R B =3+10.5*3+16.5+19.5*2+21+22+23=156(2分) A 组逆转数和U A =120-(13*14)/2=29B 组逆转数和U B =156-(10*11)/2=101(2分)当n A =13,n B =10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney 秩和检验的临界值,所以用正态近似。
计算2326.21245.16362603612/)11013(*10*132/10*132912/)1(2/-≈-≈-=++-=++-=B A B A B A A n n n n n n U Z (2分)当显著性水平a 取0.05时,正态分布的临界值Z a/2=-1.96(1分) 由于Z<Z a/2,所以拒绝H 0,说明A 组学生比B 组学生算得快。
(1分)4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。
记下损坏前延迟的时间名次(数目越大越耐久)如下:方法:A B B A B A B A A B A A A B A B A A A A 序: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20用Mann-Whitney 秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良?(10分)解、设假设组:H 0:两种工艺在提高耐用性方面的优良性一致;H 1:A 工艺比B 工艺更优良(1分,假设也可用符号表达式)根据样本数据知n A =13;n B =7(1分),计算A 工艺的秩和R A =1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分)B 工艺的秩和R B =2+3+5+7+10+14+16=57(1分)A 工艺的Mann-Whitney 秩和U A =R A -n A (n A +1)/2=153-(13*14)/2=62(1分)B 工艺的Mann-Whitney 秩和U B =R B -n B (n B +1)/2=57-(7*8)/2=29(1分)当n A =13,n B =7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney 秩和检验的临界值,所以用正态近似。
计算3075.16194.125.1625.1595.1612/)1713(*7*132/7*136212/)1(2/≈≈=++-=++-=B A B A B A A n n n n n n U Z (2分)当显著性水平a 取0.05时,正态分布的临界值Z a/2=1.96(1分)由于Z<Z a/2,所以样本数据提供的信息不足以拒绝H 0,可以说A 、B 两种工艺在提高耐用性方面的优良性一致,A 工艺并不比B 工艺更优良。
(1分)第五章p118-1211、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位:g/cm 2):表4检验法。
(14分) 解:建立假设组:H 0:不同百分比纤维的棉花其平均抗拉强度一样; H 1:不同百分比纤维的棉花其平均抗拉强度不一样。
(2分) 已知,k=5,n 1= n 2= n 3= n 4= n 5=8(2分)。
混合排序后各观察值的秩如表4所示:表4根据表4计算得:(6分)由于自由度k-1=5-1=4,n j =8>5,是大样本,所以根据水平a=0.05,查X2分布表得临界值C=9.488,(2分)因为Q>C ,故以5%的显著水平拒绝H 0假设,不同百分比纤维的棉花其平均抗拉强度不一样。
(2分)7、按照一项调查,15名顾客对三种电讯服务的态度(“满意”或“不满意”)为(15分)解:建立假设组:H 0:顾客对3种服务的态度无显著性差异;H 1:顾客对3种服务的态度有显著性差异。
(2分)本例中,k=3,n=15。
(2分)又因(5分)自由度k-1=3-1=2,(2分)取显著性水平a=0.05,查X2分布表得临界值c=5.992,(2分)因为Q>C ,故以5%的显著水平拒绝H 0假设,即顾客对3种服务的态度有显著性差异。
(2分)8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1:表1试检验村民对这三个候选人的评价有没有区别?解:建立假设组: H 0:三个候选人在村民眼中没有区别H 1:三个候选人在村民眼中有差别(2分)数据适合用Cochran Q 检验(2分)。
而且已知n=20,k=3,∑x i =∑y j =28。
(2分)6154.1843233323257)13(3431414257464169281323222222=-⨯⎭⎬⎫⎩⎨⎧--=∴=++++==++=++===∑∑∑∑θ j i j i y X y x 6857.2841385.715.2535.2501665.78414012)1(3)1(122222212≈⨯-++++⨯⨯=+-+=∴∑=N n R N N H k j jj计算结果见表3:表3根据表2计算得:48221266118922222222=+++==++=∑∑ j i y x (2分)则7778.048283)328266)(13(3)()[1(2222≈-⨯--=---=∑∑∑∑jj i i y y k kx x k k Q (2分) 取显著性水平a=0.05,查卡方分布表得卡方临界值C =5.9915,由于Q<C ,故无法拒绝零假设,可以认为三个候选人在村民眼中没有区别。