(同济大学)应用统计往届试题(-7-10共五套真题)

合集下载

同济大学应用统计期末试题

同济大学应用统计期末试题

一、填空1.从某个总体中抽取了两组样本,第一组样本观测值为()()163,13,6,,2,0x x ----=-⋅⋅⋅,则秩序统计量的观测值()16,y y ⋅⋅⋅= 。

第二组观测值()()140,2,2,1,y y -⋅-⋅⋅=,则第二组样本在两组混合样本中的秩和为 (结用平均秩)2.设简单随机样本在两组混合样本()()1515,,,X X Y Y ⋅⋅⋅⋅⋅⋅,分别取自正态总体()21,N μσ,()22,N μσ,其中12,R μμ∈,且两总体独立,则在置信水平1α-下,12a b μμ+(其中,a b 是大于0的常数)的单侧置信下限为: (结果可用统计量2212,,,X Y S S 及分位数表示)3.设总体(~)X P λ,λ未知,0λ>,()15,X X ⋅⋅⋅是取自这个总体的一个大小为5的样本,检验01:1,:2H H λλ==,给出拒绝域(){}1,1,1,1,1W =,则该检验的一类风险为: ,二类风险为:二、为适应经济的快速发展,交通部门拟采取措施大力整治交通状况,现抽样调查得知在某个繁忙的交通路口经过的2463辆汽车中,直行的车辆有1584辆,左转车辆有577辆,右转车辆有302辆,试问在置信水平=0.1α下,该路口的左转车辆的占比是否显著小于25%(试用大样本方法构造检验)三、为考察四个地区对松树的生长是否有影响,现将四个地区的品种在相似环境下生长的松树,各随机抽取5根,测得它们的树干直径如下:(单位:厘米,已知316=2.46F,)试问在显著性水平10%下,这四个地区对松树的生长是否有影响,这里假定松树的直径服从方差相等的正态分布。

四、为研究分娩过程中使用胎儿电子监测仪时对孕妇分娩方式是否会造成影响,对500例已经分娩的产妇作回顾调查,得到如下结果:试问在产妇分娩过程中使用胎儿电子监测仪对孕妇分娩方式是否会造成影响(=0.05α,且已知()20.951=3.84χ)五、未研究不同年龄层的失业状况,调查了若干城市,分别得20~24岁年龄段男性的失业率及35~39岁年龄段男性的失业率数据(%)如下:试问在显著性水平5%下,能否认为35~39岁年龄段男性的失业率显著高于20~24岁年龄段男性的失业率(用秩和检验,且当10,10m n==时,()()<=≤=)830.05,1270.95P T P T六(1)为考察硫酸铜在水中溶解度(单位:克)Y 受温度(单位:℃)x 的影响,做了9次试验,得到数据(),,1,29i i x y i =⋅⋅⋅,并计算得到如下结果:999992211111360,288,20400,10888.32,14639ii ii i i i i i i i xy x y x y ==========∑∑∑∑∑,设()21,o Y N x ββσ+,试求经验回归系数并用T 检验法检验00:0H β=(取()0.950.05,7 2.3646t α==,计算结果保留两位小数)σ的估计量2ˆσ的均方误差(2)在一元回归分析问题中,试求2(3)在一元回归分析问题中,试推导σ的双侧1α-置信区间七、设X 对数正态分布()2,LN μσ,即()()221ln 2,,,0x f x x μσμσ--=>,()1,n X X ⋅⋅⋅是取自该总体的一个样本: (1)若2,μσ均未知,,0μσ-∞<<+∞>,试分别求ˆμ极,ˆσ极 (2)若2σ已知,问ˆμ极是否是μ的有效估计?八、设()1n X X ⋅⋅⋅,是取自正态总体()21,N σ的一个样本,其中20σ>,未知,对于检验问题:2201:2,:2H H σσ≥<,试求出一个显著性水平为α的一致最大功效检验。

应用统计基础试题及答案

应用统计基础试题及答案

应用统计基础试题及答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述数据集中趋势的统计量?A. 众数B. 方差C. 标准差D. 极差答案:A2. 在统计学中,标准正态分布的均值是:A. -1B. 0C. 1D. 2答案:B3. 以下哪个选项是描述数据离散程度的统计量?A. 平均数B. 中位数C. 众数D. 极差答案:D4. 假设检验中的“显著性水平”通常用哪个希腊字母表示?A. αB. βC. γD. δ5. 相关系数的取值范围是:A. -1到1B. 0到1C. -1到0D. 0到-1答案:A6. 以下哪个选项是描述数据分布形状的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C7. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 众数D. 偏度答案:C8. 在统计学中,完全正相关的情况下,相关系数的值是:A. 0B. 1C. -1D. 2答案:B9. 以下哪个选项是描述数据分布离散程度的统计量?B. 众数C. 方差D. 极差答案:C10. 以下哪个选项是描述数据分布偏斜方向的统计量?A. 均值B. 标准差C. 偏度D. 极差答案:C二、多项选择题(每题3分,共15分)1. 下列哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 在统计学中,以下哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 极差D. 标准差答案:AB3. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差D. 平均数答案:ABC4. 在假设检验中,以下哪些是常见的检验类型?A. t检验B. 方差分析C. 卡方检验D. 回归分析答案:ABC5. 以下哪些统计量可以用来描述数据的分布?A. 均值B. 众数C. 偏度D. 峰度答案:ABCD三、判断题(每题1分,共10分)1. 标准差是衡量数据集中趋势的统计量。

(×)2. 相关系数的绝对值越接近1,表示变量之间的相关性越强。

应用数理统计复习题及答案(2010)

应用数理统计复习题及答案(2010)

应用数理统计复习题(2010)一 填空题1设621,,,X X X 是总体)1,0(~N X 的一个样本,26542321)()(X X X X X X Y +++++=。

当常数C =1/3 时,CY 服从2χ分布。

2 设统计量)(~n t X ,则~2X F(1,n) ,~12XF(n,1) 。

3 设n X X X ,,,21 是总体),(~2σu N X 的一个样本,当常数C = 1/2(n-1) 时,∑-=+-=11212)(n i i i X XCS 为2σ的无偏估计。

4 设)),0(~(2σεεβαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。

对于固定的0x ,则0x βα+~()20201,x x N x n Lxx αβσ⎛⎫⎡⎤- ⎪⎢⎥++ ⎪⎢⎥ ⎪⎢⎥⎣⎦⎝⎭。

5.设总体X 服从参数为λ的泊松分布,1.9,2,2,2.1, 2.5为样本,则λ的矩估计值为ˆλ= 2.1 。

6.设总体212~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的置信区间为()()()()222212211,11n S n S n n ααχχ-⎡⎤--⎢⎥⎢⎥--⎢⎥⎣⎦。

7.设X 服从二维正态),(2∑μN 分布,其中⎪⎪⎭⎫ ⎝⎛=∑⎪⎪⎭⎫⎝⎛=8221,10μ令Y =X Y Y ⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛202121,则Y 的分布为 ()12,02TN A A A A μ⎛⎫= ⎪⎝⎭∑ 。

8.某试验的极差分析结果如下表(设指标越大越好):表1 因素水平表表2 极差分析数据表则(1)较好工艺条件应为22121A B C D E 。

(2)方差分析中总离差平方和的自由度为 7 。

(3)上表中的第三列表示 A B ⨯交互作用 。

9.为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见表3)。

应用统计学试题含答案

应用统计学试题含答案

二、单项选择题(每题 1 分,共10 分)1 .重点调查中的重点单位是指()A. 处于较好状态的单位B. 体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2 .根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A .各组的权数必须相等 B.各组的组中值必须相等C .各组数据在各组中均匀分布D .各组的组中值都能取整数值3. 已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A.甲班较大B. 乙班较大C. 两班相同D. 无法作比较4. 某乡播种早稻5000亩,其中20咖用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520 公斤B.530 公斤C.540 公斤D.550 公斤5. 时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200%6. 用最小平方法给时间数列配合直线趋势方程y=a+bt,当b< 0时,说明现象的发展趋势是()A.上升趋势B. 下降趋势C. 水平态势D. 不能确定7. 某地区今年和去年相比商品零售价格提高12%则用同样多的货币今年比去年少购买()的商品。

8. 置信概率表达了区间估计的()A.精确性B. 可靠性C. 显着性D. 规范性9. H0:从= ^0,选用Z统计量进行检验,接受原假设H0的标准是()A.|Z| > 乙B.|Z|<Z «/2C.Z > 乙/2D.Z>-Z «10. 对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题(每题2分,共10分)1. 抽样调查的特点有()。

《应用统计》所有答案

《应用统计》所有答案

三、综合题(本大题共3小题,每小题10分,共30分)1、设二维随机变量(X,Y)的概率密度为⎪⎩⎪⎨⎧>≤≤=-其他,00,10,21),(2y x e y x f y,问X 与Y 是否相互独立,并说明理由。

解:⎩⎨⎧≤≤==⎰+∞其他,010,1),()(0x dy y x f x f X因为)()(),(y f x f y x f Y X =,(2分)所以X 与Y 相互独立。

2、设连续型随机变量X 的分布函数为⎪⎩⎪⎨⎧≥<≤<=8,180,8,0)(x x xx x F ,求)(),(X D X E 。

3、设)50,,2,1( =i X i 是相互独立的随机变量,且都服从泊松分布)03.0(P 。

令∑==501i iXZ ,试用中心极限定理计算}3{≥Z P 。

(附8907.0)225.1(,2247.15.1=Φ≈,结果保留小数点后三位) 解:03.0)(==λi X E ,(2分))50,,2,1(03.0)(2====i X D i σλ,(2分)记∑==ni iXZ 1。

由独)225.1(1Φ-=(2分)1093.0=4、随机变量)2,10(~2N X ,求(1)}13{≥X P ;(2)}2|10{|<-X P 。

(附8413.0)1(,9332.0)5.1(=Φ=Φ) 解:0668.0)5.1(1)13(1}13{1}13{}13{=Φ-=-=≤-=>=≥F X P X P X P5、设二维随机变量(X,Y )的分布列为如下表,则求:(1)(X,Y )关于X 的边缘分布列 (2)(X,Y )关于Y 的边缘分布列 (3)X 与Y 是否独立解:(1)、(X,Y )关于X 的边缘分布列(2)、(X,Y )关于Y 的边缘分布列X 与Y 不是独立6、设连续型随机变量X 的概率密度为⎩⎨⎧≤≤=其他,00,sin )(a x x x f ,试确定常数a 并求)6(π>X P 。

应用统计学考试试题

应用统计学考试试题

应用统计学考试试题一、选择题(每题 3 分,共 30 分)1、下列数据中,属于分类数据的是()A 年龄B 工资C 性别D 体重2、为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生调查,这种抽样方法是()A 简单随机抽样B 分层抽样C 系统抽样D 整群抽样3、设随机变量 X 的概率密度函数为$f(x)=\begin{cases}2x, &0<x<1 \\ 0, &\text{其他}\end{cases}$,则 P(05 < X < 15) =()A 075B 05C 025D 14、设随机变量 X 服从参数为λ的泊松分布,且 P(X = 1) = P(X = 2),则λ =()A 1B 2C 3D 45、设总体 X 服从正态分布$N(\mu,\sigma^2)$,其中$\sigma^2$已知,$\mu$未知。

从总体中抽取样本容量为 n 的样本,样本均值为$\overline{x}$,则$\mu$的置信水平为 1 $\alpha$的置信区间为()A $(\overline{x} z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}})$B $(\overline{x} t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}})$C $(\overline{x} z_{\alpha}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha}\frac{\sigma}{\sqrt{n}})$D $(\overline{x} t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}})$6、在假设检验中,原假设为 H0,备择假设为 H1,如果原假设被拒绝,则()A 可能犯第一类错误B 可能犯第二类错误C 两类错误都可能犯D 两类错误都不可能犯7、对于两个独立样本均值之差的检验,当两个总体方差未知但相等时,检验统计量为()A $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{\sigma_1^2}{n_1} +\frac{\sigma_2^2}{n_2}}}$B $T =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2}}}$C $F =\frac{s_1^2}{s_2^2}$D $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{(n_1 1)s_1^2 +(n_2 1)s_2^2}{n_1 + n_2 2}(\frac{1}{n_1} +\frac{1}{n_2})}}$8、方差分析中,用于检验不同水平下总体均值是否相等的统计量是()A F 统计量B T 统计量C Z 统计量D $\chi^2$统计量9、相关系数的取值范围是()A -1, 1B 0, 1C (∞,+∞)D 0, +∞)10、在线性回归模型中,判定系数 R²越接近 1,说明()A 回归方程的拟合程度越好B 回归方程的拟合程度越差C 自变量对因变量的影响越大D 自变量对因变量的影响越小二、填空题(每题 3 分,共 30 分)1、数据的类型包括_____、_____和_____。

(同济大学)应用统计往届试题(-7-10共五套真题)

(同济大学)应用统计往届试题(-7-10共五套真题)

11-12年一、填空题(24分,每空3分)1、 设()19,,X X 是从总体()1,2N 中抽取的样本,记9119i i X X ===∑则()9211i i X =⎛⎫E - ⎪⎝⎭∑= ,()29211i i X =⎛⎫E - ⎪⎝⎭∑= ,设0.1P k ⎛⎫ ⎪⎪>=⎪⎪⎪⎭,则k =(结果可用分位数表示).2、 设第一组样本观测值()()14,,3,3,1.5,4x x =- ,则其经验分布函数观测值() 4F x = .第二组样本观测值()()1234,,,0,2,1,2y y y y =--,则第二组样本在两组混合样本中的秩和是 .其中01λ<<未知,设()14,,X X 是从中抽取的样本,其观测值()()1234,,,0,1,1,2x x x x =,则λ的极大似然估计值是 .4、 设()19,,X X ,()19,,Y Y 分别是取自正态总体()21,N μσ,()22,N μσ的两个简单随机样本,其中1μ、2μ、2σ均未知,且两总体独立,则在置信水平0.95下,12μμ-的单测置信上限为 ;若对如下的检验问题0H :12μμ≥,1H :12μμ<,当显著性水平0.05α=时,样本()1919,x x y y 落在拒绝域内,则当0.1α=时,对该检验问题应作 .(填接受0H 或拒绝0H 或不能确定).二、(10分)设某高校高等数学课程考试的不及格率为0.2,现对教学方法进行了改革并加强了学风建设,一学期结束时进行了高数课程考试,从参加的考试学生中抽取了400个,发现有60个学生不及格,试用大样本方法检验教学改革后是否显著降低了学生的不及格率,取0.05α=(已知0.95 1.645μ=,0.975 1.96μ=)三、(10分)根据某市公路交通部门某年中前6个月交通事故记录,统计得星期一至星期日发生交通事故的次数如下:问交通事故发生是否与星期几无关?取0.05α=,已知()20.95612.592χ=.四、(10分)在一条河附近有一家化工厂,为调查河水被污染的情况,调查人员在河的4个位置取样,分别是:①紧靠化工厂,②距化工厂10km ,③距化工厂20km ,④距化工厂30km.在每个位置取4个水样,测量水中溶解氧的含量(溶解氧含量越低说明污染越严重),得到如下数据:在5%的显著性水平下检验各取样位置的水中溶解氧含量之间是否有显著差异?(已知()0.953,128.74F =,()0.954,12 5.91F =).五、(10分)比较用两种不同的饲料(低蛋白与高蛋白)喂养大白鼠对体重增加的影响,结果如下:试用秩和检验法检验高蛋白饲料是否比低蛋白饲料能显著的增加小白鼠的体重(取0.05α=)?(已知8m =,8n =时,()520.95P T ≥=,()840.05P T >=)六、(14分)设()1,,n X X 为来自总体()2,N μσ的样本()2n ≥,其中μ、2σ均未知,⑴ 求常数C 使得 ()2211ni i C X Xσ==-∑为无偏估计,并问此时的无偏估计是否为有效估计?为什么? ⑵ 求常数k 使得 ()2221ni i k X Xσ==-∑的均方误差达最小;⑶ 比较⑴、⑵你能得出什么结论?七、(12分)设n 组样本(),i i x Y ,1,,i n = 之间有关系式()i i i Y x x βε=-+,其中()20,i N εσ ,1,,i n = ,11ni i x x n ==∑,且1,,n εε 相互独立,(),i i x y 为n 组样本观测值,1、 求β的最小二乘估计 β;2、 证明 β是形如1ni ii C Y =∑估计量的最小方差无偏估计.八、(10分)设总体X 服从几何分布,即()()11x P X x p p -==-,1,2,x = ,其中01p <<未知,()14,,X X 是取自这个总体的一个样本,对如下的检验问题0H :12p =, 1H :12p > 导出显著性水平316α=的最大功效检验.10-11年一、填空题(24分,每空3分)1、 设()110,,X X ,()110,,Y Y 分别是取自正态总体()211,N μσ、()222,N μσ的两个简单随机样本,其中1μ,2μ,21σ,22σ均未知,并且两总体独立,则在置信水平0.9下,12e σσ的单侧置信下限为 ;对如下的检验问题0H :2212σσ≤,1H :2212σσ>,当显著性水平0.05α=时,该检验问题的拒绝域为(结果可用分位数表示).2、 样本观测值()15,,x x 为()3,2,1,2,0-,则次序统计量的观测值()()()15,,x x = .经验分布函数的观测值 ()5Fx = .3、 设总体X 的密度函数为()1e 2xf x θθ-=,x -∞<<+∞,0θ>未知,()1,,n X X 是取自总体X 的一个样本,记11n i i X X n ==∑,()2211n i i S X Xn =-∑ ,2211n i i A X n =∑ ,则()X E = ,()2S E = ,()2A E = ,θ的矩估计为 .二、(10分)某医院研究吸烟与呼吸道疾病之间的关系,对500名居民进行调查得如下表的在0.05α=下检验吸烟是否与呼吸道疾病有关(已知()20.951 3.84χ=)三、(10分)一批教师在一段长时间内对一门课程的打分有12%为优、18%为良、40%为中,18%为及格,12%为不及格,现在一个新教师在一学期内对学该课程的150名学生打分为22个优,34个良,66个中,16个及格,12个不及格.在显著性水平0.05α=下,检验该新教师是否与一批教师对该门课程打分的各档成绩比例一致.(已知()20.9549.488χ=,()20.95511.071χ=)四、(10分)某从事债券交易服务的交易公司,其中最为盈利的一种服务是债券设计,他们需要确定是否不同的债券设计得到的平均收益是相同的.为此考虑债券设计的4个品种:1号到4号债券,对每一种债券设计选出4份客户收益登记表,构成下面的一张债券设计数据表,假设第i 号债券收益()i X服从()2,i N μσ(单位:人民币10元),试检验这4种债券设计的平均收益是否有显著差异(取显著性水平0.05α=).已知()0.953,128.74F =,()0.954,12 5.91F =五、(10分)用两种不同方法冶炼的某种金属材料,分别取样测定某种杂质的含量,所得数据如下(单位为万分率)假设这两种方法冶炼时杂质含量的方差相同,试用秩和检验法检验新方法是否显著降低了杂质含量(取0.05α=)?(已知8m =,8n =时,()520.95P T ≥=,()840.95P T ≤=)六、(12分)设总体X 的密度函数⎪⎩⎪⎨⎧>=-其余0022x ex x f x θθθ/),(,未知)0>θ(.设),,(n X X X 21是从该总体X 中抽出的样本.(1)求θ的极大似然估计量ˆθ; (2)问ˆθ是否是θ的最小方差无偏估计?七、(14分)为了研究大学生高等数学成绩x 与物理成绩y 的关系,在一大群学生中随机抽取8名学生,调查他们的成绩得到数据如下:1、 试求0β、1β、2σ的无偏估计;2、 试推导如下检验问题0H :028β=,1H :028β>的拒绝域,并用推得的拒绝域检验0β是否可以认为显著大于28.(取0.05α=)(已知()0.956 1.9432t =,()0.9756 2.47t =)八、(10分)设总体()2,X B p ,即()()221xx P X x p p x -⎛⎫==- ⎪⎝⎭,0,1,2x =,其中p 未知,01p <<,()123,,X X X 是取自这个总体的一个样本,对如下的检验问题0H :12p =, 1H :13p =, 导出显著性水平764α=的最大功效检验.09-10年一、填空题(20分)1、 (3分)设样本观测值为()3,2,0,2,1,1--,则经验分布函数()6F x 的观测值 ()6Fx 在0.8x =处的值为 .2、 (3分)设()18,,X X ,()18,,Y Y 分别是来自正态总体()21,N μσ,()22,N μσ的两个简单随机样本,其中1μ,2μ,2σ均未知,且两总体独立,则在置信水平0.95下()321μμ-的单侧置信上限为 .(结果可用分位数表示)3、 (每空2分,共计8分)设()1234,,,X X X X 是来自0-1分布()1,B p 的样本,01p <<未知,对假设检验问题,0H :12p =,1H :13p =,现有二个检验A 和B ,其拒绝域分别为(){}0,0,0,0A W =,(){}1,1,1,1B W =,则检验A 的显著性水平为 ,B 的显著性水平为 ,且检验 优于检验 .4、 (每空3分)设()110,,X X 是从总体()20,N σ中抽取的样本,其中20σ>未知,则21021i i X =⎛⎫E ⎪⎝⎭∑=,设0.1P k ⎛⎫ ⎪⎪>=⎪⎪⎪⎭,则k = .(结果可用分位数表示)二、(8分)某产品的正品率原为0.9,现对这种产品进行新工艺试验,并在新工艺下抽取了400件产品,发现有370件正品,试用大样本方法检验这次新工艺是否显著提高了产品的正品率?取显著性水平0.05α=(已知0.95 1.645μ=,0.975 1.96μ=)三、(8分)对男性和女性的体育运动偏好进行调查,得到如下的列联表在显著性水平0.05下能否认为性别与体育运动偏好是有关的?(()20.952 5.991χ=)问第1班组的劳动生产率是否比第2班组的劳动生产率有显著的提高(取)?(已知5=m ,6=n 时()210.05P T <=,()95.039=≤T P ,其中T 为二组混合样本中第1组样本的秩和统计量)五、(12分)某谷物采用三种不同肥料,每种肥料施于四块相同条件的农田上,其收获量数据如下:(假定收获量服从方差相同的正态分布)在显著性水平下1.检验这三种肥料的收获量有无显著差异; 2.进一步检验在采用2A 、3A 种肥料下,收获量是否有差异.(已知()0.992,98.02F =,()0.993,9 6.99F =,()0.9959 3.25t =)六、(14分)设总体X 服从几何分布,其概率函数()()11x P X x p p -==-,1,2,,x = 01p <<未知,()1,n X X 为总体中抽取的样本,1、 求1p 的极大似然估计估计ˆ1p ;2、 问ˆ1p 是否是1p的有效估计?七、(14分)为了考察一种硝酸盐在水中的溶解度(单位:克)Y 受温度(单位:C 0) x 的影响,做了9次试验,得数据如下:i x 0 10 20 30 40 50 60 70 80 i y 15 18 22 27 29 34 40 48 55 假定溶解度),(~210σββx N Y +.(1) 求0β和1β、2σ的无偏估计,并写出经验回归函数; (2) 在显著性水平05.0=α下,检验原假设:0H1β=0是否成立(用t 检验法或F 检验法的其中一种方法解题),并证明t 检验法与F 检验法是等价的.(已知()365.27975.0=t ,()0.951,7 5.59F =,()0.951,9 5.12F =)八、(14分)设()1,,n X X 是取自正态总体()2,N μσ的一个样本,其中μ、2σ均未知,对于假设检验问题0H :0μ≤,1H :1μ=,试求在显著性水平0.05下的最大功效检验.08-09一、填空题(共12分) 1、 设总体()2,X N μσ ,μ、2σ均未知,()116,,X X 为从中抽取的样本,则μ的0.95的单侧置信上限为 ()0.95154S X t *+ . e μ-的0.95的单侧置信上限为 ()0.95154SX t e *⎛⎫-- ⎪ ⎪⎝⎭. (结果可用分位数表示)2、 设总体()21,X N μσ ,总体()22,Y N μσ ,1μ,2μ,2σ 均未知,()19,,X X 是从中抽取的样本,()15,,Y Y 是从中抽取 的样本,且X 与Y 独立,则()()952211i j i j D X X Y Y ==⎛⎫-+-=⎪⎝⎭∑∑424σ, ()()9215210.71174i i j j X X P Y Y ==⎛⎫- ⎪ ⎪> ⎪- ⎪⎝⎭∑∑= 0.9 .(已知()0.94,8 2.81F =) 二、(10分)某企业为比较白班与夜班的生产效率是否有明显差异,随机抽取了7个工作日进行观察,各日产量比班生产是否存在显著差异.(已知()370.025P T <=, ()680.025P T >=,其中T 为第一组样本在二组混合样本中的秩和).答案:T=55,不能拒绝原假设。

应用统计真题

应用统计真题

精品文档论述题:1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比较,指出各自的优缺点。

3.试述费歇判别的基本思想方法及主要步骤。

4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。

6.解释正交试验设计的特点及理论依据。

7.试论述一元线性回归的基本思想及主要方法步骤。

一、(任选两题,每题10 分,共 20 分)1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.解释正交试验设计的特点及理论依据。

3.试述一元线性回归的基本思想及主要方法步骤。

答案: 1. 假设原理运用了小概率原理,在原假设H0正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生了,则认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,则没有理由拒绝原假设。

第一类错误:弃真错误即 H 0为真时,作出拒绝 H 0的判断;第二类错误:纳伪错误即 H 0不真时,作出接受 H 0的判断。

通常限制犯第一类错误的概率,增大样本容量使犯第二类错误的概率尽可能地小。

为了简化检验过程,更多的应用是只控制犯第一类错误的概率,而不考虑犯第二类错误的概率。

2.正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、省的特点。

“多”是指可以考虑多因素、多指标;“快”是指试验次数少、周期短、见效快;“好”是指可以很快找到优秀方案和可能最优方案;“省”是指省时间、省耗费、省资金、省劳力等。

正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比性两个方面。

均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水平组合的方案之中。

整齐可比性是指对于每列因素,在各个水平导致的结果之和中,其它因素的各个水平出现的次数是相同的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11-12年一、填空题(24分,每空3分)1、 设()19,,X X 是从总体()1,2N 中抽取的样本,记9119i i X X ===∑则()9211i i X =⎛⎫E - ⎪⎝⎭∑= ,()29211i i X =⎛⎫E - ⎪⎝⎭∑= ,设0.1P k ⎛⎫ ⎪⎪>=⎪⎪⎪⎭,则k =(结果可用分位数表示).2、 设第一组样本观测值()()14,,3,3,1.5,4x x =- ,则其经验分布函数观测值() 4F x = .第二组样本观测值()()1234,,,0,2,1,2y y y y =--,则第二组样本在两组混合样本中的秩和是 .其中01λ<<未知,设()14,,X X 是从中抽取的样本,其观测值()()1234,,,0,1,1,2x x x x =,则λ的极大似然估计值是 .4、 设()19,,X X ,()19,,Y Y 分别是取自正态总体()21,N μσ,()22,N μσ的两个简单随机样本,其中1μ、2μ、2σ均未知,且两总体独立,则在置信水平0.95下,12μμ-的单测置信上限为 ;若对如下的检验问题0H :12μμ≥,1H :12μμ<,当显著性水平0.05α=时,样本()1919,x x y y 落在拒绝域内,则当0.1α=时,对该检验问题应作 .(填接受0H 或拒绝0H 或不能确定).二、(10分)设某高校高等数学课程考试的不及格率为0.2,现对教学方法进行了改革并加强了学风建设,一学期结束时进行了高数课程考试,从参加的考试学生中抽取了400个,发现有60个学生不及格,试用大样本方法检验教学改革后是否显著降低了学生的不及格率,取0.05α=(已知0.95 1.645μ=,0.975 1.96μ=)三、(10分)根据某市公路交通部门某年中前6个月交通事故记录,统计得星期一至星期日发生交通事故的次数如下:问交通事故发生是否与星期几无关?取0.05α=,已知()20.95612.592χ=.四、(10分)在一条河附近有一家化工厂,为调查河水被污染的情况,调查人员在河的4个位置取样,分别是:①紧靠化工厂,②距化工厂10km ,③距化工厂20km ,④距化工厂30km.在每个位置取4个水样,测量水中溶解氧的含量(溶解氧含量越低说明污染越严重),得到如下数据:在5%的显著性水平下检验各取样位置的水中溶解氧含量之间是否有显著差异?(已知()0.953,128.74F =,()0.954,12 5.91F =).五、(10分)比较用两种不同的饲料(低蛋白与高蛋白)喂养大白鼠对体重增加的影响,结果如下:试用秩和检验法检验高蛋白饲料是否比低蛋白饲料能显著的增加小白鼠的体重(取0.05α=)?(已知8m =,8n =时,()520.95P T ≥=,()840.05P T >=)六、(14分)设()1,,n X X 为来自总体()2,N μσ的样本()2n ≥,其中μ、2σ均未知,⑴ 求常数C 使得 ()2211ni i C X Xσ==-∑为无偏估计,并问此时的无偏估计是否为有效估计?为什么? ⑵ 求常数k 使得 ()2221ni i k X Xσ==-∑的均方误差达最小;⑶ 比较⑴、⑵你能得出什么结论?七、(12分)设n 组样本(),i i x Y ,1,,i n = 之间有关系式()i i i Y x x βε=-+,其中()20,i N εσ ,1,,i n = ,11ni i x x n ==∑,且1,,n εε 相互独立,(),i i x y 为n 组样本观测值,1、 求β的最小二乘估计 β;2、 证明 β是形如1ni ii C Y =∑估计量的最小方差无偏估计.八、(10分)设总体X 服从几何分布,即()()11x P X x p p -==-,1,2,x = ,其中01p <<未知,()14,,X X 是取自这个总体的一个样本,对如下的检验问题0H :12p =, 1H :12p > 导出显著性水平316α=的最大功效检验.10-11年一、填空题(24分,每空3分)1、 设()110,,X X ,()110,,Y Y 分别是取自正态总体()211,N μσ、()222,N μσ的两个简单随机样本,其中1μ,2μ,21σ,22σ均未知,并且两总体独立,则在置信水平0.9下,12e σσ的单侧置信下限为 ;对如下的检验问题0H :2212σσ≤,1H :2212σσ>,当显著性水平0.05α=时,该检验问题的拒绝域为(结果可用分位数表示).2、 样本观测值()15,,x x 为()3,2,1,2,0-,则次序统计量的观测值()()()15,,x x = .经验分布函数的观测值 ()5Fx = .3、 设总体X 的密度函数为()1e 2xf x θθ-=,x -∞<<+∞,0θ>未知,()1,,n X X 是取自总体X 的一个样本,记11n i i X X n ==∑,()2211n i i S X Xn =-∑ ,2211n i i A X n =∑ ,则()X E = ,()2S E = ,()2A E = ,θ的矩估计为 .二、(10分)某医院研究吸烟与呼吸道疾病之间的关系,对500名居民进行调查得如下表的在0.05α=下检验吸烟是否与呼吸道疾病有关(已知()20.951 3.84χ=)三、(10分)一批教师在一段长时间内对一门课程的打分有12%为优、18%为良、40%为中,18%为及格,12%为不及格,现在一个新教师在一学期内对学该课程的150名学生打分为22个优,34个良,66个中,16个及格,12个不及格.在显著性水平0.05α=下,检验该新教师是否与一批教师对该门课程打分的各档成绩比例一致.(已知()20.9549.488χ=,()20.95511.071χ=)四、(10分)某从事债券交易服务的交易公司,其中最为盈利的一种服务是债券设计,他们需要确定是否不同的债券设计得到的平均收益是相同的.为此考虑债券设计的4个品种:1号到4号债券,对每一种债券设计选出4份客户收益登记表,构成下面的一张债券设计数据表,假设第i 号债券收益()i X服从()2,i N μσ(单位:人民币10元),试检验这4种债券设计的平均收益是否有显著差异(取显著性水平0.05α=).已知()0.953,128.74F =,()0.954,12 5.91F =五、(10分)用两种不同方法冶炼的某种金属材料,分别取样测定某种杂质的含量,所得数据如下(单位为万分率)假设这两种方法冶炼时杂质含量的方差相同,试用秩和检验法检验新方法是否显著降低了杂质含量(取0.05α=)?(已知8m =,8n =时,()520.95P T ≥=,()840.95P T ≤=)六、(12分)设总体X 的密度函数⎪⎩⎪⎨⎧>=-其余0022x ex x f x θθθ/),(,未知)0>θ(.设),,(n X X X 21是从该总体X 中抽出的样本.(1)求θ的极大似然估计量ˆθ; (2)问ˆθ是否是θ的最小方差无偏估计?七、(14分)为了研究大学生高等数学成绩x 与物理成绩y 的关系,在一大群学生中随机抽取8名学生,调查他们的成绩得到数据如下:1、 试求0β、1β、2σ的无偏估计;2、 试推导如下检验问题0H :028β=,1H :028β>的拒绝域,并用推得的拒绝域检验0β是否可以认为显著大于28.(取0.05α=)(已知()0.956 1.9432t =,()0.9756 2.47t =)八、(10分)设总体()2,X B p ,即()()221xx P X x p p x -⎛⎫==- ⎪⎝⎭,0,1,2x =,其中p 未知,01p <<,()123,,X X X 是取自这个总体的一个样本,对如下的检验问题0H :12p =, 1H :13p =, 导出显著性水平764α=的最大功效检验.09-10年一、填空题(20分)1、 (3分)设样本观测值为()3,2,0,2,1,1--,则经验分布函数()6F x 的观测值 ()6Fx 在0.8x =处的值为 .2、 (3分)设()18,,X X ,()18,,Y Y 分别是来自正态总体()21,N μσ,()22,N μσ的两个简单随机样本,其中1μ,2μ,2σ均未知,且两总体独立,则在置信水平0.95下()321μμ-的单侧置信上限为 .(结果可用分位数表示)3、 (每空2分,共计8分)设()1234,,,X X X X 是来自0-1分布()1,B p 的样本,01p <<未知,对假设检验问题,0H :12p =,1H :13p =,现有二个检验A 和B ,其拒绝域分别为(){}0,0,0,0A W =,(){}1,1,1,1B W =,则检验A 的显著性水平为 ,B 的显著性水平为 ,且检验 优于检验 .4、 (每空3分)设()110,,X X 是从总体()20,N σ中抽取的样本,其中20σ>未知,则21021i i X =⎛⎫E ⎪⎝⎭∑=,设0.1P k ⎛⎫ ⎪⎪>=⎪⎪⎪⎭,则k = .(结果可用分位数表示)二、(8分)某产品的正品率原为0.9,现对这种产品进行新工艺试验,并在新工艺下抽取了400件产品,发现有370件正品,试用大样本方法检验这次新工艺是否显著提高了产品的正品率?取显著性水平0.05α=(已知0.95 1.645μ=,0.975 1.96μ=)三、(8分)对男性和女性的体育运动偏好进行调查,得到如下的列联表在显著性水平0.05下能否认为性别与体育运动偏好是有关的?(()20.952 5.991χ=)问第1班组的劳动生产率是否比第2班组的劳动生产率有显著的提高(取)?(已知5=m ,6=n 时()210.05P T <=,()95.039=≤T P ,其中T 为二组混合样本中第1组样本的秩和统计量)五、(12分)某谷物采用三种不同肥料,每种肥料施于四块相同条件的农田上,其收获量数据如下:(假定收获量服从方差相同的正态分布)在显著性水平下1.检验这三种肥料的收获量有无显著差异; 2.进一步检验在采用2A 、3A 种肥料下,收获量是否有差异.(已知()0.992,98.02F =,()0.993,9 6.99F =,()0.9959 3.25t =)六、(14分)设总体X 服从几何分布,其概率函数()()11x P X x p p -==-,1,2,,x = 01p <<未知,()1,n X X 为总体中抽取的样本,1、 求1p 的极大似然估计估计ˆ1p ;2、 问ˆ1p 是否是1p的有效估计?七、(14分)为了考察一种硝酸盐在水中的溶解度(单位:克)Y 受温度(单位:C 0) x 的影响,做了9次试验,得数据如下:i x 0 10 20 30 40 50 60 70 80 i y 15 18 22 27 29 34 40 48 55 假定溶解度),(~210σββx N Y +.(1) 求0β和1β、2σ的无偏估计,并写出经验回归函数; (2) 在显著性水平05.0=α下,检验原假设:0H1β=0是否成立(用t 检验法或F 检验法的其中一种方法解题),并证明t 检验法与F 检验法是等价的.(已知()365.27975.0=t ,()0.951,7 5.59F =,()0.951,9 5.12F =)八、(14分)设()1,,n X X 是取自正态总体()2,N μσ的一个样本,其中μ、2σ均未知,对于假设检验问题0H :0μ≤,1H :1μ=,试求在显著性水平0.05下的最大功效检验.08-09一、填空题(共12分) 1、 设总体()2,X N μσ ,μ、2σ均未知,()116,,X X 为从中抽取的样本,则μ的0.95的单侧置信上限为 ()0.95154S X t *+ . e μ-的0.95的单侧置信上限为 ()0.95154SX t e *⎛⎫-- ⎪ ⎪⎝⎭. (结果可用分位数表示)2、 设总体()21,X N μσ ,总体()22,Y N μσ ,1μ,2μ,2σ 均未知,()19,,X X 是从中抽取的样本,()15,,Y Y 是从中抽取 的样本,且X 与Y 独立,则()()952211i j i j D X X Y Y ==⎛⎫-+-=⎪⎝⎭∑∑424σ, ()()9215210.71174i i j j X X P Y Y ==⎛⎫- ⎪ ⎪> ⎪- ⎪⎝⎭∑∑= 0.9 .(已知()0.94,8 2.81F =) 二、(10分)某企业为比较白班与夜班的生产效率是否有明显差异,随机抽取了7个工作日进行观察,各日产量比班生产是否存在显著差异.(已知()370.025P T <=, ()680.025P T >=,其中T 为第一组样本在二组混合样本中的秩和).答案:T=55,不能拒绝原假设。

相关文档
最新文档