统计学考试试卷及参考答案二
统计学考试题及答案

统计学考试题及答案一、选择题(每题2分,共20分)1. 以下哪个不是描述性统计的范畴?A. 均值B. 中位数C. 众数D. 回归分析2. 标准差是衡量数据的:A. 集中趋势B. 离散程度C. 偏态D. 峰态3. 在正态分布中,数据的分布形态是:A. 双峰B. 单峰C. U形D. 无规律4. 以下哪个是参数估计的目的?A. 描述总体B. 描述样本C. 估计总体参数D. 进行假设检验5. 假设检验中的零假设(H0)通常表示:A. 研究者希望证明的效应B. 没有效应或效应为零C. 效应显著D. 效应不显著二、简答题(每题10分,共30分)6. 简述中心极限定理的内容及其在实际应用中的意义。
7. 解释什么是置信区间,并说明其在统计推断中的作用。
8. 描述什么是相关系数,并解释其在数据分析中的重要性。
三、计算题(每题25分,共50分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。
请计算: - 均值- 中位数- 众数- 方差- 标准差10. 假设某产品的质量控制数据服从正态分布,平均重量为100克,标准差为5克。
如果从这批产品中随机抽取100个样本,计算样本均值在95%置信水平下的置信区间。
统计学考试答案一、选择题1. D(回归分析属于推断统计)2. B(标准差是衡量数据离散程度的指标)3. B(正态分布是单峰分布)4. C(参数估计的目的是估计总体参数)5. B(零假设通常表示没有效应或效应为零)二、简答题6. 中心极限定理指出,大量独立同分布的随机变量之和在次数趋于无穷大时趋于正态分布,无论原始分布是什么。
这一定理在抽样调查、质量控制等领域有广泛应用。
7. 置信区间是用于估计总体参数的一个区间范围,它表示在多次抽样的情况下,有特定比例(如95%)的样本统计量会落在这个区间内。
它在统计推断中帮助我们对总体参数进行估计。
8. 相关系数是度量两个变量之间线性关系强度和方向的统计指标。
统计学试题库及答案

统计学试题库及答案一、单项选择题(每题2分,共20分)1. 统计学中,用来描述数据集中趋势的度量是:A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 以下哪项不是描述数据离散程度的统计量?A. 极差B. 四分位差C. 平均数D. 标准差答案:C3. 在统计学中,用于衡量两个变量之间线性相关程度的统计量是:A. 相关系数B. 回归系数C. 回归方程D. 回归分析答案:A4. 假设检验中,拒绝原假设的决策规则是:A. P值大于显著性水平B. P值小于显著性水平C. 样本均值等于总体均值D. 样本均值不等于总体均值答案:B5. 以下哪个选项不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 回归抽样答案:D6. 用于估计总体均值的点估计量是:A. 样本均值B. 样本方差C. 样本中位数D. 总体均值答案:A7. 在回归分析中,自变量的个数是:A. 1B. 2C. 3D. 任意多个答案:D8. 以下哪个选项是统计学中用于描述数据分布形状的图形?A. 箱线图B. 条形图C. 饼图D. 散点图答案:A9. 以下哪个统计量不能用来衡量数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:D10. 以下哪个选项是统计学中用于描述数据分布的参数?A. 均值B. 方差C. 标准差D. 所有选项答案:D二、多项选择题(每题3分,共15分)1. 下列哪些是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 以下哪些是统计学中常用的数据收集方法?A. 观察法B. 实验法C. 调查法D. 抽样法答案:ABC3. 以下哪些是描述数据离散程度的统计量?A. 极差B. 四分位差C. 方差D. 标准差答案:ABCD4. 在统计学中,以下哪些是假设检验的步骤?A. 建立假设B. 选择显著性水平C. 计算检验统计量D. 做出决策答案:ABCD5. 以下哪些是统计学中常用的图形表示方法?A. 条形图B. 饼图C. 散点图D. 箱线图答案:ABCD三、判断题(每题1分,共10分)1. 统计学中,众数是出现次数最多的数据值。
统计学考试试题及答案

统计学考试试题及答案统计学是一门研究数据收集、处理、分析和解释的科学。
以下是一份统计学考试试题及答案,供参考。
一、选择题(每题2分,共20分)1. 以下哪项不是描述性统计的组成部分?A. 均值B. 方差C. 标准差D. 抽样答案:D2. 总体参数与样本统计量的主要区别是什么?A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 总体参数和样本统计量都是固定的D. 总体参数和样本统计量都是变化的答案:A3. 正态分布的特点是:A. 均值等于中位数B. 均值不等于中位数C. 标准差等于0D. 均值大于标准差答案:A4. 相关系数的取值范围是:A. (-1, 1)B. (0, 1)C. (-∞, ∞)D. (1, ∞)答案:A5. 以下哪种情况适合使用t检验?A. 总体标准差未知B. 总体标准差已知C. 样本量很大D. 样本量很小答案:A二、简答题(每题10分,共20分)1. 简述中心极限定理的内容及其在实际应用中的意义。
答案:中心极限定理指出,在一定条件下,大量相互独立的随机变量之和经过标准化后趋于正态分布,无论这些随机变量本身是什么分布。
这一定理在实际应用中非常重要,因为它允许我们使用正态分布的性质来估计总体参数,即使我们不知道总体的具体分布。
2. 解释什么是置信区间,并说明其在统计推断中的作用。
答案:置信区间是一个范围,用于估计总体参数的值。
它基于样本统计量和概率分布来构建,表示我们对总体参数的估计值有一定的信心。
在统计推断中,置信区间提供了一种量化不确定性的方法,帮助我们理解估计的可靠性。
三、计算题(每题15分,共30分)1. 给定一组数据:23, 27, 31, 35, 39, 43, 47, 51, 55, 59。
计算这组数据的平均值和标准差。
答案:平均值(均值)= (23+27+31+35+39+43+47+51+55+59) / 10 = 39 标准差= √[(Σ(xi - 均值)²) / (n-1)] = √[(Σ(23-39)²+ ... + (59-39)²) / 9] ≈ 11.362. 假设某班级学生的平均成绩为80分,标准差为10分。
医学统计学方法试题及答案(二)

医学统计学方法试题及答案(二)1.在同一总体中进行抽样研究,随着样本含量增大,则()A.标准差增大B.标准误增大C.标准差趋向0D.标准差减小E.标准误减小2.抽样误差是指()A.总体参数与总体参数间的差异B.个体值与样本统计量间的差异C.总体参数间的差异D.样本统计量与总体参数间的差异E.个体值与总体参数间的差异3.X±2.58S 包括变量值的()A.68.3%B.80.0%C.90.0%D.95.0%E.99.0%4.正常参考值范围应()A.取双侧界限B.取单侧界限C.同时计算单侧和双侧界限D.根据实际情况取单侧或双侧界限E.应该是规定不变5.两个样本率差别的假设检验,其目的是()A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同6.有关参考值范围的说法,正确的是()A.参考值范围应根据正常人范围的95%来制定B.如果随机测量某人的某项指标,其值在正常人范围的95%之内,那么应认为此人的此项指标正常C.如果某项指标超出了参考值范围,那么其应为不正常D.求正态资料的参考值范围,精确度越高越好E.所谓的正常和健康都是相对的,在正常人或健康人身上都存在着某种程度的病理状态7.在标准正态分布的曲线下面积中,区间(1.96,+∞)所对应的面积是()A.95%B.99%C.5%D.2.5%E.1%8.甲率P1=48/168,乙率P2=63/200,则甲乙两率的平均率为()A.(48+63)÷2B.(48/168+63/200)÷2C.(48+63)/(168+200)D.48/468+63/200E.(48+168)/(63+200)9.为了由样本推断总体,样本应该是()A.总体中任意的一部分B.总体中的典型部分C.总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分10.统计推断的主要内容为()A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测11.在假设检验中,P值和α值的关系为()A.P值越大,a值就越大B.P值越大,α值就越小C.P值和α值均可由研究者事先设定D.P值和α值都不可以由研究者事先设定E.P值的大小与α值的大小无关12.在两组正态分布资料比较的检验中,结论是P<0.05,差别有统计学意义,则P越小,说明()A.两样本均数差别越大B.两总体均数差别越大C.两样本均数有差别的可能性越大D.越有理由认为两样本均数不同E.越有理由认为两总体均数不同13.两样本均数比较,经检验得出差别有统计学意义的结论时,P越小,说明()A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同14.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,为较好的分析此数据,应用的统计检验方法是()A.配对检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验15.两组数据作均数差别t检验,要求数据分布近似正态而且()A.要求两组数据均相近,方差相近B.要求两组数据方差相近C.要求两组数据相近D.均数及方差相差多少都无所谓E.要求标准误相近16.两组数据作均数差别的t检验,其自由度为()A.n1+n2B.n1-n2C.n1+n2-1D.n1+n2-2E.n1+n2-317.在样本均数与总体均数比较时,若n=25,t=1.96,则()A.P>0.05B.P=0.05C.P<0.05D.P<0.01E.P>0.0118.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为()A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比较D.应进行假设检验后再下结论E 应增加气温数据才能做比较19.分析计数资料时,最常用的显著性检验方法是()A.t检验B.正态检验C.方差分析D.X检验法E.z检验,可认为()20.三个样本率作比较,χ2>χ20.01(3)A.各总体率不等或不全相等B.各样本率不等或不全相等C.各总体率均不相等D.各样本率均不相等E.各总体率全相等21.总体均数置信区间的宽度取决于()A.置信水平B.标准差C.标准误D.置信水平、标准差和样本含量E.样本含量22.四个百分率作比较,有1个理论数小于5、大于1,其他都大于5,则()A.只能作校正χ2检验B.不能作χ2检验C.作χ2检验不必校正D.必须先作合理的合并E.要用精确概率法23.某医生对一批计量、计数资料实验数据进行假设检验,结果判定如下:进行四格表χ2检验时,χ2=3.96则()A.P<0.05B.P=0.05C.P>0.05D. P<0.01E.P=0.0124.标准误的正确解释是()A.样本均数的标准差B.样本率的标准差C.标准差的平均数D.标准差的标准差E.统计量的标准差参考答案1.E2.D3.E4.D5.B6.E7.D8.C9.E 10.B 11.E 12.E 13.C 14.A 15.B 16.D 17.A 18.D 19.D 20.A 21.D 22.C 23.A 24.A。
统计学原理模拟试卷及参考答案

统计学原理模拟试卷及参考答案统计学原理试卷(一)一、单项选择题(每题2分,共20分):1、以所有工人为总体,则“工龄”是()A、品质标志B、数量标志B、标志值 D、质量指标2、在变量数列中,若标志值较小的组而权数大时,计算出来的平均数()A、近标志值较大的一组B、接近标志值较小的一组C、不受次数影响D、仅受标志值的影响3、由组距数列确定众数时,如果众数相邻两组的次数相等时,则()A、众数为零B、众数就是那个最大的变量值C、众数组的组中值就是众数D、众数就是当中那一组的变量值4、某企业产品产量增长30%,价格降低30%,则总产值()A、增长B、不变C、无法判断D、下降5、已知某厂甲产品的产量和生产成本与直线存在线性相关关系,当产量为1000件时,其生产总成本为3万元,不随产量变化的成本为0.6万元,则成本总额对产品产量的回归方程为()(4分)A、Yc=6+0.24X B Yc=6000+24XC、Yc=24+6000XD、Yc=2400+6X6、在简单随机重复抽样的情况下,如果抽样误差减少一半(其他条件不变),则样本单位必须()A、增加两倍B、增加到两倍C、增加四倍D、增加三倍7、抽样误差的大小()A、即可避免,也可控制B、既无法避免,也无法控制C、可避免,但无法控制D、无法避免,但可控制8、如果时间数列环比增长速度大体相同,可以拟合()A、指数曲线B、抛物线C、直线D、无法判断9、若职工平均工资增长10.4%,固定构成工资指数增长15%,则职工人数结构影响指数为A、96%B、126.96%C、101.56%D、125.4%二、多项选择题(每题2分,答案有选错的,该题无分;选择无错,但未选全的,每选对一个得0.5分,共10分)1、影响样本单位数的主要因素是()A、总体标志变异程度B、抽样推断的可靠程度C、极限误差的大小D、抽样方法和组织形式的不同E、人力、物力、财力的可能条件2、标志变异指标可以反映()A、社会活动过程的均衡性B、社会生产的规模和水平C、平均数代表性的大小D、总体各单位标志值分布的集中趋势E、总体各单位标志值分布的离中趋势3、在算术平均数中()A、算术平均数容易受极大值的影响B、调和平均数容易受到极小值的影响C、算术平均数和调和平均数都不受极端值的影响D、中位数和众数不受极端值影响E、中位数易受极小值影响,众数易受极大值影响4、如果一个反映多种商品销售量变动的综合指数为110%,其分子、分母之差为850万元,则可以说()A、平均说来,商品的销售量和价格上升了10%B、商品销售量增加了850万元C、商品销售额增加了10%D、商品销售量增加了10%E、由于商品销售量增加而使商品销售额增加了850万元5、某厂3位职工的工资分别为800元、1000元、1500元,则这里()A、有三个变量B、只有一个变量C、有三个变量值D、只有一个变量值E、既有变量,也有变量值三、填空题(每空1分,共10分)1、指标的数值随总体范围的大小而增减,指标的数值不随总体范围的大小而增减。
统计学原理试卷及参考答案

《统计学原理》试卷及答案一.单项选择题(每小题1分,共15分) 1、一个统计总体( D )A 、只能有一个标志B 、只能有一个指标C 、可以有多个标志D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( C )A 、2000名学生B 、 2000名学生的学习成绩C 、每一名学生D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( B )。
A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( C )。
A 、工业普查B 、工业设备调查C 、职工调查D 、未安装设备调查5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( B )。
A 、调查时间B 、调查期限C 、标准时间D 、登记期限6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( B )A 、50在第一组,70在第四组B 、60在第三组,80在第五组C 、70在第四组,80在第五组D 、80在第四组,50在第二组7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( A )A 、简单算术平均法B 、加权算术平均法C 、加权调和平均法D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( B )A 、计划期初应达到的水平B 、计划期末应达到的水平C 、计划期中应达到的水平D 、整个计划期应达到的水平9、某地区有10万人,共有80个医院。
平均每个医院要服务1250人,这个指标是( B )。
A 、平均指标B 、强度相对指标C 、总量指标D 、发展水平指标10、时间序列中,每个指标数值可以相加的是( B )。
A 、相对数时间序列B 、时期数列C 、间断时点数列D 、平均数时间序列11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( B )。
统计学考试试题及答案

统计学考试试题及答案一、单选题1. 在统计学中,描述一个数据分布中心位置的指标是:A. 方差B. 标准差C. 中位数D. 众数答案:C. 中位数2. 下列哪个统计学概念最能反映数据的离散程度:A. 四分位差B. 标准差C. 平均值D. 方差答案:B. 标准差3. 在假设检验中,我们设定的用于比较的两个假设是:A. 原假设和备择假设B. 显著性水平和临界值C. 双侧检验和单侧检验D. 误差类型Ⅰ和误差类型Ⅱ答案:A. 原假设和备择假设二、多选题4. 下列哪些是描述统计学的内容(可多选):A. 参数估计B. 假设检验C. 因子分析D. 方差分析答案:A. 参数估计,B. 假设检验,D. 方差分析5. 下列哪些是推论统计学的内容(可多选):A. 描述统计学B. 方差分析C. 置信区间估计D. 方差分析答案:B. 方差分析,C. 置信区间估计三、简答题6. 请简要说明什么是标准正态分布。
答:标准正态分布是一个均值为0,标准差为1的正态分布,其概率密度函数为f(x) = (1/(√(2π)))*e^(-x^2/2)。
标准正态分布的形状是对称的,且其曲线在均值处高峰,分布的两侧逐渐趋近于0。
7. 什么是抽样误差?该如何减小抽样误差呢?答:抽样误差是由于样本抽取不完全随机导致的统计量与总体参数之间的偏差。
要减小抽样误差,可以采取增加样本容量、采用随机抽样、增加调查问卷的覆盖面等方法来提高抽样的随机性和代表性,从而降低抽样误差的发生概率。
以上就是统计学考试试题及答案的内容,希望能对您的学习和复习有所帮助。
祝您取得优异的成绩!。
统计学期末考试试题及答案(共2套)

期末考试 统 计 学 课程 A 卷试题一、单项选择题(在每小题的四个备选答案中选择 一个正确的答案代码填入题前括号内,每小题1分,共10分)【 】1、甲、乙两组工人的平均日产量分别为18件和15件。
若两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重上升,则两组工人总平均日产量会A 、上升B 、下降C 、 不变D 可能上升,也可能下降【 】2、甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差8.4分,则A 、 乙班学生平均成绩代表性好一些B 、甲班学生平均成绩代表性好一些C 、无法比较哪个班学生平均成绩代表性好D 、两个班学生平均成绩代表性一样【 】3、某企业单位产品成本计划在上月的基础上降低2%,实际降低了1.5%,则单位产品成本降低计划完成程度为A 、 75%B 、 99.5%C 、100.5%D 、 133.2%【 】4、某企业最近几批产品的优质品率P分别为85%、82%、91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选 A 、91% B 、85% C 、94% D 、82% 【 】5、一般而言,总体平均数的无偏、有效、一致估计量是A 、样本平均数B 、样本中位数C 、 样本众数D 、不存在 【 】6、单相关系数等于零时意味着变量X 与Y 之间一定 A 、无任何相关关系 B 、无线性相关关系 C 、无非线性相关关系 D 、以上答案均错误 【 】7、在右侧检验中,利用P 值进行检验时,拒绝原假设的条件是A 、P 值> αB 、P 值>βC 、 P 值< αD 、 P 值<β【 】8、正态总体,方差未知,且样本容量小于30,这时检验总体均值的统计量应取 A 、nSx Z 0μ-=~N(0,1) B 、 nx Z σμ0-=~N(0,1)C 、)1(~)1(2222--=n Sn χσχ D 、)1(~0--=n t nSx t μ【 】9、原始资料平均法计算季节指数时,计算各年同期(月或季)的平均数,其目的是消除各年同一季度(或月份)数据上的A 、季节变动B 、循环变动C 、长期趋势D 、不规则变动 【 】10、为了分析我校不同专业学生的某次统计学测验成绩是否有显著差异,可运用方差分析法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学第二套试卷及参考答案一、最佳选择题(40分)1.均数是表示变量值_A_水平的指标。
(A) 平均(B)变化范围(C)频数分布(D)相互间差别大小2.原始数据同乘以一个不等于0的常数后_D_。
(A) 均数不变、标准差变(B)均数、标准差均不变(C)均数变、标准差不变(D)均数、标准差均变3.描述正态或近似正态分布资料特征的是__B____。
(A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距4.描述偏态分布资料特征的是_A__。
(A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距5.均数与标准差计算的数值A 。
(A)均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以(C)两者都可以是负数(D)两者都不可以是负数6、比较身高和体重两组资料的变异度大小宜采用___C___。
(A) 极差(B)标准差(C)变异系数(D)四分位间距7.说明某事物内部各组成部分所占比例应选_B___。
(A) 率(B)构成比(C)相对比(D)标准差8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。
(A)S (B)R (C)CV (D)9. 已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是 C(A)5 (B)28 (C)29 (D)410.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为 A(A)95% (B)49.5% (C)99% (D)97%11.两样本均数间的差别的假设检验时,查t界值表的自由度为 C(A)n-1(B)(r-1)(c-1)(C)n1+n2-2(D)112.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A(A)总体中个体值存在差别(B)样本中个体值存在差别(C)样本只含总体的一部分(D)总体均数不等于013.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小 B(A)α=0.05 (B) α=0.20 (C) α=0.01 (D) α=0.1014. 比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。
(A)线图(B)条图(C)半对数线图(D)圆图15.构成比用来 C(A) 反映某现象发生的强度(B) 表示两个同类指标的比(C) 反映某事物内部各部分占全部的比重(D) 表示某一现象在时间顺序的排列16.某医院的资料计算各种疾病所占的比例,该指标为 D(A)发病率(B) 患病率(C) 相对比(D)构成比17.等级资料的比较宜用 C(A) t检验(B) 检验(C) 秩和检验(D) 方差分析18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于 C(A)T11(B)T12 (C) T21 (D)T2219.四格表校正x2检验公式适用于 D(A)n<40, T>5 (B)n<40, 1<T<5(C)n>40, T<5 (D)n>40, 1<T<520.同一双变量资料,进行直线相关与回归分析,有 B(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b二、填空题12分1、统计资料按其性质不同,通常将资料分为(计量、计数、等级) 三种类型。
2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为( 统计描述)与(统计推断)两个阶段。
3、计量资料,随着样本例数的增大,S逐渐趋向于( σ ),逐渐趋向于( 0 )。
4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。
5、( 相关分析)侧重于考察变量之间相关关系密切程度,(回归分析)则侧重于考察变量之间数量变化规律。
6、对某地一年级12名女大学生体重(x :单位kg)与肺活量(y:单位L)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:?=0.000419+0.058826X,这意味着体重每增加1kg ,肺活量平均增加(0.058826L );且两者之间为( 正)相关。
三、名词解释13分1.参数和统计量2.概率3.计数资料4.回归系数答案见书本相应的位置四、简答题15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
五、计算分析题1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
修改表:某年某地1964-1968年某病住院期与急性期病死率比较年份病例数住院期急性期死亡总数总病死率(%)死亡数病死率(%)1964 17 8 47.1 7 41.21965 13 5 38.5 4 30.81966 15 7 46.7 6 40.01967 15 6 40.0 6 40.01968 12 4 33.3 4 33.3合计72 30 41.7 27 37.52、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可)表1 某新药临床试验部分指标医院代码性别身高体重疗效组别1 1 175.00 63.00 3 01 2 157.00 54.00 2 01 1 178.00 67.002 11 2 165.00 50.00 3 0. 2 162.00 51.00 4 0. 2 156.00 48.00 2 1. 1 176.00 62.00 2 1. 1 184.00 72.00 2 05 1 168.00 65.00 2 05 2 166.00 46.00 2 1分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。
两组疗效比较可用秩和检验。
第三套试卷及参考答案一、选择题20分1.7人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为__C__A.1:12.4 B.1:8 C.1:16 D.1:8~1:162.比较身高和体重两组数据变异度大小宜采用___A___A.变异系数 B.方差 C.极差 D.标准差3.下列关于个体变异说法不正确的是__C__A.个体变异是生物体固有的。
B.个体变异是有规律的。
C.增加样本含量,可以减小个体变异。
D.指标的分布类型反映的是个体的分布规律。
4.实验设计的原则是__C___A.对照、随机、均衡B.随机、重复、均衡C.对照、重复、随机D.随机、重复、齐同5.说明某现象发生强度的指标为__B____A.平均数B.率C.构成比D.相对比6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C表后,其卡方值的自由度为__C_A.8 B.1 C.3 D.跟样本含量有关7.假设检验中的第一类错误是指_A__所犯的错误。
A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0C.拒绝了实际上不成立的H0D.不拒绝实际上不成立的H08.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高__D___ A.B.C.D.9.两样本均数的t检验对资料的要求是_D___A.正态性、独立性、方差齐性B.资料具有代表性C.为定量资料D.以上均对10.四个率的比较的卡方检验,P值小于0.01,则结论为_D__A.四个总体率均不相等;B.四个样本率均不相等;C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。
二、名词解释10分1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率;答案:见书上相应的地方三、填空题10分1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样(系统抽样),分层抽样,整群抽样2、统计推断的内容主要包括参数估计和假设检验。
3、临床观察7名某病患者,其潜伏期(天)各为:3,7,9,5,6,9,16,则其全距为13天。
4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:⑴有效⑵无效⑶有效(4)有效……⒇无效,这种资料属于何种类型资料计数资料。
5、实验研究的基本要素是:处理因素、受试对象、实验效应四、简答题20分1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。
2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95% 表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。
为什么?答:没有这个规律。
相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。
五、分析计算题40分1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。
男婴x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 女婴x2 7.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3 (1)该资料是数值变量资料还是分类资料?数值变量资料(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t检验(3)经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。