研究生医学统计学试题
研究生医学统计学试题

《医学统计学》试题注:满分300分。
最终成绩=总得分/3;说明1、试题意在考察研究生对《医学统计学》理论知识和SPSS统计软件的学习掌握情况。
2、研究生在答题过程中严禁抄袭、复印。
如发现答案雷同者,该科目成绩将判为“不及格”,后果由学生自负。
3、答题时,不写具体的操作过程(如“选择Analyze→General linear Models→Univariate…,弹出Univariate对话框”)。
4、答题时,首先应明确交代某题所用的具体统计方法。
5、答题时,只将答题有关的SPSS输出结果粘贴到答案中,并且对结果要做出必要的解释;对答题无关的输出结果不要粘贴到答案中。
如果对结果不做任何解释,或将跟答题无关的输出结果粘贴到答案中,将对成绩有严重影响。
6、试题(卷)的答案要求A4纸双面打印。
1、(20分)从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下表1,①求其均数,中位数,标准差,标准误,最大值,最小值,极差、第2.5、25、75、97.5百分位数(10分);②编制(改进)频数分布表、绘制直方图(各5分)。
表1 某年某单位101名正常成年的血清总胆固醇(mmol/L)2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.80 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.95 3.00 3.262、(10分)为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表2第(1)~(3)栏。
研医学统计学试题

研究生医学统计学模拟题——共八套医学统计学葵花宝典系列之二模拟练习题(一)一、问答题1.数值变量资料(定量资料)和分类变量资料(定性资料、计数资料)常用的描述性指标及其适用条件或意义?2.常用的抽样分布及其参数估计(不要求写出各分布的概念和理论分布模型)?3.假设检验的基本步骤?4.方差分析的基本思想?5.四个表资料假设检验的方法和应用条件6.你学过那些涉及的秩和检验?什么条件应用秩和?7.何谓随访资料中的截尾值数据?退出终止失访8.实验设计的基本要素与基本原则?二、计算题1.某单位检测两公司纯净水的大肠杆菌污染情况,检测结果见下表。
问:甲、乙两公司纯净水产品大肠杆菌污染是否相同从正态分布且两组方差齐,比较两种节育器放置一个月后月经增加量的平均水平是否相等?硅胶:23 13 13 14 23 22 20 21 18 21铜T:40 42 41 49 40 48 403.在人类遗传学中皮纹是一个重要的遗传性状,且存在遗传异质性,某研究单位调查某地男性191人,得左手皮纹主线指数的军属为6.79,标准差为1.66,试估计该地区男性左手皮纹主线指数95%的可信区间4.10名健康儿童头发和全血中硒含量(单位:1000ppm)的测量结果如下,试做直线回归分析发硒70 66 88 69 91 73 66 96 58 73血硒17 10 13 11 16 9 7 14 5 10模拟练习题(二)一、问答题1.数值型变量资料中描述离散趋势的指标有哪些?其应用条件分别是什么??2.数值变量总体比较分类变量总体率符合possion分布的总体计数的95.4%可信区间3.举例说明实验设计的基本要素4.方差分析的基本思想、应用条件,至少举出3种设计类型资料?方差分析的总变异是如何分解的5.生存分析对随访资料有哪些基本要求6.多元线性回归、logistic回归、cox回归对变量有哪些要求??7.试述完全随机分析世纪的两样本比较的统计分析思想8.A、B两种减肥药,30名受试者按同性别、体重相近配对后,随即服用A、B药,一月后观察体重下降值(1)这是什么类型的分析(2) 采用何种分析方法(3) 变量或资料的类型是什么 模拟练习题(三)一、问答题1、 简述直线回归分析基本内容和步骤(10分)2、 什么是生存时间?生存时间资料有何特点?生存分析常用的统计分析方法有哪些?(10分)3、 请写出logistic 回归和Cox 回归基本模型的表达形式及其应用条件,并解释其中偏回归系数的流行病学含义(10分)4、 学过的假设检验中,哪些方法用到了t 分布或u 分布原理,并写出其相应的应用条件(15分)5、 简述分类变量资料假设检验的统计分析思路(15分)6、 何谓方差分析的基本思想?列出交叉设计、拉丁方设计的方差分析中总变异的分解方法(7分)7、 某医院为观察某新药治疗急性支气管炎的疗效,用氨苄青霉素作对照,病人入院时,全温在39度以下的分在治疗组,体温在39度以上的分在对照组。
研究生医学统计学复习题

医学统计学第一阶段复习题一、单项选择题1. 下列资料属于有序分类变量的是()。
A.白细胞计数B.患者治疗结果评定(治愈、好转、有效、无效)C.患者年龄D.住院天数2. 统计学中所说的总体是指()。
A.根据研究目的确定的研究对象的全体B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体3. 比较身高和体重两组数据变异程度大小宜采用()。
A.变异系数B.方差C.标准差D.四分位数间距4. 正态曲线下、横轴上,从-∞到均数的面积为()。
A .95%B.50% C.97.5%D.99%5. 计算一群同质个体的体重的平均水平,选择()。
A.均数B.几何均数C.中位数D.四分位数6. 描述样本均数离散程度的指标,宜选择( B )。
A.标准差B.标准误C.变异系数D.四分位数间距7. 横轴上,标准正态曲线下从0到1.96的面积为()。
A.95% B.45% C.47.5%D.49.5%8. 计算一群同质个体的胸围的平均水平,选择()。
A.几何均数B.均数C.中位数D.四分位数9. 比较某地1~2岁和10~12岁儿童身高的变异程度,宜用()。
A.极差B.四分位数间距C.变异系数D.方差10. 横轴上,标准正态曲线从-2.58到0的面积为()。
A.95% B.45% C.49.5%D.47.5%11. 计算一群同质个体的收缩压的平均水平,选择( C )。
A.中位数B.几何均数C.均数D.标准差12. 用均数和标准差可全面描述其特征的分布是()。
A.正偏态分布B.负偏态分布C.任意分布D.正态分布13. 横轴上,正态曲线下从μ到μ+2.58σ的面积为()。
A.49.5% B.47.5% C.45% D.95%14. t分布曲线和标准正态曲线比较,()。
A.中心位置左移B.中心位置右移C.分布曲线平坦一些D.分布曲线陡峭一些15. 由样本推断总体,样本应该是()。
A.总体中有价值的一部分B.总体中有代表性的一部分C.总体中的任意一部分D.总体中典型部分16. 当样本量增大时,以下说法正确的是()。
研究生医学统计学试题

2.完全随机设计方差分析属于单向方差分析,随机区组设计方差分析属于双向方差分析。
3.前者变异拆分:SS总=SS组间+SS误差(或SS组内),后者变异拆分:SS总=SS区组+SS处理+SS误差。
故随机区组实验设计得方差分析检验效能更高。
3、率和构成比有何不同?为什么不能以比代率?一、率和比例的概念不同1、率:又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
率的比例基数可以是百分率,千分率,万分率,十分率等。
应该根据其在医学中的使用习惯来使用。
人口学指标如出生率,死亡率等习惯用千分率;恶性肿瘤的发病率,死亡率一般用万分率或十万分率;住院病人的病死率,床周转率等则常用百分率。
2、比例指标,通常计算构成比,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
二、率和比例的计算方法不同1、率的计算公式为:率=发生某现象的观察单位数/可能发生某现象的观察单位总数*KK为比例系数,可以为100%,10000/万,100000/10万等。
2、构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
4.举例说明回归分析的用途:回归分析主要是研究两个变量间的数量依存关系的统计学方法。
例如欲研究血清胆固醇含量与舒张压间是否存在依存关系,可在某大学随机抽取20名成年男性,测得他们的血清胆固醇含量和舒张压,并对两者指标采用简单线性回归方法进行分析可得是否存在依存关系。
5、简述非参数检验的优缺点,什么情况下会用非参数检验?优点:(1)对总体分布未做出任何假定,因此适用于任何分布的资料。
如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。
(2)易于收集资料、统计分析比较简便。
缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。
硕士研究生医学统计学期末考试

硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1 分,共20 分)1. 用配对t 检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2. 对多个总体率有无差别做假设检验时,如果P< 0.05,则拒绝H),差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
( )4. 成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5•做t检验时,如果t > t0.05,v ,则P< 0.05,差别无统计学意义,可认为两总体均数不相等。
2的检验,当n A 40,T> 5时,只能用四格表x2检验的专用公式,不能用确切概率法。
()6. 四格表x的检验,当n A 40, T A 5时,只能用四格表x 2检验的专用公式,不能用确切概率法。
()7. Logistic 回归中, 因变量可为二分类, 多分类或等级资料。
( )8. 期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10. 机械抽样和立意抽样属于非概率抽样。
( )11. 样本含量的估计需要事先确定的是12. 多个样本比较的秩和检验,用K-WH 检验,当样本含量足够大时,可用z 检验近似。
()13. 同一资料,有 。
()14. 发病率高的疾病称为多见病。
( )15. Logistic 回归可用于筛选疾病的危险因素。
()20. 如果要控制其他变量的影响,看某两个变量的相关性,可用偏相关进行分析。
()、选择题(每题 1分,共20 分)1. 用两种药物治疗冠心病病人,结果见下表。
问两种药物治疗冠心病的疗效是否不同,较 好的统计方法是 _______a. R x C 表x 2检验b. Wilcox on 秩和检验c. Pearson 直线相16. 对于单向有序行列表,如果要做优劣检验,2检验中,x 2值越大,P 值越小, 17四格表的x大,P 值越小,说明两总体率的差别越大。
研究生医学统计试题

研究生?卫生统计学?课程理论考试卷〔A卷〕〔试卷总分:55分,考试时间:45分钟,试题内容9页,空白纸3页〕姓名:学号:电脑号:试题号:一、单项选择题: 每题1分,55题,共计55分1. 描述一组偏态分布资料的集中趋势时,最适宜选择的指标是A.几何均数B.算术均数D.众数2. 测量体重、转氨酶等指标所得的资料叫做:〔〕A、计数资料B、计量资料C、等级资料D、间断性资料E、分类资料3.统计中所说的总体是指:( )A根据研究目确实定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体4.抽样的目的是:( )A、研究样本统计量B、研究总体参数C、研究典型案例D、研究误差E、样本推断总体参数5. 下面哪个不是样本的指标〔〕A、xB 、pC、rD、E、s6. 均数与标准差适用于A、正偏态分布资料B、负偏态分布资料C、正态分布资料D、频数分布类型不明的资料E.不对称分布的资料7.两样本均数的t检验中,检验假设〔H〕是A μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X28. 作单侧检验的前提是:A、新药优于旧药B、新药差于旧药C、不知新药好还是旧药好D、新药不比旧药差E、新旧药差不多好9. 在假设检验时,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,那么〔〕A. 增大了第一类错误B. 减小了第一类错误C. 增大了第二类错误D. 减小了第二类错误E. 以上都不正确10. 两样本均数比拟的t检验,差异有统计学意义时,P越小,说明〔〕A.两样本均数差异越大B.两总体差异越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同11. 两个样本含量分别为20和30的样本作t检验, 自由度为: 〔〕A.50B.49C.25D.2412.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是 ( ) A率 B构成比 C相比照 D绝对数 E标化率13.卡方检验中自由度的计算公式是 ( )A行数×列数 B n-1 C N-k D〔行数-1〕〔列数-1〕 E行数×列数-114.反映某一事件发生强度的指标应选用( )A 构成比B 相比照C 绝对数D 率 E变异系数15.欲比拟两地死亡率,计算标准化率可以〔〕。
硕士研究生医学统计学期末考试

硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1分,共20分)1.用配对t检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2.对多个总体率有无差别做假设检验时, 如果P<0.05, 则拒绝H0, 差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
()4.成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5.做t检验时, 如果t>t0.05,v, 则P<0.05,差别无统计学意义, 可认为两总体均数不相等。
2的检验, 当n≥40,T≥5时, 只能用四格表χ2检验的专用公式, 不能用确切概率法。
( )6.四格表χ的检验, 当n≥40,T≥5时, 只能用四格表χ2检验的专用公式, 不能用确切概率法。
( )7.Logistic回归中, 因变量可为二分类, 多分类或等级资料。
( )8.期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10.机械抽样和立意抽样属于非概率抽样。
( )11.样本含量的估计需要事先确定的是δ,β,α,σ。
( )12.多个样本比较的秩和检验, 用K-W H检验, 当样本含量足够大时,可用z检验近似。
( )13. 同一资料,有。
( )14.发病率高的疾病称为多见病。
()15.Logistic回归可用于筛选疾病的危险因素。
( )16.对于单向有序行列表, 如果要做优劣检验,最好的方法是χ2检验。
( )17四格表的χ2检验中, χ2值越大, P值越小, 说明两总体率的差别越大。
( )检验中, χ2值越大, P值越小, 说明两总体率的差别越大。
研究生医学统计基础题

最佳选择题1.以下指标中(D )可用来描述计量资料离散程度。
A.算术均数B.几何均数C.中位数D.极差E.第50百分位数2.偏态分布宜用( C )描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差3.用均数和标准差可全面描述(A )资料的分布特征。
A.正态分布B.左偏态分布C.右偏态分布D.对称分布E.任何计量资料分布 ;4.正态曲线下、横轴上,从均数μ到+∞的面积为( C )A.97.5% B.95% C.50% D.5% E.不能确定(与标准差的大小有关)5.若X~N(μ,σ),则X的第95百分位数为(D)A.μ-1.64σB.μ-1.96σC. μ+σD.μ+1.64σE.μ+1.96σ6.若正常成人的血铅含量X近似对数正态分布,则可用公式()制定95%正常值范围。
(其中Y=logX)A. B. C. D. E.7.各观察值均加(或减)同一个数后,( D )A.均数不变,标准差不一定变B. 均数不变,标准差变C. 均数不变,标准差也不变D. 均数变,标准差不变E. 均数变,标准差也变8.各观察值同乘以一个不等于0的数后,( D )不变。
A.均数B.标准差C.几何均数D.中位数E.变异系数9.( A )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态E.对数偏态10.最小组段无下限或最大组段无上限的频数分布表资料,可用( D )描述其集中趋势。
A.均数B.标准差C.几何均数D.中位数E.四分位数间距医学统计学基础理论复习题一、是非题:(如判断该题正确则在题后括号内打“√”,判断该题错误则在题后括号内打“×”)1.农村妇女生育情况调查结果如下所示,该资料类型为计量资料。
( f )生育胎次 0 1 2 3 4妇女人数 5 25 70 30 142.观察到50例某传染病的潜伏期,整理成频数表如下:这是计量资料。
( f )潜伏期(小时) 12~ 36~ 60~ 84~ 108~例数 8 22 12 6 23. 身高的标准差比体重的大,因此,身高的变异程度比体重的大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南昌大学医学院硕士生试卷试卷编号:卷课程名称:医学统计学 适用专业:科学学位 专业:班级姓名: 学号: 学院 (系 ): 考试日期: 题号 一 二 三 四 五 六七 八九十 总分 统分 题分 30152530 100 签名得分考生注意事项: 1、本试卷共 6 页,请查看试卷中是否有缺页或破损。
如有立即举手报告以便更换。
2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。
一、最佳选择题 (每题 2 分,共 30 分)得评 阅把每题的答案填入下表中: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ABCDBBACCCBBCDB1、描述一组正态分布资料的集中趋势,以指标为好。
A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数2、比较成人身高和儿童身高的离散趋势,宜用 。
A. 标准差;B. 变异系数;C. 方差;D. 离均差平方和3、对于正态分布资料, X +1.96S ,所对应的面积占总面积的 。
A. 95% ;B. 99% ;C. 47.5%;D. 49.5%4、下列说法哪个是错误的?中位数适用于描述资料。
A. 最小组段无下限;B. 最大组段无上限;C. 偏态分布;D. 正态分布 5、 大,表示用该样本均数估计总体均数的可靠性小。
A. S X ;B. S ;C.CV ;D. Q U —Q L 6、某地 1992 年随机抽取 100 名健康女性,算得其血清总蛋白含量的均数为 74g/L ,标准差为 4g/L ,则其 95%的可信区间为 。
A. 74 ± 1.96× 4;B. 74 ±1.96× 4/10;C. 74± 2.58×4;D. 74± 2.58×4/10第1页共6页南昌大学医学院硕士生试卷7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。
A. α =0.01;B. α=0.05;C. α =0.10;D. α=0.208、两样本均数比较的t 检验结果, P<0.05 ,可认为。
A. 两样本均数不等; B. 两样本均数相等;C. 两总体均数不等;D. 两总体均数相等9、完全随机设计的方差分析结果,P≤ 0.05,可认为。
A. 各样本均数不等或不全等;B. 各样本均数都不相等;C. 各总体均数不等或不全等;D. 各总体均数都不相等10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。
A. 年发病率;B. 年患病率;C. 患病构成比;D. 患者平均数11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。
A.将两县的总死亡率直接比较;B.对年龄进行标准化后,再比较两县总死亡率;C.将两县的总死亡率进行 t 检验后再比较;D.将两县的总死亡率进行χ2检验后再比较12、下面哪一点不是Poisson 分布的性质。
A. λ =σ2;B. 当λ≥ 20 时,近似正态分布;C. 可加性;D. 相互影响性13、χ2检验中理论数T 的计算式为。
A. nr (1 nc ) ;B. (1 nr ) nc ;C. nr nc ;D. nr ncN N N N 14、已知两组计量资料方差不齐,可用检验。
A. t 检验;B. U 检验;C. F 检验;D. 秩和检验15、对一组既做相关分析又做回归分析的资料,有。
A. b=r ;B. t b=tr;C. b=a;D. r=1第2页共6页南昌大学医学院硕士生试卷二、名词解释 (每题 3 分,共15 分 )得评阅1.总体:总体是根据研究目的所确定的所有同质个体某实际值的集合。
2.变异:变异指的是同质个体中同一观察指标的个体观察值之间的差异。
3.抽样误差:由于个体变异和随机抽样的原因,用样本统计量估计总体参数往往存在误差,称样本统计量与总体参数之间的差异为抽样误差。
4.第一类错误:拒绝实际上成立的 H0,这类“弃真”的错误称为第一类错误,第一类错误的概率常用α表示。
5.参考值范围:参考值是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化指标常数,也称正常值。
参考值范围是指在正常人群中,95% 对象的观察值范围。
三、简答题 (每题 5 分,共25 分 )得评阅1、简述计量资料统计描述指标体系。
①频数分布:频数表、频数图②集中趋势描述:算术均数、几何均数、中位数、众数③ 离散趋势:极差、四分位数间距、标准差、变异系数、方差2、完全随机实验设计和随机区组实验设计的方差分析,何者检验效能更高,为什么?1.完全随机设计没有把混杂因素(如年龄、体重等)考虑进去,而随机区组设计通过设置区组而使得混杂因素在同一区组内均匀。
第3页共6页南昌大学医学院硕士生试卷2.完全随机设计方差分析属于单向方差分析,随机区组设计方差分析属于双向方差分析。
3.前者变异拆分:SS 总 =SS 组间 +SS 误差(或SS 组内),后者变异拆分:SS 总 =SS 区组+SS 处理 +SS 误差。
故随机区组实验设计得方差分析检验效能更高。
3、率和构成比有何不同?为什么不能以比代率?一、率和比例的概念不同1、率:又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
? 率的比例基数可以是百分率,千分率,万分率,十分率等。
应该根据其在医学中的使用习惯来使用。
人口学指标如出生率,死亡率等习惯用千分率;恶性肿瘤的发病率,死亡率一般用万分率或十万分率;住院病人的病死率,床周转率等则常用百分率。
2、比例指标,通常计算构成比,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
二、率和比例的计算方法不同1、率的计算公式为:率=发生某现象的观察单位数/可能发生某现象的观察单位总数*KK 为比例系数,可以为100%, 10000/万 ,100000/ 10 万等。
2、构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
4.举例说明回归分析的用途:回归分析主要是研究两个变量间的数量依存关系的统计学方法。
例如欲研究血清胆固醇含量与舒张压间是否存在依存关系,可在某大学随机抽取 20 名成年男性,测得他们的血清胆固醇含量和舒张压,并对两者指标采用简单线性回归方法进行分析可得是否存在依存关系。
5、简述非参数检验的优缺点,什么情况下会用非参数检验?优点:( 1)对总体分布未做出任何假定,因此适用于任何分布的资料。
如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。
( 2)易于收集资料、统计分析比较简便。
缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。
满足参数检验要求的资料分析时应首选参数检验方法。
不满足参数检验要求的资料应选非参数检验。
适用以下情况:1.分布不明的小样本计量资料; 2.等级资料; 3.不满足正态和方差齐性条件的小样本计量资料;4.一端或两端是不确定数值(如 <0.5、>5.0等)的计量资料第4页共6页南昌大学医学院硕士生试卷四、计算分析题 (每题 15 分,共 30 分 )得评 阅22; u0.05=1.96; u 0.01=2.58 ) (参考界值: χ0.05, 1=3.84 ; χ0.01,1=6.63 1、某地随机抽样调查了360 名健康成年男性的红细胞数,得均数为4.66×1012/L ,标准差为 0.58 ×1012/L 。
请问:①该地健康成年男性红细胞数的均数是多少?②测得某成年男性的红细胞数为 4.00 ×1012/L ,该男性红细胞数是否正 常?解:①正常人红细胞数是服从正态分布,此次抽样的样本量为 360,大于 100,故近似标准12 /L 正态分布。
x- u0.05 ×S x =4.66×10 12-1.96× 0.58 ×10 12/√ ̄360=4.60 ×1012 /L x+ u0.05×S x=4.66×10 12 +1.96× 0.58 ×10 12/√ ̄360=4.72 ×1012 12)/L 。
该地健康成年男性红细胞数总体均数的 95%可信区间为( 4.60×10 , ×104.72 ②H0: μ=μ 0=4.66×1012/L , 即该男性红细胞数与该地健康成年男性红细胞数均数相等。
H 1:μ ≠ μ 0=4.66×1012/L ,即该男性红细胞数与该地健康成年男性红细胞数均数相等。
α=0.05u=( 4.00 ×1012- 4.66× 1012)/ (0.58 ×1012/ √ ̄ 360 ) =-0.02 ,查表得 P<0.05 。
按 α=0.05 水准,拒绝 H0,接受 H 1,差异有统计学意义。
故该男性红细胞数属于不正常。
2、某医师在甲、乙两地各调查了 3 万人,观察食管癌的患病情况,结果甲地发现食管癌患者 30 人,乙地发现食管癌患者 20 人。
假定甲、乙两地人口年龄构成相同,问甲、乙两地食管癌患病率有无差别?( 10 分)解:由题意可得,甲、乙两地食管癌服从 Poisson 分布。
H0: Π 甲 =Π乙 ,甲、乙两地食管癌患病率相等。
α=0.05 H1:Π 甲≠ Π ,甲、乙两地食管癌患病率不等。
乙2=60000 ×( 30×29980-20×29970)2/ (30000×30000×50×59950) =2.001查表得 P<0.05 。
按α=0.05 水准,拒绝 H0,接受 H1,差异有统计学意义。
甲、乙两地食管癌患病率有差别,甲地高于乙地。
第5页共6页南昌大学医学院硕士生试卷第6页共6页。