医学统计学 研究生期末考试版(包含大题)
福建医科大学《医学统计学》08级研究生期末考试卷

组别.........体检数.........血清甘胆酸超标数.........γ-谷氨酰转肽酶超标数.........TNT组.........71. 54. 1.对照组.........40. 2. 1.5、某医生收集了100名儿童的身高,求出其与各自父母身高的相关系数r值(非正态)如下,年龄:.出生时.3个月、.6个月、9个月、12个月、16个月、19个月、24个月、2、5岁、3岁(共9个).相关系数:.0.12、0.31、0.37、0.44、0.47、0.5、0.52、0.28、0.49问是否随着年龄的增长,r值也增加。
《医学统计学》2007研究生考试题目一问答题:20例的样本,其95%可信区间是(X-1。
96标准误,X+1。
96标准误),正确吗?为什么?二。
计算题:1。
从一条河取六个点,每一个点在深浅位置各测汞值得出一个表,分析河水深浅位置汞值有无差别。
(配对t检验)2。
分别用猪油茶油奶油喂养三组老鼠共60只,每组20只,2个月后得出下列血脂数值,请问饲料对血脂有疗效好一般差试验组12 10 3对照组2 4 7&分析两种治疗方法有差别吗?4。
LXX&& LYY&&&&&& LXY&& 已知,检验一个回归方程。
5。
中西方法治疗支气管炎有效无效普通型喘息型混合型分析治疗对各型有无区别?(因为是记忆,数据记不起)《医学统计学》2003、2004级七年制(计算分析题)1、一组偏态分布资料,计算集中和离散趋势指标。
2、从一条河取六个点,每一个点在深浅位置各测锌值得出一个表,分析河水深浅位置锌值有无差别。
3、为研究TNT工人血清甘胆酸和γ-谷氨酰转肽酶超标情况,以随机的方式抽查TNT和对照工人血清甘胆酸和γ-谷氨酰转肽酶,资料如下表,问两种工人的这两项指标有无差别?组别体检数血清甘胆酸超标数γ-谷氨酰转肽酶超标数TNT组71 54 1对照组40 2 14、某医生收集了100名儿童的身高与其父母的相关系数r值(非正态),给出一表格,年龄&&&&&&&& 出生时3个月6个月。
《医学统计学》期末考试试卷附答案

《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》期末考试试卷附答案

《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
研究生医学统计试题

研究生《卫生统计学》课程理论考试卷(A卷)(试卷总分:55分,考试时间:45分钟,试题内容9页,空白纸3页)姓名:学号:电脑号:试题号:一、单选题: 每题1分,55题,共计55分1. 描述一组偏态分布资料的集中趋势时,最适宜选择的指标是A.几何均数B.算术均数C.中位数D.众数E.标准误2. 测量体重、转氨酶等指标所得的资料叫做:()A、计数资料B、计量资料C、等级资料D、间断性资料E、分类资料3.统计中所说的总体是指:( )A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体4.抽样的目的是:( )A、研究样本统计量B、研究总体参数C、研究典型案例D、研究误差E、样本推断总体参数5. 下面哪个不是样本的指标()A、⎺xB 、pC、rD、σE、s6. 均数与标准差适用于A、正偏态分布资料B、负偏态分布资料C、正态分布资料D、频数分布类型不明的资料E.不对称分布的资料7.两样本均数的t检验中,检验假设(H0)是A μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X28. 作单侧检验的前提是:A、已知新药优于旧药B、已知新药差于旧药C、不知新药好还是旧药好D、已知新药不比旧药差E、已知新旧药差不多好9. 在假设检验时,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则()A. 增大了第一类错误B. 减小了第一类错误C. 增大了第二类错误D. 减小了第二类错误E. 以上都不正确10. 两样本均数比较的t检验,差别有统计学意义时,P越小,说明()A.两样本均数差别越大B.两总体差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同11. 两个样本含量分别为20和30的样本作t检验, 自由度为: ()12.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是( )A率B构成比C相对比D绝对数E标化率13.卡方检验中自由度的计算公式是( )A行数×列数 B n-1 C N-k D(行数-1)(列数-1)E行数×列数-1 14.反映某一事件发生强度的指标应选用( )A 构成比B 相对比C 绝对数D 率E变异系数15.欲比较两地死亡率,计算标准化率可以()。
医学统计学课程期末考试(五)及答案

医学统计学课程期末考试(五)一、单项选择题(每题2分,共40分)1. 下面属于计数资料的是( )。
A.脉搏B. 肺活量C. 血型D.红细胞计数2. 均数抽样误差是指( )。
A. 个体值和总体均数之差B. 个体值和样本均数之差C. 样本均数和总体均数之差D. 样本率和总体率之差3. 已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,10,11,8,>20,其潜伏期的平均水平约为( )天。
A.9 B.9.5 C.10 D.10.24. 为了解某城市女婴出生体重情况,随机抽得该市区120名新生女婴,测得其平均出生体重为3.10kg ,标准差为0.50kg ,则该市女婴出生体重总体均数的95%置信区间为( )。
A .0.501.963.10⨯± B .1200.50/1.963.10⨯±C .0.501.643.10⨯± D .1200.50/1.643.10⨯±上题中算得的该市女婴出生体重总体均数的95%置信区间,可以解释为( )。
A .该市95%的女婴出生体重在此范围内 B .该市95%的女婴出生体重总体均数在此范围内C .该市女婴出生体重的总体均数在此范围内,其可信度为95%D .有95%的可信度,认为此范围包含了该市女婴出生体重的总体均数5. 两组配对数据(n=11)用差值作为变量编秩,得正秩和为12,负秩和为54,其双侧界值为T 0.1=13-53, T 0.05=10-56,T 0.02=7-59,T 0.01=5-61,其该配对研究的p 值为( )。
A. P >0.1 B. P <0.05 C. 0.05<P <0.1 D. P <0.016. 用不同药物对某病治疗后的疗效比较,得到结果如表1。
表1 不同药物对某病治疗后的疗效分组 例数 有效人数 有效率(%)甲药组乙药组150 45 30125 30 24两个有效率不同,其差别的原因可能有( ) 。
医学统计学期末试卷一删(4).doc

医学统计学期末试卷题型:A119.率标准化的主要目的是A.把率变成构成比B.消除内部构成的差异C.把大的率变小,小的率变大D.把率变成绝对数E.把构成比变成绝对数20.正态分布的中位数是A.0B. 1C. 1. 96D. 2. 58E.与"有关21.正态分布曲线下,横轴上,从-1. 64到1.64的面积为A.92. 5%B.97. 5%C.95%D.99%E.无法判断22.定性资料完全随机设计四格表资料的卡方检验,其校正公式的应用条件是A."N40 且 T>5B.77<40 且T>5C.n>40 且 1 <T<5D.7?<40 且]<TW5E.77 ^40 且 T<123.配对设计资料的符号秩和检验,可利用查表法确定值的样本例数n的范围为A.5W”W50B.37/5-50C.55S//5S30D.3</7<30E.〃>5024.随机抽样的目的是A.消除系统误差B.消除测量误差C.减少随机误差D.减少样本的偏性E.消除抽样误差25.直线回归方程中,回归系数可能的取值范围是A.(0, 1)B.[0, 1]C.(-1, 1)D.[-1, 1]E.( — 8, +8)26.当自由度趋向无穷大时,卡方分布的极限分布为A.正态分布B.t分布C.超几何分布D.二项分布E.F分布27.直线回归中,若自变量X乘以2,则回归方程A.截距改变,回归系数不变B.截距不变,回归系数变成原系数二分之一C.截距和回归系数都改变D.截距和回归系数都不变E.截距和回归系数都不能确定是否改变28.以下关于秩和检验的说法哪个是错误的A.编秩时,如遇相同数值,取其平均秩次B.符合参数检验条件时,不可用非参数检验C.当相同秩次较多时应使用校正公式D.秩和检验的检验效率局于I检验E.当样本量超出查表范围时,改用正态近似法计算统计量29.统计表的制作时需注意A.标题写在表的下方B.横标目在表的上部,纵标目在表的左侧C.横标目在表的左侧,纵标目在表的上部D.表中仅可以有顶线与底线E.表格中每个格子四边都要画线30.根据医学知识判断,以下哪组变量最适宜进行线性相关回归分析A.性别与体育锻炼强度B.膳食模式与糖尿病C.父亲身高与儿子身高D.高血压患病率与年龄E.睡眠时间与睡眠质量31.若总例数相同,则成组女检验与配对女检验相比A.成组f检验的效率高些B.配对f检验的效率高些C.两者效率相等D.两者效率相差不大E.两者效率不可比32.四分位间距可用于描述的资料分布类型是A,正偏态分布B,正态分布C,对称分布D.偏态分布E.负偏态分布33.未知且刀很小时,总体均数的95%可信区间估计的通式为A JT+L96SX + 1.96^B.*c. xDE.刀文如34.比较两组数据的偏离程度的指标是A.方差B.几何均数C.众数D.中位数E.均数35.表示什么A.总体均数的标准误B.总体均数的离散度C.变量X的可靠程度D.样本均数的标准差E.总体均数的标准差36.两变量线性相关系数r的绝对值越接近1,则有A.回归系数越大B.回归系数越小C.回归方程的总平方和越大D.回归方程的回归平方和越大E.回归方程的残差平方和越大37.对某地20岁男性身高作何种变化后,将服从标准正态分布A.自然对数变换B.求倒数C.求反对数D.减去均数除以标准差E.平方根反正弦38.描述两种不同类型疾病发病率随时间的上升速度,宜绘制的统计图是A.直条图B,半对数线图C,散点图D.线图E,直方图39.对样本的简单直线回归方程进行假设检验,得到P>Q. 05,则说明A,总体回归系数=0B,总体回归系数不为0C,不能认为总体回归系数等于0D,尚不能认为总体回归系数不为0E,无法得出结论40.仅增大样本量,则正确的是A.可信区间的可信度变大B.标准误变大C.可信区间变窄D.抽样误差增加E.标准差变大41.以下可以用来说明患有某种疾病病人不同年龄组所占比例的指标是A.平均率B.率C.构成比D.相对比E.比值比42.计算乙肝疫苗接种后血清学检查的阳转率,分母是A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数E.乙肝疫苗接种后的阳转人数43.图示某地区新中国成立以来三种疾病的发病率在各年度的升降速度,宜绘制A.普通线图B.直方图C.百分条图D.半对数线图E.直条图44.在假设检验时,本应作单侧检验的问题误用了双侧检验,可导致A.增加了 I类错误B.增加了 II类错误C.增加了把握度D.减小了可信度E.增加了效度45.若两变量满足线性回归分析的条件且总体回归系数8=3. 2,则样本回归系数bA.也等于3. 2B.服从均数3. 2的正态分布C.一定大于0D.假设检验时一定有P<0. 05E.假设检验时一定有P>0. 0546.在r个处理组,〃个观察值的完全随机设计方差分析中,其尸统计量的分子与分母自由度应分别为A.r, nB.r—1, n~rC.r—1, 〃一 1D.n~r, r~lE.n~r,〃一 147.等级资料比较宜用A. y检验B.t检验C.非参数检验D.方差分析E.相关分析48.完全随机设计资料进行多个样本均数的比较时,如果处理因素无作用,则方差分析的尸值在理论上应等于A.0B.-1C. 1D.8E. 249.关于标准正态分布,下面说法正确的是A.是均数为0,标准差为1的正态分布B.比一般正态分布要矮胖C.比一般正态分布要高尖D.高峰位置处于一般正态分布的左侧E.高峰位置处于一般正态分布的右侧50.2008年哈尔滨市居民糖尿病患病率的调查研究中,总体是A.所有哈尔滨市居民B.所有糖尿病患者C.2008年哈尔滨市居民中的糖尿病患者D.2008年所有哈尔滨市居民E.2008年哈尔滨市居民中的非糖尿病患者51.当两组(或几组)资料均数相接近、度量单位相同时,标准差大的那组资料A.均数的代表性最差B.均数的代表性最好C.无法据此判断均数的代表性D.均数也大E.均数小52.以下指标中可以用来描述定量资料集中趋势的指标是A.几何均数B.全距C.标准差D.百分位数E.变异系数53.随着自由度的增加,广分布的界值A.变小B.变大C.不变D.不确定E.以上都不是54.样本是A.总体中任意的一部分B.总体中的典型部分C.总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分55.在完全随机设计的方差分析中,各个实验观察值应A.相互关联B.相互独立C.计量逐步精确D.方法逐步改进E.没有特定要求56.某地某年肝炎病人数占同年传染病人数的10. 1%,这是一种()指标A.时点患病率B.构成比C.发病率D.集中趋势E.相对比57.统计表有广义与狭义两种,狭义统计表是指A.调查表B.实验表C.统计报表D.统计分析表E.整理汇总表58.对资料做标准正态变换的是B.X"D.。
硕士研究生医学统计学期末考试

硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1 分,共20 分)1. 用配对t 检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2. 对多个总体率有无差别做假设检验时,如果P< 0.05,则拒绝H),差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
( )4. 成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5•做t检验时,如果t > t0.05,v ,则P< 0.05,差别无统计学意义,可认为两总体均数不相等。
2的检验,当n A 40,T> 5时,只能用四格表x2检验的专用公式,不能用确切概率法。
()6. 四格表x的检验,当n A 40, T A 5时,只能用四格表x 2检验的专用公式,不能用确切概率法。
()7. Logistic 回归中, 因变量可为二分类, 多分类或等级资料。
( )8. 期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10. 机械抽样和立意抽样属于非概率抽样。
( )11. 样本含量的估计需要事先确定的是12. 多个样本比较的秩和检验,用K-WH 检验,当样本含量足够大时,可用z 检验近似。
()13. 同一资料,有 。
()14. 发病率高的疾病称为多见病。
( )15. Logistic 回归可用于筛选疾病的危险因素。
()20. 如果要控制其他变量的影响,看某两个变量的相关性,可用偏相关进行分析。
()、选择题(每题 1分,共20 分)1. 用两种药物治疗冠心病病人,结果见下表。
问两种药物治疗冠心病的疗效是否不同,较 好的统计方法是 _______a. R x C 表x 2检验b. Wilcox on 秩和检验c. Pearson 直线相16. 对于单向有序行列表,如果要做优劣检验,2检验中,x 2值越大,P 值越小, 17四格表的x大,P 值越小,说明两总体率的差别越大。
常州大学《医学统计学》2022-2023学年第二学期期末试卷

常州大学《医学统计学》2022-2023学年第二学期期末试卷《医学统计学》考试内容:《医学统计学》;考试时间:120分钟;满分:100分;姓名:——;班级:——;学号:——一、选择题(每题3分,共30分)1. 直方图主要用于表示:A. 某现象内部构成B. 某现象地理分布C. 各现象的比较D. 某现象的频数分布2. 偏态分布资料描述集中趋势较好的指标是:A. 算术均数B. 几何均数C. 中位数D. 众数3. 医学统计学研究的对象是:A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E. 有变异的医学事件4. 描述正态分布资料的变异度,常用的指标是:A. 极差B. 标准差C. 变异系数D. 四分位数间距5. 假设检验的目的在于检验:A. 样本的概率是否为小概率B. 总体参数是否不同C. 样本统计量与总体参数是否不同6. 抽样误差是指:A. 样本统计量与总体参数之间的差异B. 样本均数与总体均数之间的差异C. 样本各观测值之间的差异D. 样本各观测值与样本均数之间的差异7. 在配对设计的t检验中,如果P值大于0.05,表示:A. 两组数据有显著差异B. 两组数据无显著差异C. 检验方法不适用D. 样本量不足8. 下列哪项不属于非参数检验方法?A. 秩和检验B. t检验C. 卡方检验D. 符号秩和检验9. 在进行两独立样本的均数比较时,若两样本方差齐性检验显示方差不齐,应选用:A. t检验B. u检验C. 方差分析D. 非参数检验10. 直线回归是讨论一组观察单位两变量间:A. 线性相关关系的方向与程度B. 均数的差别C. 线性依存关系数量变化的规律二、填空题(每题2分,共20分)1. 医学统计学是研究医学数据中_____与_____的学科。
2. 描述性统计主要用于概括和描述数据的_____、_____和_____特征。
3. 在正态分布中,均数(μ)、中位数和_____三者相等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释1总体与样本总体:指根据研究目的确定的同质的所有研究对象的某项或某几项指标测量值的集合。
根据总体集合所包括的元素分为有限总体和无限总体。
样本:指以某种方式按预先规定的概率从总体中随机抽取的、足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
联系:根据研究目的,从总体中抽取的部分有代表性的样本,可用样本统计量推断总体参数。
2标准差与标准误标准差(S):描述一个变量的所有观察值与均数的平均离散程度的指标。
表示单个观测值对某均数的离散程度,用于描述观测值的变异范围。
标准差越大表明数据的离散程度越大。
变量值的标准差S S标准误:描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,相当于多个样本均数的标准差,反映的是样本均数之间的变异。
表示样本统计量对总体参数的离散程度,用于推断估计总体参数的可信区间和假设检验。
标准误越大表明样本的统计值越差,样本对总体的代表性越差。
样本均数的标准误S X性率的标准误S p3.X±1.96S与X±t0.05/2,v S X即算术平均数,描述一个变量的所有观察值的平均水平,适用于频数分布对称数据。
XS即标准差,描述一个变量的所有观察值与均数的平均离散程度。
S X即标准误,反映样本均数间的离散程度和样本均数与相应总体均数间的差异,是说明均数抽样误差大小的指标。
t0.05/2,v表示双侧尾部面积为0.05,自由度为v的t界值。
X±1.96S:表示从正态总体中抽大样本,观测值95%的波动范围,常用来制定参考值范围,判断某人的某一指标是否正常。
X±t0.05/2,v S X:表示从正态总体中抽大样本或小样本,总体均数95%的可信区间(置信区间),表示该区间有95%的可能性包含总体均数。
4.计量资料与计数资料计量资料:指通过度量衡的方法,测量每一个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量衡单位和多为连续性资料。
计数资料:指将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量衡单位和多为间断性资料。
5 点估计与区间估计点估计:就是直接用随机样本的样本均数X作为做为总体均数μ的一个估计,用样本的标准差S作为总体标准差δ的一个估计,即直接用样本统计量X±S作为总体参数μ±δ的估计值。
区间估计:是按预先给定的概率(1-α)用一个区间来估计总体均数,这个区间称为可信度(1-α)的可信区间(CI)或置信区间,预先给定的1-α称为可信度或置信度,常取95%或99%。
6回顾性研究与前瞻性研究回顾性研究:现有结果,后回顾过去一探求接受因素的百分比,由果溯因,例:病例—对照研究。
不能直接估计相对危险度,通常要通过计算优势比或比数比(OR)来近似估计相对危险度。
前瞻性研究:先设定因素,后经过一段时间研究后,分析暴露因素与疾病发生之间的因果关系。
由因探果,例:队列研究。
可直接估计相对危险度(RR)。
7完全随机设计与完全随机区组设计完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。
随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。
两种实验设计方案均为单因素实验设计。
区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。
8独立测定数据与重复测定数据独立测定数据:对一群观察对象的每个个体都独立测定一次得到的一个测定值,各测量数据之间无关联。
重复测定数据:对一个样本同时或不同时测定得到的多个测量值,各测量数据之间有关联。
9假设检验中的α与Pα:指检验水准(显著性水准),在原假设成立的前提下,规定它拒绝原假设可能要犯I 类错误的最大概率水平。
是预先规定的判断小概率事件的概率尺度,通常规定为0.01或0.05。
P :指从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际预拒绝H 0可能犯Ⅰ类错误的概率。
假设检验规定,如果一次实验结果P >α,则不拒绝H 0,统计结论为“差别没有统计学意义”。
如果一次实验结果P ≤α,则拒绝H 0,统计结论为“差别有统计学意义”。
10调查研究与实验研究调查研究:指研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。
它无法将研究对象随机分组,样本量大,混杂因素多,用多因素分析。
实验研究:指研究者主动地安排实验因素,控制实验条件,排除非实验因素干扰的研究。
混杂因素少,可用单因素分析。
二者关系:调查研究常为实验研究提供线索,而实验研究成果又须回到现场实践中去验证。
11.r 与br :即样本直线相关系数。
计算公式为x x y y r --,表示具有直线关系的两个变量间相关的密切程度与方向。
r >0为正相关。
要求x,、y 服从双变量正态分布。
常用于流行病学。
b :即样本直线回归系数。
计算公式()22x y xy n b x x n -=-∑∑∑∑∑,表示当x 变化一个单位时y 的平均改变的估计值。
b >0时x ↑→y ↑;b <0时x ↑→y ↓。
要求x ,y 服从双变量正态分布或y 服从正态分布。
常用于实验室研究。
联系:r 无单位,b 有单位;r 与b 符号一致,假设检验也等价。
12敏感度与特异度敏感度:某病中真病人的阳性率,即真阳性率。
表示对真病人的确诊能力。
敏感度值愈高,漏诊的可能性愈小,因此该值愈大愈好。
特异度:某病中非病人的阴性率,即真阴性率。
表示对非病人的鉴别和排除能力。
特异度值愈大,诊断为假阳性的概率越小,误诊的可能性愈小。
13准确度与精密度准确度:测定值与真实值的接近程度,用于说明测定方法有无系统误差。
一般采用回收试验,计算回收率度量其大小。
回收率愈接近100%,则准确度愈高;当回收率偏离100%较大时,则测定方法存在系统误差。
回收率=(实测值-原有量)/加入量。
精密度:指对同一标本进行多次重复测定时,测定值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。
此值愈小,说明测定方法重现性愈好。
联系:准确度与精密度均为评价检测方法可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使其精密度高,也不能采用此方法;当测定方法的精密度差,其准确度也不会高。
14关联性分析与趋势性分析关联性分析:研究具有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。
关联性分析较趋势性分析内涵更宽广,适用资料广,但量化含义相对粗犷,适合于社会学调查资料分析,对于定类变量一般不计方向。
趋势性分析:针对一个变量随同另一个变量的数量变化有规律性地发生线性、非线性数量协变关系,研究其协变关系规律的统计分析方法。
存在自变量与应变量的。
15 阳性预报率与阴性预报率阳性预报率(PV+):表示预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。
PV (+)=a/a+b 。
阴性预报率(PV-):表示诊断结果为阴性者实际未患病的概率。
PV (-)=d/c+d两者是结构预报率的表示方法。
二,填空题1.科研设计的三点设计要素:处理或观察因素、对象、效应指标。
2.科研设计四个基本原则:随机化、设置均衡对照、足够的样本含量、盲法原则。
3.六性分析:估计性、聚积性、差异组间对比性、关联性、越势性、协调性。
4.7种基本设计方案:完全随机,随机区组,重复测定,交叉、析因,正交、多元(大T方)。
5.常用抽样方法:单纯随机抽样,系统随机抽样,分层随机抽样,整群随机。
6.量变类型:a.数据表达的种类:正态、非正态(单方偏态),例:若资料测量值经正态性检验推断为正态分布,用均值表达其平均水平;若测量值呈单峰偏态分布,用中位数表达其平均水平;若测量值是属于血清学滴度资料或者lgX呈正态分布,则用几何均数表达其平均水平。
b.若自变量是等级成计量变量,结果是患病率、可做趋势性卡方检验。
C.完全随机设计的两(多)组等级资料对比分析采用秩和检验。
7.临床参考值(选择题):什么分布、单|双侧,95%区间,不同人群组间差别。
8. X±S,中位数,四分位数间距。
9.差异的对比分析四种:均衡性检验、数据的描述、差异对比性分析正确方法,安全性描述。
10.等级资料的对比分析:水平比较不能用卡方检验,若资料结果变量是等级资料不能用卡方检验,只能构成比较才能用卡方检验。
11.结果指标是多于2个的对比性分析:结果变量≥2个指标时用大T方检验(选择题)12.单向有序列联表13.双向有序列联表:双相等级的列联表可以做相关分析。
14.诊断试验设计要点:具备“金标准”,要有随机对照试验和真实两组人群,执行试验者盲法检测,同期检测。
15.诊断实验3类指标:基本标准:敏感度、特异度。
综合指标:准确度、尤登指数、阳性似然比、阴性似然比。
其他指标:结构预极率,人群预极率。
三、应用题:1.多组比较(I 类错误增大)1)三个独立样本为什么不能用两两T检验。
T检验主要用于剂量资料两均数比较的假设检验中,T检验时,犯I 类错误概率计算α' =1—(1—α)k(k 重复次数),若三个独立样本用两两T检验,则k ≥ 2。
因α≥0.05,常致α'>0.05,因此犯I 类错误概率较大。
2)组内分组资料是几个因素的?至少两个因素,且不是单因素的。
2.问卷的考评内容(四种):○1.信度考评,指问卷测量结果的可靠性、稳定性和一致性,即精确度○2.效度考评,即问卷的有效性和正确性,即准确度,效度越高说明问卷结果越能反映所测对象的真正特征○3.反应度考评○4.可接受性评价,指被测定对象对问卷的接受程度。
3.ROC曲线描述:○1.ROC曲线以真阳性率(灵敏度)作纵轴,以假阳性率(特异度)作横轴,而画出的曲线。
○2.图形似曲线,且抛物线偏左上方。
○3.ROC曲线的绘制采用两种不同的方法:一是由原始数据分组后直接绘制,二是利用适当的模型通过与原始数据拟合而形成的光滑曲线。
○4.ROC曲线偏左上方,曲线下的面积越大,诊断的准确性越高。
○5.面积用A表示:一般0.5<A ≤0.7 表示诊断价值较低,0.7<A≤0.9 诊断价值中等,A≥0.9表示价值较高。
4.实验误差中系统误差:方法学研究的恒定系统误差和比例系统误差○1.恒定系统误差:指误差数值不随某些测量条件变化的系统误差,表现为恒定线性。
比例系统误差是在系统误差中与真实值固定形成比例的一种误差,表现为周期性和非线性。
○2.一次固有加标值试验,只能获得一次回收率,用以推算一次恒定误差。