统计学(1)

合集下载

统计学教案(1)

之间的相关，因果关系，运用相关，回归分析两变量之间的密切程度。相同的是这三章内容中反映的指标都是特定时间的指标值，但是我们知道，作为反映经济活动的各项指标随着各方面的约束，在时间推移条件下，是回发生变化的。例如，某县2014年GDP
为亿兀，2015年为亿兀，亿兀，亿兀均是指标值，但是时间不同，指标值发生了变化：
蔬菜：（）=牛肉（）=
鲜蛋：（）=水产品（）=
全部商品价格变动使该市居民增加支出的金额为艺piqi-艺poqi
==（万兀）
（4）每一种商品销售量的变动对居民支出金额增加数为；P0（Q1-Q0）
蔬菜（）=牛肉17（）=
鲜蛋9（）=水产品（）=
全部商品销售量变动使得该市居民增加支出金额为艺PoQ-艺PoQ
难点：利用指数进行因素分析
新课引入：
指标用来反映经济现象的数量特征，是统计工作的一个必然目标，是进行统计分析的基础。那么：在第四章，我们学习了根据总体资料，编制总量指标，平均指标及变异指标，相对指标等。在第五章，我们掌握了根据样本资料，在允许误差的概率保证程度下，对总体指标进仃估计分析。在第八早，我们学习了对冋一个总体下，单位不冋标志
4.指数的种类(简答题，填空题，单选题)
(1)按其所反映的对象范围的不冋划分为：个体指数和总指数
(2)按其反映的指标性质不冋分为：数量指标指数和质量指标指数
(3)按照采用的基期不冋，分为：定基指数和环比指数
(4)按其计算方法和计算公式的表现形式不同，分为：总量指标指数和平均指标指数。
二、指数的编制
解：（1）蔬菜的价格指数K=P1/P0==%
牛肉的价格指数K=P1/P0==%
鲜蛋的价格指数K=P1/P0==%
水产品的价格指数K=P1/P0==%

统计学原理试题 (1)

统计学原理试题(总分：99.98，做题时间：120分钟)一、单项选择题（每题1分，共15分）(总题数：15，分数：15.00)1.社会经济统计学是一门社会科学，它对社会经济现象的研究（）（分数：1.00）A.是一种纯数量的研究B.是从定性认识开始，以定量认识为最终目的C.是在社会经济现象的质与量的密切联系中，研究其数量关系√D.是一种对经济现象做的定性研究解析：2.对某市科技人员进行调查，科技人员的职称和年龄（）（分数：1.00）A.是品质标志B.是数量标志C.前者是数量标志，后者是品质标志D.前者是品质标志，后者是数量标志√解析：3.对企业职工按工种分组，在此基础上再按工资水平分组，这种分组属于（）（分数：1.00）A.简单分组B.复合分组√C.品质标志分组D.数量标志分组解析：4.计算比较相对指标（）（分数：1.00）A.只能是两个总量指标对比B.只能是两个相对指标对比C.只能是两个平均指标对比D.既可以是两个总量指标对比，也可以是两个相对指标或平均指标对比√解析：5.某地区工业增加值1995年比1994年增长6%，1996年比1995年增长4%，1997年比1996年增长8%。

则三年来该地区工业增加值平均每年增长速度的计算方法为（）（分数：1.00）C.106%×104%×108% －100% √D.6%×4%×8%解析：6.某企业1997年比1996年产量增长了15%，产品单位成本下降了4%，1996年企业总成本支付了30万元，则1997年总成本比1996年多支付（）（分数：1.00）A.3万元B.4.5万元C.3.12万元√D.1.38万元解析：7.调查误差包括登记误差和代表性误差，在抽样调查中（）（分数：1.00）A.只有登记误差B.只有代表性误差C.两种误差都有√D.两种误差都没有解析：8.在简单随机抽样条件下，当极限误差范围Δ扩大一倍，则抽样单位数（）（分数：1.00）A.只需原来的1/2B.只需原来的1/4 √C.是原来的1倍D.是原来的√2倍解析：9.加权调和平均数指数要成为综合指数的变形，其权数（）（分数：1.00）A.必须用基期的价值量指标B.必须用报告期的价值量指标√C.必须用基期的数量指标D.必须用报告期的数量指标解析：10.配合回归直线的前提条件是（）（分数：1.00）A.两个变量必须有明显的依存关系B.两个变量必须有函数关系C.两个变量存在一定的相关关系D.两个变量存在显著的线性相关关系√解析：11.在相关分析中，若变量Ｘ的值减少，变量Ｙ的值也随之减少，则两个变量间的关系是（）（分数：1.00）A.正相关√B.负相关C.复相关D.不相关解析：12.对某企业职工平均工资的变动进行分析时，若分析职工人员结构的变动对总平均工资的影响程度应采用（）（分数：1.00）A.总平均工资可变构成指数B.总平均工资综合指数C.总平均工资固定构成指数D.总平均工资结构影响指数√解析：13.检验回归方程代表性大小的统计分析指标是（）（分数：1.00）A.相关系数B.回归系数C.估计标准误√D.符号系数解析：14.对甲乙两企业工人劳动生产率的高低进行抽样调查，调查的工人数甲企业80人，乙企业150人，两企业工人劳动生成率的方差相同，则抽样平均误差（）（分数：1.00）A.甲企业大√B.乙企业大C.两个企业一样大D.不能确定解析：15.在总体内部情况复杂，而且各单位之间差异程度大、单位数又多的情况下，宜采用（）（分数：1.00）A.简单随机抽样B.等距抽样C.类型抽样√D.整群抽样解析：二、多项选择题（每题１分，共10分）(总题数：10，分数：10.00)16.总量指标的重要意义在于它是（）（分数：1.00）A.对社会经济现象认识的起点√B.计算相对指标的基础√C.计算平均指标的基础√D.实行经营管理的依据√E.反映某些相关事物之间数量联系程度的综合指标解析：17.对某项资料进行统计分组时，其关键的问题是（）（分数：1.00）A.划分数量标志和品质标志B.选择分组标志√C.选择分组体系D.区分简单分组与复合分组E.划分各组界限√解析：18.设Ｐ为价格，Ｑ为销售量，则总指数∑P0Q1/∑P0Q0的意义是（）（分数：1.00）A.综合反映多种商品的销售量的变动程度√B.综合反映商品价格和销售量的变动C.综合反映商品销售额的变动D.反映商品销售量的变动对销售额变动的影响程度√E.综合反映多种商品价格的变动程度解析：19.普查是一种（）（分数：1.00）A.专门组织的调查√B.只调查时期现象C.不连续调查√D.全面调查√E.非全面调查解析：20.在直线回归方程中，回归系数（）（分数：1.00）A.表明两变量之间的相关程度B.表明两变量之间的相关方向√C.表明两变量之间的密切程度D.表明两变量之间的量变关系√E.在数学上称为斜率√解析：21.时点指标所形成的时间数列中（）（分数：1.00）A.指标的各个数值是可以相加的B.指标的各个数值是不能相加的√C.指标的各个数值相加起来没有实际意义√D.数列中各项指标数值的大小与时点间隔有直接关系E.数列中的资料通过连续登记取得解析：22.在一定的误差范围要求下（）（分数：1.00）A.概率度大，要求可靠性低，抽样数目相应要多B.概率度大，要求可靠性高，抽样数目相应要多√C.概率度小，要求可靠性低，则抽样数目相应要少√D.概率度小，要求可靠性高，则抽样数目相应要少E.概率度小，要求可靠性低，抽样数目相应要多解析：23.定基增长速度等于（）（分数：1.00）A.累积增长量除以基期发展水平√B.环比增长速度的连乘积C.环比发展速度的连乘积减去１√D.定基发展速度减１√E.逐期增长量除以基期水平解析：24.平均指标的特点是（）（分数：1.00）A.将同一总体各单位标志值的差异抽象化√B.将总体统计指标值的差异抽象化C.将不同总体各单位标志值的差异抽象化D.将各总体的数量差异抽象化E.是总体数量特征的代表值√解析：25.下列属于时点指标的有（）（分数：1.00）A.某地区某年人口增加数B.某地区某年乡镇企业总数√C.某地区某年招工录取率D.某地区某年商业网点数√E.某种原材料期初库存量√解析：三、填空题（每空１分，共15分）(总题数：8，分数：15.00)26.抽样调查是按照 1抽选调查单位进行调查的方法，其目的是 2。

医学统计学方法试题及答案(一)

医学统计学方法试题及答案（一）1.呈对数正态分布的数值变量资料，描述集中趋势的指标最宜选用（）A.几何均数B.众数C.算术均数D.调和均数E.中位数2.某课题组获得某校新入学大学男生腹部皮下脂肪厚度(cm)和身高(cm)资料，现比较这两个变量的离散趋势，最佳的指标是（）A.变异系数B.全距C.方差或标准差D.偏度系数E.四分位数间距3.研究者预比较两种中成药对口腔溃疡的治疗效果是否有差别，用“有效、一般、无效”作为评价疗效的指标。

宜采用的统计分析方法是（）A.t检验B.方差分析C.Z检验D.秩和检验E.回归分析4.不是四分位数间距特点的是（）A.适用条件同中位数B.反映数值变量资料的离散趋势C.较极差稳定D.考虑了每个变量值的变异情况E.不受两端极大值、极小值的影响5.对于正偏态分布的资料，M与X的关系为（）A.M=XB.M<XC.M>XD.M=2XE.M与X无确定关系6.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指（）A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围7.对于一组经对数变换后亦不服从正态分布的偏态分布资料，描述该组的离散趋势应选用（）A.方差B.样本标准差C.总体标准差D.四分位数间距E.变异系数8.不是正态分布特征的是（）A.曲线位于横轴上方均数处最高B.以零为中心，左右对称C.均数为其位置参数D.标准差为其变异度参数E.正态分布曲线下面积有一定分布规律9.某病住院日的频数分布呈单峰分布。

平均住院日为10日。

中位数为5日，则住院日的分布是（）A.正态分布B.正偏态分布C.负偏态分布D.左偏态分布E.对称分布10.下列指标为相对比的是（）A.中位数B.几何均数C.均数D.标准差E.变异系数11.某高校测得1100名20岁健康男大学生的身高，经检验资料服从正态分布，其均值为172cm，标准差为4cm，求得的区间(172-2.58×4,172+2.58×4)称为身高的（）A.99%医学参考值范围B.95%医学参考值范围C.99%总体均数可信区间D.95%总体均数可信区间E.97.5%总体均数可信区间12.正态分布是（）A.以+值为中心的频数分布B.以参数为中心的频数分布C.以变量为中心的频数分布D.以观察例数为中心的频数分布E.以均数为中心的频数分布13.计算相对数的目的是（）A.为了进行显著性检验B.为了表示绝对水平C.为了便于比较D.为了表示实际水平E.为了表示相对水平14.对计数资料进行统计描述的主要指标是（）A.平均数B.相对数C.标准差D.变异系数E.中位数15.说明两个有关联的同类指标的比即为（）A.率B.相对比C.构成比D.频率E.频数16.说明某事物内部各组成部分的比重或分布的指标称为（）A.率B.标准差C.频率D.相对比E.构成比17.说明某现象发生强度的指标为（）A.全距B.相对比C.率D.均数E.比值比18.假设检验的目的是（）A.检验参数估计的准确度B.检验参数估计的糖确度C.检验总体参数是否不同D.检验样本统计量是否不同E.检验样本统计量与总体参数是否不同19.某医生治疗了两例视网膜炎患者，1例有效，说法错误的是（）A.总有效率为50%B.最好用绝对数表示C.必须用率表示时，应同时给出其可信区间D.分母太小，用相对数不可靠E.最好是增大样本量在进行统计描述20.经调查甲乙两地的冠心病粗死亡率均为4/105，经统一年龄构成后，甲地标化率为4.5/105，乙地为3.8/105。

医学统计学案例分析(1)

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。

经检验，得连续性校正χ2=3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（％）中药12（9.33）2（4.67）1485.7西药 6（8.67）7（4.33）1346.2合计1892766.7【问题1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】(1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。

(2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。

(3) 患者总例数n=27＜40，该医师用χ2检验是不正确的。

当n＜40或T＜1时，不宜计算χ2值，需采用四格表确切概率法（exact probabilities in 2×2 table）直接计算概率案例分析－卡方检验（一）【例1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。

该医师采用成组t检验（有效=1，无效=0）进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义检验（有效=1，无效=0）进行进行假设检验，结果t ＝2.848，P＝0.005，差异有统计学意义，故认为中西药治疗胃炎的疗效有差别，中药疗效高于西药。

【问题1-1】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？（4）该资料应该用何种统计方法？【分析】(1) 该资料是按中西药疗效（有效、无效）分类的二分类资料，即计数资料。

(2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。

医学统计学网络作业(1)答案

上海交通大学网络教育学院医学院分院医学统计学网络作业(1)专业：公共事业管理（专科）、护理学（专升本）单选题1. 从一个数值变量资料的总体中抽样，产生抽样误差的原因是（）A总体中个体值存在差别B样本中个体值存在差别C样本只含总体的一部分D总体均数不等于02. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点，调查3000人中有300名血压超过临界值，这份资料属于：( )A 定量资料B 分类资料C 等级资料D 离散型变量3. 调查某地区高血压的患病情况，抽样调查了2000名居民，得到了2000份对舒张压与收缩压的数据，请问此资料是：( )A 分类资料B等级资料 C 定量资料D分析后才知4. 统计工作的基本步骤的第三步应该是（）A 设计B 收集C 分析D整理5. 概率P的取值范围是（）A P≤1B 0≤P≤1C P>0D P>0且P≤16. 随机调查社区2000人，得到平均体重为60公斤，则该资料属于（）A 计量资料B 总体资料C 计数资料D 等级资料7. 若资料为正态分布，最好计算下列哪个指标来衡量集中程度（）A 全距B 算术均数C 几何均数D 中位数8. 抗体滴度资料通常使用哪个集中趋势指标( )A 全距B 几何均数C 中位数D 算术均数9. 抽样调查了10名居民体重资料，请问平均体重该用哪个指标计算( )A 中位数B 几何均数C 算术均数D 都可以10. 中位数特别适用于（）A 正态分布资料B 对数正态分布资料C 抗体滴度资料D 严重偏态分布资料11. 关于频数分布表说法错误的是（）A 第一组必须包含最小值B 一般最后一组同时标出上下限C 组距应该要等距分组D 组段数不宜过多或过少12. 描述两端没有界限资料的集中趋势时最好用哪个指标（）A 算术均数B 几何均数C 中位数D 全距13. 若资料为正态分布，最好计算下列哪个指标来衡量离散程度（）A 全距B 算术均数C 标准差D 中位数14. 若资料末端没有截尾值，最好计算下列哪个指标来衡量离散程度（）A 全距B 算术均数C 标准差D 四分位间距15. 一组资料的标准差等于5，变异系数等于10%，样本均数等于（）A 5B 50C 20D 10016. 比较两组正态分布数据离散度大小的指标，如果单位不同该用 ( )A 四分位间距B 变异系数C 标准差D 标准误17. σ表示 ( )A 总体方差B 样本方差C 总体标准差D 总体标准误18. 四分位间距的使用条件与哪个指标是一致的（）A 中位数B 算术均数C 几何均数D 变异系数19. 一组数据呈正态分布，其中大于S X 96.1-的变量有： ( )A 95%B 2.5%C 47.5%D 97.5%20. 一组数据呈偏态分布，其双侧95％的参考值范围为： ( )A P 0-P 25B P 2..5-P 97.5C P 0-P 95D P 5-P 10021. 对于临床上计算尿铅的95%正常值可用哪个百分位数表示 ( )A P 0 — P 95B P 2.5 — P 97.5C P 5 — P 95D P 5 — P 10022. 偏态资料的医学参考值范围估计方法是（）A 正态分布法B 百分位法C A 和B 都是D A 和B 都不是23. 标准差表示：（）A 正态分布B 个体变异C 抽样误差D 标准误24. 标准正态分布曲线的位置参数和形态参数分别是（）A 0和1B 3和5C 1和 SD 无法确定25. X σ的含义是（）A 标准误的理论值B 样本标准误C 标准误的估计值D 以上都不对26. t 分布是（）A 近似正态分布B 离散性分布C 动态分布D 标准正态分布27. 一组100个样本的资料均数等于5，变异系数等于20%，则标准误等于（）A 5B 1C 0.1D 0.0128.标准误反映 ( )A 个体差异B 个体变异C 均数变异D 标准差29 .标准误不可用于 ( )A 估计参数B 计算μ可信区间C 假设检验D 估计医学参考值30. t 分布中，当自由度为无穷大，t 分布逼近（）A 近似正态分布B 偏态分布C 标准正态分布D F 分布31. 大样本正态分布数据总体均数99％可信区间为 ( ) A x S X 96.1± B S X 96.1±D S X 58.2±32. 在假设检验中符号H1表示： ( )A 有效假设B 备择假设C 无效假设D 虚假假设33. H 0 ：μ＝μ0，H 1：μ≠μ0属于 ( )A 双侧检验B 单侧检验C 两者均可D 视情况而定34. 检验水准的符号是（）A βB ωC θD α35．下列哪个变量为标准正态变量（）A s x μ-C x s x μ-D x x σμ-36．下列哪一变量服从t 分布（）A σμ-x B σμ-xD x s x μ-37．在标准差与标准误的关系中（）A 二者均反映抽样误差大小B 总体标准差增大时，总体标准误也增大C 样本例数增大时，样本标准差与标准误都减小D 总体标准差一定时，增大样本例数会减小标准误38．从同一正态分布总体中随机抽样,理论上有95％的样本均数在（） Ax s x 96.1± B x s 96.1±μ D x σμ96.1±39．参数可信区间估计的可信度是指（）A αB 1－αC βD 1－β40．下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大（）A 变异系数B 标准差C 标准误D 极差41．两样本比较作t 检验，差别有显著性时，P 值越小说明（） A 两样本均数差别越大 B 两总体均数差别越大C 越有理由认为两总体均数不同D 越有理由认为两样本均数不同42．两样本比较时，分别取以下检验水准，哪一个的犯Ⅱ类错误最小（）A α=0.05B α=0.01C α=0.10D α=0.2043.当样本含量n 固定时，选择下列哪个检验水准得到的检验功效最低（）A α=0.01B α=0.10C α=0.05D α=0.2044.假设检验中的第二类错误是指（）A 拒绝了实际上成立的0HB 不拒绝实际上成立的0HC 拒绝了实际上不成立的0HD 不拒绝实际上不成立的0H45.配对资料比较两样本均数的差异用（）A 配对卡方检验B 成组t 检验C 配对 t 检验D 校正卡方检验46. I 类错误指的是（）A 错误的H0被接受的可能性B 真实的的H0被拒绝的可能性C 错误的H0被拒绝的可能性D 真实的的H0被接受的可能性47. 为研究缺氧对正常人心率的影响，有50名志愿者参加试验，分别测得试验前后的心律，问应用何种统计检验方法来较好地分析此数据？（）A 配对t 检验B 两独立样本t 检验C 可信区间D 单个样本t 检验48．两样本均数比较用t 检验，其目的是检验（） A 两样本均数是否不同 B 两总体标准差是否不同C 两个总体均数是否相同D 两个样本均数是否相同49. 有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t 检验时，自由度是（）A n1+ n2B n1+ n2 –1C n1+ n2 +1D n1+ n2 -250. 已知正常人某定量指标的总体均值μ0=5，今随机测得某地一组特殊人群中的30人该指标的数值，为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义，若用t 检验，则自由度应该是（）A 5B 28C 29D 451.配对设计两样本均数间的差别的假设检验时，查t 界值表的自由度为（）A n-1B （r-1）（c-1）C n1+n2-2D 152.两样本均数的t 检验对资料的要求是（） A 正态性、独立性、方差齐性 B 资料具有代表性C 为定量资料D 以上均对53.两组独立样本t 检验要求：（）A 两组数据样本一致B 两组数据都是计数数据C 两组数据总体方差相等D 没有特殊要求54.配伍组设计的两因素方差分析有（）A 总SS =组间SS +配伍SS +误差SSB 总SS =组间SS +配伍SSC 总SS =组间SS +误差SSD 总SS =组间SS +组内SS55.欲比较12名氟作业工人工前、工中，工后4小时的尿氟浓度，采用两因素方差分析，处理组间与配伍组间自由度分别为: （）A 3，10B 2，10C 2，9D 3，956.方差分析的主要目的是比较 ( )A 总体均数之间的差异性B 样本均数之间的差异性C 总体方差之间的差异性D 总体变异系数之间的差异性57．多个总体均数比较的F检验, P≤0.05时可推论为 ( )A 总体均数之间两两间有差异性B 各样本均数之间有差异性C 至少两个总体均数之间的有差异D 总体方差之间有差异性58．多个样本均数间的两两比较的方法常用（）A q检验B t检验C u 检验D F检验59．方差分析又叫（）A q检验B t检验C u 检验D F检验60．方差分析结果，F<F0.05(n1,n2)，则统计结论为：（）A 各总体均数不全相等B 各样本均数间差别都有显著性差异C 各总体均数相等D 各样本均数各不相等。

统计学1

一、名词解释1、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据，具体又分为定类数据与定序数据。

（定类数据是对事物进行分类的结果，表现为类别，由定类尺度计量而成。

定序数据是对事物按照一定的排序进行分类的结果，表现为有顺序的类别，由定序尺度计量而成。

）2、定量数据是指用数值来表现事物数量特征的数据，具体又分为定距数据与定比数据两种。

（定距数据是一种不仅能反映事物所属的类别和顺序，还能反映事物类别或顺序之间数量差距的数据，由定距尺度计量而成。

定比数据是一种不仅能体现事物之间数量差距，还能通过对比运算，即计算两个测度值之间的比值来体现相对程度的数据，由定比尺度计量而成。

）3、长期趋势是指时间数列中指标值在较长一段时间内，由于受普遍的、持续的、决定性的基本因素的作用，使发展水平沿着一个方向持续向上或向下发展或持续不变的基本态势。

4、季节变动是指数列中各期指标值随着季节交替而出现周期性的、有规则的重复变动，这里的时间通常指一年。

5、循环变动是指时间数列中各项指标值随着时间变动发生周期性的重复变化，但循环变动所需的时间更长，重复变动的规律性、变动周期和时间也不像季节变动来得稳定、可以预测。

6不规则变动是由未能得到解释的一些短期波动所组成的，常指时间数列由于受偶然因素或意外条件影响，在一段时间内（通常指短期内）呈现不规则的或自然不可预测的变动。

7、相关关系，也称统计相关，是指现象之间存在的非确定性的数量依存关系。

8、点估计也称定值估计，就是以样本观测数据为依据，对总体参数做出确定值的估计，也就是用一个样本的具体统计值去估计总体的未知参数。

9、区间估计，就是指用一个具有一定可靠程度的区间范围来估计总体参数，即对于未知的总体参数9,想办法找出两个数值Qi和他（B i v他），使B处于区间（0|， 9）内的概率为1- a，即n （ 9iv 9V 9）=1- a区间（9i， 9）为总体参数的估计区间或置信区间，91为估计下限或置信下限，9为估计上限或置信上限。

[整理版]统计学-机考（1）

将某地区1996—2002年的新增加人口数量按年排列的动态数列属于（）A.相对数动态数列B.平均数动态数列C.时期数列D.时点数列本题得分：2分正确答案：C您的答案：C所在章：统计学知识点：统计学答案解析：2统计调查对象是（）A.总体各单位标志值B.总体单位C.现象总体D.统计本题得分：2分正确答案：C您的答案：C所在章：统计学知识点：统计学答案解析：3某单位职工的平均年龄为35岁，这是对（）的平均A.变量B.变量值C.数量标志D.数量指标本题得分：2分正确答案：B您的答案：B所在章：统计学知识点：统计学答案解析：4下列指标中，不属于平均数的是（）A某省人均粮食产量B某省人均粮食消费量C某企业职工的人均工资收入D某企业工人劳动生产率本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：5在变量数列中，当标志值较大的组权数较小时，加权算术平均数（）A偏向于标志值较小的一方B偏向于标志值较大的一C不受权数影响D上述说法都不对本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：6平均差的主要缺点是（）A与标准差相比计算复杂B易受极端数值的影响C不符合代数演算方法D计算结果比标准差数值大本题得分：2分正确答案：C您的答案：C所在章：统计学知识点：统计学答案解析：7对于右偏分布，均值、中位数和众数之间的关系是（）A均值>中位数>众数B中位数>均值>众数C众数>中位数>均值D众数>均值> 中位数本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：8对于右偏分布，平均数、中位数和众数之间的关系是（）A平均数＞中位数＞众数B中位数＞平均数＞众数C众数＞中位数＞平均数D众数＞平均数＞中位数本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：9下列不是次序统计量的是（）A中位数B均值C四分位数D极差本题得分：2分正确答案：B您的答案：B所在章：统计学知识点：统计学答案解析：10假设总体比例为0.55，从此总体中抽取容量为100的样本，则样本比例的标准差为（）A0.01B0.05C0.06D0.55本题得分：2分正确答案：B您的答案：B所在章：统计学知识点：统计学答案解析：11假设总体比例为0.4，采取重复抽样的方法从此总体中抽取一个容量为100的简单随机样本，则样本比例的期望是（）A0.3B0.4C0.5D0.45本题得分：2分正确答案：B您的答案：B所在章：统计学知识点：统计学答案解析：12估计量的含义是指（）A用来估计总体参数的统计量的名称B用来估计总体参数的统计量的具体数值C总体参数的名称D总体参数的具体数值本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：13无偏估计是指（）A样本统计量的值恰好等于待估的总体参数B所有可能样本估计值的数学期望等于待估总体参数C样本估计值围绕待估总体参数使其误差最小D样本量扩大到和总体单元相等时与总体参数一致本题得分：2分正确答案：B您的答案：B所在章：统计学知识点：统计学答案解析：14置信系数（）A准确性B精确性C显著性D可靠性本题得分：2分正确答案：D您的答案：D所在章：统计学知识点：统计学答案解析：15设R为列联表的行数，C为列联表的列数，则进行拟合优度检验时所用统计量X2的自由度为（）ARBCCR×CD（R-1）×（C-1）本题得分：2分正确答案：D您的答案：D所在章：统计学知识点：统计学答案解析：16方差分析中，依据p值做统计决策时，若p值小于显著性水平，则（）A拒绝原假设B所检验因素对因变量观测值有显著影响C不拒绝原假设D条件不充分，无法判断本题得分：2分正确答案：A您的答案：A所在章：统计学知识点：统计学答案解析：17一名工程师提出三种不同的产品装配方法。

医学统计学练习(一)

联系要求：1、将答案写在答题纸上，下次上课上交。

2、计算题只写出分析方法，不需要进行计算。

医学统计学练习题（一）第六章方差分析1．方差分析的基本思想？2．方差分析的条件？3．简述随机区组设计、拉丁方设计、交叉设计、析因设计、正交设计的主要设计要点及其变异度分解方法。

4．简述重复测量数据方差分析的应用条件。

5．有3组进食高脂饮食的家兔，接受不同处理后，测定其血清肾素血管紧张素转化酶（ACE）浓度，试比较三组家兔的血清ACE浓度。

3组家兔的血清ACE浓度对照组61.24 58.65 46.79 37.43 66.54 59.27A降脂药82.35 56.47 61.57 48.79 62.54 60.87B降脂药26.23 46.87 24.36 38.54 42.16 30.33 6．为研究注射不同剂量植物雌激素大豆异黄酮单体对大白鼠子宫重量的影响，取5窝不同种系的大白鼠，每窝3只，随机地分配到3个组内接受不同剂量大豆异黄酮单体的注射，然后测定其子宫重量，结果见下表。

问注射不同剂量的大豆异黄酮单体对大白鼠子宫重量是否有影响?3组大白鼠子宫重量大白鼠种系大豆异黄酮单体剂量(μg/100g) 0.25 0.5 0.751 102 117 1452 56 68 1183 67 96 1364 73 89 1245 53 68 1027．某中医院研究中药复方（A药）治疗高血压的疗效，以传统的抗高血压卡托普利（B药）作对照。

同时还考虑个体差异与给药A、B顺序对收缩压的影响。

通过交叉设计进行临床研究，记录患者服用A、B两种药物结果见下表。

试分析A、B两药对收缩压的影响，以及给药A、B顺序对收缩压的影响。

交叉设计A、B两药对收缩压的影响患者编号随机数第一阶段第二阶段1 5 A 140 B 1102 B 135 A 1503 10 B 145 A 1304 A 130 B 1255 9 A 140 B 1456 B 122 A 1207 8 B 120 A 1458 A 135 B 1459 6 B 120 A 11810 A 130 B 11411 3 A 145 B 12012 B 140 A 12013 2 B 160 A 18014 A 150 B 13515 1 A 140 B 14016 B 110 A 12017 4 B 150 A 13518 A 110 B 134197 A 115 B 12020 B 150 A 1408．研究高锰酸盐处理后对甘蓝叶核黄素浓度测量结果的影响，采用2×2的析因处理，A因素为试样处理方式，B因素为试样重量，试验结果见下表。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

统计学1.数据分析所用的方法可分为描述统计方法和推断统计方法2.按照所采用的计量尺度的不同，可以将统计数据分为分类数据、顺序数据和数值型数据（判断数据类型）分类数据：是只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，是用文字来表达的。

例如，人口按照性别分为男、女两类；企业按照业务属性分为医药企业、家电企业、纺织品企业等，这些均属于分类数据。

为便于统计处理，对于分类数据可以用数字代码来表示各个类别，比如：用1表示男性，用0表示女性。

顺序数据：是只能归于某一有序类别的非数字型数据。

顺序数据虽热也有类别，但这些类别是有序的。

比如考试成绩可分为优、良、中、及格、不及格；一个人的受教育程度分为小学、初中、高中、大学及以上。

一个人对事物的态度可以分为非常同意、同意、保持中立、不同意等数值型数据：是按数字尺度的观察值，其结果表现为具体的数值3．截面数据：是在相同或近似相同的时间点上收集的数据，这类数据通常是在不同的空间上获得，用于描述现象在某一时刻的变化情况。

例如，2010年我国各地区的国内生产总值数据时间序列数据：是在不同时间内收集到的数据，这类数据是按时间顺序收集到的，用于描述现象随时间的变化情况。

如2010—2012年我国的国内生产总值数据4.参数：用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值。

总体平均数：总体标准差：总体比例：统计量：是用来描述样本特征的概括性数字度量。

样本平均数：样本标准差：样本比例：5.分类变量：（选择题）分类变量：是说明事物类别的一个名称，其取值为分类数据。

如“性别”就是一个分类变量，其变量值为“男”、“女”；行业也是一个分类变量，其变量值为“零售业”“旅游业”“汽车制造业”顺序变量：是说明事物有序类别的一个名称，其取值为顺序数据。

如“受教育程度”也是一个顺序变量，其变量值为“小学”“初中”“高中”“大学”数值型变量：是说明事物数字特征的一个名称，其取值是数值型数据。

如“产品变量”“零件尺寸”“时间”6.抽样采集数据的方式可分为两类：概率抽样和非概率抽样概率抽样：也称随机抽样，是指遵循随机抽样原则进行的抽样，总体中的每个单位都有一定的机会被选入样本。

特点：（1）抽样时是按一定的概率以随机原则抽取样本注意：随机不等于随便（2）每个单位被抽中的概率是已知的，或是可以计算出来的。

（3）当用样本对总体目标量进行估计时，要考虑到每个单位被抽中的概率。

抽样概率的方式：（1）简单随机抽样：就是从包括总体N个单位的抽样框中随机地、一个一个的抽取n个单位作为样本，每个单位的入样概率是相等的。

（2）分层抽样：是将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机的抽样（3）整群抽样：将总体中若干个单位合并为组，这样的组称为群。

抽取式直接抽取群，然后对中选的所有单位全部实施调查（4）系统抽样：将总体中的所有单位（抽样单位）按一定的顺序排列，在规定是的范围内随机地抽取一个单位作为初始单位，然后按事先规定好的规则确定其他样本单位（5）多阶段抽样：使抽样段数增多。

非概率抽样：是相对于抽样概率而言的，指抽取样本时不是依据随机原则，而是根据研究目的数据的要求，采用某种方式从总体中抽取出部分单位对其实施调查。

类型：（1）方便抽样：调查过程中由调查员依据方便的原则，自行确定入抽样本的单位。

（2）判断抽样：是另外一种比较方便的抽样方式，是指研究人员根据经验、判断和对研究对象的了解，有目的地选择一些单位作为样本，实施时根据不同的目的有重点的抽样、典型抽样、代表抽样等方式。

（不能推断总体）（3）自愿抽样：指调查者自愿参加，成为样本中的一份子，向调查人员提供有关信息。

（4）滚雪球抽样：适用于对稀少群体的调查。

滚雪球抽样是指先随机选择一些被访者并对其实施访问，再请他们提供另外一些属于所研究目标总体的调查对象，根据所形成的线索选择此后的调查对象。

（5）配额抽样：配额抽样也称“定额抽样”，是指调查人员将调查总体样本按一定标志分类或分层，确定各类（层）单位的样本数额，在配额内任意抽选样本的抽样方式。

（不需要建立抽样框）7.抽样误差：是由抽样的随机性引起的样本结果与总体真值之间的误差。

抽样误差大小与许多因素有关，如（样本量的大小）和（总体的变异性）。

样本量越大，抽样误差就越大。

总体的变异性越大，即各单位之间的差异越大，抽样误差也就越大。

非抽样误差：指除抽样误差之外的，由于其他原因引起的样本观察结果与总体真值之间的差异。

有以下几种类型：抽样框误差：一一对应关系回答误差：调查者在接受调查时给出的回答与真实情况不符无回答误差：被调查者拒绝接受调查调查员误差：由于调查员的误差而产生的调查误差测量误差：测量中产生的误差8..数据分组：是根据统计研究的需要，将原始数据按照某种标准分成不同的组别。

数据分组的主要目的是观察数据的分布特征。

数据分组方法有两种：（单变量值分组）和（组距分组）。

最小值：下限最大值：上限统计分组时，遵循不重不漏原则，“上组限不在内”9. 数据分布的特征从三方面进行测度和描述：①（分布的集中趋势），反映各数据向其中心值靠拢或聚集的程度。

②（分布的离散程度），反映各数据远离其中心值的趋势。

③（分布的形状），反映数据分布的偏态和峰态。

10. 集中趋势：一组数据向某一中心值靠拢的程度，反映了一组数据中心点的位置所在。

低层次数据的集中趋势测度值适用于高层次的测量数据，高层次数据的集中趋势测度值并不适用于低层次的测量数据。

11.分类数据：众数：一组数据中出现次数最多的变量值，用Mo表示。

是一个位置代表值，不受数据中极端值的影响，可以有两个或多个众数，具有不唯一性。

主要用于测度分类数据的集中趋势，也适用于作为顺序数据以及数值型数据集中趋势的测度值（数据较多时应用或数据分布偏斜程度较大时应用）顺序数据：分位数和中位数中位数：一组数据排序后处于中间位置上的变量值，用Me表示。

不受极端值影响。

主要用于测度顺序数据的集中趋势，也适用于测度数值型数据的集中趋势，不适用于分类数据。

中位数位置=（n+1）/2 （数据分布偏斜程度较大时应用）12.数值型数据：平均数：易受极端值的影响。

是集中趋势最主要的测度值，它主要适用于数值型数据，不适用于分类数据和顺序数据。

（数据对称分布或接近分布时应用）13. 众数、中位数、平均数的关系：如果数据的分布是对称的，众数、中位数和平均数必定相等。

如果数据是左偏分布，存在极小值，平均数＜中位数＜众数。

如果数据是右偏分布，存在极大值，众数＜中位数＜众数15..离散程度的度量：反映的是各变量值远离其中心值的程度。

说明了集中趋势测度值的代表程度。

数据的离散程度越大，集中趋势的测度值对数据的代表性就越差；离散程度越小，代表性就越好。

分类数据：异种比率：是指非众数组的频数占总频数的比率。

主要用于衡量众数对一组数据的代表程度。

异众比率越大，说明非众数组的频数占总频数的比重越大，众数的代表性越差，反之越好顺序数据：四分位差：反映了中间50%数据的离散程度，其数据越小，说明中间越集中；其数值越大，说明中间的数据越分散。

不受极差影响四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。

也可适用于数值型数据，但不适合分类数据。

数值型数据：方差和标准差方差的计算公式：标准差的计算公式：16.相对位置的度量：判断一组数据是否有离群数据。

标准分数、经验法则、切比雪夫不等式。

标准分：变量值与其平均数的离差除以标准分后的值。

公式：相对离散程度：离散系数。

离散系数也叫变异系数，一组数据的标准差与其相对应的平均数之比。

离散系数是测度数据离散的相对统计量，主要用于比较不同样本数据的离散程度。

离散系数大数据的离散程度也大；离散系数小，数据的离散程度也小。

17.数据的分布特征与适用的描述统计量：数据分布特征：①集中趋势：众数、中位数、平均数②离散程度：异众比率、四分位差、极差、平均差、方差或标准差、离散系数。

③分布的形状：偏态系数、峰态系数18.概率。

概率的古典定义：如果某一随机试验的结果有限，而且各个结果出现的可能性相等，则某一事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值。

结果有限、机会均等。

概率的统计定义：在相同条件下随机试验n次，某事件A出现m次（m ≦n），则比值m/n称为事件A发生的频率。

随n的增大，该频率围绕某一常数p 上下波动，波动幅度逐渐减小，趋于稳定。

这个频率的稳定值即为该事件的概率。

19.随机变量：离散型随机变量，连续型随机变量离散型随机变量的概率分布：期望值：表示期望是反映随机变量X取值的集中趋势的理论均值。

是随机变量X的期望指标。

表示了随机变量本身的平均水平或集中程度。

方差与标准差：随机变量的方差是用来反映随机变量取值的离散程度的。

每一个随机变量取值与期望值的离差平方之期望值。

σ²=D(X)=E(X²)-[E(X)]²随机变量方差的平方根为标准差。

二项分布和泊松分布：二项分布，随机变量服从的概率分布。

二项分布的期望值和方差：E(X)=np，D(X)=npq。

泊松分布，用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。

如:在某企业中每月发生的事故的次数；人寿公司每天收到的死亡声明的个数泊松分布的期望值和方差：E(X)=λ，D(X)=λ。

20.连续性随机变量的概率分布：正态分布：一种连续型分布。

（离散型：二项分布）X服从正态分布，记作X~N(μ，σ²)，随机变量X服从均值为μ、方差为σ²的正态分布。

特点：（1）f（x）》=0，即整个概率密度曲线都在x轴上方。

（2）曲线f(x)相对于x=μ对称。

并在x=u时达到最大值，f(u)= （3）曲线的陡缓程度由标准差决定，σ越大，曲线越平缓；σ越小，曲线越陡峭。

（4）当x趋于无穷时，曲线以x轴为其渐近线标准正态分布：相应的正态分布N（0,1）称为标准态分布。

它的重要性在于任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。

公式Z= 21.X^2分布T分布：22.样本均值的分布：样本均值的抽样分布：容量相同的所有可能样本的样本均值的概率分布，一种理论概率分布，进行推断总体均值μ的理论基础。

中心极限定理：设从均值为μ、方差为σ²(有限)的任意一个总体中抽取样本量为n的样本，当n充分大时（至少大于30），样本均值的抽样分布近似服从均值为μ，方差为σ²/n的正态分布。

23.样本比例的抽样分布：1.容量相同的所有可能样本比例的概率分布2.当容量样本很大时，样本比例的抽样分布可用正态分布近似 3.一种理论概率分布 4.推断总体比例π的理论基础。