广东药科大学统计学练习题
医学统计学考试试题及答案

医学统计学考试试题及答案l.统计中所说的总体是指:() [单选题] *A根据研究目的确定的同质的研究对象的全体(正确答案)B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.统计学的主要作用是 : () [单选题] *A使分析更为简单B避免计算出现错误C改善数据质量D克服个体变异的影响E探测随机现象的规律(正确答案)3.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本4.测量身高、体重等指标的原始资料叫:() [单选题] *A计数资料B计量资料(正确答案)C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人,治疗结果如下:()[单选题] *A计数资料B计量资料C无序分类资料D有序分类资料(正确答案)E数值变量资料6.正态分布曲线的位置参数是: () [单选题] *AαBβC µ(正确答案)DσEχ7.医学统计学的基本内容是: () [单选题] *A统计设计、数据整理与核查、统计描述、统计推断(正确答案) B收集资料、整理资料、设计、统计推断C统计设计、收集资料、统计推断、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断8.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: () [单选题] *A抽样误差B系统误差(正确答案)C随机误差D责任事故E以上都不对9.以下何者不是实验设计应遵循的原则 : () [单选题] *A对照的原则B随机原则C重复原则D交叉的原则(正确答案)E以上都不对10.对于配对设计的t检验,其检验假设H0是:() [单选题] *A两样本均数相同B两样本均数不同C两总体均数相同D两样本均数不同E配对数据的差值总体均数为0(正确答案)11.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 : () [单选题] * A 算术均数B几何均数C 中位数(正确答案)D 标准差E 变异系数12.各观察值均加(或减)同一数后: () [单选题] *A均数不变,标准差改变B均数改变,标准差不变C两者均不变(正确答案)D两者均改变E以上均不对13.比较某地1990~1997年肝炎发病率宜绘制 : () [单选题] *A直条图B构成图C普通线图(正确答案)D直方图E统计地图14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24以上(小时),问该食物中毒的平均潜伏期为多少小时? () [单选题] *A 5B 5.5C 6(正确答案)D l0E 1215.比较12岁男孩身高和体重的变异程度大小,宜采用的指标是: () [单选题] *A全距B标准差C方差D变异系数(正确答案)E极差16.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是 : ()[单选题] *A变异系数B离均差平方和C极差D 四分位间距E标准差(正确答案)17.以下不属于统计表的基本组成的是:() [单选题] *A.标题B.标目C.线条D.时间(正确答案)E.数字18.某项指标95%医学参考值范围表示的是: () [单选题] *A在此范围“异常”的概率大于或等于95%B 在此范围“正常”的概率大于或等于95%C 在“异常”总体中有95%的人在此范围之外D 在“正常”总体中有95%的人在此范围(正确答案)E 在人群中检测指标有5%的可能超出此范围19.20世纪50年代,发现某省部分地区的居民因长期饮用深井高碘水导致高碘性甲状腺肿,随机抽查得到该地区甲乙两村常住居民的高碘性甲状腺肿患病率,甲村为20.6%,乙村为25.3%,则甲乙两村该病的合计患病率为:() [单选题] *A两村患病率的几何平均数得29.11%B 两村患病率相加得45.9%C 两村患病率相乘得5.21%D 两村患病率的平均数得22.95%E 甲乙两村调查人群中患该病总人数除以调查总人数(正确答案)20.药物A对于治疗普通肺炎的有效率为67.0%,药物B治疗普通肺炎的有效率为65 .7%,为了分析A药和B药对于普通肺炎的有效率是否不同,经过两独立样本的t检验计算t值,最后查表得到的P=0.035,那么该研究中最后应该下的研究结论应该是:() [单选题] *A药物A与药物B治疗普通肺炎的有效率相同B 尚不能认为药物A与药物B治疗普通肺炎的有效率相同(正确答案)C 尚不能认为药物A与药物B治疗普通肺炎的有效率不同D 药物A治疗普通肺炎的有效率优于药物BE 无法下结论21.以下属于离散型变量指标的是:() [单选题] *A身高B 体重C 住院病人数D 血液中血红蛋白含量(正确答案)E 某地年降水量22.小概率事件是指:() [单选题] *A统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件(正确答案)B 统计学上一般把P≤0.5或P≤0. 1的事件称为小概率事件C 统计学上一般把P≤0.05或P>0.01的事件称为小概率事件D 统计学上一般把P≤0.25的事件称为小概率事件E 发生概率足够小的事件23.在绘制频数分布表的过程中,组限在每组中: () [单选题] * A只包含下限而不包含上限(正确答案)B 只包含上限而不包含下限C 既包含下限又包含上限D 可自行选择包含上限或下限E 上限和下限均不包含24.以下几幅图中属于正偏态分布的是: ( A ) [单选题]A(正确答案)BC DE25.描述抗体滴度集中趋势适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数26.算术均数与中位数相比,其特点是:() [单选题] * A不易受极端值的影响B 能充分利用数据的信息(正确答案)C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明资料27.医学参考值范围的计算方法主要有:() [单选题] *A百分位数法和估计值法B 百分位数法和正态分布法(正确答案)C 百分位数法和查表法D 正态分布法和查表法E 查表法和公式计算法28.比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以:() [单选题] * A排除对结果有不良影响的个体B 增大样本量C 采用标准化率(正确答案)D 更改相关数据E 通过统计软件消除影响29.统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的: () [单选题] *A标准值B 标准差C 标准化率D 标准误(正确答案)E 标准方差30.以下变量适合用单侧检验进行分析的是:() [单选题] *A血铅水平(正确答案)B 血压C 呼吸次数D 血红蛋白含量E 3岁男童正常身高3l.统计学中所谓的样本通常是指:() [单选题] *A总体中有代表性的一部分观察单位(正确答案)B可测量的生物性样品C统计量D某一变量的测量值E数据中的一部分观测值32.医学统计学研究的对象是:() [单选题] *A医学中的小概率事件B各种类型的数据C动物和人的本质D疾病的预防与治疗E医学中具有不确定性结果的事物(正确答案)33.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本34,下列观测结果属于有序数据的是:() [单选题] *A收缩压测量值B脉搏数C住院天数D病情程度(正确答案)E四种血型35.两样本均数比较,其差别有统计学意义是指 :() [单选题] * A两样本均数的差别具有实际意义B两总体均数的差别具有实际意义C两样本和两总体均数的差别都具有实际意义D有理由认为两样本均数有差别E有理由认为两总体均数有差别(正确答案)36.不可完全消除的误差类型是:() [单选题] *A系统误差B 随机误差(正确答案)C 抽样误差D 人为误差E 机械误差37.正态曲线下,横轴上从均数到+∞的面积是:() [单选题] *A 50%(正确答案)B 95%C 97.5%D 99%E 不能确定(与标准差的大小有关)38.6人接种流感疫苗一个月后测定抗体滴度为1:20,1:40,1:80,1:160,1:320,求平均滴度应选用的指标是:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数39.描述两端无确定数值数据的平均水平适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数E 中位数(正确答案)40.以下变量中,属于分类变量的是: () [单选题] *A脉搏B血型(正确答案)C肺活量D红细胞计数E血压41.减少抽样误差的有效途径是:() [单选题] *A避免系统误差B控制随机测量误差C增大样本含量(正确答案)D减少样本含量E以上都不对42.样本是总体的 : () [单选题] *A有价值的部分B有意义的部分C有代表性的部分(正确答案)D任意一部分E典型部分43.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:() [单选题] * A统计设计B收集资料C整理资料D分析资料(正确答案)E以上均不对44.统计工作的步骤正确的是:() [单选题] *A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料(正确答案)D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断45.表示血清学滴度资料平均水平最常计算 :() [单选题] *A算术均数B几何均数(正确答案)C中位数D全距E率46.一种新的治疗方法不能治愈病人,但能延长病人寿命,那么则会发生的情况是 :() [单选题] *A 该病患病率增加(正确答案)B 该病发病率增加C 该病患病率下降D 该病发病率下降E 以上都不对47.计算标化死亡率的目的是:() [单选题] *A 减少死亡率估计的抽样误差B 减少死亡率估计的系统误差C 便于进行不同地区的死亡率比较D 便于进行不同时间的死亡率比较E 消除不同人群内部构成不同的影响(正确答案)48.统计推断的目的是: () [单选题] *A参数估计B假设检验C统计描述D用样本信息推断总体特征(正确答案)E以上均不对49.两样本均数比较时,其无效假设是:() [单选题] * A.两个总体均数不同B.两个样本均数不同C.两个总体均数相同(正确答案)D.两个样本均数相同E.以上均不对50.实验设计的三个基本要素是: () [单选题] *A化学因素、物理因素、研究对象B 研究者、受试对象、效果C 受试对象、背景因素、实验效应D 处理因素、实验效应、受试对象(正确答案)E 干扰因素、实验场所、处理因素。
《医药数理统计学》试题及答案 ()

(一)填充题1.统计数据可以分为数据、数据、数据、据等三类,其中数据、数据属于定性数据。
2.常用于表示定性数据整理结果的统计图有、;而、、、等是专用于表示定量数据的特征和规律的统计图。
3.用于数据整理和统计分析的常用统计软件有等。
4. 描述数据集中趋势的常用测度值主要有、和等,其中最重要的是;描述数据离散程度的常用测度值主要有、、、等,其中最重要的是、。
(二)选择题1. 各样本观察值均加同一常数c后( )A.样本均值不变,样本标准差改变B.样本均值改变,样本标准差不变C.两者均不变 D. 两者均改变2.关于样本标准差,以下哪项是错误的()。
A.反映样本观察值的离散程度 B.度量了数据偏离样本均值的大小C.反映了均值代表性的好坏 D.不会小于样本均值3.比较腰围和体重两组数据变异度大小宜采用()A.变异系数(CV)B.方差(S2)C.极差(R) D.标准差(S)(三)计算题1. 测得10名接触某种病毒的工人的白细胞(109/L)如下:7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95(1)计算其样本均值、方差、标准差、标准误和变异系数。
(2)求出该组数据对应的标准化值;(3)计算其偏度。
解:(1)75.6795.55.61.7101=+++=∑= i i x ,n =10=+++=∑=222101295.55.61.7 i i x462.35 样本均值775.61075.6711===∑=n i i x n x 方差)(111222∑=--=n i i x n x n S 371.0)775.61035.462(912=⨯-= 标准差2S S ==371.0≈0.609 标准误193.040609.0===n SS x变异系数CV =%100||⨯x S =%100775.6609.0⨯=8.99%; (2)对应的标准化值公式为609.0775.6-=-=i i i x S x x u 对应的标准化值为 0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355;(3)33)2)(1()(S n n x x n S i k ---=∑=0.204。
广药统计学简答

简述众数、中位数和均值的特点及应用场合众数:不受极端值影响、具有不惟一性、数据分布偏斜程度较大且有明显峰值时应用中位数:不受极端值影响、数据分布偏斜程度较大时应用平均数:易受极端值影响、数学性质优良、数据对称分布或接近对称分布时应用简述用excel进行回归的具体步骤,写出excel输出的回归结果包括几个部分第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【回归】,选择【确定】第4步:当对话框出现时在【Y值输入区域】设置框内键入Y的数据区域在【X值输入区域】设置框内键入X的数据区域在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域在【残差】分析选项中选择所需的选项写出用excel进行方差分析的操作步骤第1步:选择【工具】下拉菜单,选择【数据分析】选项第2步:在分析工具中选择【单因素方差分析】,选择【确定】第3步:当对话框出现时在【输入区域】方框内输入数据单元格在【a】方框输入题目所需提示的a在【置信度】选项中给出所需的数值在【输出选项】中选择输出区域回归分析主要解决哪些方面的问题?1.从一组样本数据出发,确定变量之间的数学关系;2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;3.利用所求的关系式,根据一个或几个变量的取值来估计与预测另一个变量的值,并给出可靠程度;季节指数的计算的基本步骤1.计算移动平均值,并将其结果进行“中心化”处理。
将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”(CMA)2.计算移动平均的比值,也称为季节比率,将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值,即季节指数3.季节指数调整,各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。
具体方法是:将第2步计算的每个季节比率的平均值除以它们的总平均值什么是季节指数,它起到什么作用,举一个例子说明1刻画序列在一个年度内各月或季的典型季节特征2以其平均数等于100%为条件而构成3反映某一月份或季度的数值占全年平均数值的大小4如果现象的发展没有季节变动,则各期的季节指数应等于100%5季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定例子:在市场销售中,一些商品如电风扇、冷饮、四季服装等往往受季节影响而出现销售的 淡季和旺季,回归分析中误差项与残差项的区别与联系1. 误差项8是随机变量2. 反映了除x 和y 之间的线性关系之外的随机因素对y 的影响,是不能由x 和y 之间的线性关系所解释的变异性3. 残差定义为*七—^)4. 联系为可以用残差的代数式来估计误差项写出判定系数的计算公式,并说明判定系数的意义?1. 回归平方和占总误差平方和的比例2. 反映回归直线的拟合程度3. 取值范围在:0, 1 :之间4. R2 -1,说明回归方程拟合的越好;R2—0,说明回归方程拟合的越差5. 判定系数等于相关系数的平方1 — n i = E (y —y I i i =1 i =1请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用 方法?比如用平均工资代表某一地区的典型收入,平均房价代表某一地区的典型房价。
20级广东医中药学本科《 医学统计学 》试卷

20级广东医中药学本科《医学统计学》试卷考试时间:120分钟姓名:身份证号码:专业:学号:一、最佳选择题(每小题2分,共20分)1.7人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为()A.1:12.4B.1:8C.1:16D.1:8~1:162.比较身高和体重两组数据变异度大小宜采用()A.变异系数B.方差C.极差D.标准差3.下列关于个体变异说法不正确的是()A.个体变异是生物体固有的。
B.个体变异是有规律的。
C.增加样本含量,可以减小个体变异。
D.指标的分布类型反映的是个体的分布规律。
4.实验设计的原则是()A.对照、随机、均衡B.随机、重复、均衡C.对照、重复、随机D.随机、重复、齐同5.说明某现象发生强度的指标为()A.平均数B.率C.构成比D.相对比6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C表后,其卡方值的自由度为()A.8B.1C.3D.跟样本含量有关7.假设检验中的第一类错误是指()所犯的错误。
A.拒绝了实际上成立的H0B.不拒绝实际上成立的H0C.拒绝了实际上不成立的H0D.不拒绝实际上不成立的H08.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高()A.α= 0.01B.α=0.05C.α=0.10D.α=0.209.两样本均数的t检验对资料的要求是()A.正态性、独立性、方差齐性B.资料具有代表性C.为定量资料D.以上均对10.四个率的比较的卡方检验,P值小于0.01,则结论为()A.四个总体率均不相等;B.四个样本率均不相等;C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。
二、名词解释(每题3分,共15分)1.相关系数:2.抽样误差:3.变异系数:4.总体参数:5.区间估计:三、填空题(每空1分,共11分)17. 1、常用的四种概率抽样方法有:_______________________,_______________________,_______________________,_______________________。
高等教育医药数理统计考试试及答案

医药数理统计考试试题一、单选题1、数理统计是以()为基础,通过对随机现象观察数据的收集整理和分析推断来研究其统计规律的学科。
[单选题] *A.数学理论B.概率论√C.哲学理论D.随机理论2、统计学的核心是()。
[单选题] *A.数据收集B.数据整理C.数据分析√D.数据解释3、下列不属于统计学常用的软件的是()。
[单选题] *A.SPSSB.SASC.R软件D. Photoshop√4、下列关于数据的说法错误的是()。
[单选题] *A.不同类型数据需要使用不同的统计方法进行分析和处理B.数据可分为定类数据、定序数据和数值数据等三种类型C.定类数据和定序数据数据属于定性数据D.数值数据属于定性数据√5、下列关于数据分布的特征描述有误的一项是()。
[单选题] *A.对数据分布的特征进行描述只需要描述其集中趋势即可√B.均值是数据分布集中趋势的最主要统计量C.中位数和众数主要用于描述数据分布的集中趋势D.描述数据分布离散程度的最重要的统计量是方差和标准差6、下列不属于随机试验特点的是()。
[单选题] *A.试验在相同条件下可重复进行B.能事先明确试验的所有可能结果C.试验之前能确定哪一个结果会出现√D.试验之前不能确定哪一个结果会出现7、下面的维恩图显示事件A与B之间的关系为()。
[单选题] *8、若事件A和B互不相容,P(A)=0.3,P(B)=0.6,则P(A+B)=()。
[单选题] *B.0.42C.0.30D.0.90√9、有100张从1到100号的卡片,从中任取一张,取到卡号是7的倍数的概率为()。
[单选题] *A. 7/50√B. 7/100C. 7/48D. 15/10010、下列说法正确的是()。
[单选题] *A.任一事件的概率总在(0,1)之内B.不可能事件的概率不一定为0C.必然事件的概率一定为1√D.以上均不对11、下列变量属于离散型随机变量的是()。
[单选题] *A.人的体重B.人的血压C.考试成绩D.骰子点数√12、正态分布有两个参数μ与σ,()相应的正态曲线的形状越扁平。
广医大医学统计学题库(研一)

广医大医学统计学题库(研一)单选题:1下面的变量中是分类变量的是a.体重b.体重c.年龄d.血型e.血压2下面的变量中就是就是数值变量的就是a.性别b.年龄c.血型d.职业e疗效3.随机事件的概率p为a.p=0b.p=1c.p=-0.5d.c0.5c.总体中随机抽取的一部分d.总体中按比例分配的一部分e.总体中信息明确的一部分5.若以播发汞含量大于2.6ug/kg为异常,调查某地1000人中多少人属异常,这资料可以看做a.计量资料b.计数资料c.等级资料d.实验资料e.以上均不对6.统计数据工作的步骤就是:a.作假设、计算统计量、查界值表和作结论b.整理资料、分析资料、假设检验c.统计数据设计、搜集资料、整理和分析资料d.成立对照组、估算样本、重复试验e.统计数据叙述、区间估算、假设检验7.反映计量资料集中趋势的指标是____。
a.标准差b.标准误c.率为d.全距e.均数8.基本建设频数表错误的作法就是____。
a.找到最大值和最小值,排序极差b.定组距,常用等组距,一般分8~15组为宜c.写组段时组段可重叠,如“2~4,4~6,?”d.用划记法计频数e.第一个组段应当包含变量最小值,最后一个组段应包含变量最大值9.在叙述资料的变异程度时,最阔的范围就是___。
a均数?标准差b极差c四分位数间距d95%的参考值范围ep5~p95间距10.比较20头河马体重和20只小白鼠体重两组数据变异程度大小宜采用____a.变异系数(cv)b.方差c.极差(r)d.标准差(s)e.四份位数间距11.对血清滴度资料则表示平均水平的最为常用统计数据量就是::a.均数b.中位数c.几何均数d.全距e.标准差12.描述一组偏态分布资料的变异程度时,适宜的统计量是:a.变异系数(cv)b.方差c.极差(r)d.标准差(s)e.四份位数间距13关于标准正态分布曲线下的面积,错误的就是____a.-1.96至1.96间曲线下面积就是95%b.1.96至2.58间曲线下面积就是2%c.大于1.645的曲线下面积就是2.5%d.-1.96至-1.645间曲线下面积就是2.5%e.大于1.96的曲线下面积为2.5%14.??1.96?范围内占到正态曲线下面积的____。
2021年统计学习题及答案完整

第一某些计量资料记录描述一、最佳选取题1、描述一组偏态分布资料变异度,以()指标较好。
A、全距B、原则差C、变异系数D、四分位数间距E、方差2.用均数和原则差可以全面描述()资料特性。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观测值均加(或减)同一数后()。
A.均数不变,原则差变化B.均数变化,原则差不变C.两者均不变D.两者均变化E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.原则差E.四分位数间距5.偏态分布宜用()描述其分布集中趋势。
A.算术均数B.原则差C.中位数D.四分位数间距E.方差6.各观测值同乘以一种不等于0常数后,()不变。
A.算术均数B.原则差C.几何均数D.中位数E.变异系数7.()分布资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(阐明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限频数分布资料,可用()描述其集中趋势。
A.均数B.原则差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最惯用来表达其平均水平指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.原则差二、简答题1、对于一组近似正态分布资料,除样本含量n外,还可计算,S和,问各阐明什么?2、试述正态分布、原则正态分布及对数正态分布某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量成果3、阐明频数分布表用途。
4、变异系数用途是什么?组段频数5、试述正态分布面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、依照1999年某地某单位体检资料,116名正常0.9~ 13成年女子血清甘油三酯(mmol/L)测量成果如右表, 1.0~ 19请据此资料: 1.1~ 25(1)描述集中趋势应选取何指标?并计算之。
广东药科大学统计学练习题

练习一一、单项选择题(每题1分,共15分,选出最为恰当的一项)。
1.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中,样本是()A、100所中学B、20个城市C、全国的高中学生D、100所中学的高中学生2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。
对样本中位数可作如下解释()A、大多数女性MBA的起薪是47543美元B、最常见到的起薪是47543美元C、样本起薪的平均值为47543美元D、有一半女性的起薪高于47543美元3.某组数据的四分之一分位数是45,中位数是85,四分之三分位数是105,则该组数据的分布是()A、右偏的B、对称的C、左偏的D、上述全不对4.权数对均值的影响实质上取决于()A、各组权数的绝对值大小B、各组权数是否相等C、各组变量值的大小D、各组权数的比重5.下列关于抽样调查的描述,不正确的是()A、目的是根据抽样结果推断总体;B、结果往往缺乏可靠性;C、是一种非全面;D、调查单位是随机抽取的6.两组数据的均值不等,但标准差相等,则()A、均值小,差异程度大;B、均值大,差异程度大;C、两组数据的差异程度相同;D、无法判断。
7.下列叙述正确的是()A、众数可以用于数值型数据;B、中位数可以用于分类数据;C、几何平均数可以用于顺序数据;D、均值可以用于分类数据。
8.各变量值与其()的离差之和等于零。
A、中位数;B、众数;C、均值;D、标准差9.点估计的缺点是()A、不能给出总体参数的准确估计B、不能给出总体参数的有效估计C、不能给出点估计值与总体参数真实值接近程度的度量D、不能给出总体参数的准确区间10.估计量的抽样标准误差反映了估计的()A、准确性;B、精确性;C、显著性;D、可靠性11.在总体均值和总体比率的区间估计中,允许的极限误差由()确定。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习一一、单项选择题(每题1分,共15分,选出最为恰当的一项)。
1.为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中,样本是()A、100所中学B、20个城市C、全国的高中学生D、100所中学的高中学生2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。
对样本中位数可作如下解释()A、大多数女性MBA的起薪是47543美元B、最常见到的起薪是47543美元C、样本起薪的平均值为47543美元D、有一半女性的起薪高于47543美元3.某组数据的四分之一分位数是45,中位数是85,四分之三分位数是105,则该组数据的分布是()A、右偏的B、对称的C、左偏的D、上述全不对4.权数对均值的影响实质上取决于()A、各组权数的绝对值大小B、各组权数是否相等C、各组变量值的大小D、各组权数的比重5.下列关于抽样调查的描述,不正确的是()A、目的是根据抽样结果推断总体;B、结果往往缺乏可靠性;C、是一种非全面;D、调查单位是随机抽取的6.两组数据的均值不等,但标准差相等,则()A、均值小,差异程度大;B、均值大,差异程度大;C、两组数据的差异程度相同;D、无法判断。
7.下列叙述正确的是()A、众数可以用于数值型数据;B、中位数可以用于分类数据;C、几何平均数可以用于顺序数据;D、均值可以用于分类数据。
8.各变量值与其()的离差之和等于零。
A、中位数;B、众数;C、均值;D、标准差9.点估计的缺点是()A、不能给出总体参数的准确估计B、不能给出总体参数的有效估计C、不能给出点估计值与总体参数真实值接近程度的度量D、不能给出总体参数的准确区间10.估计量的抽样标准误差反映了估计的()A、准确性;B、精确性;C、显著性;D、可靠性11.在总体均值和总体比率的区间估计中,允许的极限误差由()确定。
A、置信水平B、统计量的抽样标准差C、置信水平和统计量的抽样标准差D、统计量的抽样方差12.下面的说法正确的是()A、一个无偏的估计量意味着它非常接近总体的参数;B、一个无偏的估计量并不意味着它等于总体的参数;C、一个有效的估计量意味着它更接近总体的参数;D、一个有效的估计量意味着它等于总体的参数。
13.在假设检验中,“=”总是放在( )A、原假设上;B、备择假设上;C、可以放在原假设上,也可以放在备择假设上;D、有时放在原假设上,有时也放在备择假设上14.在假设检验中,原假设总是表示( )A、总体参数会变大;B、总体参数会变小;C、总体参数没有变化;D、样本统计量没有变化。
15.P值的大小()A、与拒绝原假设的对或错有关;B、与拒绝原假设的对或错无关;C、与拒绝备择假设的对或错有关;D、与观测数据出现的经常程度有关。
一、单项选择题(每小题1分,共15分)DDCDB AACCB CBACB二、简答题(每题5分,共20分)16、常见变异指标有哪些?变异指标的主要作用有哪些?1)常用的变异指标主要有:极差、四分位差、平均差、标准差、离散系数、异众比率。
2)变异指标的主要作用:①说明数据的离散程度,反映变量的稳定性、均衡性。
②衡量平均数的代表性③在统计推断中,变异指标常常还是判别统计推断前提条件是否成立的重要依据,也是衡量推断效果好坏的主要尺度。
17、确定检验统计量时应考虑哪些因素?(10分)答:主要考虑:1)总体的分布;2)总体的方差已知还是未知;3)样本容量的大小18、二手资料与一手资料有何不同?使用二手资料时应注意哪些问题?二手资料是指与研究内容有关的信息,只需重新加工、整理的资料(2分);而一手资料是指必须通过调查和实验的方法直接获得的资料(2分)。
注意问题:①资料的可信度;②资料的时效性;③资料的产生背景;④数据质量;⑤要注意数据的定义、含义、计算口径和计算方法;⑥注明数据来源。
(各1分)19、什么是参数最小二乘估计?最小二乘法是指使因变量的观察值y i与估计值y iˆ之间的残差平方和达到最小来求得βˆ0和βˆ1的方法(5分),即.min1)ˆˆ()ˆ(22==∑--∑-xyyy iiiiββ(2分)然后对该式求相应于βˆ0和βˆ1的偏导数并令其等于零,便可求出βˆ和βˆ1(3分)。
三、计算题(共70分)20、1. (10分)某公司付给生产一线雇员的平均工资是每小时15美元。
该公司正计划建造一座新厂,备选厂址有好几个地方。
但是,能够获得每小时至少15美元的劳动力是选厂址的主要因素。
某个地方的40名工人的样本显示:最近每小时平均工资是x=14美元,样本标准差是s=2.4美元。
问在α=0.01的显著水平下,样本数据是否说明在这个地方的工人每小时的平均工资大大低于15美元?已知326.201.0=z ,426.201.0=t (10分)解:15:,15:10<≥μμH H检验统计量为:n s x z /μ-= , 拒绝域为: 326.201.0-=-=-<z z z α由已知计算得:635.240/4.21514/-=-=-=n s x z μ由于01.0635.2z z -<-=,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。
或检验统计量为:ns x t /μ-= , 拒绝域为: 426.201.0-=-=-<t t t α由已知计算得:635.240/4.21514/-=-=-=n s x t μ由于 01.0635.2t t -<-=,故拒绝原假设,即可认为该地区的平均工资确实大大低于15美元。
21、一家知名螺杆生产厂家一个生产车间某天的生产数量(单位:根)如下所示: 41,25,29,47,38,34,30,38,43,40 46,36,45,37,37,36,45,43,33,44 35,28,46,34,30,37,44,26,38,44 42,36,37,37,49,39,42,32,36,35根据以上数据进行适当分组,编制频数分布表,并绘制直方图。
解:频数分布表如下:一生产车间某天产量分组表按产量分组(万元) 频数(天) 频率(%) 25~30 4 10.0 30~35 6 15.0 35~40 15 37.5 40~45 9 22.545~50 6 15.0 合计 40 100.0 直方图(略)22、已知甲、乙两个班学生的成绩资料如下:甲班的平均成绩为78.5分,成绩标准差是9.58分;乙班的资料见下表:计算:(1)乙班学生的平均成绩、成绩标准差和标准差系数; (2)哪个班的平均成绩更具有代表性?为什么?∴(1))(4.73503670分乙==∑∑=f xf x ()()分乙84.1044.1175058722≈==∑-∑=ffx x σ %77.14%1004.7384.10%100≈⨯=⨯=乙乙乙x v σσ (2)具有代表性!乙班学生的平均成绩更甲班学生的平均成绩比又,乙甲甲甲甲甲甲∴≈⨯=⨯=∴==σσσννσνσ %20.12%1005.7858.9%10058.95.78x x23、某快餐店某天随机抽取49名顾客对其的平均花费进行抽样调查。
调查结果为:平均花费8.6元,标准差2.8 元。
试以95.45%的置信度估计:(1)该快餐店顾客总体平均花费的置信区间及这天营业额的置信区间(假定当天顾客有2000人);(2)若其他条件不变,要将置信度提高到99.73%,至少应该抽取多少顾客进行调查?(提示:69.10455.0=z ,22/0455.0=z ;32/0027.0=z ,78.20027.0=z ) 1、4.0498.2==x μ,8.04.02=⨯=∆x总体均值的置信区间:(8.6-0.8,8.6+0.8)即(7.8,9.4)元 营业总额的置信区间:(2000*7.8,2000*9.4)即(15600,18800)元。
必要的样本容量: 11125.1108.08.2*922===n 24、某公司的10家下属企业的产量与生产费用之间关系如下:要求:(1)计算相关系数并进行显著性检验;(2)拟合回归方程; (3)计算估计标准误差yx S2222221657277119107777090310165777713293810)()(-⨯-⨯⨯-⨯=---=∑∑∑∑∑∑∑y y n x x n y x xy n r =0.808(2)=-⨯⨯-⨯=--=∑∑∑∑∑22217777090310165777713293810)(ˆx x n y x xy n β0.398789.13410777398.0101657ˆˆ1=⨯-=⨯-=∑∑n x ny ββ回归方程为:x y398.0789.134ˆ+= (3)8132938398.01657789.1342771192ˆˆ102⨯-⨯-=---=∑∑∑n xyy yS yx ββ=10.394练习二一、单项选择题(每题1分,共15分,选出最为恰当的一项)。
1.在假设检验中,原假设总是表示( )A、总体参数会变大B、总体参数会变小C、总体参数没有变化D、样本统计量没有变化2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54794美元,中位数是47543美元,标准差是10250美元。
根据这些数据可以判断,女性MBA起薪的分布状态()A、尖峰,对称B、右偏C、左偏D、均匀3.当()时,均值只受变量值大小的影响,而与次数无关。
A、变量值较大而次数较小B、变量值较大且次数较大C、各变量值出现次数相等D、变量值较小且次数较小4.当数据分布有对称的集中趋势时,其均值()A、趋于变量值大的一方B、趋于变量值小的一方C、趋于权数大的变量值D、趋于哪方很难判定5.某城市对1000户居民的一项调查显示,人均收入在2000-3000元的家庭占24%,在3000-4000元的家庭占26%,在4000-5000元的家庭占29%,在5000-6000元的家庭占10%,在6000-7000元的家庭占7%,在7000元以上的家庭占4%。
从此数据可以判断,该城市收入数据的分布是( )。
A、右偏的;B、左偏的;C、对称的;D、正态的。
6.计算方差所依据的中心数据是()A、众数;B、中位数;C、均值;D、几何平均数7.以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的是()A、95%的置信区间比90%置信区间宽B、样本容量较小的置信区间较小C、相同置信水平下,样本量大的区间较大D、样本均值越小,区间越大8.在参数估计中利用t分布构造置信区间的条件是()A、总体分布需服从正态分布且方差已知B、总体分布为正态分布,方差未知C、总体不一定是正态分布但须是大样本D、总体不一定是正态分布,但需要方差已知9.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是他与总体参数的离差越小越好。