《医药数理统计方法》考试大纲
医药数理统计大纲_试题及答案

星期二 2010 03 09本科段《医药数理统计》考试大纲1课程性质和设置目的医药数理统计是运用数理统计的原理和方法来分析和解释中医药及医学研究中遇见的各种现象和试验调查资料的一门学科,已成为医药学研究中一种不可缺少的工具,在医药信息的正确收集、整理和分析中发挥着重要作用。
因此,本课程设置目的:1. 使学生了解统计学方法在现代生物科学尤其在医药学研究中的重要作用;2. 系统掌握医药数理统计的基本原理、基本概念、具体实验资料分析方法以及试验设计方法等的应用;3. 通过对医药数理统计的学习,培养学生严谨的科学态度与分析问题、解决问题的能力,为以后的科学研究打下基础。
3课程内容与考核目标根据中药学专业的设置特点及教学计划要求,该课程主要内容如下:第1章事件与概率着重介绍事件之间的关系和运算及概率的基本概念和运算。
熟悉随机事件、概率的基本概念,熟练掌握概率的计算方法,了解全概率与Bayes公式。
1随机事件及其运算2事件的概率——统计定义及古典概率3概率的运算4全概率与Bayes公式第2章随机变量的概率分布与数字特征熟悉随机变量、概率分布的基本概念,掌握随机变量的均数、方差(标准差)及其变异系数的计算方法和它们反映的数据意义,掌握二项分布、泊松分布、正态分布的概率计算方法及其数字特征的表达式。
了解三种分布的渐近关系和大数定律及中心极限定理。
第一节离散型变量的概率分布第二节连续型变量的概率分布第三节随机变量的数字特征第四节三种重要分布的渐近关系第五节大数定律及中心极限定理(只需了解)第3章随机抽样和抽样分布熟悉随机抽样和统计量的基本概念,掌握样本数字特征的计算方法和它们反映的数据意义,掌握几种从正态总体中抽取的样本统计量的u分布、ⅹ2分布、t分布、F分布表达公式。
了解概率纸及其应用的方法。
1随机抽样2样本的数字特征3抽样的分布4概率纸及其应用(只需了解)第4章连续型随机变量的参数估计与检验熟悉概率分布的参数概念和意义,掌握正态分布参数的三种估计(点估计、区间估计、假设检验)方法,了解假设检验的原理及两类检验错误的处理方法。
医学统计学复习提纲

《医学统计学》复习提纲第二章 统计描述公式:几何均数(1)直接法: nn X X X G ...21=或 )lg (lg )lg ...lg lg (lg 1211nX n X X X G n ∑--=+++=(2)加权法:)lg (lg ....lg ...lg lg (lg 12122111∑∑--=++++++=f X f f f f X f X f X f G k k k中位数(median ) (1) 直接法:n 为奇数 , 2)1(+=n X M n 为偶数,)(21122++=n n X X M(2)频数表法:用于频数表资料。
∑-+=)2(L Mf nf i L M 标准差(standard deviation ): nX ∑-=2)(μσ 1)(2--=∑n X X S离均差平方和2)(∑-X X 常用SS 或l XX 表示。
∑∑∑-=-==NX X X X l SS XX 222)()(直接法: 1)(22--=∑∑n n X X S 加权法:1)(22--=∑∑∑∑f ffX fX S1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请联系实际加以说明。
率和构成比所说明的问题不同,绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。
这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。
但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。
若要比较高血压的患病率,应该计算患病率指标。
3. 应用相对数时应注意哪些问题?4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
医学统计学复习大纲

医学统计学复习大纲(一)绪论1)总体与样本总体:根据研究目的确定的同质研究对象的全体。
分为有限总体与无限总体。
样本:从总体中随机抽取的部分观察单位。
2)参数与统计量参数:总体的统计指标,用希腊字母表示。
如总体均数、标准差,分别记为μ、σ。
固定的常数。
统计量:样本的统计指标,用拉丁字母表示。
如样本均数、标准差,为X(拔)、S。
在参数附近波动的随机变量。
3)抽样误差误差:实际观察值与客观真实值之差a.系统误差在实际观测过程中,由研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。
特点:观察值有方向性、周期性。
可以通过严格的实验设计和技术措施消除b.非系统误差由研究者的偶然失误而造成。
c.随机误差排除上述误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小和方向不固定。
随机测量误差——提高操作者熟练程度可以减少这种误差。
随机抽样误差(由抽样造成的样本统计量和总体参数间的差异。
)——不可避免,但有一定的分布规律,可估计。
4)四种随机抽样方法a.单纯随机抽样——将观察单位逐一编号,然后用随机数字表、抽签或电脑等方法随机抽取部分观察单位组成样本。
为最基本的抽样方法。
b.系统抽样——按一定顺序机械地每隔若干个观察单位抽取一个观察单位以组成样本。
又称间隔抽样、机械抽样、等距抽样。
c.整群抽样——从总体中随机抽取若干个“群体”以组成样本。
这个群体可以是班级、街道社区等。
d.分层抽样——先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计上叫“层”),再从每一层内随机抽取一定数量的观察单位,以组成样本。
也即分类抽样。
误差大小排序:整群抽样>单纯随机抽样>系统抽样>分层抽样5)P ≤ 0.05(5%)或P ≤ 0.01(1%)称为:小概率事件,即某事件发生的可能性很小。
6)变量的分类a.数值变量——其变量值是定量的,表现为数值的大小,一般有度量衡单位。
——计量(定量)资料b.分类变量——其变量值是定性的,表现为互不相容的类别或属性。
医药数理统计自考复习

第一章J一、事件之间的关系及运算:包含:事件A发生必然导致事件B发生,记作AuB或BnA。
相等:若AuB,同时有BuA,记为A二B并事件:C = A + B二{A,B至少有一个发生}交事件:AB={A9B同时发生}互斥事件:A,B不同时发生即互斥完备群:即•柑S)且壬4=:。
/-I对立事件:在一次试验中A与B有且仅有一个发生,即AB=^且4 + B=C二、事件的概率1 •频率的定义:进行条件相同的n次试验,事件A出现m次,则称m为事件A的频数, 比值n/m称为事件A发生的频率。
记作/(A)= m/n2•概率的古典定义:主要看例题3.概率的性质:11 OSP⑷VI;2 \叱)=1 ;P(O)= 0三、概率的运算1. 加法定理:互斥事件P(4 + B)= P(A)+ P(B)—般事件P(A + B)= P(A)+ P(B)一P(AB)对立事件P(A + B)= P(4)+P(B)= 12 .乘法定理:独立事件P(AB) = P(A)P(B)(独立的定义:P(A) = P(A/B)或P(B) = P(B/A))一般事件P(AB) = P(A)P(B/A) = P(B)P(A/B)注意:独立不胡,胡不独立3 .条件概率:P(B/A)= ^# , P(B/A)= 1-P(B/A)四. 全概公式和逆概公式(重点)定理1 :若事件组〃显2,…B“是一列互不相容的事件,且有= 6对任何事件A ,有1-1P(A)^P(B i)P{A/B i).即r-1P(A) = P(AB, + g +•• + AB)f-11-1定理2 :若〃”伙,…〃”是一列互不相容的事件,且产C,P(Bj>0,心1,2,…r-1则对任一事件A,P(A)>0 有Pg/A)= j(3)P0/Bj,即D(B J P(4/B JPg*需例题Z书后习题。
第二章概率分布与数宇特征离散型变量的概率分布与数宇特征一. 概率函数1、定义:P{X =心}=久,写成表格的形式(分布率)2、基本性质:戸n o ; Z竹=1r二、分布函数1、泄义:F(x) = P{X Sx}, x G RP{x2 <X<>x5} = P{X VxJ-P{X <>x2} = F(X5)-F(X2)= P(x i) + P(x4) + P(x s)2、性质:OVF(x)Vl; F(x)是x 的不减函数;F(Y>)=0,F(*O)=1。
《医药数理统计方法》中药专业

7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95 (1)计算其样本均值、方差、标准差、标准误和变异系数。
(2)求出该组数据对应的标准化值; (3)计算其偏度。
解75.6795.55.61.7101=+++=∑= i i x ,n =10 =+++=∑=222101295.55.61.7 i i x 462.35 样本均值775.61075.6711===∑=n i i x n x 方差)(111222∑=--=n i i x n x n S 371.0)775.61035.462(912=⨯-=标准差2S S ==371.0≈0.609标准误193.040609.0===n S S x 变异系数CV =%100||⨯x S=%100775.6609.0⨯=8.99%; (2)对应的标准化值公式为609.0775.6-=-=i i i x S x x u 对应的标准化值为0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355; (3)33)2)(1()(S n n x x n S i k ---=∑=0.204 2.用事件A 、B 、C 表示下列各事件: (1)A 出现,但B 、C 不出现; (2)A 、B 出现,但C 不出现; (3)三个都出现; (4)三个中至少有一个出现; (5)三个中至少有两个出现;(6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。
解:(1)ABC (2)ABC (3)ABC (4)ABC BC A C B A C AB C B A C B A C B A ++++++ 或A +B +C 或C B A -Ω (5)ABC BC A C B A C AB +++ (6)ABC 或Ω-(A +B +C )或C B A ++(7)ABC ABC ABC ++ (8)ABC ABC ABC ABC +++ (9)BCA CB AC AB C B A C B A C B A C B A ++++++ 或Ω-ABC 或ABC7.某大学学生中近视眼学生占22%,色盲学生占2%,其中既是近视眼又是色盲的学生占1%。
医药数理统计方法(人卫版)

第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类常用统计图形条形图,圆形图(饼图)茎叶图,箱形图(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()nni i i i x x x C ==-≤-∑∑证一:设21()()ni i fC x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2nni i i i f C x C x n C f C n =='''=--=-+=∑∑令f '(C )=0,得唯一驻点11= ni i C x x n==∑由于()20f x n ''=>,故当Cx=时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nnnnni i i i i i i i i i ni i x x x C x n xx Cx n C n x Cx n Cn x C x C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni i i i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.492.692.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.992.093.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.291.892.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.090.8(1)取组距为0.5,最低组下限为90.5,试作出频数分布表;(2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
医药数理统计方法试题

医药数理统计方法第四章抽样误差与假设检验一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布4. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。
[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
101.4X=, 1.5S=,450n=,0.07XS===95%可信区间为下限:/2.101.4 1.960.07101.26 XX u Sα=-⨯=-(g/L)上限:/2.101.4 1.960.07101.54 XX u Sα+=+⨯=(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
医药数理统计方法

一、判断题(正确的在答题纸上选择A,错误的选择B)1. n个事件1,,nA A相互独立的充要条件是它们的积事件的概率等于它们各自概率的积。
2. 对于有限总体来说,二项分布适用于不放回抽取的情况,而超几何分布适用于有放回抽取的情况。
3. 在概率密度曲线是单峰并且对称时,众数、中位数、数学期望都相等。
4. 与正态总体有关的2χ、t、F分布,都是研究统计量的极限分布。
5. 同一个参数的无偏估计量并不是唯一的,在样本的观察值变动时,波动更小的估计量更有效。
6. 假设检验中,犯第一类错误的概率α越小,则犯第二类错误的概率β也越小。
7. 在拟合优度的2χ中,当1df=时,使用校正公式。
这是因为离散型分布用于连续型分布时,必须进行校正。
8. 符号检验比符号秩检验简单,但是符号秩检验的效率要高。
对同一个问题,二者作出的结论是一致的。
9. 在方差分析中,T方法和S方法没有区别,二者都是两两间多重比较的检验方法。
10. 两个变量间可能存在一定的函数关系,而在统计学中它们是不相关的。
二、选择题11.已知()0.7,()0.4,P A P A B=-=则()___P A B=。
() 0.4 () 0.3 () 0.7 (D) 0.6 ABC12. Poisson 分布、二项分布、Weibull 分布和两点分布的参数个数依次是____。
(A) 1, 2, 3, 2(B) 2, 3, 2, 2(C) 2, 2, 2, 1(D) 1, 2, 3, 113. 已知随机变量X 的数学期望E(X)是2,方差V(X)是1。
则21X -的期望和方差分别是____。
() 3, 2() 3, 4() 4, 2() 4, 4A B C D14. 设对总体X 得到一个容量为5的样本值:4.5,2.0,1.0,1.5,4.5。
则______, _______X s ==。
() 2.7, 1.68() 2.7, 1.88() 3, 1.68() 3, 1.88A B C D15. 设θ为总体X 的一个未知参数,置信区间的水平为α。