统计学二项分布习题,DOC

统计学二项分布习题,DOC
统计学二项分布习题,DOC

(一)单项选择题

1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则()

A .样本患病率p =X /n 服从

B (n ,π)

[评析]本题考点:二项分布的正态近似特性。

从对二项分布特性的描述中可知:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π,)1(ππ-n )。π不接近0也不接近1,等同于π接近0.5,因而此题目答案为D 。

3. 以下分布中,其均数和方差总是相等的是()

A.正态分布B.对称分布

C.Poisson分布D.二项分布

答案:C

[评析]本题考点:Poisson分布的特性。

Poisson分布P(μ)的参数只有一个,即μ。它的均数和方差均

C

从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X代表所取出球中的红色球数,则X服从二项分布B(10,0.5)。()

答案:正确。

[评析]本题考点:二项分布的定义。

2

二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;

②每次试验的条件不变;③各次试验独立。此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。所以,此题目

3.Bernoulli试验

(二)单项选择题:

1.X1、X2分别服从二项分布B(n1,p1)、B(n2,p2),且X1、

X

相互独立,若要X=X1+X2也服从二项分布,则需满足下列条件()。2

A.X1=X2B.n1=n2

C.p1=p2D.n1p1=n2p2

2.二项分布B(n,p)的概率分布图在下列哪种条件下为对称分布()。

A.n=50B.p=0.5

C.np=1D.p=1

C.95~105D.74.2~125.8

(三)简答题

1.服从二项分布及Poisson分布的条件分别是什么?

2.二项分布、Poisson分布分别在何种条件下近似正态分布?

3.在何种情况下,可以用率的标准误S p描述率的抽样误差?

4

(四)计算题

1.已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区10位成人的血清,其中3人为阳性。该地区成人乙肝表面抗原阳性率是否高于全国平均水平?

2.对甲、乙两种降压药进行临床疗效评价,将某时间段内入院的

则称此随机变量X服从以n、π为参数的二项分布(B i n o m i a l D i s t r i b u t i o n),记为X~B(n,π)。

2.Poisson分布:若离散型随机变量X的取值为0,1,…,n,且相应的取值概率为

6

μμ-==e k k X P k

!)((μ>0)

则称随机变量X 服从以μ为参数的Poisson 分布(PoissonDistribution ),记为X ~P (μ)。

3.Bernoulli 试验:将感兴趣的事件A 出现的试验结果称为“成功”,事件A 不出现的试验结果称为“失败”,这类试验就称为Bernoulli

20),其分布近似于正态分布。

3.当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p 描述率的抽样误差。

(四)计算题

1.建立检验假设

H0:该地区成人乙肝表面抗原阳性率为10%;

H1:该地区成人乙肝表面抗原阳性率大于10%。

α=0.05。

从总体率为10%的人群随机抽取10人,3人或3人以上阳性的概

著差别,甲药比乙药有效率高。

3.放射性物质含量为4克/千克的矿石每千克的平均脉冲记数为μ=100*4=400/小时,μ值较大,可利用Poisson分布的近似正态分布特性进行计算。

H0:两矿区矿石中该放射性物质含量相等,即后一矿区矿石发生

8 脉冲频率的总体均数为400/小时;H 1:两矿区矿石中该放射性物质含量不相等,即后一矿区矿石发生脉冲频率的总体均数不等于400/小时。α=0.05。

30400400

1000=-=u >2.58,P <0.01。

在α=0.05水平上,拒绝H 0,接受H 1,即两矿区矿石中该放射性

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

随机变量及其分布列经典例题

随机变量及其分布列典型例题 【知识梳理】 一.离散型随机变量的定义 1定义:在随机试验中,确定一个对应关系,使得每一个试验结果都用一个确定的数字表示.在这个对应关系下,数字随着试验结果变化而变化的变量称为随机变量、 ①随机变量就是一种对应关系;②实验结果必须与数字对应; ③数字会随着实验结果的变化而变化、 2.表示:随机变量常用字母X ,Y,ξ,η,…表示. 3、所有取值可以一一列出的随机变量,称为离散型随机变量 ( dis cre te ran dom var ia ble ) . 二、离散型随机变量的分布列 1.一般地,若离散型随机变量X 可能取的不同值为x 1,x 2,…,xi ,…,x n, X 取每一个值x i (i=1,2,…, n)的概率P (X =xi)=pi ,则称表: 为离散型随机变量X P(X =x i )=p i , i =1,2,…,n, 也可以用图象来表示X 的分布列、 2.离散型随机变量的分布列的性质 ①pi ≥0,i=1,2,…,n ;②11 =∑=n i i p . 三.两个特殊分布 1.两点分布),1(~P B X 若随机变量X 的分布列具有上表形式,则称服从两点分布,并称p =P (X =1)为成功概率. 2、超几何分布),,(~n M N H X 一般地,在含有M 件次品的N 件产品中,任取n件,其中恰有X 件次品,则P (X =k )= n N k n M N k M C C C --,k =0,1,2,…,m ,其中m =min {}n M ,,且n ≤N ,M ≤N ,n ,M,N ∈N * . 三、二项分布 一般地,在n 次独立重复试验中,用 X 表示事件A 发生的次数,设每次试验中事件A发生的概率为p ,则P (X=k )=C 错误!p k (1-p)n - k ,k=0,1,2,…,n 、此时称随机变量X服从二项分布,记作X ~B (n ,p),并称p 为成功概率.易得二项分布的分布列如下;

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

二项分布专题练习

二项分布专题练习 1.已知随机变量X 服从二项分布,X ~B 16,3?? ??? ,则P (X =2)=( ). A . 316 B . 4243 C . 13 243 D . 80 243 2.设某批电子手表正品率为 34,次品率为1 4 ,现对该批电子手表进行测试,设第X 次首次测到正品,则P (X =3)等于( ). A .223 13C 44??? ??? B .2 2331C 44 ??? ? ?? C .2 1344 ??? ??? D .2 3144 ??? ??? 3.甲、乙两名篮球队员轮流投篮直至某人投中为止,设甲每次投篮命中的概率为0.4,乙投中的概率为0.6,而且不受其他次投篮结果的影响,设投篮的轮数为X ,若甲先投,则P (X =k )等于( ). A .0.6k - 1×0.4 B .0.24k -1×0.76 C .0.4k -1×0.6 D .0.76k - 1×0.24 4.10个球中有一个红球,有放回地抽取,每次取出一球,直到第n 次才取得k (k ≤n )次红球的概率为( ). A .2191010n k -???? ? ? ???? B . 191010k n k -???? ? ? ???? C .1119C 1010k n k k n ---???? ? ????? D .1 1119C 1010k n k k n ----???? ? ??? ?? 5.在4次独立重复试验中,事件A 发生的概率相同,若事件A 至少发生1次的概率为 65 81 ,则事件A 在1次试验中发生的概率为( ). A . 13 B . 25 C . 56 D . 34 6.某一批花生种子,如果每一粒发芽的概率为4 5 ,那么播下4粒种子恰有2粒发芽的概率是__________. 7.一个病人服用某种新药后被治愈的概率为0.9,则服用这种新药的4个病人中至少3人被治愈的概率为__________.(用数字作答) 8.假定人在365天中的任意一天出生的概率是一样的,某班级中有50名同学,其中有两个以上的同学生于元旦的概率是多少?(结果保留四位小数)

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

二项分布经典例题+测验题资料

二项分布经典例题+测 验题

二项分布 1.n 次独立重复实验 一般地,由n 次实验构成,且每次实验相互独立完成,每次实验的结果仅有两种对立的状态,即A 与A ,每次实验中()0P A p =>。我们将这样的实验称为n 次独立重复实验,也称为伯努利实验。 (1)独立重复实验满足的条件第一:每次实验是在同样条件下进行的;第二:各次实验中的事件是互相独立的;第三:每次实验都只有两种结果。 (2)n 次独立重复实验中事件A 恰好发生k 次的概率 ()P X k ==(1)k k n k n C p p --。 2.二项分布 若随机变量X 的分布列为()P X k ==k k n k n C p q -,其中 0 1.1,0,1,2,,,p p q k n <<+==则称X 服从参数为,n p 的二项分布,记作(,)X B n p 。 1.一盒零件中有9个正品和3个次品,每次取一个零件,如果取出的次品不再放回,求在取得正品前已取出的次品数X 的概率分布。 3.甲乙两人各进行3次射击,甲每次击中目标的概率为2 1,乙每次击中目标的概率为3 2. (1)记甲击中目标的此时为ξ,求ξ的分布列及数学期望; (2)求乙至多击中目标2次的概率; (3)求甲恰好比乙多击中目标2次的概率. 【巩固练习】

1.(2012年高考(浙江理))已知箱中装有4个白球和5个黑球, 且规定:取出一个白球的2分,取出一个黑球的1分.现从该箱中任取(无放回,且每球取到的机会均等)3个球,记随机变量X为取出3球所得分数之和. (Ⅰ)求X的分布列。 (Ⅱ)求X的数学期望E(X). 2.(2012年高考(重庆理))(本小题满分13分,(Ⅰ)小问5分,(Ⅱ)小问8分.) 甲、乙两人轮流投篮,每人每次投一球,.约定甲先投且先投中者获胜,一直到有人获胜或每人都已投球3次时投篮结束.设甲每 次投篮投中的概率为1 3,乙每次投篮投中的概率为1 2 ,且各次投篮 互不影响. (Ⅰ) 求甲获胜的概率。 (Ⅱ) 求投篮结束时甲的投篮次数 的分布列与期望 3.设篮球队A与B进行比赛,每场比赛均有一队胜,若有一队胜4场则比赛宣告结束,假定,A B在每场比赛中获胜的概率都是 1 2 ,试求需要比赛场数的期望. 3.(2012年高考(辽宁理))电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图。

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

二项分布经典例题+测验题

二项分布 1.n 次独立重复实验 一般地,由n 次实验构成,且每次实验相互独立完成,每次实验的结果仅有两种对立的状态,即A 与A ,每次实验中()0P A p =>。我们将这样的实验称为n 次独立重复实验,也称为伯努利实验。 (1)独立重复实验满足的条件第一:每次实验是在同样条件下进行的;第二:各次实验中的事件是互相独立的;第三:每次实验都只有两种结果。 (2)n 次独立重复实验中事件A 恰好发生k 次的概率 ()P X k ==(1)k k n k n C p p --。 2.二项分布 若随机变量X 的分布列为()P X k == k k n k n C p q -,其中 0 1.1,0,1,2,,,p p q k n <<+==则称X 服从参数为,n p 的二项分布,记作(,)X B n p 。 1.一盒零件中有9个正品和3个次品,每次取一个零件,如果取出的次品不再放回,求在取得正品前已取出的次品数X 的概率分布。 3.甲乙两人各进行3次射击,甲每次击中目标的概率为2 1,乙每次击中目标的概率为3 2 . (1)记甲击中目标的此时为ξ,求ξ的分布列及数学期望; (2)求乙至多击中目标2次的概率; (3)求甲恰好比乙多击中目标2次的概率. 【巩固练习】 1.(2012年高考(浙江理))已知箱中装有4个白球和5个黑球,且

规定:取出一个白球的2分,取出一个黑球的1分.现从该箱中任取(无放回,且每球取到的机会均等)3个球,记随机变量X为取出3球所得分数之和. (Ⅰ)求X的分布列。 (Ⅱ)求X的数学期望E(X). 2.(2012年高考(重庆理))(本小题满分13分,(Ⅰ)小问5分,(Ⅱ)小问8分.) 甲、乙两人轮流投篮,每人每次投一球,.约定甲先投且先投中者获胜,一直到有人获胜或每人都已投球3次时投篮结束.设甲每次投 篮投中的概率为1 3,乙每次投篮投中的概率为1 2 ,且各次投篮互不 影响. (Ⅰ) 求甲获胜的概率。 (Ⅱ) 求投篮结束时甲的投篮次数 的分布列与期望 3.设篮球队A与B进行比赛,每场比赛均有一队胜,若有一队胜 4场则比赛宣告结束,假定,A B在每场比赛中获胜的概率都是1 2 , 试求需要比赛场数的期望. 3.(2012年高考(辽宁理))电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查. 下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图。

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

正态分布及其经典习题和答案

专题:正态分布 【知识网络】 1、取有限值的离散型随机变量均值、方差的概念; 2、能计算简单离散型随机变量的均值、方差,并能解决一些实际问题; 3、通过实际问题,借助直观(如实际问题的直观图),认识正态分布、曲线的特点及曲线所表示的意义。 【典型例题】 例1:(1)已知随机变量X 服从二项分布,且E (X )=2.4,V (X )=1.44,则二项分布的参数n ,p 的值为 ( ) A .n=4,p=0.6 B .n=6,p=0.4 C .n=8,p=0.3 D .n=24,p=0.1 答案:B 。解析:()4.2==np X E ,()44.1)1(=-=p np X V 。 (2)正态曲线下、横轴上,从均数到∞+的面积为( )。 A .95% B .50% C .97.5% D .不能确定(与标准差的大小有关) 答案:B 。解析:由正态曲线的特点知。 (3)某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是 ( ) A 32 B 16 C 8 D 20 答案:B 。解析:数学成绩是X —N(80,102), 8080 9080(8090)(01)0.3413,480.34131610 10P X P Z P Z --??≤≤=≤≤=≤≤≈?≈ ???。 (4)从1,2,3,4,5这五个数中任取两个数,这两个数之积的数学期望为___________ 。 答案:8.5。解析:设两数之积为X , ∴E(X)=8.5. (5)如图,两个正态分布曲线图: 1为)(1 ,1x σμ?,2为)(22x σμ?, 则1μ 2μ,1σ 2σ答案:<,>。解析:由正态密度曲线图象的特征知。 例2:甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格. (Ⅰ)求甲答对试题数ξ的概率分布及数学期望; (Ⅱ)求甲、乙两人至少有一人考试合格的概率. 答案:解:(Ⅰ)依题意,甲答对试题数ξ的概率分布如下: 甲答对试题数ξ的数学期望 E ξ=5 9 61321210313010=?+?+?+? . (Ⅱ)设甲、乙两人考试合格的事件分别为A 、B ,则

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

二项分布经典例题练习题

二项分 布 1.n 次独立重复试验 一般地,由n 次试验构成,且每次试验相互独立完成,每次试验的结果仅有两种对立的状态,即A 与A ,每次试验中()0P A p =>。我们将这样的试验称为n 次独立重复试验,也称为伯努利试验。 (1)独立重复试验满足的条件第一:每次试验是在同样条件下进行的;第二:各次试验中的事件是互相独立的;第三:每次试验都只有两种结果。 (2)n 次独立重复试验中事件A 恰好发生k 次的概率()P X k ==(1)k k n k n C p p --。 2.二项分布 若随机变量X 的分布列为()P X k ==k k n k n C p q -,其中0 1.1,0,1,2,,,p p q k n <<+==L 则称X 服从参数为,n p 的二项分布,记作(,)X B n p :。 1.一盒零件中有9个正品和3个次品,每次取一个零件,如果取出的次品不再放回,求在取得正品前已取出的次品数X 的概率分布。 2.一名学生每天骑车上学,从他家到学校的途中有6个交通岗,假设他在各个交通岗遇到 红灯的事件是相互独立的,并且概率都是31 . (1)设ξ为这名学生在途中遇到红灯的次数,求ξ的分布列; (2)设η为这名学生在首次停车前经过的路口数,求η的分布列;

(3)求这名学生在途中至少遇到一次红灯的概率. 3.甲乙两人各进行3次射击,甲每次击中目标的概率为 21,乙每次击中目标的概率为3 2. (1)记甲击中目标的此时为ξ,求ξ的分布列及数学期望; (2)求乙至多击中目标2次的概率; (3)求甲恰好比乙多击中目标2次的概率. 【巩固练习】 1.(2012年高考(浙江理))已知箱中装有4个白球和5个黑球,且规定:取出一个白球的 2分,取出一个黑球的1分.现从该箱中任取(无放回,且每球取到的机会均等)3个球,记随机变量X 为取出3球所得分数之和. (Ⅰ)求X 的分布列; (Ⅱ)求X 的数学期望E (X ). 2.(2012年高考(重庆理))(本小题满分13分,(Ⅰ)小问5分,(Ⅱ)小问8分.) 甲、乙两人轮流投篮,每人每次投一球,.约定甲先投且先投中者获胜,一直到有人获胜 或每人都已投球3次时投篮结束.设甲每次投篮投中的概率为1 3 ,乙每次投篮投中的概 率为1 2 ,且各次投篮互不影响. (Ⅰ)求甲获胜的概率; (Ⅱ)求投篮结束时甲的投篮次数ξ的分布列与期望

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

相关文档
最新文档