统计学习题1

统计学习题1
统计学习题1

第2章统计数据的描述

练习:

2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果

如下:

700 716 728 719 685 709 691 684 705 718

706 715 712 722 691 708 690 692 707 701

708 729 694 681 695 685 706 661 735 665

668 710 693 697 674 658 698 666 696 698

706 692 691 747 699 682 698 700 710 722

694 690 736 689 696 651 673 749 708 727

688 689 683 685 702 741 698 713 676 702

701 671 718 707 683 717 733 712 683 692

693 697 664 681 721 720 677 679 695 691

713 699 725 726 704 729 703 696 717 688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;

(3)绘制茎叶图,并与直方图作比较。

2.2某百货公司6月份各天的销售额数据如下(单位:万元):

257 276 297 252 238 310 240 236 265 278

271 292 261 281 301 274 267 280 291 258

272 284 268 303 273 263 322 249 269 295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。

2.3在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)企业数(个)

200~300 19

300~400 30

400~500 42

500~600 18

600以上11

合计120

计算120家企业利润额的均值和标准差。

答案

2.1 (1)排序略。

(2)频数分布表如下:

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)灯泡个数(只)频率(%)

650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计

100

100

直方图(略)。

2.2L U (2) 17.21=s (万元)。

2.3 x =426.67(万元);48.116=s (万元)。

第3章 概率与概率分布

练习:

3.6某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 答案

3.6这是一个计算后验概率的问题。

设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:

6115

.050612.030951

.0)|()()|()()|()()|(===

A B P A P A B P A P A B P A P B A P +

决策者会倾向于采用新的生产管理流程。

第4章 抽样与抽样分布

练习:

4.1 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。

⑴ 给出x 的抽样分布(重复抽样)的均值和标准差

⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。

4.4 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。

⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远?

⑶ 为了回答b 你必须要知道μ吗?请解释。 4.6 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、

金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样

的分布以及x 的均值和方差是什么?证明你的回答; ⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率

呢?在209美元和217美元之间的概率呢?

4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为406=μ克、标准

差为1.10=σ克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量x 。

(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;

(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出

现问题了呢,为什么? 答案

4.1 ⑴ 20, 2; ⑵ 近似正态; ⑶ -2.25; ⑷ 1.50。 4.4 ⑴ 101, 99 ⑵ 1 ; ⑶ 不必。

4.6 ⑴ 正态分布, 213, 4.5918; ⑵ 0.5, 0.031, 0.938。

4.7 ⑴ 406, 1.68, 正态分布; ⑵ 0.001; ⑶是,因为小概率出现了。

第5章 参数估计

练习:

2.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少?

2.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客

组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;

(3) 如果样本均值为120元,求总体均值95%的置信区间。

2.3 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽

取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 2.4 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视

机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。

2.5 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允

许误差不超过4%,应抽取多大的样本? 答案

5.1 (1)79.0=x σ;(2)E =1.55。 5.2 (1)14.2=x σ;(2)E =4.2;(3)(115.8,124.2)。 5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (18.11%,27.89%);(17.17%,22.835)。 5.5

48。

第6章 假设检验

练习:

6.1 某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。研究人

员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。 a) 选择检验统计量并说明其抽样分布是什么样的? b) 检验的拒绝规则是什么? c) 计算检验统计量的值,你的结论是什么?

6.2 一项调查显示,每天每个家庭看电视的平均时间为

7.25个小时,假定该调查中包括了

200个家庭,且样本标准差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平α=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?

6.3 一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了

研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取α=0.01,检验如下的假设:

75.0:0=πH 75.0:1≠πH 对这个医生的论断你有什么看法?

6.4 一个视频录像设备(VCR )的平均使用寿命为6年,标准差为0.75年,而抽选了由30

台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差。并在α=0.05的显著性水平下做出结论。

答案

6.1 (1)检验统计量

n s x z /μ

-=

,在大样本情形下近似服从标准正态分布;

(2)如果05.0z z >,就拒绝0H ;

(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。

6.2 z =3.11,拒绝0H 。 6.3 z =

7.48,拒绝0H 。 6.4

2χ=206.22,拒绝0H 。

第7章 方差分析与试验设计

练习:

7.1 从三个总体中各抽取容量不同的样本数据,得到如下资料。检验3个总体的均值之间

是否有显著差异?(α=001.)

样本1 样本2 样本3 158 148 161 154 169

153 142 156 149

169 158 180

7.2 某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货,为

比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)

试分析三个企业生产的电池的平均寿命之间有无显著差异?(=005.)如果有差异,用LSD 方法检验哪些企业之间有差异? 答案

7.1 0215.86574.401.0=<=F F (或01.00409.0value =>=-αP ),不能拒绝原假设。 7.2 8853.30684.1705.0=>=F F (或05.00003.0value =<=-αP ),拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;

85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

第8章 相关与回归分析

练习:

8.1 表中是道琼斯工业指数(DJIA )和标准普尔500种股票指数(S&P500)1988年至

计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。

8.4美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street

(1)画出这些数据的散点图;

(2)根据散点图。表明二变量之间存在什么关系?

(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;

(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?

8.5 表中是1992年亚洲各国人均寿命(y )、按购买力平价计算的人均GDP (1x )、2x 3x

资料来源:联合国发展规划署《人的发展报告》

(1)用多元回归的方法分析各国人均寿命与人均GDP 、成人识字率、一岁儿童疫苗接种率的关系;

(2)对所建立的回归模型进行检验。 答案

8.1(1)利用Excel 计算结果可知,相关系数为 0.948138XY r =,说明相关程度较高。 (2)计算t 统计量

2.681739

8.436851

0.317859t =

=

=

=

给定显著性水平=0.05,查t 分布表得自由度n -2=10-2=8的临界值2t α为2.306,

显然t t α>,表明相关系数 r 在统计上是显著的。 8.4 (1)数据散点图如下:

(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。

(3)设投诉率为Y ,航班正点率为X

建立回归方程 12i i i Y X u ββ=++ 估计参数为 ^

6.01780.07i i Y X =-

(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:

4187.08007.00178.6?=?-=i Y (次/10万)

8.5 由Excel 回归输出的结果可以看出:

(1)回归结果为

^

23332.993090.0716190.1687270.179042i i i i Y X X X =+++

(2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。

由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。

第9章 时间序列分析

练习:

9.2 某地区社会商品零售额1988—1992年期间(1987年为基期)每年平均增长10%,1993—1997年期间每年平均增长8.2%,1998—2003年期间每年平均增长6.8%。问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少?

9.4 某公司近10年间股票的每股收益如下(单位:元):

0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50 (1)分别用移动平均法和趋势方程预测该公司下一年的收益;

(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向?

(2)拟合线性模型测定长期趋势; (3)预测2004年各季度鲜蛋销售量。 答案 9.1

(1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长:

%86.2313186.213186.31%)8.61(%)2.81(%)101(5

55==-=-+?+?+ (2)年平均增长速度为

1%)8.61(%)2.81(%)101(15

555-+?+?+=0.0833=8.33%

(3) 2004年的社会商品零售额应为

509.52)0833.01(307=+?(亿元)

9.2

(1)用每股收益与年份序号回归得^

0.3650.193t Y t =+。预测下一年(第11年)的每

股收益为488.211193.0365.0?

11=?+=Y 元

(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向。

(2)t T t ?+=63995

.09625.8 (3)趋势剔出法季节比例计算表(一)

上表中,其趋势拟合为直线方程t T t ?+=63995

.09625.8。

根据上表计算的季节比率,按照公式KL t t t S T Y -?=计算可得: 2004年第一季度预测值:

7723.21097301.1)1763995.09625.8(???11717=??+=?=S T Y

2004年第二季度预测值: 49725.23147237.1)1863995.09625.8(???21818=??+=?=S T Y 2004年第三季度预测值: 009.18852641.0)1963995.09625.8(???3

1919=??+=?=S T Y 2004年第四季度预测值:

6468.19902822.0)2063995.09625.8(???42020=??+=?=S T Y

统计学练习题1.2

统计学 一、单项选择题 1.要了解50个学生的学习情况,则总体单位是() A、50个学生 B、每一个学生 C、50各学生的学习成绩 D、每一个学生成绩 2.一个总体单位() A、只能有一个标志 B、只能有一个指标 C、可以有多个标志 D、只能有一个指标 3.统计认识的过程是() A、从质到量 B、从量到质 C、从质开始到量,再到质与量的结合 D、从量开始到质,再到量与质的结合 4.对某市高等学校的科研所进行调查,则统计总体是() A、某市所有的高等学校 B、某一高等学校的科研所 C、某一高等学校 D、某市所有高等学校的科研所 5.某高校在校学生数为10000人,若要研究该校在校学生规模是否适度,这里的“在校学生数为10000人”是() A、指标 B、变量 C、标志 D、标志值 6.某企业几个工人的工资分别为1500元、l650元,1800元和2000元,这几个数字是() A、标志 B、标志值 C、指标 D、变量 7.下列指标中属于数量指标的是() A、利润额 B、劳动生产率 C、人口密度 D、资金利税率 8.某企业有500名职工,将500名职工的月工资总额除以500之后求出该企业的月平均工资,这是() A、对500个变量求平均 B、对500个变量值求平均 C、对500个标志求平均 D、对500个指标求平均 9、下列属于离散变量的是() A、厂房面积 B、职工人数 C、销售额 D、原材料消耗额 10.下列各项中哪项属于存量() A、存款余额 B、存款发生额 C、出生人数 D、人口自然增长量 二、多项选择题 1、在全国人口普查中() A、每个人是总体单位 B、女性是品质标志 C、年龄是数量标志 D、人口平均寿命是数量标志 E、全国人口数是总体 2、下列标志中,属于品质标志的有() A、利润率 B、产品品种 C、男性 D、产值 E、统计人员技术职务 3、下列统计指标中,属于数量指标的有() A、全国总人口 B、社会总产值 C、平均工资 D、全国钢产量 E、计划完成程度 4、下列指标中属于离散指标的有() A、商业企业单位数 B、商品总销售额 C、职工人数 D、商品库存额 E、商店经营商品品种数 5、下列标志中,属于数量标志的有() A、职务 B、出勤人数 C、产品产量 D、八级工资制 E、文化程度 6、下列各项中,属于统计指标的有() A、某人的身高 B、我国某年的钢铁产量 C、某设备的使用年限 D、某职工某年的工资收入 E、2008年我国的人均国内生产总值 三、综合题 要调查某大型汽车制造公司职工的情况时,试指出总体、总体单位,并举出若干个品质标志、数量标志、数量指标和质量指标的例子。 一、单项选择题

统计学试题库带大题的

统计学试题库带大题的 统计学期末必看题 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变量和随机 变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等) A、从质到量 B、从量到质 C、从质到量,再到质和量的结合 D、从总体到个体 2、某班5名同学的某门课的成绩分别为60、70、75、80、85,这5个数是() A、指标 B、标志 C、变量 D、变量值 3、调查某市职工家庭的生活状况时,统计总体是() A、该市全部职工家庭 B、该市每个职工家庭 C、该市全部职工 D、该市职工家庭户数 4、调查某班50名学生的学习情况,则总体单位是() A、该班50名学生 B、该班每一名学生

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学题库答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图

选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1 选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE

统计学复习题1

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间?

要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。 (2)说明成年组和青少年组平均身高的代表性哪个大?为什么? 要求:试比较哪个单位的职工工资差异程度小。 8、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。 与平均分数相比,该位应试者哪一项测试更为理想? KEY: 1、(1)77,80.5,68.5,87.25 (2)83,18.75,0.173 (3)中位数,是数据分布明显左偏又是顺序数据。

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学试题库及答案

1、统计学与统计工作的研究对象就是完全一致的。F 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。T 3、统计学就是对统计实践活动的经验总结与理论概括。T 4、一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。T 5、数量指标就是由数量标志汇总来的,质量指标就是由品质标志汇总来的。F 6、某同学计算机考试成绩80分,这就是统计指标值。F 7、统计资料就就是统计调查中获得的各种数据。F 8、指标都就是用数值表示的,而标志则不能用数值表示。F 9、质量指标就是反映工作质量等内容的,所以一般不能用数值来表示F。 10、总体与总体单位可能随着研究目的的变化而相互转化。T11、女性就是品质标志。T 12、以绝对数形式表示的指标都就是数量指标以相对数或平均数表示的指标都就是质量指标 T 13、构成统计总体的条件就是各单位的差异性。F 14、变异就是指各种标志或各种指标之间的名称的差异。F 9、调查某校学生,学生“一天中用于学习的时间”就是(A)A、标志 13、研究某企业职工文化程度时,职工总人数就是(B) B数量指标 14、某银行的某年末的储蓄存款余额(C)C、可能就是统计指标,也可能就是数量标志 15、年龄就是(B)B、离散型变量 四、多项选择题 1、全国第四次人口普查中(BCE)A、全国人口数就是统计总体B、总体单位就是每一个人 C、全部男性人口数就是统计指标 D、男女性别比就是总体的品质标志 E、人的年龄就是变量 2、统计总体的特征表现为(ACD)A、大量性B、数量性C、同质D、差异性E、客观性 3、下列指标中属于质量指标的有(ABCDE)A、劳动生产率B、产品合格率C、人口密度 D、产品单位成本 E、经济增长速度 4、下列指标中属于数量指标的有(ABC) A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资 5、下列标志中属于数量标志的有(BD)A、性别B、出勤人数C、产品等级D、产品产量E 文化程度 6、下列标志中属于品质标志的有(ABE)A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质 7、下列变量中属于离散型变量的有(BE)A、粮食产量B、人口年龄C、职工工资 D、人体身高 E、设备台数 8、研究某企业职工的工资水平,“工资”对于各个职工而言就是(ABE)A、标志B、数量标

#统计学综合练习(1-6章)58867

综合练习(1-6章) 一、填空题 1.统计学是一门__收集、整理、显示和分析_统计数据的科学。 1.统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数 量规律性。 2.__描述统计___是整个统计学的基础和统计研究工作的第一步;___推断统计__是现代统 计学的核心和统计研究工作的关键环节; 2.描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。 3.推断统计是根据样本信息对总体进行估计、假设检验、预测或 其他推断的统计方法。 4.抽样调查中误差的来源有__抽样误差、_____和___非抽样误差两类。 3.____统计表___和____统计图______是显示统计资料的两种主要方式。 5.从统计方法的构成来看,统计学可以分成_描述统计学、推断统计学___。 6.统计调查的方法主要有_抽样调查、普查__。 4.美国10家公司在电视广告上的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9, 25,23.9,23,20。样本数据的中位数为27.95 5.分组的目的是找出数据分布的数量规律性,因此在一般情况下,组数不应少于5组,也 不应多于15组。 6.现有数据3,3,1,5,13,12,11,9,7。它们的中位数是 7 。 7.众数、中位数和均值中,不受极端值影响的是___众数、中位数__。 7.和是从数据分布形状及位置角度来考虑的集中趋势代表值,而是经过对 所有数据计算后得到的集中趋势值。 8.下列数据是某班的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69, 77,66,87,55,95,86,78,86,85,87,92,73,82。这些成绩的极差是。 9.变异系数为0.4,均值为20,则标准差为。 10.在统计学考试中,男生的平均成绩为75分,女生的平均成绩为80分,如果女生人数占 全班人数的2/3,则全班统计学平均成绩为____。 11.分组数据中各组的值都减少1/2,每组的次数都增加1倍,则加权算术平均数将_______。 12.已知某村2005年人均收入为2600元,收入的离散系数为0.3,则该村村民平均收入差 距(标准差)为______。 13.根据下列样本数据3,5,12,10,8,22计算的标准差为(保留3位有效数字)。 14.设随机变量X~N(2,4),则P{X≤2}=_______________. 15.考虑由2,4,10组成的一个总体,从该总体中采取重复抽样的方法抽取容量为3的样 本,则抽到任一特定样本的概率为。 16.随机变量根据取值特点的不同,一般可分为和。 17.某地区六年级男生身高服从均值为164cm、标准差为4cm的正态分布,若从该地区任 选一个男生,其身高在160cm以下的概率为(用标准正态分布函数表示)。 18.假定总体共有1000个单位,均值为32,标准差为5。采用不重复抽样的方法从中抽取 一个容量为30的简单随机样本,则样本均值的标准差为(保留4位小数)。

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学题库及题库答案

统计学题库及题库答案 ) B 、进行调查的时间 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、 对比分析不同性质的变量数列之间的变异程度时 ,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、 在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( ) A 、扩大为原来的 3倍 B 、扩大为原来的 2/3倍 C 、扩大为原来的 4/9倍 D 、扩大为原来的 2.25倍 5、 某地区组织职工家庭生活抽样调查 ,已知职工家庭平均每月每人生活费收入的标准差为 可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576 户 B 、144 户 C 、100 户 D 、288 户 6、当一组数据属于左偏分布时,则( ) A 、 平均数、中位数与众数是合而为一的 B 、 众数在左边、平均数在右边 C 、 众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、 某连续变量数列,其末组组限为 500以上,又知其邻组组中值为 480,则末组的组中值为( ) A 、 520 B 、 510 C 、 500 D 、 490 8、 用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、 各组的次数必须相等 B 、 变量值在本组内的分布是均匀的 C 、 组中值能取整数 D 、 各组必须是封闭组 9、 XjX 2’…,X n 是来自总体的样本,样本均值 X 服从( )分布 A 、N(F 2) B.、N(0,1) C 、 N(n 巴nb 2 ) N(=) D 、 n 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题 2分,共10分) 1、抽样推断中,样本容量的多少取决于( )。 A 、总体标准差的大小 B 、 允许误差的大小 c 、抽样估计的把握程度 D 、总体参 题库1 、单项选择题(每题 2分,共20分) 1、调查时间是指( A 、调查资料所属的时间 C 、调查工作的期限 12元,要求抽样调查的

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

统计学第一章练习题

第一章概述 综合复习题 1.要了解某一地区国有工业企业的生产经营情况,则统计总体是( B )。 A.每一个国有工业企业 B.该地区的所有国有工业企业 C.该地区的所有国有工业企业的生产经营情况 D.每一个企业 2.要了解20个学生的学习情况,则总体单位是( C )。 A.20个学生 B.20个学生的学习情况 C.每一个学生 D.每一个学生的学习情况 3.下列各项中属于数量标志的是( B )。 A.性别 B.年龄 C.职称 D.健康状况 4. 总体和总体单位不是固定不变的,由于研究目的改变,下列说法正确的是(A)。 A.总体单位有可能变换为总体,总体也有可能变换为总体单位 B.总体只能变换为总体单位,总体单位不能变换为总体

C.总体单位不能变换为总体,总体也不能变换为总体单位 D.任何一对总体和总体单位都可以互相变换 5.以下岗职工为总体,观察下岗职工的性别构成,此时的标志是 (C)。 A.男性职工人数 B.女性职工人数 C.下岗职工的性别 D.性别构成 6. 统计工作过程大致可以分为以下几个阶段(C)。 A.统计设计、统计调查、统计整理、统计汇总 B.统计调查、统计整理、统计分析 C.统计设计、统计调查、统计整理、统计分析 D.统计设计、统计调查、统计整理 7. 统计工作的基础与前提是( A )。 A.统计调查 B.统计设计 C.统计整理 D.统计汇总 8.在医院总体中,医院所数(甲)、医院职工人数(乙)和病床张数(丙)三个指标( B )。 A.都是总体单位总量 B.甲是总体单位总量,乙、丙是总体标志总量 C.都是总体标志总量 D.乙是总体单位总量,甲、丙是总体标志总量

相关文档
最新文档