统计学第五版复习

合集下载

《统计学》复习题_3

《统计学》复习题一、选择题(有且仅有一个答案是正确的)1、劳动生产率是个（）指标①动态②质量③流量④强度2、社会经济统计是（）的有力武器①解决问题②克服困难③认识社会④进行合作3、计划完成程度是个（）指标①动态②流量③强度④质量4、统计有三种含义，其中（）是基础①统计学②统计活动③统计资料④统计部门5、把一个工厂的工人组成总体，每一个工人是（）①总体单位②数量标志③指标④品质标志6、人口普查中规定统一的标准时间是为了（）①登记的方便②避免重复或遗漏③扩大宣传效果④确定调查单位7、人口普查中，居民按年龄分组，宜编制（）数列①组距②单项③离散④均可8、变量数列的组成要素一般是（）①一个②两个③三个④四个9、某电视机厂为了检验全厂产品质量，应采用（）①普查②重点调查③典型调查④抽样调查10、统计分组的关键是（）①搜集各种原始资料②注意资料的真实性③正确选择分组标志与划分各组界限④绘制次数分配图11、某种产品单位成本计划规定比基期下降3%，实际比基期下降3.5%，则其单位成本计划完成程度相对指标为（）① 116.7% ② 100.5% ③ 85.7% ④ 99.5%12、我国1993年轻工业增加值为重工业增加值的89.8%，该指标为（）①结构相对指标②比例相对指标③比较相对指标④动态相对指标13、总量指标数值的大小（）①随总体范围扩大而增大②随总体范围扩大而减少③随总体范围缩小而增大④与总体范围大小无关14、标志变异指标中，由总体中两上极端数值大小决定的是（）①全距②平均差③标准差④标准差系数15、计算结构相对指标时，总体各部分数值与总体数值对比求得的比重之和（）①小于100% ②大于100% ③等于100% ④不等于100%16、某种商品的年末库存额是（）①时期指标并实物指标②时点指标并实物指标③时期指标并价值指标④时点指标并价值指标17、统计表的分类中不含（）①一览表②简单表③分组表④复合表18、时期指标的特点是（）① 不具有可加性 ② 具有可加性 ③ 与时间间隔无关 ④ 只能间断计数19、对于不同变量数列之间标志值离散程度的比较，只能计算（）① 标准差 ② 平均差 ③ 全距 ④ 标准系数20、是非标志标准差数值的取值范围是（）① 0-0.25 ② 0-0.5 ③ 0-1 ④ 0.5-121、以1949年为最初水平，1994年为最末水平，计算钢产量的年递增率时，需要开（）次方。

《统计学》复习提纲

第一章绪论第一节统计的产生和发展一、统计的产生：源于人类的计数与统计实践活动。

二、统计的发展1、英国的政治算术学派（17世纪）【“有实无名”的统计学】创始人：英国的威廉·配第（政治经济学之父）代表作：《政治算术》——统计学诞生的标志；文中针对英、法、荷兰的国情，利用数字、重量、尺度的方法，并配以朴素的图表（现代统计学广为采用的方法和内容）进行三国国力的比较，但没有使用“统计学”一词。

2、德国的国势学派（又称记述学派）（18世纪）【“有名无实”的统计学】代表人物：康令、阿亨瓦尔康令在大学开设“国势学”课程，以文字技术和比较为主，反映各国的国情国力；阿亨瓦尔继承和发展了康令的思想，并于1749年首次使用“统计学”代替“国势学”，认为统计学是关于各国基本制度的学问，但缺乏数字和内容。

3、数理统计学派（19世纪）代表人物：凯特勒（比利时）（古典统计学的完成者，近代统计学的先驱者）代表作：《社会物理学》——他将概率论引进统计学，完成了统计学和概率论的结合。

第二节统计学的性质和特点一、统计的三个含义：统计工作（过程）、统计资料（成果）和统计学（理论）。

二、统计学的研究对象：大量社会现象（主要是经济现象）的总体数量方面的方法论科学。

三、统计学的特点：数量性、总体性、具体性、社会性、广泛性。

第四节统计学中的几个基本概念一、统计总体与总体单位1、统计总体：是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。

统计总体可以分为有限总体和无限总体，总体所包含的单位数有限的比如人口数、企业数，反之比如大海里的鱼资源数。

2、总体单位：是指构成总体的个别单位。

注：总体和总体单位的划分是相对的，它们随着统计研究对象和研究目的变化而相互转化。

二、统计标志与统计指标1、统计标志：用来说明总体单位所具有的属性或特征的名称。

可分为品质标志和数量标志。

品质标志是说明总体单位质的特征，不能用数字来表示的，如性别、籍贯、工种等；数量标志是说明总体单位量的特征，是可用数字来表示的，如年龄、身高、收入等。

《统计学》(第五版) (13)第13章聚类分析

聚类分析的“对象”可以是所观察的多个样本，也可以是针对每个样本测得的多个变量
按照变量对所观察的样本进行分类称为Q型聚类
按照多项经济指标(变量)对不同的地区(样本)进行分类
按照样本对多个变量进行分类，则称为R型聚类
按照不同地区的样本数据对多个经济变量进行分类
两种聚类没有什么本质区别，实际中人们更感兴趣的通常是根据变量对样本进行分类(Q型聚类)
根据每一类消费者的因子的特征，最终将消费者的生活方式分为6个类别，即：时尚型、自保型、领袖型、上进型、迷茫型 (缺乏生活目标型)和平庸型
13 - 5
统计学
STATISTICS (第五版)
怎样把消费者分类？
时尚型：这类消费者约占样本量的约21%，主要特征为：年龄相对较轻，平均年龄在35岁左右，教育程度相对较高，一般具有高中以上文化程度，虽然平均家庭月收入较好，平均在2200元左右，同时也是分散程度最高的，表明喜爱时尚并不是高收入者的专利。这一类型中的三资企业员工的比例最大，未婚的比例较大，约占1/4，女性的比例为 55%，高于男性
自保型：这类消费者占16%，他们更多的是为自己的生计考虑，考虑自己能否有稳定的经济来源，维持家庭的经济保障是他们最关心的问题。这些人的平均受教育程度较低，中年人的比例较高，平均年龄在 44岁左右，家庭月收入较低，平均在1600元左右，国营企业员工以及离退休人员的比例较高。女性的比例高于男性
领袖型：这类消费者占13%。教育程度处于社会平均水平，主要为中年人，有较多的生活阅历，年龄多在45-54岁之间。家庭月平均收入一般在1800元左右。在职业上没有显著特征。已婚比例是各类消费者中最高的，这似乎表明有稳定的家庭也是成为领袖的一个条件。男性比例占55%，高于女性

统计学(第五版)贾俊平等著—课后习题答案

4.2（1）众数：19；23中位数：23 平均数：24（2）四分位数：Q L 位置=425=6.25.所以Q L =19+0.25^0=19 Q U 位置=475=18.75，所以Q U =25+2^0.75=26.5（3）标准差：6.65 （4）峰度0.77，偏度1.08 4.3(1)茎叶图Frequency Stem & Leaf 1.00 5. 5 3.00 6. 678 5.00 7. 13488 (2) 平均数：7，标准差0.71 （3）第一种方式的离散系数x s v s ==2.797.1=0.28 第二种方式的离散系数xs v s ==771.0=0.10 所以，第二种排队方式等待时间更集中。

（4）选择第二种，因为平均等待的时间短，而且等待时间的集中程度高 4.5．甲企业总平均成本nf Mx ki ii∑==1=3406600=19.41（元）乙企业总平均成本nf Mx ki ii∑==1=（元）29.183426255=所以甲企业的总平均成本比乙企业的高，原因是甲企业高成本的产品B 生产的产量比乙企业多，所以把总平均成本提高了。

4.6计算数据如表：利润总额的平均数nf Mx ki ii∑==1=（万元）67.42612051200= 利润总额标准差()nx x f *2∑-=σ= （万元）99.1151201614666==σ 峰态系数6479.03352.23)99.115(120851087441643)(4414—=-=-⨯=--=∑=ns f x MK ki ii偏态系数313)(ns f x MSK ki ii∑=-==2057.0)99.115(120)67.426(3513=⨯-∑=i iif M4.8对于不同的总体的差异程度的比较采用标准差系数，计算如下：%3.8605===x s v s 男； %10505===x s v s 女（1）女生的体重差异大，因为离散系数大；（2）以磅为单位，男生的平均体重为132.6磅，标准差为11.05磅；女生的平均体重为110.5磅，标准差为11.05磅%33.86.13205.11===x s v s 男%105.11005.11===x s v s 女（3）156065=-=-=s x x z i i ，所以大约有68%的人体重在55kg~65kg 之间；（4）255040=-=-=s x x z i i ，所以大约有95%的女生体重在40kg~60kg 之间。

演示文稿统计学第五版第八章课后习题答案

8.6 某厂家在广告中声称，该厂生产的汽车轮胎在正常行驶条件下寿命超过25000公里的目前平均水平。对一个由15个轮胎组成的随机样本做了试验，得到样本均值和标准差分别为27000和5000公里。假定轮胎寿命服从正态分布，问该厂的广告是否真实？ (α=0.05)
解：N=15，x=27000，S=5000 小样本正态分布，σ未知，用t统计量计算。
x 解：已知 =241.5，S=98.726，N=16
小样本正态分布，σ未知，t统计量
右侧检验，α=0.05，自由度N-1=15，即 =1.75t3
HH
：μ≤225
0：μ>225
1
t x - 241.5 - 225 0.67
S/ n 98.726/ 16
结决论策：：因有为证t据值落表入明接，受元域件，平所均以接寿受命与2，2拒5小绝时H无0 。显著性H差1异，不能认为元件的
=n2134
p1=20.98%, p=2 9.7%
ZZ=11.218.6%4/50.028=4.03>1.645
决结论策:：调在查α数=据0.能05支的持水“平吸上烟拒绝者容。易H 0患慢性气管炎”
这种观点。
第20页，共23页。
8.12 为了控制贷款规模，某商业银行有个内部要求，平均每项贷款数额不能超过60万元。随着经济的发展，贷款规模有增大的趋势。银行经理想了解在同样项目条件下，贷款的平均规模是否明显地超过60万元，还是维持
，
2 A
632
。从B2 A厂5生7产2的材料中随机抽取81个样品，测
得 x A 1070kg/cm2 ；从B厂生产的材料中随机抽取64个样品，测
得 xB 1020kg/cm2 。根据以上调查结果，能否认为A、B两厂生产的材料平均

贾俊平《统计学》第五版第10章方差分析

i1 j1
i1
SSA = 76.8455
3）组内平方和 SSE
每个水平或组的各样本数据与其组平均值的离差
平方和
反映每个样本各观察值的离散状况，又称组内离差
平方和
该平方和反映的是随机误差的大小
k ni
2
计算公式为 SSE
xij xi
i1 j1
SSE = 39.084
检验的因素或因子
2. 水平
因素的具体表现称为水平 A1、A2、A3、 A4四种颜色就是因素的水平
3. 观察值
在每个因素水平下得到的样本值每种颜色饮料的销售量就是观察值
1. 试验
这里只涉及一个因素，因此称为单因素四水平
的试验
2. 总体
因素的每一个水平可以看作是一个总体比总体如A1、A2、A3、 A4四种颜色可以看作是四个
观察值 (j) 1 2 3 4 5 6 7
消费者对四个行业的投诉次数
零售业
行业( A ) 旅游业航空公司家电制造业
57
62
51
70
55
49
49
68
46
60
48
63
45
54
55
69
54
56
47
60
53
55
47
单因素方差分析
（计算结果）
解：设四个行业被投诉次数的均值分别为，1、2 、3、4 ，
• 当这个比值大到某种程度时，就可以说不同水平之间存在着显著差异
10.1.3 方差分析中的基本假定 1.每个总体都应服从正态分布
• 对于因素的每一个水平，其观察值是来自服从正态分布总体的简单随机样本。

统计学复习题

定类数据是级别最低的数据( √)重点调查中的重点单位是根据当前工作中的重点来确定的( ×)总体中各标志值之间的差异程度越大,标准差就越小( ×)若各时期的增长水平相等,则各期的增长速度也相等( ×)统计总指数最基本的作用是反映复杂现象总体数量综合变动的方向和程度。

( √)抽样误差不可避免，所以不能事先计算和控制( ×)定序数据不可以求和( ×)制定调查方案的首要问题是确定调查对象。

( ×)中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响( ×)某一时间数列共有20年资料,若采用5项移动平均,则修匀后的数列缺少4项数据( √)重点调查的重点单位是根据当前的工作重点来确定的( ×)帕氏指数的同度量因素应选择基期。

( ×)在抽样推断中，用来反映总体数量特征的指标称为总体指标或全及指标，也叫总体参数( ×)相关的两个变量，只能算出一个相关系数( √)先对总体中的个体按主要标志加以分类，再以随机原则从各类中抽取一定的单位进行调查，这种抽样调查形式属于( D )A.简单随机抽样B.等距抽样C.整群抽样D.类型抽样在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、950、1080、660，则其众数和中位数分别为( B )A. 1080,1600B.1080,1080C. 950,1250D.750，1080对于对称分布的数据，众数、中位数和平均数的关系是( B )A. 众数>中位数>平均数B.众数=中位数=平均数C.平均数>中位数>众数D.中位数>众数>平均数序时平均数中的“首末折半法”适用于计算( B )A.时期数列B.间隔相等的间断时点数列C.间隔不等的间断时点数列D.间隔相等的连续时点数列某企业2013年的产值比2009年增长了200%，则年平均增长速度为( C ) A.50% B.13.89%C.31.61%D.29.73%指数按对象范围不同，可分为( A )A.个体指数和总指数B.数量指标指数和质量指标指数C.定基指数和环比指数D.平均指数和综合指数下列各项中属于指数的是( C )A.人均粮食产量B.平均价格C.发展速度D.人口数对一批商品进行质量检验，最适宜采用的调查方法是( B )A．全面调查B．抽样调查C．典型调查D．重点调查权数对加权算术平均数的影响，决定于( C )A．各组标志值的数值大小B．权数的绝对数大小C．各组单位数占总体单位数比重的大小D．总体单位数的多少当一组数据属于左偏分布时，则( D )A. 平均数、中位数与众数是合而为一B.众数在左边、平均数在右边C.众数的数值较小，平均数的数值较大D.众数在右边、平均数在左边时间序列中对应于具体时间的指标数值称为( A )A.变量B.发展水平C.增长量D.发展速度某公司A产品的销售额2007年比2002年增长53.5%，2006年比2002年增长40.2%，则2007年比2006年增长( A )A.9.5%B.13.3%C.33.09%D.15.9%指数按其所表明的经济指标性质不同，分为( B )A.个体指数和总指数B.数量指标指数和质量指标指数C.定基指数和环比指数D.平均指数和总指数某企业销售额增长了5%，销售价格下降了3%，则销售量( C )A.增长8%B.增长1.94%C.增长8.25%D.增长1.85%根据分析数据所使用的方法不同,可将统计学分为( CD )A.应用统计学B.理论统计学C.描述统计学D.推断统计学E.数理统计学指出下列分组哪些是按数量标志分组( ACE )A.企业按所有制分组B.家庭按人口多少分组C.家庭按收入水平分组D.产品按合格与不合格分组E.职工按工资水平分组影响时间序列发展水平变化的因素主要有( ABCD )A.长期趋势B.季节变动C.循环变动D.不规则变动E.同度量因素下列现象中可以认为是离散变量的现象是( ACD )A.设备台数B. 身高C.企业个数D. 学生人数E. 长度制定一个周密的统计调查方案,应确定( ABE )A.调查目的和调查对象B.调查单位和填报单位C.调查项目和调查表D.调查资料的使用范围E.调查的时间和时限依据指标值的特点，绝对数时间序列分为( AB )A.时期数列B.时点数列C.相对数时间序列D.平均数时间序列E.整数时间序列影响抽样平均误差的因素有( ABCD )A.总体标志变异程度B.样本容量C.抽样方法D.抽样组织方式E.可靠程度相关系数表明两个变量之间的( DE )A.线性关系B.因果关系C.变异程度D.相关方向E.相关的密切程度对成年组和幼儿组共500人身高资料分组，分组资料如表：成年组幼儿组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150～155 155～160 160～165 165～170 170以上 30 120 90 40 20 70～75 75～80 80～85 85～90 90以上 20 80 40 30 30要求：(1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。

统计学第五版第四章课后习题答案ppt课件

.
23
4.13、
答：
（1）、我认为应用标准差或者离散系数来反应投资的风险。
（2）、如图所示，高科技类股票的离散系数较大，所以风险较大；而商业类股票的离散系数较小，所以风险相对较小。如果选择风险小的股票进行投资，应选择商业类股票。
（3）、如果进行股票投资，我希望能够获取高收益，所以我会选择高科技类股票。
.
3
4.2 （1）（2）（3）（4）：
.
4
（4）：网民年龄的分布特征：
如图所示：
大多网络用户的年龄为19岁，网络用户年龄的中间值为23岁，上四分位数为27岁，下四分位数为19岁，说明年龄在19-23岁和 23-27岁的网络用户数量差不多，网络用户的平均年龄是24岁，证明有个别网络用户的年龄较大，把整体平均数给拉高了，使整体分布表现为右偏分布。
以女生体重的差异较大。（2）、
男生体重的平均数：x =60*2.21=132.6b
男生体重的标准差：s=5*2.21=11.05b
女生体重的平均数： x =50*2.21=110.5b
女生体重的标准差：s=5*2.21=110.5b
.
16
（3）&（4）讲该抽样近似看做正态分布进行估计：
.
12
4.6
.
13
这20家企业利润
额的平均数为
426.67万元，标
准差为116.48，
说明这120家企业
盈利不等且相差较
大，SK为正值，
所以这120家企业
利润的正离差值较
大，属于右偏分布
倾斜程度不是很大，
且为扁平分布，数
据的分布较分散。
.
14
4.7

《统计学》复习资料

《统计学》复习资料（一）一单选题1. 下面的哪一个图形最适合描述结构性问题( )A. 条形图B. 饼图C. 对比条形图D. 直方图2. 下列描述正确的是A. 点估计比区间估计需要更大的样本容量B. 点估计相对于区间估计更加准确C. 点估计无法给出参数估计值的置信度和误差大小D. 区间估计无法给出参数估计值的置信度和误差大小3. 假设检验中所犯的错误有两种类型，β错误是指（）A. 弃真错误，即拒绝正确的原假设。

B. 取伪错误，即接受一个错误的原假设。

C. 弃真错误，即接受一个错误的原假设。

D. 取伪错误，即拒绝正确的原假设。

4. 同时抛3枚质地均匀的硬币，巧合有2枚正面向上的概率为 ( )。

A. 0.125B. 0.25C. 0.375D. 0.55. 根据概率的统计定义，可用以近似代替某一事件的概率的是 ( )。

A. 大量重复试验中该随机事件出现的次数占试验总次数的比重B. 该随机事件包含的基本事件数占样本空间中基本事件总数的比重C. 大量重复随机试验中该随机事件出现的次数D. 专家估计该随机事件出现的可能性大小6. 为了反映商品价格与需求之间的关系，在统计中应采用( )A. 划分经济类型的分组B. 说明现象结构的分组C. 分析现象间依存关系的分组D. 上述都不正确7. 1.指出下面的数据哪一个属于分类数据( )A. A 年龄B. B 工资C. C 汽车产量D. D 购买商品的支付方式(现金、信用卡、支票)8. 在成数估计中，样本容量的取得通常与总体成数有关，但总体成熟未知，通常A. 取成数为0.5B. 取成数为0C. 取成数的标准差最小D. 取抽样误差最小9. 样本或总体中各不同类别数值之间的比值称为( )A. 频率B. 频数C. 比例D. 比率10. 调查项目( )A. 是依附于调查单位的基本标志B. 与填报单位是一致的C. 与调查单位是一致的D. 是依附于调查对象的基本指标11. 要反映我国工业企业的整体业绩水平，总体单位是:A. 我国每一家工业企业B. 我国所有工业企业C. 我国工业企业总数D. 我国工业企业的利润总额12. 一家公司的人力资源部主管需要研究公司雇员的饮食习惯，改善公司餐厅的现状。

贾俊平《统计学》(第5版)课后习题-第2章数据的搜集【圣才出品】

第2章　数据的搜集1．什么是二手资料？使用二手资料需要注意些什么？答：（1）如果与研究内容有关的原信息已经存在，只是对这些原信息重新加工、整理，使之成为进行统计分析可以使用的数据，则称为间接来源的数据，即二手资料。

（2）在使用二手资料前，对二手资料进行评估是必要的。

对二手资料进行评估应考虑如下一些内容：①资料是谁搜集的？这主要是考察数据搜集者的实力和社会信誉度。

②为什么目的而搜集？为了某个集团的利益而搜集的数据是值得怀疑的。

③数据是怎样搜集的？搜集数据可以有多种方法，不同方法所采集到的数据，其解释力和说服力都是不同的。

如果不了解搜集数据所用的方法，很难对数据的质量做出客观的评价。

数据的质量来源于数据的生产过程。

④什么时候搜集的？对于过时的数据，其说服力自然受到质疑。

另外，使用二手数据，要注意数据的定义、含义、计算口径和计算方法，避免错用、误用、滥用。

在引用二手数据时，应注明数据的来源，以尊重他人的劳动成果。

2．比较概率抽样和非概率抽样的特点。

举例说明什么情况下适合采用概率抽样，什么情况下适合采用非概率抽样。

答：（1）由于非概率抽样不是依据随机原则抽选样本，样本统计量的分布是不确切的，因而无法使用样本的结果对总体相应的参数进行推断。

非概率样本的特点是操作简便、时效快、成本低，而且对于抽样中的统计学专业技术要求不是很高。

概率抽样是依据随机原则抽选样本，这时样本统计量的理论分布是存在的，因此可以根据调查的结果对总体的有关参数进行估计，计算估计误差，得到总体参数的置信区间，并且在进行抽样设计时，对估计的精度提出要求，计算为满足特定精度要求所需要的样本量。

当然，概率抽样的技术含量更高，无论抽选样本和对调查数据进行分析，都要求有较高的统计学专业知识，调查的成本也比非概率抽样的调查成本高。

（2）非概率抽样适合探索性的研究，调查的结果用于发现问题，为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试，如产品包装测试、广告测试等，这时不需要将调查结果投影到总体的情况。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。