统计学第四版贾俊平人大-假设检验stata

假设检验作业

8.1 小样本、方差已知的均值校验

已知：总体服从N(4.55,0.1082)；n=9；x =4.484；α=0.05 假设：H 0：μ=4.55； H 1：μ≠4.55。利用stata 求Z 统计量:

display z=(4.484-4.55)/(0.108/sqrt(9))

又83.1=Z <96.12/±=αZ 故原假设能接受，即现在生产的铁水平均含碳量为4.55。

8.2 大样本的均值校验

已知：总体服从N(700,602)；n=36；x =680；α=0.05 假设：H 0：μ≥700； H 1：μ<700。利用stata 求Z 统计量：

display (680-700)/(60/sqrt(36))

又2=Z >

Z =1.64，故原假设不能接受，即这批元件不合格。

8.3 小样本、方差已知的均值校验

已知：总体服从N(250,302)；n=25；x =270；α=0.05 假设：H 0：μ≥250； H 1：μ<250。利用stata 求Z 统计量：

display (270-250)/(30/sqrt(25))

又Z

=3.33>

Z =1.64，故原假设不能接受，即这种化肥使小麦增产不明显。

8.4 小样本、方差未知的均值校验

已知：总体服从N(100,σ2)；n=9；Xi(i=1,2,3,4,5,6,7,8,9)；α=0.05 假设：H0：μ=100；

H1：μ≠100。

利用stata新建weight.dta输入数据：

编写程序求t统计量：

clear

use weight

list weight

egen wgt1=mean(weight)

egen sd=sd(weight)

display (wgt1-100)/(sqrt(sd)/sqrt(9))

又Z

=0.06<2/α

=1.96，故原假设能接受，即该打包机工作正常。

8.5 大样本的比例校验

假设：H0：π≤5%；

H1：π>5%。

P=6/50=0.12

编写程序求Z统计量:

clear

display (0.12-0.05)/sqrt(0.05*(1-0.05)/50)

又Z

=2.27>α

=1.64，故原假设不能接受，即该批产品不能出厂。

8.6小样本、方差未知的均值检验

假设：H0：μ=25000；

H1：μ≠25000。

已知：总体服从N(25000,σ2)；n=15；x=27000；s=5000；α=0.05 编写程序求t统计量：

display (27000-25000)/(5000/sqrt(15))

又Z=1.55<2/αZ=1.96，故原假设能接受，即该厂家的广告真实。

8.7 小样本、方差未知的均值检验

已知：总体服从N(225,σ2)；n=16；X i(i=1,2,…,16)；α=0.05

假设：H0：μ≥250；

H1：μ<250。

利用stata新建life.dta输入数据：

编写程序求t统计量：

clear

use life

list life

egen life1=mean(life)

egen sd=sd(life)

display (225-life1)/(sqrt(sd)/sqrt(16))

又Z

=6.64>α

=1.64，故原假设不能接受，即元件的平均寿命没有显著的大于225h。

8.8 小样本方差检验

已知：n=9；X i (i=1,2,…,9)；α=0.05 假设：H 0：σ2≤100； H 1：σ2>100。

利用stata 新建jieguo.dta 输入数据：

编写程序求2χ统计量：

clear

use jieguo list jieguo

egen sd=sd(jieguo) display (9-1)*sd/100

又)8(295.0χ=2.7326则2χ<)8(295.0χ，故原假设不能接受。

8.9 大样本、方差已知的两总体均值之差相等检验

已知：A ：n A =81，2A σ=632，A x =1070；：n B =64，2

B σ=572，B x =1020；α=0.05

假设：H 0：0=-B A μμ； H 1：0≠-B A μμ。

利用stata 编写程序求Z 值：

display ((1070-1020)-0)/sqrt((63^2/81)+(57^2/64))

又

=5.01>

/αZ =1.96，故原假设不能接受，即A 、B 两厂家生产的材料平均抗压强度

不相同。

8.10 小样本、方差未知的两总体均值之差检验

条件： n A =12，2A s 未知，A x 未知；n B =12，2B s 未知，B x 未知；α=0.05

假设：H 0：0=-B A μμ； H 1：0≠-B A μμ。

利用stata 新建time.dta 输入数据：

利用stata 编写程序求t 值：

clear use time

egen timeAsd=sd(timeA) egen timeBsd=sd(timeB)

egen timeAmean=mean(timeA) egen timeBmean=mean(timeB)

display ((timeAmean- timeBmean)-0)/sqrt((timeAsd/12)+ (timeBsd/12))

求f 值： display ((timeAsd/12)+ (timeBsd/12))^2/((timeAsd/12)^2/(12-1)+

(timeBsd/12)^2/(12-1))

又t

=4.49>

)

22(2/αt =2.0739，故原假设不能接受，即两种方法的装配时间无显著区别。

8.11 两总体比例之差不为零的检验

已知：A ：n A =205，p A =43/205=0.21；n B =134, p B =13/134=0.10；α=0.05；d0=0 假设：H 0：0>-B A ππ；

H 1：0≤-B A ππ。

利用stata 编写程序求z 值：

display ((0.21-0.10)-0)/sqrt(0.21*(1-0.21)/205+0.10*(1-0.10)/134)

又Z

=2.85>

Z =1.645，故原假设不能接受，即两种方法的装配时间无显著区别。

8.12 大样本、方差未知的均值检验（P 值）

已知：n=144；x =68.1；s=45；α=0.01 假设：H 0：60≤μ； H 1：60>μ。

利用stata 编写程序求z 值：

display (68.1-60)/(45/sqrt(144))

又

=2.16<

Z =2.33

利用excel 的统计函数NORMSDIST 求得2.16的对应函数值为0.984613665。由于该题进行的是右侧检验，故 P=1-0.984613665=0.015386

P 值大于α=0.01，故原假设能接受，即贷款的平均规模没有超过60万元。

8.13 两总体比例相等检验

已知：n A =11000，p A =104/11000=0.009455；n B =11000, p B =189/11000=0.017182；α=0.05；d0=0

假设：H 0：0<-B A ππ； H 1：0≥-B A ππ。

利用stata 编写程序求z 值： display

((0.009455-0.017182)-0)/sqrt(0.009455*(1-0.009455)/11000+0.017182*(1-0.017182)/11000)

又

=5.00>

Z =1.645，故原假设不能接受，即阿司匹林不可以降低心脏病的发病率。

8.14 大样本的均值校验

已知：总体服从N(7.0,0.032)；n=80；x =6.97；s 2=0.0375；α=0.05 假设：H 0：μ=7.0； H 1：μ≠7.0。利用stata 求Z 统计量：

display (6.97-7.0)/(0.0375/sqrt(80))

又Z

=7.16>

/αZ =1.96，故原假设不能接受，即这批螺栓不合格。

8.15 两总体小样本、方差未知的均值之差校验

已知：A ：n A =25，2A s =56，A x =82；n B =16，2B s =49未知，B x =78；α=0.02

假设：H 0：0≥-B A μμ； H 1：0<-B A μμ。

利用stata 编写程序求t 值：

clear

display ((82- 78)-0)/sqrt((56/25)+ (49/16))

F 值：

display ((56/25)+ (49/16))^2/((56/25)^2/(25-1)+ (49/16)^2/(16-1))

取f=34 又t

=1.74<

)

34(αt =2.168467，故原假设能接受，即男生得成绩比女生的好。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3．1 为评价家电行业售后服务的质量，随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为：A．好；B．较好；C一般；D．较差；E.差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求： (1)指出上面的数据属于什么类型。顺序数据 (2)用Excel制作一张频数分布表。用数据分析——直方图制作：接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图，反映评价等级的分布。用数据分析——直方图制作： (4)绘制评价等级的帕累托图。逆序排序后，制作累计频数分布表：

统计学第四版贾俊平人大-回归与时间序列stata

回归分析与时间序列一、一元线性回归 11.1 （1）编辑数据集，命名为linehuigui1.dat 输入命令scatter cost product,xlabel(#10, grid) ylabel(#10, grid)，得到如下散点图，可以看到，产量和生产费用是正线性相关的关系。（2）输入命令reg cost product，得到如下图：可得线性函数（product为自变量，cost为因变量）：y=0.4206832x+124.15,即β0=124.15，β1=0.4206832 （3）对相关系数的显著性进行检验，可输入命令pwcorr cost product, sig star(.05) print(.05)，得到下图：

可见，在α=0.05的显著性水平下，P=0.0000<α=0.05，故拒绝原假设，即产量和生产费用之间存在显著的正相关性。 11.2 （1）编辑数据集，命名为linehuigui2.dat 输入命令scatter fenshu time,xlabel(#4, grid) ylabel(#4, grid)，得到如下散点图，可以看到，分数和复习时间是正线性相关的关系。 2）输入命令cor fenshu time计算相关系数，得下图：可见，r=0.8621，可见分数和复习时间之间存在高度的正相关性。 11.3 （1）（2）对于线性回归方程y=10-0.5x，其中β0=10，表示回归直线的截距为10；β1=-0.5，表示x变化一单位引起y的变化为-0.5。（3）x=6时，E(y)=10-0.5*6=7。 11.4 （1），判定系数测度了回归直线对观测数据的拟

统计学原理作业(1)答案

《统计学原理》作业一一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。（×） 2．统计调查过程中采用的大量观察法，是指必须对研究对象的所有单位进行调查。（×） 3．总体的同质性是指总体中的各个单位在所有标志上都相同。（×）4．个人的工资水平和全部职工的工资水平，都可以称为统计指标。（×）5．对某市工程技术人员进行普查，该市工程技术人员的工资收入水平是数量标志。（√） 6．社会经济统计学的研究对象是社会经济现象的数量方面，但它在具体研究时也离不开对现象质的认识。（√） 7．品质标志表明单位属性方面的特征，其标志表现只能用文字表现，所以品质标志不能直接转化为统计指标。（√） 8．品质标志说明总体单位的属性特征，质量指标反映现象的相对水平或工作质量，二者都不能用数值表示。（×） 9．某一职工的文化程度在标志的分类上属于品质标志，职工的平均工资在指标的分类上属于质量指标。（√） 10．总体单位是标志的承担者，标志是依附于总体单位的。（√）二、单项选择 1．社会经济统计的研究对象是（C ）。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2．构成统计总体的各个单位称为（A ）。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3．对某城市工业企业未安装设备状况进行普查，总体单位是（B ）。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4．标志是说明总体单位特征的名称（C）。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值5．总体的变异性是指（ B ）。 A．总体之间有差异B、总体单位之间在某一标志表现上有差异 C．总体随时间变化而变化D、总体单位之间有差异 6．工业企业的设备台数、产品产值是（D ）。 A、连续变量 B、离散变量 C．前者是连续变量，后者是离散变量 D、前者是离散变量，后者是连续变量 7．几位学生的某门课成绩分别是57分、68分、78分、89分、96分，“学生成绩”是（B ）。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8．在全国人口普查中（B ）。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9．下列指标中属于质量指标的是（B ）。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学作业答案

1. 一家调查公司进行一项调查，其目的是为了了解某市电信营业厅大客户对该电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户，发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在95％的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比率p 的区间估计，在置信水平为10%下，其允许误差E ＝ 0.08。则：（1）这80名受访者样本中为本地购房者的比率是多少？（2）若显著性水平为95%，则要保持同样的精度进行区间估计，需要调查多少名购房者。解：这是一个求某一属性所占比率的区间估计的问题。根据已知n =30，2 /αz ＝1.96，根据抽样结果计算出的样本比率为%30309?==p 。总体比率置信区间的计算公式为： ()n p p z p ?1??2/-±α 计算得： ()n p p z p ?1??2/-±α＝30％()30 %301%3096.1-??± ＝（13.60％，46.40％） 5、某大学生记录了他一个月31天所花的伙食费，经计算得出了这个月平均每天花费10.2元，标准差为2.4元。显著性水平为在5%，试估计该学生每天平均伙食费的置信区间。解：由已知：=x 10.2，s ＝2.4，96.1025.0=z ，则其置信区间为： 314 .296.12.10025.0?±=±n s z x ＝〔9.36，11.04〕。该学生每天平均伙食费的95％的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95％的置信区间为〔2.2，3.4〕小时，问该次抽样样本平均读报时间t 是多少？若样本量为100，则样本标准差是多少？若我想将允许误差降为0.4小时，那么在相同的置信水平下，样本容量应该为多少？解：样本平均读报时间为：t ＝ 24.32.2+＝2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E ＝3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封，其中有若干封是属于广告邮件，并且根据这一周数据估计广告邮件所占比率的95％的置信区间为〔8.9％， 16.1％〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收到48封邮件，标准差为9封，则其每周平均收到邮件数的95％的置信区间是多少？（设每周收到的邮件数服从正态分布）解：本周收到广告邮件比率为：p ＝2 161.0089.0+＝0.125 收到广告邮件数为：n ×p ＝56×0.125＝7封根据已知：x ＝48，n ＝20，s ＝9，093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68，52.32] 8、为了解某银行营业厅办理某业务的办事效率，调查人员观察了该银行营业厅办理该业务的柜台办理每笔业务的时间，随机记录了15名客户办理业务的时间，测得平均办理时间为t ＝12分钟，样本标准差为s =4.1分钟，则：（1）其95％的置信区间是多少？（2）若样本容量为40，而观测的数据不变，则95％的置信区间又是多少？解：（1）根据已知有()145.214025.0=t ，n ＝15，t ＝12，s =4.1。置信区间为：()151 .4145.21214025.0?±=±n s t t ＝〔9.73，14.27〕

完整版上海交大统计学原理第二次作业及答案

1.同时抛两枚不同的硬币，恰有一枚正面朝上的概率是（）（单选）选择一项：炒a. 1 炒b. 1/8 O c. 1/4 同d. 1/2 2.对于连续型数据的分组（）选择一项： a.水平法 b.累计法 c.推算法 d.直接法） 4.各变量值与其算术平均数的离差值和等于（选择一项： a.最小值 C b.取大值 c.各变量值的算术平均数 d.零） 5.下列统计指数，不属于数量指标指数的有（选择一项： a.零售价格指数

b. 产量指数诃c?收购量指数因d.工资总额指数 6. 以下分组标志中属于品质标志的是（）（多选）选择一项或多项： * a.性别 □ b.年龄 "c.职业 d.月收入门e.职称 7. 我国2003年国内生产总值比上年增长了9.1%，这个指标是（）（单选）选择一项： U a.发展速度拥b.增长速度目c.发展水平 d.增长量 8. 统计指数区分数量指标指数与质量指标指数，是依据（）（单选）选择一项：炒a.对比基期的不同 °b.对象范围的大小 ⑥c.统计指标的性质不同 d.同度量因素的固定与否 9. 我国财政收入，2003年比上年增加2787亿元，这是（）（单选）选择一项：炒a.发展水平 b.增长量

炒a.两个数列的平均数代表性相同 °b.平均数的代表性甲数列高于乙数列同c.平均数的代表性乙数列高于甲数列口d.平均数的代表性无法判断 11.全年12个月的季节比率之和应是（）（单选）选择一项：」a.标准差系数 b.平均差系数 ‘ c.全距 * d.平均差

」a.是不同情况下同一指标对比的比率 □ b.反映现象的强度、密度和普遍程度巫c. 一般有正指标与逆指标之分門d.是两个性质不同而有密切联系的总量指标对比的结果 "e. 一般是以有名数表示的，但也有采用千分数等形式表示的 15.下列现象的相关密切程度最高的是（）（单选）选择一项： a. 某商店的职工人数与商品销售额之间的相关系数0.87 * b.流通费用水平与利润率之间的相关关系为-0.94 口c.商品销售额与利润率之间的相关系数为0.51 口d.商品销售额与流通费用水平的相关系数为-0.81 16在实验中，两个事件有一个发生时，另一个就不发生，称这两个事件（）（单选）选择一项： ⑥a.互斥事件口b.必然事件 c. 独立事件 d. 不可能事件 17. 两组数据的均值不等，但标准差相等，则（）（单选）选择一项：

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业：统计学考试科目：统计思想综述课程代码：123201 考题卷号：1

除不能导致SSE显著减小为止。逐步回归：结合向前选择和向后剔除，从没有自变量开始，不停向模型中增加自变量，每增加一个自变量就对所有现有的自变量进行考察，若某个自变量对模型的贡献变得不显著就剔除。如此反复，直到增加变量不能导致SSE显著减少为止。五、（20分）如果一个时间序列包含趋势、季节成分、随机波动，适用的预测方法有哪些？对这些方法做检验说明。可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解法等进行预测。（1）Winter指数平滑模型包含三个平滑参数，即（取值均在0~1），以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度，对于季度数据，L=4，对于月份数据，L=12；I为季节调节因子。平滑值消除季节变动，趋势项更新是对趋势值得修正，季节项更新是t期的季节调整因子，是用于预测的模型。使用Winter 模型进行预测，要求数据至少是按季度或月份收集的，而且需要有四个以上的季节周期（4年以上的数据）。使用Winter 模型进行预测，要求数据至少是按季度或月份收集的，

而且需要有四个以上的季节周期（4年以上的数据）。（2）引入季节哑变量的多元回归对于以季度记录的数据，引入3个哑变量，其中=1(第1季度)或0(其他季度)，以此类推，则季节性多元回归模型表示为：其中b0是常数项，b1是趋势成分的系数，表示趋势给时间序列带来的影响，b2、b3、b4表示每一季度与参照的第1季度的平均差值。（3）分解预测第1步，确定并分离季节成分。计算季节指数，然后将季节成分从时间序列中分离出去，即用每一个时间序列观测值除以相应的季节指数以消除季节性。第2步，建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型，并根据这一模型进行预测。第3步，计算出最后的预测值。用预测值乘以相应的季节指数，得到最终的预测值。

统计学贾俊平_第四版课后习题答案 2

3．3 某百货公司连续40天的商品销售额如下：单位：万元 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 要求：根据上面的数据进行适当的分组，编制频数分布表，并绘制直方图。 1、确定组数： ()l g 40l g () 1.60206 111 6.32l g (2)l g 20.30103 n K =+ =+=+=，取k=6 2、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（49-25）÷6=4，取5 3、分组频数表销售收入（万元）频数频率% 累计频数累计频率% <= 25 1 2.5 1 2.5 26 - 30 5 12.5 6 15.0 31 - 35 6 15.0 12 30.0 36 - 40 14 35.0 26 65.0 41 - 45 10 25.0 36 90.0 46+ 4 10.0 40 100.0 总和 40 100.0 频数 246810121416<= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+ 销售收入频数频数 3.9.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据：年龄 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图； (2) 从直方图分析成人自学考试人员年龄分布的特点。解：（1）制作直方图：将上表复制到Excel 表中，点击：图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图：(见Excel 练习题2.6)

西南财大版统计学原理统计学作业练习题及答案。

第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表：要求：（1）计算样本平均数和抽样平均误差。（2）以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。 2.采用简单随机重复抽样方法，在2 000件产品中抽查200件，其中合格品190件。要求：（1）计算合格品率及其抽样平均误差。（2）以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。（3）如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从 5 000个产品中抽取进行调查.其结果如下：要求：试根据上述资料：（1）按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。（2）按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。（3）根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。 4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下：抽查结果统计表要求：（1）以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。（2）以同样的概率保证估计该批茶叶合格率范围。

5.某工厂生产一种新型灯泡5000只，随后抽取100只作耐用时间测试。结果表明，平均寿命为4500小时，标准差300小时，试在90%的概率保证下，估计该新式灯泡平均寿命时间，假定概率保证程度提高到95%，允许误差缩小一半，试问应抽取多少只灯泡进行测试。 6.调查一批机械零件合格率。根据过去资料，合格品率曾有过99%、97%、95%三种情况，现在要求误差不超过1%，要求估计的把握程度为95%，问需要抽查多少零件?（提示：总体方差取最大值） 7.某部门对职工进行家庭经济情况调查，取得年度项抽样资料如下，试以90%的概率保证程度，估计该部门职工的家庭月收入。抽查结果统计表 8.某市有职工10万人，其中：职员4万人，工人6万人，现进行职工收入抽样调查，并划分职员与工人两类进行选样，要先按不同类型抽查40名职员与60名工人，结果如下：要求这次调查的极限误差不超过2元，概率保证程度 95.45%，试按类型抽样组织计算必要的抽样数目。如果按简单随机抽样组织，试问：（1）同样的?和t，需按抽取多少样本单位数。（2）同样的样本单位数和概率保证程度，则会有多大的极限抽样误差。（3）同样的样本单位数和?应有多大的概率保证程度。 9.从某县的100个村中抽出10村进行各村的全户调查设平均每户饲养家禽35头，每村平均数的方差为16。要求：（1）以90%的概率估计全县平均每户饲养家禽数。（2）如果极限误差 2.412 ?= x 则其概率保证程度如何？

统计学-基于R第3版习题答案(第二章)

习题 2.1 （1）简单频数分布表： > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》（第3版）—例题和习题数据（公开资源）\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表： > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表： > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业性别满意度男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 （2）条形图： > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

统计学原理作业1答案

统计学原理作业1答案统计学原理作业1 第一章~第三章一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(×) 2、统计调查过程中采用的大量观察法，是指必须对研究对象的所有单位进行调查。(×) 、全面调查包括普查和统计报表。(?) 3 4、统计分组的关键是确定组限和组距。(×) 5、在全国工业普查中，全国企业数是统计总体，每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次，因此这是一种连续性调查方法。(?) 7、对全国各大型钢铁生产基地的生产情况进行调查，以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(?) 8、对某市工程技术人员进行普查，该市工程技术人员的工资收水平是数量标志。(?) 9、对我国主要粮食作物产区进行调查，以掌握全国主要粮食作物生产的基本情况，这种调查是重点调查。(?) 10、我国人口普查的总体单位和调查单位都是第一个人，而填报单位是户。(?) 二、单项选题 1、设某地区有670家工业企业，要研究这些企业的产品生产情况，总体单位是(C) A、每个工业企业 B、670家工业企业 C、每一件产品 D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日，则调查时限 ) 为(B A、一日 B、一个月 C、一年 D、一年零一个月

3、在全国人口普查中(B) A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、人国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值，上述两上变量是(D) A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量，后者为离散变量 D、前者为离散变量，后者为连续变量 5、下列调查中，调查单位与填报单位一致的是(D) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D) A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A) A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品的销售额 D、每季统计进口贸易额 8、全面调查与非全面调查的划分是以(C) A、时间是否连续来划分的 B、最后取得的资料是否全面完全来划分 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小来划分 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组三、多项选择题 1、总体单位是总体的基本组成单位，是标志的直接承担者，因此(A,D) A、在国有企业这个总体下，每个国有企业就是总体单位 B、在工业总产值这个总体下，单位总产值就是总体单位 C、在全国总人口这个总体下，一个省的总人口就是总体单位

统计学课程作业及答案2

统计学作业2 单项选择题第1题某地区有10万人口，共有80个医院。平均每个医院要服务1250人，这个指标是（）。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标答案：B 第2题某企业2002年工业总产值比1992年增长了3倍，则该公司1992-2002年间工业总产值平均增长速度为（） A、11.61% B、14.87% C、13.43% D、16.65% 答案：A 第3题某工业企业的某种产品成本，第一季度是连续下降的。1月份产量750件，单位成本20元；2月份产量1000件，单位成本18元；3月份产量1500件，单位成本15元。则第一季度的平均成本为（）。 A、17.67 B、17.54 C、17.08 D、16.83 答案：C 第4题已知4个水果商店苹果的单价和销售额，要求计算4个商店苹果的平均单价，应该采用（）。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数答案：C

第5题如果分配数列把频数换成频率，那么方差（）。 A、不变 B、增大 C、减小 D、无法预期变化答案：A 第6题某厂5年的销售收入如下：200万、220万、250万、300万、320万，则平均增长量为（）。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方答案：B 第7题直接反映总体规模大小的指标是（）。 A、平均指标 B、相对指标 C、总量指标 D、变异指标答案：C 第8题计算结构相对指标时，总体各部分数值与总体数值对比求得的比重之和（）。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案：C 多项选择题第9题下列统计指标属于总量指标的是（）。 A、工资总额

人大版_贾俊平_统计学_第三版_课后习题答案

第3章概率与概率分布——练习题(全免) 1 .解:设A ＝女性，B ＝工程师，AB ＝女工程师，A+B ＝女性或工程师（1）P(A)＝4/12＝1/3 （2）P(B)＝4/12＝1/3 （3）P(AB)＝2/12＝1/6 （4）P(A+B)＝P(A)＋P(B)－P(AB)＝1/3＋1/3－1/6＝1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会（即允许在第一次脱靶后进行第二次射击）。某射击选手第一发命中的可能性是80％，第二发命中的可能性为50％。求该选手两发都脱靶的概率。解:设A ＝第1发命中。B ＝命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P +＝＝0.8×1＋0.2×0.5＝0.9 脱靶的概率＝1－0.9＝0.1 或（解法二）：P (脱靶)＝P (第1次脱靶)×P(第2次脱靶)＝0.2×0.5＝0.1 8.已知某地区男子寿命超过55岁的概率为84％，超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少？解: 设A ＝活到55岁，B ＝活到70岁。所求概率为： ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ＝＝＝＝ 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知，采用新生产管理流程后产品优质率达95％的占四成，优质率维持在原来水平（即80%）的占六成。该企业利用新的生产管理流程进行一次试验，所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策？解:这是一个计算后验概率的问题。设A ＝优质率达95％，A ＝优质率为80％，B ＝试验所生产的5件全部优质。 P(A)＝0.4，P (A )＝0.6，P (B|A )=0.955， P(B |A )=0.85，所求概率为： 6115.050612 .030951.0)|()()|()()|()()|(＝＝＝A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品，采购数量分别占总采购量的25％、30％和45％。这三个企业产品的次品率分别为4％、5％、3％。如果从这些产品中随机抽出一件，试问：（1）抽出次品的概率是多少？（2）若发现抽出的产品是次品，问该产品来自丙厂的概率是多少？解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品，B 表示次品。由题意得：P (A 1)＝0.25，P (A 2)＝0.30， P (A 3)＝0.45；P (B |A 1)＝0.04，P (B |A 2)＝0.05，P (B |A 3)＝0.03；因此，所求概率分别为：

统计学原理第三章习题答案

一．判断题部分 1 ：对统计资料进行分组的目的就是为了区分各组单位之间质的不同。（×） 2：统计分组的关键问题是确定组距和组数。（ × ） 3：组中值是根据各组上限和下限计算的平均值，所以它代表了每一组的平均分配次数。（ × ） 3 ：分配数列的实质是把总体单位总量按照总体所分的组进行分配。（ ∨ ） 4：次数分配数列中的次数，也称为频数。频数的大小反映了它所对应的标志值在总体中所起的作用程度。（ ∨ ） 5：某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。（×） 6：连续型变量和离散型变量在进行组距式分组时，均可采用相邻组组距重叠的方法确定组限。（ ∨ ） 7：对资料进行组距式分组，是假定变量值在各组内部的分布是均匀的，所以这种分组会使资料的真实性受到损害。（ ∨ ） 8：任何一个分布都必须满足：各组的频率大于零，各组的频数总和等于或 100%。（ × ） 9：按数量标志分组形成的分配数列和按品质标志分组形成的分配数列，都可称为次数分布。（ ∨ ） 10：按数量标志分组的目的，就是要区分各组在数量上的差异。（ 11：统计分组以后，掩盖了各组内部各单位的差异，而突出了各组之间单位的差异。（ ∨ ） 12：分组以后，各组的频数越大，则组的标志值对于全体标志水平所起的作第三章统计资料整理 ×）

用也越大；而各组的频率越大，则组的标志值对全体标志水平所起的作用越小。（ × ）．单项选择题部分 2：在组距分组时，对于连续型变量，相邻两组的组限（ A ）。 A 、必须是重叠的 B 、必须是间断的 C 、可以是重叠的，也可以是间断的 D 、必须取整数 3：下列分组中属于按品质标志分组的是（ B ）。 A 、学生按考试分数分组 B 、产品按品种分组 C 、企业按计划完成程度分组 D 、家庭按年收入分组 4 ：有一个学生考试成绩为７０分，在统计分组中，这个变量值应归入（ B ）。 A 、60---70 分这一组 B 、 70---80 分这一组 C 、60— 70或 70—80两组都可以 D 、作为上限的那一组 5：某主管局将下属企业先按轻、重工业分类，再按企业规模分组，这样的分组属于（ B ）。 A 、简单分组 B 、复合分组 C 、分析分组 D 、结构分组 6：简单分组和复合分组的区别在于（ B ）。 A 、选择的分组标志的性质不同 B 、选择的分组标志多少不同 1：统计整理的关键在（ B A 、对调查资料进行审核 C 、对调查资料进行汇总）。 B 、对调查资料进行统计分组 D 、编制统计表

教育统计学课后练习参考答案

教育统计学课后练习参考答案第一章 1、教育统计学，就是应用数理统计学的一般原理和方法，对教育调查和教育实验等途径所获得的数据资料进行整理、分析，并以此为依据，进行科学推断，从而揭示蕴含在教育现象中的客观规律的一门科学。教育统计学既是统计科学中的一个分支学科，又是教育科学中的一个分支学科，是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看，教育统计学属于教育科学体系的一个方法论分支；从学科性质来看，教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理，计算出简单明白的统计量数来描述庞大的资料，以显示其分布特征的统计方法。推断统计又叫分析统计，它根据统计学的原理和方法，从我们所研究的全体对象（即总体）中，按照等可能性原则采取随机抽样的方法，抽出总体中具有代表性的部分个体组成样本，在样本所提供的数据的基础上，运用概率理论进行分析、论证，在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中，一种事物常存在几种可能出现的情况或获得几种可能的结果，这类现象称为随机现象。随机现象具的特点：（1）一次条件完全相同的实验有多种可能的结果（这样的实验称为随机实验）；（2）在实验之前不能确切知道哪种结果会发生；（3）在相同的条件下可以重复进行这样的实验。 4、总体，也叫做母体或全域，是指具有某种共同特征的个体的总和。当所研究的总体数量非常大时，可以从总体中抽取其中一部分个体来观测，由此来推断总体的信息，从总体中抽出的这部分个体就称为样本，它是用以表征总体的个体的集合。通常将样本中样本个数大于或等于30个的样本称为大样本，小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后，仍放回原总体，然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数，简称参数。反映样本特征的量数叫做样本统计量，简称统计量。参数是总体的真正数值，是固定的常量，理论上应该通过计算总体中全部个体的数值而获得，但由于总体中个体的数量通常很大，总体参数往往很难获得，在统计分析中一般通过样本的数值来估计。在进行推断统计时，就是根据样本统计量来推断总体相应的参数。第二章 1、按照数据的来源，可分为计数数据和度量数据；按照数据的取值情况，可分为间断性数据和连续性数据；按照数据的测量水平，可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了；表的层次要清晰；主谓分明。 4、连续性数据：（2），（3）；间断性数据：（1），（4）。 5、略 6、（1）50；（2）75；（3）34；（4）5；（5）45

统计学(第四版)考试题贾俊平高等教育出版社

模拟试题一单项选择题(每小题2分，共20分) 1.一项调查表明，在所抽取的1000个消费者中，他们每月在网上购物的平均花费是200元，他们选择在网上购物的主要原因是“价格便宜”。这里的参数是（ A ） A. 1000个消费者 B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额 2.为了调查某校学生的购书费用支出，从男生中抽取60名学生调查，从女生中抽取40名学生调查，这种抽样方法属于（ D ） A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3.某班学生的平均成绩是80分，标准差是10分。如果已知该班学生的考试分数为对称分布，可以判断考试分数在70到90分之间的学生大约占（ C ） A. 95% B. 89％ C. 68％ D. 99％ 4.已知总体的均值为50，标准差为8，从该总体中随机抽取容量为64的样本，则样本均值的数学期望和抽样分布的标准误差分别为（） A. 50，8 B. 50，1 C. 50，4 D. 8，8 5.根据某班学生考试成绩的一个样本，用95%的置信水平构造的该班学生平均考试分数的置信区间为75分～85分。全班学生的平均分数（ D ） A ．肯定在这一区间内 B ．有95%的可能性在这一区间内 C ．有5%的可能性在这一区间内 D ．要么在这一区间内，要么不在这一区间内 6.一项研究发现，2000年新购买小汽车的人中有40%是女性，在2005年所作的一项调查中，随机抽取120个新车主中有57人为女性，在05.0=α的显着性水平下，检验2005年新车主中女性的比例是否有显着增加，建立的原假设和备择假设为（ C ） A ． %40:,%40:10≠=ππH H B ． %40:,%40:10<≥ππH H C ．% 40:,%40:10>≤ππH H D ．% 40:,%40:10 ≥<ππH H 7.在回归分析中，因变量的预测区间估计是指（ B ） A. 对于自变量x 的一个给定值0x ，求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定值0x ，求出因变量y 的个别值的区间 C. 对于因变量y 的一个给定值 0y ，求出自变量x 的平均值的区间 D. 对于因变量y 的一个给定值0y ，求出自变量x 的平均值的区间 8.在多元线性回归分析中，如果F 检验表明线性关系显着，则意味着（ A ） A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系着 B. 所有的自变量与因变量之间的线性关系都显着 C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显着 D. 所有的自变量与因变量之间的线性关系都不显着 9.如果时间序列的逐期观察值按一定的增长率增长或衰减，则适合的预测模型是（ D ） A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型 10.设p 为商品价格，q 销售量，则指数∑ ∑0 10q p q p 的实际意义是综合反映（ B ） A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度 C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度二、简要回答下列问题（每小题5分，共15分） 1、简述直方图和茎叶图的区别。 2、简述假设检验中P 值的含义。 3、解释指数平滑法。 4、（15分）甲、乙两个班参加同一学科考试，甲班的平均考试成绩为86分，标准差为12分。乙班考试成绩的分布如下：

《统计学原理》形考作业参考答案

《统计学原理》作业（一）（第一～第三章）一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。（√） 2、统计调查过程中采用的大量观察法，是指必须对研究对象的所有单位进行调查。( × ) 3、全面调查包括普查和统计报表。(× ) 4、统计分组的关键是确定组限和组距（×） 5、在全国工业普查中，全国企业数是统计总体，每个工业企业是总体单位。（×） 6、我国的人口普查每十年进行一次，因此它是一种连续性调查方法。（×） 7、对全国各大型钢铁生产基地的生产情况进行调查，以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。（√） 8、对某市工程技术人员进行普查，该市工程技术人员的工资收入水平是数量标志。(√) 9、对我国主要粮食作物产区进行调查，以掌握全国主要粮食作物生长的基本情况，这种调查是重点调查。(√) 10、我国人口普查的总体单位和调查单位都是每一个人，而填报单位是户。（√）二、单项选择题１、设某地区有６７０家工业企业，要研究这些企业的产品生产情况，总体单位是（C ）Ａ、每个工业企业；Ｂ、６７０家工业企业；Ｃ、每一件产品；Ｄ、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日，则调查期限为（B）。 A、一日 B、一个月 C、一年 D、一年零一个月 3、在全国人口普查中（B）。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值，上述两个变量是（D）。 A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量，后者为离散变量 D、前者为离散变量，后者为连续变量 5、下列调查中，调查单位与填报单位一致的是（ D ） A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是（D）。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是（A）。 A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品销售额 D、每季统计进出口贸易额 8、全面调查与非全面调查的划分是以（ C ） A、时间是否连续来划分的 B、最后取得的资料是否完全来划分的 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小划分的 9、下列分组中哪个是按品质标志分组（B）Ａ、企业按年生产能力分组Ｂ、产品按品种分组Ｃ、家庭按年收入水平分组Ｄ、人口按年龄分组三、多项选择题１、总体单位是总体的基本组成单位，是标志的直接承担者。因此（A、D）Ａ、在国营企业这个总体下，每个国营企业就是总体单位；Ｂ、在工业总产值这个总体下，单位总产值就是总体单位；Ｃ、在全国总人口这个总体下，一个省的总人口就是总体单位；Ｄ、在全部工业产品这个总体下，每一个工业产品就是总体单位；Ｅ、在全部固定资产这一总体下，每个固定资产的价值就是总体单位。２、在对工业企业生产设备的调查中（B、C、E）Ａ、全部工业企业是调查对象；Ｂ、工业企业的全部生产设备是调查对象；Ｃ、每台生产设备是调查单位；Ｄ、每台生产设备是填报单位；Ｅ、每个工业企业是填报单位３、对连续变量与离散变量，组限的划分在技术上有不同要求，如果对企业按工人人数分组，正确的方法应是