现代统计分析方法试卷

合集下载

《现代统计分析方法与应用》第三版

《现代统计分析方法与应用》第三版

何晓群编著,《现代统计分析方法与应用》第三版,中国人民大学出版社,2012。

数据和部分程序下载第2章服装标准例程序利用R软件,运行如下R程序便可计算相应的条件均值和条件协方差矩阵:#均值向量m=matrix(c(154.98,83.39,70.26,61.32,91.52),nrow=5,ncol=1);m;#协方差矩阵sigma=matrix(c(29.66,6.51,1.85,9.36,10.34,6.51,30.53,25.54,3.54,19.53,1.85,25.54,39.86,2.23,20.70,9.36,3.54,2.23,7.03,5.21,10.34,19.53,20.70,5.21,27.36),5,5);sigma;#条件均值x5=85;m1=matrix(m[1:4,1],4,1)+matrix(sigma[1:4,5]*sigma[5,5]^(-1),4,1)%*%(x5-sigma[5,1]);m1;#条件协方差1(d[x1,x2,x3,x4|x5])d1=sigma[1:4,1:4]-matrix(sigma[1:4,5]*sigma[5,5]^(-1),4,1)%*%matrix(sigma[5,1:4],1,4);d1;#条件协方差2(d[x1,x2,x3|x4,x5])d2=d1[1:3,1:3]-matrix(d1[1:3,4]*d1[4,4]^(-1),3,1)%*%matrix(d1[4,1:3],1,3);d2;注:上面程序假定585X ,可以根据实际情况更改5X的值以计算相应的条件均值。

利用R软件,运行如下的R程序便可计算出偏相关系数:#均值向量m=matrix(c(154.98,83.39,70.26,61.32,91.52),nrow=5,ncol=1);m;#协方差矩阵sigma=matrix(c(29.66,6.51,1.85,9.36,10.34,6.51,30.53,25.54,3.54,19.53,1.85,25.54,39.86,2.23,20.70,9.36,3.54,2.23,7.03,5.21,10.34,19.53,20.70,5.21,27.36),5,5);sigma;#偏相关系数1(r[12.45])r1=d2[1,2]/sqrt(d2[1,1]*d2[2,2]); r1;#偏相关系数2(r[13.45])r2=d2[1,3]/sqrt(d2[1,1]*d2[3,3]); r2;#偏相关系数3(r[23.45])r3=d2[2,3]/sqrt(d2[2,2]*d2[3,3]); r3;第3章例3.1 某超市为了研究顾客对三种牌号的矿泉水的喜好比例,以便为下一次进货提供决策,随机观察了150名购买者,并记录下他们所买的品牌,统计出购买三种品牌的人数如表3-1。

统计学考试试题2

统计学考试试题2

统计学试题2一、单项选择题(每小题1分,共15分)1. 用图形、表格和概括性数字对数据进行描述的方法属于( )A、理论统计学B、应用统计学C、描述统计学D、推断统计学2. 某灯泡厂为了掌握灯泡产品的质量情况而进行的调查属于()。

A.普查 B.重点调查C.典型调查D.抽样调查3. 在连续型数据的频数分布中,其末组组限为500以上,又知其邻组组中值为480,则末组组中值为()A.520 B.510 C.500 D.4904. 下列分组中哪个是按品质标志分组()A.企业按年生产能力分组 B.产品按品种分组C.家庭按收入水平分组 D.人口按年龄分组5. 某寝室11名同学的英语成绩分别为70.71.76.78.83.86.85.81.90.93.97,则英语成绩的上四分位数为()A.86 B.74.75 C.90 D.816. 对几组平均水平相同的数据进行离散程度的比较时,通常使用的统计量是()。

A.极差 B.平均差C.标准差 D.离散系数7. 某地区2005年工业增加值850亿元,若按每年平均增长6%的速度发展,2015年该地区工业增加值将达到()亿元A.11%)61(850+⨯ B.10%)61(850+⨯C.11%6850⨯ D.10%6850⨯8. 根据各季度商品销售额数据计算的季节指数分别为∶一季度70%,二季度95%,三季度110%,四季度125%。

受季节因素影响最大的是()。

A.一季度B.二季度C.三季度D.四季度9. 统计指数划分为个体指数和总指数的依据是()A. 指数化指标的性质不同B.采用的同度量因素不同C. 反映的对象范围不同D.指数的对比性质不同某企业10. 同一数量货币,报告期只能购买基期商品量的90%,这是因为物价( )A.上涨10%B.下降10%C.上涨11.1%D.下降11.1%11. 在其他条件相同的情况下,95%的置信区间比90%的置信区间()。

A. 宽B. 窄C. 相同D. 无法确定12. 在其他条件不变的情况下,若使估计时所需的样本容量减小,则应该()。

统计学和统计法基础知识:统计方法考试题库(题库版)

统计学和统计法基础知识:统计方法考试题库(题库版)

统计学和统计法基础知识:统计方法考试题库(题库版)1、单选?某企业三种产品的单位成本和产量资料如下表,若根据上表资料编制三种产品的总成本指数、成本总指数、产量总指数,并分析由于单位产品成本和产量变动对产品总成本的影响,(江南博哥)请回答下述问题:总成本指数为()。

A.108.62%B.118.04%C.92.05%D.98.45%正确答案:A2、单选重置抽样的特点是()。

A.每次抽样的总体单位数都是不同的B.各次抽选相互影响C.每次抽选时,总体单位数都在逐渐减少D.每次抽选时,总体单位数始终不变正确答案:D参考解析:重置抽样是指在抽取样本单位的时候每次只抽取一个样本单位,观察记录之后再放回到总体中参加下一次的抽样,这样在抽样的过程中总体单位总数始终不变。

3、单选为了调查某校学生的每月的生活费支出,从全校抽取6个班级的学生进行调查,这种调查方法是()。

A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样正确答案:D参考解析:整群抽样是将一组被调查者视为一个抽样单位,每次抽取时抽出来的是一组(群),而不是一个个体单位。

题中某校学生为总体,8个班级的学生为群,从全校抽取8个班级的学生进行调查,这种调查方法是整群抽样。

4、单选根据随机抽样调查资料,某企业工人生产定额平均完成103%,标准误为1%,置信度为95.45%,可以推断该企业工人的生产定额平均完成百分比()。

A.小于101%B.大于105%C.在102%~104%之间D.在101%~105%之间正确答案:D参考解析:当总体方差σ2已知时,总体均值μ在1-α置信水平下的置信区间为,由题目知,标准误为1%,故平均完成百分比的范围为(103%-2×1%,103%+2×1%),即为101%~105%之间。

5、单选某小区新增住户2%,每家住户用电量比上年提高了5%,则该小区用电量总额增长()A.7%B.7.1%C.10%D.11.1%正确答案:B6、多选?下列属于拉氏指数的有()。

统计学考试计算题答案统计学试题及答案

统计学考试计算题答案统计学试题及答案

统计学考试计算题答案统计学试题及答案一、填空题(每空1分,共10分)1.从标志与统计指标的对应关系来看,标志通常与( )相同。

2.某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( )。

3.国民收入中消费额和积累额的比例为1:0.4,这是( )相对指标。

4.在+A的公式中,A称为( )。

5.峰度是指次数分布曲线项峰的( ),是次数分布的一个重要特征。

6.用水平法求平均发展速度本质上是求( )平均数。

7.按习惯做法,采用加权调和平均形式编制的物量指标指数,其计算公式实际上是( )综合指数公式的变形。

8.对一个确定的总体,抽选的样本可能个数与( )和( )有关。

9.用来反映回归直线代表性大小和因变量估计值准确程度的指标称( )。

二、是非题(每小题1分,共10分)1.统计史上,将国势学派和图表学派统称为社会经济统计学派。

2.统计总体与总体单位在任何条件下都存在变换关系统计学原理试题及答案统计学原理试题及答案。

3.学生按身高分组,适宜采用等距分组。

4.根据组距数列计算求得的算术平均数是一个近似值。

5.基尼系数的基本公式可转化为2(S1+S2+S3)。

6.对连续时点数列求序时平均数,应采用加权算术平均方法。

7.分段平均法的数学依据是Σ(Y-YC)2=最小值。

8.平均数、指数都有静态与动态之分。

9.在不重复抽样下,从总体N中抽取容量为n的样本,则所有可能的样本个数为Nn个10.根据每对____和y的等级计算结果ΣD2=0,说明____与y之间存在完全正相关。

三、单项选择题(每小题2分,共10分)1.在综合统计指标分析^p 的基础上,对社会总体的数量特征作出归纳、推断和预测的方法是A.大量观察法B.统计分组法C.综合指标法D.模型推断法2.对同一总体选择两个或两个以上的标志分别进行简单分组,形成A.复合分组B.层叠分组C.平行分组体系D.复合分组体系3.交替标志方差的最大值为A.1B.0.5C.0.25D.04.如果采用三项移动平均修匀时间数列,那么所得修匀数列比原数列首尾各少A.一项数值B.二项数值C.三项数值D.四项数值5.可变权数是指在一个指数数列中,各个指数的A.同度量因素是变动的B.基期是变动的C.指数化因数是变动的D.时期是变动的四、多项选择题(每小题2分,共10分)1.反映以经济指标为中心的三位一体的指标总体系包括A.社会统计指标体系B.专题统计指标体系C.基层统计指标体系D.经济统计指标体系E.科技统计指标体系2.典型调查A.是一次性调查B.是专门组织的调查C.是一种深入细致的调查D.调查单位是有意识地选取的E.可用采访法取得资料3.下列指标中属于总量指标的有A.月末商品库存额B.劳动生产率C.历年产值增加额D.年末固定资金额E.某市人口净增加数4.重复抽样的特点是A.各次抽选互不影响B.各次抽选相互影响C.每次抽选时,总体单位数逐渐减少D.每次抽选时,总体单位数始终不变E.各单位被抽中的机会在各次抽选中相等5.下列关系中,相关系数小于0的现象有A.产品产量与耗电量的关系B.单位成本与产品产量的关系C.商品价格与销售量的关系D.纳税额与收入的关系E.商品流通费用率与商品销售额的关系五、计算题(每小题10分,共60分)要求:(1)写出必要的计算公式和计算过程,否则,酌情扣分。

统计学试题和答案.

统计学试题和答案.

《统计学》模拟试卷(一)一、填空题(每空1分,共10分)1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。

2、收集的属于不同时间上的数据称为 数据。

3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置信区间_________________。

(Z 0.005=2.58)4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。

5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。

6、判定系数的取值范围是 。

7、设总体X ~) ,(2σμN ,x 为样本均值,S 为样本标准差。

当σ未知,且为小样本时, 则n s x μ-服从自由度为n-1的___________________分布。

8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。

二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。

每小题1分,共14分)1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.64、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( )5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )①、x > e M >o M ②、x <e M <o M ③、x >o M >e M8、方差分析中的原假设是关于所研究因素 ( )①、各水平总体方差是否相等 ②、各水平的理论均值是否相等③、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( )①、甲类较大 ②、乙类较大 ③、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( )①、187.5% ②、7% ③、106.48%11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。

统计学和统计法基础知识:统计方法试题(题库版)

统计学和统计法基础知识:统计方法试题(题库版)

统计学和统计法基础知识:统计方法试题(题库版)1、单选有意识地选择三个有代表性的农村点调查农民收入情况,这种调查方式属于()。

A.典型调查B.重点调查C.抽样调查D.普查正确答案:A参考解析:典型调查是一种非全面(江南博哥)的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。

有意识地选择三个有代表性的农村点调查农民收入情况的调查方式属于典型调查。

2、单选某种产品的单位成本Y(元/件)对产量X(千件)的回归方程为Y=100-0.2X,其中“-0.2”的意义是()。

A.产量每增加1千件,单位成本下降0.2元B.产量每增加1千件,单位成本平均下降0.2元C.产量每增加1千件,单位成本下降20%D.产量每增加1千件,单位成本下降0.2%正确答案:B参考解析:一元线性回归方程为y=b0+b1x,b0是直线的截距,表示当解释变量为零时y的平均值。

回归系数b1是直线的斜率,表示解释变量x每增加一个单位,被解释变量将相应地平均变化b1个单位。

3、单选?当总体为未知的非正态分布时,当样本容量n足够大(通常要求n≥30)时,样本均值的期望值为()A.总体均值B.总体均值的1/nC.总体均值的D.总体均值的正确答案:A4、判断题变量“性别”和变量“受教育程度”属于数值型变量。

()正确答案:错参考解析:“性别”只是说明事物类别的名称,属于分类变量;“受教育程度”是说明事物有序类别的名称,属于顺序变量。

5、多选测定现象之间有无线性关系的方法有()。

A.绘制相关表B.绘制散点图C.计算估计标准误差D.计算相关系数E.A现象进行定性分析正确答案:A, B, D, E参考解析:相关表、散点图和定性分析都可对现象之间有无线性关系作出大致的分析,相关系数用具体的数字来描述现象之间的线性相关性,相比之更为精确。

6、多选统计分析数据的方法大体可分为()A.经济统计B.理论统计C.描述统计D.应用统计E.推断统计正确答案:C, E7、单选?在数量指标综合指数中,Σq1p0-Σq0p0表示()。

统计学考试题及答案

统计学考试题及答案

统计学考试题及答案**统计学考试题及答案**一、单项选择题(每题2分,共20分)1. 统计学中的总体是指()。

A. 研究对象的全体B. 研究对象中的一部分C. 研究对象的一个样本D. 研究对象的个体答案:A2. 以下哪项不是统计数据的类型?()A. 定性数据B. 定量数据C. 离散数据D. 连续数据答案:C3. 描述一组数据集中趋势的度量,不包括以下哪项?()A. 平均数B. 中位数C. 众数D. 方差答案:D4. 以下哪项是描述数据离散程度的统计量?()A. 平均数B. 标准差C. 众数D. 极差答案:B5. 相关系数的取值范围是()。

A. -1到1之间B. 0到1之间C. 1到无穷大D. 负无穷大到正无穷大答案:A6. 以下哪项是统计学中的抽样误差?()A. 由于测量不准确造成的误差B. 由于样本选择不当造成的误差C. 由于总体变化造成的误差D. 由于样本量太小造成的误差答案:B7. 在统计学中,置信区间的置信水平通常为()。

A. 90%B. 95%C. 99%D. 100%答案:B8. 以下哪项是统计学中的假设检验?()A. 检验两个样本均值的差异是否显著B. 检验两个样本的方差是否相等C. 检验两个样本的相关性是否显著D. 所有以上选项答案:D9. 以下哪项不是非参数统计方法?()A. 卡方检验B. 曼-惠特尼U检验C. 斯皮尔曼等级相关D. 克鲁斯卡尔-瓦利斯检验答案:A10. 以下哪项是时间序列分析中的趋势分析?()A. 季节性分析B. 周期性分析C. 趋势分析D. 随机性分析答案:C二、多项选择题(每题3分,共15分)11. 以下哪些是统计学中的参数估计方法?()A. 点估计B. 区间估计C. 假设检验D. 置信区间答案:A、B12. 以下哪些是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 中位数D. 众数答案:A、B13. 以下哪些是统计学中的非参数检验方法?()A. t检验B. 卡方检验C. 曼-惠特尼U检验D. 克鲁斯卡尔-瓦利斯检验答案:C、D14. 以下哪些是统计学中的回归分析方法?()A. 简单线性回归B. 多元线性回归C. 逻辑回归D. 泊松回归答案:A、B、C、D15. 以下哪些是统计学中的方差分析方法?()A. 单因素方差分析B. 双因素方差分析C. 协方差分析D. 重复测量方差分析答案:A、B、C、D三、简答题(每题10分,共40分)16. 简述统计学中的中心极限定理及其意义。

统计学案例分析单选题100道及答案解析

统计学案例分析单选题100道及答案解析

统计学案例分析单选题100道及答案解析1. 为了了解某工厂生产的一批灯泡的使用寿命,从中抽取了100 只进行检测,在这个问题中,样本是()A. 工厂生产的一批灯泡B. 抽取的100 只灯泡C. 100D. 每只灯泡的使用寿命答案:B解析:样本是从总体中抽取的一部分个体,这里抽取的100 只灯泡就是样本。

2. 一组数据的最大值与最小值之差称为()A. 极差B. 方差C. 标准差D. 平均差答案:A解析:极差是一组数据中的最大值减去最小值。

3. 下列指标中,属于位置平均数的是()A. 算术平均数B. 调和平均数C. 几何平均数D. 中位数答案:D解析:中位数是将数据排序后,位于中间位置的数值,属于位置平均数。

4. 若一组数据的偏态系数为0,则该组数据的分布为()A. 对称分布B. 右偏分布C. 左偏分布D. 无法确定答案:A解析:偏态系数为0 时,数据分布为对称分布。

5. 抽样调查中,样本容量的确定取决于()A. 总体标准差B. 允许误差C. 抽样方法D. 以上都是答案:D解析:样本容量的确定需要考虑总体标准差、允许误差和抽样方法等因素。

6. 在假设检验中,原假设和备择假设()A. 只有一个成立B. 都有可能成立C. 都有可能不成立D. 原假设一定成立,备择假设不一定成立答案:A解析:原假设和备择假设相互对立,只有一个成立。

7. 对于两个变量之间的线性相关程度,常用()来衡量。

A. 相关系数B. 决定系数C. 回归系数D. 残差平方和答案:A解析:相关系数用于衡量两个变量之间的线性相关程度。

8. 下列哪种抽样方法不是概率抽样()A. 简单随机抽样B. 系统抽样C. 方便抽样D. 分层抽样答案:C解析:方便抽样是非概率抽样方法。

9. 一组数据的标准差越大,说明()A. 数据的离散程度越大B. 数据的离散程度越小C. 平均数越大D. 平均数越小答案:A解析:标准差越大,数据的离散程度越大。

10. 若一组数据服从正态分布,则其均值和中位数的关系是()A. 均值大于中位数B. 均值小于中位数C. 均值等于中位数D. 无法确定答案:C解析:正态分布的数据,均值等于中位数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2017年12月,研究生)
(要求:答案写在答题纸上)
一、名词解释(20分,每题4分)
1、随机项和残差项
2、时间序列平稳性
3、偏回归平方和
4、DW检验
5、大数据
二、简答题(36分,每题6分)
1、回归分析中,回归方程检验和回归系数检验有什么异同?
2、建立ARMA模型时,如何进行模型识别?
3、因子载荷矩阵有什么统计意义?它与主成分系数矩阵有什么不同?
4、判别分析中Fisher 判别准则,贝叶斯判别准则的区别?
5、利用回归分析方法如何进行边际分析和弹性分析?
6、统计上,如何测定样品或变量之间的亲疏程度?
三、论述题(44分)
1、结合自己所学专业举例说明回归分析的步骤?(14分)
2、结合自己所学专业举例说明因子分析的步骤和每步的意义?(15分)
3、结合自己所学专业举例说明系统聚类分析的步骤和应注意的问题?(15分)
(2018年7月,研究生)
(要求:答案写在答题纸上)
一、名词解释(20分,每题4分)
1、可决系数和修正可决系数
2、偏回归平方和
3、自相关系数
4、主成分
5、系统聚类分析
二、简答题(36分,每题6分)
1、回归分析中,回归方程检验和回归系数检验有什么异同?
2、建立ARMA模型时,如何进行模型识别?
3、因子载荷矩阵有什么统计意义?它与主成分系数矩阵有什么不同?
4、比较距离判别准则,Fisher 判别准则,贝叶斯判别准则的区别?
5、逐步回归分析与一般回归分析的区别和意义?
6、统计上,如何测定样品或变量之间的亲疏程度?
三、论述题(44分)
1、结合自己所学专业举例说明回归分析的应用步骤?(14分)
2、结合自己所学专业举例说明因子分析的应用步骤?(15分)
3、结合自己所学专业举例说明聚类分析的应用步骤?(15分)。

相关文档
最新文档