5统计学作业——我国城市空气质量的状况分析

5统计学作业——我国城市空气质量的状况分析
5统计学作业——我国城市空气质量的状况分析

天津商业大学

Tianjin University of Commerce 学年论文

题目我国城市空气质量的状况分析

学院经济学院

专业金融学_____

姓名胡鹏

学号120140017

完成时间2014年11月10日

我国城市空气质量的状况分析

摘要:本文针对我国城市的空气质量现状及影响城市空气质量的主要因素进行分析研究。运用聚类分析方法对我国城市空气质量等级进行分类,把空气质量状况最相似的城市聚成一类,分析原因、得出结论。并对影响城市空气质量的5个主要因素进行主成分分析,找出最能代表原来数据信息的2至3个因子代替原来的5个变量。建立回归模型,对结果进行分析,寻找解决空气质量问题的方法,并对原有方法进行改进,以便更为高效、快速地解决空气质量问题。

关键词:空气质量;聚类分析;主成分分析;回归分析

Abstract:This article mainly analyze urban air quality present situation in China and the key factors affecting urban air quality study. Using clustering analysis method on the classification of China's urban air quality levels, gather into the city air quality in most similar category, analysis of causes, concluded. Then 5 main factors affecting urban air quality to principal component analysis identify the most representative of the original data instead of the 2 to 3 factors 5 variables. Established regression model an analysis of the results, looking for ways to address air quality issues, and to improve the existing methods, to more efficient and faster to solve the air quality problem.

Keywords: air quality;cluster analysis;Principal components analysis;regression analyze

一、我国城市空气质量的现状

我国是一个人口大国,城市众多,人口密集。但由于工业的发展,我们的很多城市都受到了不同程度的污染,直接对我们造成伤害,人们疾病的发生率也逐年提高。空气中的污染物主要是可吸入颗粒、二氧化硫、二氧化氮等物质。据环保部2012年统计2011年度各省、自治区、直辖市和八家中央企业主要污染物总量减排核查核算工作表明,全国化学需氧量、氨氮和二氧化硫排放量实现同比下降,氮氧化物排放量同比上升。“十二五”期间,国家对化学需氧量、氨氮、二氧化硫、氮氧化物4种主要污染物实施排放总量控制。其中,北京市、上海市、浙江省和河南省四项主要污染物排放量平均降幅全部位居前列。但同时仍有个别地区在污染减排工作中存在突出问题。

许多城市和地区空气污染依然严重,污染类型以烟煤型污染为主,颗粒物仍是影响中国城市空气质量的主要污染物。从2013年1月12日开始,北京、天津、河北、河南、江苏等地都笼罩在雾霾中,污染程度高。在全国73个监测城市中,33个城市的部门监测站点监测数据显示,空气质量指数超过300,北京PM2.5一度超过900微克/立方米以上,空气质量达到重度污染。

二、影响城市空气质量的因素

(一)衡量指标

衡量指标的选取对于聚类分析来说至关重要,具有决定性的意义,影响空气质量好坏的因素有很多,为便于比较各个城市空气质量指标的异同点,根据我国各主要城市2011年城市空气质量指标的数据表,可以采用多元统计分析中的系统聚类法对31个主要城市的空气质量指标进行分析。由下表一知,前三个指标和后一个指标的含义不一样,并且前三个指标不能完全代表空气质量状况,所以只用后一个指标对原始数据进行聚类分析,就能透彻地来衡量我国主要城市的空气质量。原文数据如下:

表一

摘编自《中国区域经济统计年鉴2012》(二)聚类结果及分析

聚类结果:

树图1

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

杭州 11 -+

银川 30 -+

沈阳 6 -+-----+

上海 9 -+ |

3长沙 18 -+ +-----+

南宁 20 -+ | |

贵阳 24 -+-----+ |

呼和浩特 5 -+ +-----------------------------------+

南昌 14 -+ | |

长春7 -+ | |

福州 13 -+ | |

广州 19 -+-----------+ |

4海口 21 -+ | 昆明 25 -+ |

拉萨 26 -+ |

北京 1 -+---+ |

1乌鲁木齐 31 -+ +---------------+ | 兰州 28 -----+ | |

武汉 17 -+ | |

西安 27 -+ +---------------------------+

太原 4 -+-----+ |

合肥 12 -+ | |

哈尔滨8 -+ | |

2南京 10 -+ +-------------+

西宁 29 -+ |

郑州 16 -+ |

石家庄 3 -+-----+

济南 15 -+

天津 2 -+

重庆 22 -+

成都 23 -+

本文是按二级以上天数及所占比重作为衡量标准对各个城市空气质量做聚类分析。明显可见全国31个主要城市被分为四类,分类结果见树图1。各类所包含的省市自治区、直辖市如下:

第一类有3个城市,其中包括北京、兰州、乌鲁木齐;

第二类有13个城市,其中包括哈尔滨、天津、太原、西安、石家庄、济南、郑州、合肥、南京、武汉、西宁、成都、重庆;

第三类有10个城市,其中包括银川、沈阳、长春、贵阳、呼和浩特、南昌、杭州、长沙、南宁、上海;

第四类有5个城市,其中包括福州、广州、海口、昆明、拉萨。

根据《环境空气质量标准》(GB3095-1996)规定二类区即二级标准为城镇规划中确定的居住区、商业交通居民混合区、文化区、一般工业区和农村地区。我国31个主要城市都已经达到二级标准,但不同的是达到二级标准的天数各不相同。可以看出:

第一类的三个城市明显是达到二级标准天数及所占比重最少的。这主要归因于其特殊的城市职能和地理位置,工业发展比较快,工业企业比较多,而且人口密度过大,又容易受西北沙尘暴袭击。诸多因素影响导致空气质量严重恶劣,是重点治理对象。

第二类的十三个城市居于中等。主要区域为城镇规划确定的居民区、商业区交通居民混合区、文化区、一般工业区和农村地区;也相对存在一些不足之处,有待个相关部门的进一步调查及相关

对策治理。

第三类的十个城市与其他大城市相比处于中中上等水平。与空气质量较好的城市相比,I级天数较少,III级天数较多,仍存在着不少差距。但是上海是进步最大的一个城市。其中上海市政府加大力度控制大气污染源排放和建设城市绿地是促进城区空气质量变好的重要原因。这是其他城市应该学习和借鉴的。重点是分到第四类的五个城市,其中昆明、海口二级以上天数所占比重达到100%,是中国空气最好的城市。其余三个相对前三类也有明显优势。主要区域为自然保护区、风景名胜区和其他需要特殊保护的地区。

三、对各城市空气质量的主成分分析

(一)衡量空气质量好坏的指标

影响空气质量的因素有很多,本方法选取可吸入颗粒物(因子1),二氧化氮(因子2),二氧化硫(因子3),湿度(因子4),温度(因子5)等五个因素。数据如下:

(二)共线性诊断

选取的指标具有不同的量纲和量纲单位,对选中指标进行标准化处理,使其无量纲化,从而可以得到相同的协方差矩阵或相关矩阵。

由下表可知,VIF都大于1,则上述5个变量之间存在多重共线性,在下面的建模中首先要运用提取主成分的方法消除这种共线性。

表三

系数a

(三)提取主成分

根据所述原理,将标准后的样本数据输入spss软件进行主成分分析,并取特征值为大于1,得到累计贡献大于85%的主成分,结果如图:

表四

解释的总方差

表五

用这三个因子代替原来的5个变量可以概括全部信息的85.570%。说明前三个主成分代表原来的五个指标评价城市空气质量已经有足够的把握。因此,描述空气质量,可以用这三个因子。

经过spss 分析最终得出综合主成分得分(表五),它反应了各样本的综合水平。

表六

从而得到主成分方程:

=0.335+0.338错误!未找到引用源。+0.191错误!未找到引用源。-0.236错误!未

找到引用源。-0.333错误!未找到引用源。; (1)

=0.278+0.120错误!未找到引用源。+0.519错误!未找到引用源。+0.508错误!未找到引用源。+0.339错误!未找到引用源。; (2)

=0.208+0.734错误!未找到引用源。-0.877错误!未找到引用源。+0.588错误!未

找到引用源。+0.034错误!未找到引用源。; (3)

在上表中可以看出:在第一和第三主成分上,二氧化硫的得分最高,这说明二氧化硫成为我国主要城市空气污染的主要污染源,这在一定程度上说明汽车尾气,工厂废气带来的危害。在第二主成分上,二氧化氮的得分最高,表明二氧化氮也能够影响空气的质量。

(四)建立回归模型

为了使各主成分影响指标更加明显,再对数据进行回归分析,用城市空气质量达到及好于二级

的天数作为因变量y 对前三个主成份、、做普通最小二乘回归,

112233?m y

c m c m c =++ (4)

得到标准化后的主成份回归的回归方程:

123?0.7220.2310.060y

c c c =--- (5) 还原后的标准化的主成份回归方程为:

123450.3190.3160.2050.0180.16y x x x x x =---++ (6)

表八

得到未标准化的主成份回归的回归方程:

123326.80619.820 6.353 1.656y c c c =--- (7)

还原后的未标准化的主成份回归方程为:

12345326.8068.7498.671 5.6310.476 3.889y x x x x x =---++ (8)

(五)结果分析及综合评价

由方程(6)可知,可吸收颗粒物的系数最大,它对空气质量好坏的影响最大;二氧化硫次之;空气湿度的影响最小。具体分析为:可吸收颗粒物每增加1%,空气质量达到及好于二级的天数就会减少0.319%。二氧化硫每增加1%,空气质量达到及好于二级的天数就会减少0.316%。二氧化氮每增加1%,空气质量达到及好于二级的天数就会减少0.205%。空气湿度每增加1%,空气质量达到及好于二级的天数就会增加0.018%。气温每增加1%,空气质量达到及好于二级的天数就会增加0.16%。

由方程(8)知,各回归系数的实际意义为:

1β=-8.749表示,在二氧化硫(SO2)、二氧化氮(NO2)、年平均湿度、年平均气温不变的条件下,可

吸收颗粒物(PM10)每增加1毫克/立方米,空气质量达到及好于二级的天数平均就会减少8.749天。

2β=-8.671表示,在可吸收颗粒物(PM10)、二氧化氮(NO2)、年平均湿度、年平均气温不变的条

件下,二氧化硫(SO2)每增加1毫克/立方米,空气质量达到及好于二级的天数平均就会减少8.671天。

3β=-5.631表示,在可吸收颗粒物(PM10)、二氧化硫(SO2)、年平均湿度、年平均气温不变的条件

下,二氧化氮(NO2)每增加1毫克/立方米,空气质量到达及好于二级的天数平均就会减少5.631天。

4β=0.476表示,在可吸收颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、年平均气温不变的条

件下,年平均湿度每增加1%,空气质量达到及好于二级的天数平均就会增加0.476天。

5β=3.889表示,在可吸收颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、年平均湿度不变的条

件下,年平均气温每增加1摄氏度,空气质量达到及好于二级的天数平均就会增加3.889天。 由以上结果可知,影响空气质量的最主要因素是可吸收颗粒物(PM10),其次是二氧化硫(SO2),第三是气温。想要改善城市空气质量,首先从这三个方面下手。

四、结论与对策建议 (一)主要结论

纵观影响我国城市空气质量的这几个因素,我们可以判断出我国空气的污染源主要有三种:生活污染源,工业污染源以及交通污染源。

1、生活污染源:城市居民、机关和服务性行业,由于烧饭、取暖、沐浴等生活上的需要,燃烧矿物燃料,向大气排放煤烟、油烟、废气等造成大气污染;城市生活垃圾在堆放过程中厌氧分解排出的二次污染物和垃圾焚烧过程产生的废气。

2、工业污染源:随着经济的迅猛发展,各类工厂迅速增加,而大气污染的来源也迅速增多,成了我国大气污染的重要来源。主要包括燃料燃烧排放的污染物以及工艺生产过程中排放的废气(如化工厂向大气排放的具有刺激性、腐蚀性、异味和恶臭的有机和无机气体;炼焦厂排放的酚、苯、烃类

和化纤厂排放的氨、二硫化碳、甲醇、丙酮等有毒有害物质)以及生产过程中排放的各类金属和非金属粉尘。由于工业企业的性质、规模、工艺过程、原料和产品等种类不同,对大气污染的程度也不同。如:由火力发电厂、钢铁厂、化工厂及农药厂、造纸厂等各种工矿企业在生产过程中排放出来的烟气,含有烟尘、硫氧化物、氮氧化物、二氧化碳及碳黑、卤素化合物等有害物质。

3、交通污染源;:经济发展离不开交通,交通业的迅猛发展带来的大气污染也是主要来源之一。飞机、汽车、船舶排出的尾气中含NO、NO2、二氧化硫、碳氢化合物(HC)、CO、铅氧化物、苯并(a)芘、多环芳烃等大气污染物。而且由于汽车汽缸结构不好,燃烧不完全,以及使用汽油抗爆剂四乙基铅[Pb(C2H5)4等,在燃烧排放的尾气中,还含有大量污染气体。

(二)对策与建议

根据我国国情要解决空气污染问题,必须加大执法力度,彻底改变“有法不依,执法不严”的状况,提高生产技术水平,控制污染源,在旧城改建和新建城市规划时,合理布局工业企业。合理规划城市绿地,提高城市绿化水平。控制大气污染源是治理大气污染的关键,合理工业布局重在防,而生物措施,搞好城市绿化是防治结合。三者应并重,不可偏废。

1、控制污染源,加强大气检测.大众媒体监督在控制污染源方面,首先应加强检测预报工作,进行公众舆论监督。城市的空气质量像天气预报一样,天天预报。一是唤醒全民对生命之气大气质量的关注,另一方面,对主要大气污染源的工业企业增加压力。

2、促使企业进行工艺改造,加大环保投资要加大执法力度.对那些耗能大、污染重、效益差的企业。依据环保法规及行政的、经济的调控手段,坚决实行关、停、转.对污染大户要强制执行环保处理措施.促使其达到国家规定级别的排放标准。工业企业也应站在保护人类生命之气的高度积极进行工艺改造,加大环保投资力度,对废气的排放进行综合利用,杜绝或减少滴、冒、跑、漏,最大限度地降低污染物的排放量和毒害程度;废气中会有一些有价值的气体,可以循环利用,降低生产成本。从而真正做到节能减排,国家要对积极进行技术改进的企业有实质性的鼓励,以促进企业的积极性。

3、控制交通污染源和生活污染源,治理交通污染源首先要确定城市规模,控制人口数量。第二要控制车辆数量.尤其是有把摩托车出租车数量控制在适量水平,不应任其发展。第三要对车辆能源进行改革。从目前来看,推广无铅汽油和推广汽油车电子控制燃油喷射技术具有可行性,从长远来看,要开发和生产对大气无污染的新型能源车辆。如太阳、电能车辆等,还可以像日本学习,在汽车出厂时都已安装了过滤器,排放标准达到了欧洲三级标准,使得空气中的PM2.5含量大大降低,从根本上解决车辆尾气污染问题。控制生活污染源有一定困难,但如果措施得力,办法可行,仍然能取得比较理想的效果。像北方城市的取暖问题,应采取全市集中供热的办法,不准私建锅炉,同时国家应大力发展电力事业,降低电费。引导城市居民进行厨房革命,以减轻生活煤灶对大气的污染。

4、合理城市工业布局即使达到国家规定的废气排放标准的工业企业,其气体排放物仍对大气有一定的污染。所以.在旧城改建和新城规划时应充分考虑当地的自然条件,包括主导风向和地理环境。在工业企业选址时,从大气影晌方面考虑.应注意以下三点:第一、根据城市的主导风向,厂址应选在下风向;第二、厂址应选在空气流畅,利于废气扩散和稀释的地方;第三、与居住区之间要保持一定的距离。距离的大小,根据卫生部颍发-的防护级别标准执行。如氮肥生产企业属于一级防护企业,应与居住区有1000米距离.这之间应种植卫生防护林带。

5、科学利用大气环境容量:就是根据大气的自净规律定量定时的向大气中排放污染物,保证大气中的污染物浓度在大气环境容量的限度中,合理的利用大气环境容量。在控制大气污染综合整治中,合理的利用大气容量是可行的。治理时,应先考虑这一可行性措施。

6、减少燃烧。集中供热、限制私家车日出行量、增加公交车的数量,杜绝燃化炮竹(尤其是首先解决机关单位的烟花炮竹)。

7、改进制冷技术,限制使用氟利昂制冷剂。

8、治理腐败,落实环保管理,变罚款为治理。

9、搞好城市绿化。

10、限制乱砍乱伐,加大植树造林力度等。

空气污染的现象正在加剧,空气污染,人人都是受害者,一场罕见的雾霾天气,让人们意识到,治理空气污染已刻不容缓,治理空气污染不是个别人的事情,它是我们每个人公民的责任和义务。所以,我们要为治理大气污染出一份力,要经常向群众做好广泛的宣传工作,如;每年进行一周的环境保护宣传,加强群众的环保意识,了解环保的法律知识。而且,对待各个企业工厂要坚持依法管理环境,对破坏环境的人和事要进行教育和加以处罚,以致拘役判刑。不能放宽对环境保护的监察执法力度,让我们从身边的小事做起,一点一滴的积累,勿以善小而不为,勿以恶小而为之。让我们付出行动,用双手保护我们的家园,保护好我们的环境,使我们的城市居住环境更加美好。

参考文献

[1]温桂林.我国主要城市空气质量分析[D].厦门大学理学院,2011.

[2]国家环境保护总局宣传教育中西编,广播宣传手册-地球我们的家.北京:中国环境科学出版社2004.11(2-5)

[3]中国统计年鉴2011—主要城市空气质量指标[J] 2012.

[4]何晓群.应用多元统计分析[M].中国统计出版社,2010.176-209:;253-267.

[5]宋志刚,何旭洪,谢蕾蕾编著.SPSS16实用教程[M].人民邮电大学出版社,209-223;246-262.

[6]国家环保总局网站 https://www.360docs.net/doc/3d16204274.html,

[7]何晓群,刘文卿编著.应用回归分析(第二版)[M].中国人民大学出版社,2010.179-184.

[8]贾俊平,何晓群,金勇进编著.统计学(第四版)[M].中国人民大学出版社,2011.298-352.

[9]“霾伏” PM2.5[N].艺术与设计,2013年第3期.

[10]雾霾警示:我们需要改变什么[N],《老友》2013年第2期.

[11]张继娟,魏世强.我国城市大气污染现状与特点[J].四川环境,2006,25(3):104-108.

统计学第二次作业答案

《统计学》第二次作业 注:本次作业主要针对4、6、8章相关知识点。 一、单选题(共11个) 1. 直接反映总体规模大小的指标是(C )。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 2.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C )。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 3.下列相对数中,属于不同时期对比的指标有(B )。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 4. 2010年某市下岗职工已安置了13.7万人,安置率达80.6%,安置率是(D )。 A、总量指标 B、变异指标 C、平均指标 D、相对指标 5.根据同一资料计算的数值平均数通常是各不相同的,他们之间的关系是(D )。 A. 算术平均数≥几何平均数≥调和平均数 B. 几何平均数≥调和平均数≥算术平均数 C. 调和平均数≥算术平均数≥几何平均数 D. 没有关系 6.指数是表明现象变动的(B ) A. 绝对数 B. 相对数 C. 平均数 D. 抽样数 7.编制数量指标指数一般是采用( A )作为同度量因素。 A. 基期质量指标 B. 报告期质量指标

C. 基期数量指标 D. 报告期数量指标 8.价格下降后,花同样多的钱可以多购买基期商品的10%,则物价指数为(B ) A. 90% B. 90.9% C. 110% D. 111.1% 9.消费价格指数反映了(D ) A. 城乡商品零售价格的变动趋势 B. 城乡居民购买生活消费品价格的变动趋势 C. 城乡居民购买服务项目价格的变动趋势 D. 城乡居民购买生活消费品和服务项目价格的变动趋势 10.变量x与y之间的负相关是指(C ) A. x数值增大时y也随之增大 B. x数值减少时y也随之减少 C. x数值增大(或减少)y随之减少(或增大) D. y的取值几乎不受x取值的影响 11.如果相关系数为0,表明两个变量之间( C ) A. 相关程度很低 B. 不存在任何关系 C. 不存在线性相关关系 D. 存在非线性相关关系 二、多选题(共7个) 1.时期指标的特点是指标的数值(ADE )。 A、可以连续计数 B、与时期长短无关 C、只能间断计数 D、可以直接相加 E、与时期长短有关 2.在什么条件下,加权算术平均数等于简单算术平均数(ADE )。 A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

【精选】统计学第一次作业 答案

《统计学》第一次作业 一、单选题(共10个) 1.统计工作的成果是( C )。 A. 统计学 B. 统计工作 C. 统计资料 D. 统计分析和预测 2. 社会经济统计的研究对象是( C )。 A. 抽象的数量关系 B. 社会经济现象的规律性 C. 社会经济现象的数量特征和数量关系 D. 社会经济统计认识过程的规律和方法 3. 对某地区的全部产业依据产业构成分为第一产业、第二产业和第三产业,这里所使用的计量尺度是( A )。 A. 定类尺度 B. 定序尺度 C. 定距尺度 D. 定比尺度 4.某城市工业企业未安装设备普查,总体单位是( D )。 A. 工业企业全部未安装设备 B. 工业企业每一台未安装设备 C. 每个工业企业的未安装设备 D. 每一个工业企业 5.统计总体的同质性是指( B )。 A. 总体各单位具有某一共同的品质标志或数量标志 B. 总体各单位具有某一共同的品质标志属性或数量标志值 C. 总体各单位具有若干互不相同的品质标志或数量标志 D. 总体各单位具有若干互不相同的品质标志属性或数量标志值 6.下列调查中,调查单位与填报单位一致的是(D ) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 7.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( D)

A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 8.重点调查中重点单位是指(A ) A. 标志总量在总体中占有很大比重的单位 B. 具有典型意义或代表性的单位 C. 那些具有反映事物属性差异的品质标志的单位 D. 能用以推算总体标志总量的单位 9.书籍某分组数列最后一组是500以上,该组频数为10,又知其相邻组为400-450,则最后一组的频数密度为( A) A. 0.2 B. 0.3 C. 0.4 D. 0.5 10.在组距分组中,确定组限时(B ) A. 第一组的下限应等于最小变量值 B. 第一组的下限应小于最小变量值 C. 第一组的下限应大于最小就量值 D. 最后一组的上限应小于最大变量值 二、多选题(共5个) 1. 按照统计数据的收集方法,可将统计数据分为( AC )。 A. 观测数据 B. 截面数据 C. 实验数据 D. 间数列数据 2. 定比尺度的特点是( ACDE) A. 它有一个绝对固定的零点 B. 它没有绝对零点 C. 它具有定类、定序、定距尺度的全部特性 D. 它所计量的结果不会出现“0”值 E. 它可以计算两个测度值之间的比值 3.下列标志中,属于品质标志的有( BD )。 A. 工资 B. 所有制 C. 耕地面积 D. 产品质量

应用统计学第二次作业答案

你的得分:100.0 完成日期:2013年01月15日15点07分 说明:每道小题括号里的答案是您最高分那次所选的答案,标准答案将在本次作业结束(即2013年03月14日)后显示在题目旁边。 1. 2.社会经济统计的研究对象是()。 ( C ) A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.社会经济统计认识过程的规律和方法 3.某城市工业企业未安装设备普查,总体单位是()。 ( B ) A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业 4.标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。 ( C ) A.标志值有两大类:品质标志值和数量标志值 B.品质标志才有标志值 C.数量标志才有标志值 D.品质标志和数量标志都具有标志值 5.某城市工业企业未安装设备普查,总体单位是()。 ( B ) A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 6.指标是说明总体特征的,标志是说明总体单位特征的,所以() ( B ) A.标志和指标之间的关系是固定不变的 B.标志和指标之间的关系是可以变化的 C.标志和指标都是可以用数值表示的 D.只有指标才可以用数值表示 7.连续调查与不连续调查的划分依据是()。 ( B ) A.调查的组织形式 B.调查登记的时间是否连续 C.调查单位包括的范围是否全面 D.调查资料的来源 8.某市工业企业1997年生产经营成果年报呈报时间规定在1998年1月31日,则调查 期限为()。

医学统计学样题及答案解析

1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、 肾疾病,无汞作业接触史的居民238人的发汞含量如下: 发汞值 1.5~ 3.5~ 5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5( mol/kg): 人数20 66 60 48 18 16 6 1 0 3 (1)说明此频数分布的特征。 (2)选用何种指标描述其集中趋势和离散趋势? (3)估计该地居民发汞值的95%参考值范围? 答:(1)偏态分布 (2)选用中位数描述集中趋势,四分位间距描述离散趋势 (3) 频数相对频数累积频数累积相对频数 1.5~20 0.0840336 1 20 0.08403 4 3.5~66 0.2773109 2 86 0.36134 5 5.5~60 0.2521008 4 146 0.61344 5 7.5~48 0.2016806194 0.81512

7 6 9.5~18 0.0756302 5 212 0.89075 6 11.5~16 0.0672268 9 228 0.95798 3 13.5~ 6 0.0252100 8 234 0.98319 3 15.5~ 1 0.0042016 8 235 0.98739 5 17.5~0 0 235 0.98739 5 19.5~21.5 3 0.0126050 4 238 1 合计238 P2.5=1.5+(238×2.5%-0)×2/20=2.095 P97.5=13.5+(238×97.5%-228)×2/6=14.85 所以估计该地居民发汞值的95%参考值范围(2.095,14.85)

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义(15分) 患者编号1234567 治疗前血红蛋白65755076657268 治疗后血红蛋白821121258580105128 2、活动型结核患者的平均心率一般为86次/分,标准差为次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为分,标准差为3分,乙组患者均数为分,标准差为4分,问心理治疗有无效果 4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记

录如下表,问左右肾重量有无不同 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 117015011155150 215514512110125 314010513140150 411510014145140 52352221512090 612511516130120 713012017105100 81451051895100 91051251910090 1014513520105125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 健康人46

统计学第二次作业答案

《统计学》第二次作业 注:本次作业主要针对4、6、8章相关知识点。 一、单选题(共11个) 1、直接反映总体规模大小得指标就是( C )。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 2、计算结构相对指标时,总体各部分数值与总体数值对比求得得比重之与( C )。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 3、下列相对数中,属于不同时期对比得指标有( B )。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 4、 2010年某市下岗职工已安置了13、7万人,安置率达80、6%,安置率就是( D )。 A、总量指标 B、变异指标 C、平均指标 D、相对指标 5、根据同一资料计算得数值平均数通常就是各不相同得,她们之间得关系就是( D )。 A、算术平均数≥几何平均数≥调与平均数 B、几何平均数≥调与平均数≥算术平均数 C、调与平均数≥算术平均数≥几何平均数 D、没有关系 6、指数就是表明现象变动得( B ) A、绝对数 B、相对数 C、平均数 D、抽样数 7、编制数量指标指数一般就是采用( A )作为同度量因素。 A、基期质量指标 B、报告期质量指标 C、基期数量指标 D、报告期数量指标 8、价格下降后,花同样多得钱可以多购买基期商品得10%,则物价指数为( B ) A、 90% B、 90、9% C、 110% D、 111、1% 9、消费价格指数反映了( D ) A、城乡商品零售价格得变动趋势 B、城乡居民购买生活消费品价格得变动趋势 C、城乡居民购买服务项目价格得变动趋势 D、城乡居民购买生活消费品与服务项目价格得变动趋势 10、变量x与y之间得负相关就是指( C ) A、 x数值增大时y也随之增大 B、 x数值减少时y也随之减少 C、 x数值增大(或减少)y随之减少(或增大) D、 y得取值几乎不受x取值得影响 11、如果相关系数为0,表明两个变量之间( C ) A、相关程度很低 B、不存在任何关系 C、不存在线性相关关系 D、存在非线性相关关系 二、多选题(共7个) 1、时期指标得特点就是指标得数值( ADE )。

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

李晓松医学统计学作业题

实践一、数值变量的整理与描述 题1 在某市做调查获得102名7岁男童坐高资料如下图所示: (1)计算平均数与标准差; (2)计算中位数与四分位数间距。 实践二正态分布理论与应用 题1抽样调查某市45-55岁健康男性居民的血脂水平,184名45-55岁健康 男性居血清总胆固醇(TC)的X=4. 84 mmol/L, S=0.96 mmol/L.(健康人的血 清总胆固醇服从正态分布)。 (1)估计该市45 ~55岁健康男性居民的血清总胆固醇的95%参考值范围; (2)估计该市45 ~55岁健康男性居民中,血清总胆固醇住3.25-5.25 mmol/L范 围内的比例; (3)估计该市45 ~55岁健康男性居民中,血清总胆固醇低于3.80 mrnoUL所占 的比例。 实践三率的标准化在医学研究中的应用 题1:对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如下表所示,试着对该地男、女HBsAg阳性率进行率的标准化。 提示:标准组的选择可以用合并人群,也可以任选其中一组作为标准组 表某地不同年龄、性别人群的HBsAg阳性率(%) 年龄组男性女性 检查数阳性数阳性率检查数阳性数阳性率 0~ 521 12 2.30 560 13 2.32 20~ 516 14 2.71 957 26 2.72 40~ 710 43 6.06 836 54 6.46 60~ 838 63 7.52 570 49 8.60 合计2585 132 5.11 2923 142 4.86

实验四 总体均数估计在医学研究中的运用 题1 从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h )的均数为9.15,标准差为2.13。假定该类患者的红细胞沉降率服从正态分布,试估计该总体均数的95%的置信区间。 ()()某实验随机测定了100名正常人血浆内皮素ET 含量ng/L , 得均数X =81.0标准差S =18.2, (1)计算抽样误差指标 ( 2)估计正常人血浆内皮素的95%总体均数可题 2 信区间。 实验五 假设检验与t 检验 题1 经研究显示,汉族成年男子的环指长度的总体均数为10.1cm.某医生记录 了某地区12名汉族正常成年男子的环指长度(cm )分别为:10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27 问:该地区正常成年男子的环指长度是否大于一般成年男子? 题2 将18名某疾病患者随机分成两组,分别用A/B 两种药物治疗,观察前后的血红蛋白含量如下表: 表 疾病患者经A 、B 两种药物治疗前后的血红蛋白的变化结果(g/L ) A 药 物 患者编号 1 2 3 4 5 6 7 8 9 治疗前 36 44 53 56 62 58 45 43 26 治疗后 47 62 68 87 73 58 69 49 50 B 药 物 患者编号 10 11 12 13 14 15 16 17 18 治疗前 56 49 67 58 73 40 48 36 29 治疗后 81 86 70 62 84 76 58 49 60 问 (1)A 药物是否有效? (2)B 药物是否有效? (3)A 、B 药物之间疗效有无差别?

统计学课程作业及答案

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数

答案:C 第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题

统计学第二次作业最新版本

1. ( 多选题 ) 影响加权算术平均数的因素有( )。 (本题5.0分) A、各组频率或频数 B、各组标志值的大小 C、各组组距的大小 D、各组组数的多少 E、各组组限的大小 学生答案:A,B 标准答案:AB 解析: 得分:5 2. ( 多选题 ) 抽样推断中,样本容量的多少取决于( )。 (本题5.0分) A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小

E、抽样方法和组织形式 学生答案:A,B,C,E 标准答案:ABCE 解析: 得分:5 3. ( 多选题 ) 编制综合指数的原则是( )。(本题5.0分) A、质量指标指数以报告期的数量指标作为同度量因素 B、质量指标指数以基期的数量指标作为同度量因素 C、数量指标指数以基期的数量指标作为同度量 D、数量指标指数以基期质量指标作为同度因素 学生答案:A,D 标准答案:AD 解析: 得分:5 4. ( 多选题 ) 统计表按主词是否分组及分组的程度, 可分为( )(本题 5.0分) A、简单表 B、一览表 C、分组表

D、复合表 E、单一表 学生答案:A,B 标准答案:AB 解析: 得分:5 5. ( 多选题 ) 次数分配数列()(本题5.0分) A、由组距和组数、组限和组中值构成的 B、包括品质分配数列和变量数列两种 C、包括品质分配数列和变量数列两种 D、可以用图表形式表现 E、可以表明总体结构和分布特征 学生答案:B,C,D,E 标准答案:BCDE 解析: 得分:5 6. ( 多选题 ) 下列哪些指标是序时平均数()(本题5.0分) A、一季度平均每月的职工人数 B、某产品产量某年各月的平均增长量 C、某企业职工第四季度人均产值

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学作业

医学统计学作业 一、名词解释: 1、同质 2、总体 3、样本 4、数值变量资料(或计量资料) 5、无序分类变量资料 6有序分类变量资料 7、抽样误差 8、随机事件 9、小概率事件 10、概率 11、构成比 12、率 13、相对比 14、标准差 15、标准误 16、检验假设中的I型错误 17、检验假设中的U型错误 18、相关系数 19、回归系数 20、医学参考值范围 二、单项选择题: 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标应选 _________ o A、极差 B、变异系数 C、方差 D 、标准差 2、正态分布的资料常用_______ 来描述离散趋势。 A、变异系数 B、标准差 C、标准误 D四分位数间距 3、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标__________ o A、变异系数 B、标准差 C、标准误 D四分位数间距 4、_____ 小,表示用该样本均数估计总体均数的可靠性大。 A、变异系数 B、标准差 C、标准误 D极差 5、总体均数95%勺可信区间为 ________ o A (x -1.96s, x 1.96s) B 、(X - 2.58s, X 2.58s)

C、(X-1.96s X,X 1.96s x) D、(X-2.58s x, X 2.58s x) 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准差为;「, 试估计总体均数的99%可信区间____________ A、(X -52 二,X 2.58;「) B 、(X -61 二,X 1.96;「) C、(X -82 c X, X 2.58;「X) D 、(X -6匚X, X 1.96;「X) 7、四个样本均数的比较,参数假设检验为____________ A、H0: X| = x2 = X3 = x4 B 、 C、H o :叫二% =」4 D 、比:j = J =「4 8、方差分析后,各总体均数不等,要想进行多个均数两两比较,需用________ A SNK-q检验 B、t检验 C、u检验 D t,检验 9、两样本均数比较,经t检验差别有统计学意义时,P越小,说明: ____________ A、两样本均数差别越大 B 、两总体均数差别越大 C、越有理由认为两总体均数不同 D、越有理由认为两样本均数不同 10、分类资料的配对设计差异性(或优势性)检验需选用___________ o A、Pears on- x2检验 B 、CMH-x2检验 C、McNemar-x2检验 D 、Fisher的确切概率法 11、来自医院的资料可求得__________ o A、有效率 B、无效率 C、发病率 D、死亡率 12、_________________________________ 作直线相关分析,要求:o A、X和Y变量总体均服从正态分布 B、X或丫变量总体服从正态分布 C、只要因变量丫总体服从正态分布 D两变量总体服从不服从正态分布均可 13、方差分析可用于_________ o A、两个样本均数的比较 B、多个样本均数的比较 C、回归系数的假设检验 D、多个样本率的比较 14、___________________________ Fisher确切概率法可用于 A、两个样本均数的比较C、多个样本均数的比较 C、两个样本率的比较 D 、每组观察例数不太大的多个样本率的比较 15、等级资料(有序多分类资料),可采用的统计分析方法有 _ A、x2检验 B 、秩和检验 C、Ridit分析 D 、t检验或F检验 16、x2检验可用于 A、用于多个样本均数的比较 B、用于多个样本率或构成比的比较 C、可以进行多个样本率的两两比较

统计学原理作业答案

《统计学原理》作业一 一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.总体的同质性是指总体中的各个单位在所有标志上都相同。(×)4.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 6.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 7.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√) 8.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 9.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) 10.总体单位是标志的承担者,标志是依附于总体单位的。(√) 二、单项选择 1.社会经济统计的研究对象是( C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2.构成统计总体的各个单位称为(A )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3.对某城市工业企业未安装设备状况进行普查,总体单位是( B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4.标志是说明总体单位特征的名称(C)。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值 5.总体的变异性是指( B )。 A.总体之间有差异 B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D、总体单位之间有差异 6.工业企业的设备台数、产品产值是( D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7.几位学生的某门课成绩分别是57分、68分、78分、89分、96分,“学生成绩”是( B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9.下列指标中属于质量指标的是( B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学作业答案归纳

统计学作业答案归纳 1、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准差 是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样本容量 应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254.006.396.12 2 22205.02=?=?=E s z n 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信 的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客 户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在 95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比率进 行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%3030 9?==p 。

总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t

统计学原理第二次作业及答案

统计学原理第二次作业及答案 题目1 总指数的基本形式是() 选择一项: a. 个体指数 b. 平均指数 c. 综合指数 d. 平均指标指数 正确答案是:综合指数 题目2 重点调查所选的重点单位,必须是在调查对象中() 选择一项: a. 具有较大标志值的那一部分调查单位 b. 具有代表性的调查单位 c. 按随机原则选出的调查单位 d. 填报调查数据的填报单位 正确答案是:具有较大标志值的那一部分调查单位 题目3 连续变量数列、其末组为开口组,下限为1000,其相邻组的组中值为950,则末组的组中值为()(单选) 选择一项: a. 1025 b. 1050 c. 1100 d. 1150 正确答案是:1050 题目4 零售物价指数为103%,商品零售量指数为106%,则商品零售额指数为()(单选)

选择一项: a. 109% b. 110% c. 103% d. 109.18% 正确答案是:109.18% 题目5 下列不属于强度相对指标的指标有() 选择一项: a. 平均单位成本 b. 人口出生率 c. 人口死亡率 d. 人口密度 正确答案是:平均单位成本 题目6 时间序列由两个基本要素构成()(多选) 选择一项或多项: a. 时间,即现象所属的时间 b. 指标数值,即表现现象特点的各项指标数值 c. 指标名称 d. 计量单位 e. 计算公式 正确答案是:时间,即现象所属的时间, 指标数值,即表现现象特点的各项指标数值题目7 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: a. 性别

b. 年龄 c. 职业 d. 月收入 e. 职称 正确答案是:性别, 职业, 职称 题目8 在时间序列中,各指标值相加后无意义的有()(多选) 选择一项或多项: a. 时期数列 b. 时点数列 c. 绝对数时间序列 d. 相对数时间序列 e. 平均数时间序列 正确答案是:时点数列, 相对数时间序列, 平均数时间序列 题目9 我国财政收入,2003年比上年增加2787亿元,这是()(单选)选择一项: a. 发展水平 b. 增长量 c. 发展速度 d. 增长速度 正确答案是:增长量 题目10 相关关系是社会经济现象之间客观存在的()(单选) 选择一项: a. 在数量上不确定的相互依存关系 b. 在数量上确定的函数关系

《医学统计学》习题及答案

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

医学统计学作业

医学统计学作业 The latest revision on November 22, 2020

医学统计学作业 一、名词解释: 1、同质 2、总体 3、样本 4、数值变量资料(或计量资料) 5、无序分类变量资料 6、有序分类变量资料 7、抽样误差 8、随机事件 9、小概率事件 10、概率 11、构成比 12、率 13、相对比

14、标准差 15、标准误 16、检验假设中的Ⅰ型错误 17、检验假设中的Ⅱ型错误 18、相关系数 19、回归系数 20、医学参考值范围 二、单项选择题: 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标应 选。 A、极差 B、变异系数 C、方差 D、标准差 2、正态分布的资料常用来描述离散趋势。 A、变异系数 B、标准差 C、标准误 D、四分位数间距 3、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标。 A、变异系数 B、标准差 C、标准误 D、四分位数间距 4、小,表示用该样本均数估计总体均数的可靠性大。

A 、变异系数 B 、标准差 C 、标准误 D 、极差 5、总体均数95%的可信区间为 。 A 、)96.1,96.1(s x s x +- B 、)58.2,58.2(s x s x +- C 、)96.1,96.1(x x s x s x +- D 、)58.2,58.2(x x s x s x +- 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准 差为σ,试估计总体均数的99%可信区间 A 、( 2.58X σ-, 2.58X σ+) B 、( 1.96X σ-, 1.96X σ+) C 、( 2.58X X σ-, 2.58X X σ+) D 、( 1.96X X σ-, 1.96X X σ+) 7、四个样本均数的比较,参数假设检验为 。 A 、0H :4321x x x x === B 、 1H :4321x x x x ≠≠≠ C 、0H :4321μμμμ=== D 、1H :4321μμμμ≠≠≠ 8、方差分析后,各总体均数不等,要想进行多个均数两两比较,需用 A 、SNK-q 检验 B 、t 检验 C 、u 检验 D 、t ,检验 9、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说 明: 。 A 、两样本均数差别越大 B 、两总体均数差别越大

统计学课后作业答案

统计学课后作业答案

4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图:

为分组情况下的概率密度曲线:分组: 1、确定组数: () lg25 lg() 1.398 111 5.64 lg(2)lg20.30103 n K=+=+=+=,取k=6 2、确定组距:组距=( 最大值- 最小值)÷组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄(Binned) 分组后的均值与方差:

Kurtosis 1.302 分组后的直方图: 组中值 50.00 45.00 40.00 35.00 30.00 25.00 20.00 15.00 10.00 F r e q u e n c y 10 8 6 4 2 Mean =23.30 Std. Dev. =7.024 N =25 4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大? 成年组 幼儿组 平均 172.1 平均 71.3 标准差 4.201851 标准差 2.496664 离散系数 0.024415 离散系数 0.035016 幼儿组的身高差异大。 7.6利用下面的信息,构建总体均值μ的置信区间: 1) 总体服从正态分布,且已知σ = 500,n = 15, =8900,置信水平为95%。 解: N=15,为小样本正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2) 2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。 解:为大样本总体非正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 2 α() 28.109,44.10192.336.10525 10 96.136.1052=±=?±=±n z x σ αx x 2 α() 28.109,44.10192.336.10525 1096.136.1052=±=?±=±n z x σ α

相关文档
最新文档