统计数据的搜集

统计数据的搜集

统计数据的搜集

人教版二年级下册数据收集与整理教案

第一单元数据收集整理 教材分析 本单元学生主要学习一些简单的统计图表知识,初步体验数据的收集、整理、描述和分析的过程,学会用简单的方法收集和整理数据,掌握统计数据的记录方法,并能根据统计图表的数据提出并回答简单的问题,使学生了解统计的意义和作用,初步了解统计的基本思想方法,认识统计的作用和意义,逐步形成统计观念,进而养成尊重事实、用数据说话的态度。 学情分析 上学期学生已经学习了比较、分类,能正确地进行计数,所以填写统计表时不会感到太困难,其关键在于引导学生学会收集信息,整理数据,根据统计表解决问题。学生在生活中积累了较多的生活经验,能利用统计图表中的数据作出简单的分析,能和同伴交流自己的想法,体会统计的作用。本单元教材选择了与学生生活密切联系的生活场景,激发了学生的学习兴趣。如,学生的校服、讲故事比赛、春游的人数情况统计等,同时渗透一些生活基本常识,使学生明确统计的知识是为生活服务的。教学内容更加注重对统计数据的初步分析。在教学时,教师要注意让学生经历统计活动的全过程,要鼓励学生参与到活动之中,在活动中不断培养动手实践能力和独立思考能力,并加强与同伴的合作与交流。 教学目标 知识技能:使学生经历数据的收集、整理、描述和分析的过程,能利用统计表的数据提出问题并回答问题。 数学思考:了解统计的意义,学会用简单的方法收集和整理数据。 问题解决:能根据统计图表中的数据提出并回答简单的问题,并能够进行简单的分析。

情感态度:通过对周围现实生活中有关事例的调查,激发学生的学习兴趣,培养学生的合作意识和创新精神。 教学重点:使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。 教学难点:使学生亲历统计的过程,在统计中发展数学思考,提高学生解决问题的能力。 课时安排:3课时 1.数据收集整理………………………………2课时 2.练习一………………………………………1课时 第1课时数据收集整理(一) 教学目标: 1、体验数据收集、整理、描述和分析的过程,了解统计的意义。 2、能根据统计表中的数据提出并回答简单的问题,同时能够进行简单的分析。根据统计表的数据提出有价值的数学问题及解决策略。 教学重点: 使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。 教学难点: 引导学生通过合作讨论找到切实可行的解决统计问题的方法。 教法: 谈话、指导相结合法,引导学生通过对情境问题的探讨,师生互动,在具体的生活情境中让学生亲身经历发现问题、提出问题、解决问题的过程。 教学过程:

第2章统计数据的描述

第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频数)频率% A1414 B2121 C3232 D1818

E1515 合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图: 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 (1)利用计算机对上面的数据进行排序;

统计学第二章数据收集、整理与显示

第二章数据搜集、整理与显示 Ⅰ.学习目的 本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求: 1.了解统计数据的类型及其搜集方法; 2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合; 3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。 Ⅱ.课程内容要点 第一节数据的搜集 一、数据搜集 数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。 数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。 数据的计量尺度有四种 定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。 定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度。定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。 定距尺度是对事物类别或次序之间间距进行的一种测度。定距尺度不仅

能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。 定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。 从不同方面数据划分为不同类型。 根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。 根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。 根据数据的搜集方法,可以将数据分为观察数据和实验数据。 根据数据的来源渠道,可以将数据分为直接数据和间接数据。 二、数据搜集的方法 数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。 三、统计调查的形式 普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。 统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。 抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。 重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。重点调查的前提是必须存在重点单位。 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。典型调查有解剖麻雀型和划类选典型两种类型。

第二章统计数据的搜集与整理

第二章统计数据的搜集与整理 一、教学目的与要求 通过本章的学习,了解统计数据的计量尺度和数据的类型,了解绝对数和相对数的意义及比例和比率的计算方法;了解各种统计调查方式的特点和适用场合;掌握统计调查方案设计的内容,了解数据预处理的意义;掌握统计数据的分组方法,能够对原始数据进行适当的分组并编制频数分布表,绘制频数分布的直方图和茎叶图。 二、教学重点 1、统计调查方案设计 2、统计数据的分组 3、变量数列的编制 三、教学难点 1、抽样调查、重点调查与典型调查的比较 2、调查方案的设计 3、次数分布的概念 4、变量数列的基本术语及编制 四、教学基本内容 第一节数据的计量与类型 一、数据的计量尺度 (一)定类尺度 按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。 (二)定序尺度 又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。 (三)定距尺度 又称间隔尺度,是对事物类别或次序之间距离的测度。该尺度通常使用自然或物理单位作为计量尺度。例:考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。 (四)定比尺度 又称比率尺度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型 统计数据大体上分为两种类型:定性的数据和定量的数据。 定性数据也称品质数据,它说明的是事物的品质特征,是不能用数值表示的,这类数据由定类尺度和定序尺度计量形成。 定量数据也称数量数据,它说明的是事物的数量特征,是能够用数值表示的,这类数据由定距尺度和定比尺度计量形成。 说明现象某种特征的概念称为变量,变量的具体表现称为变量值。变量可分为连续型变量和离散型变量。离散变量只能取有限个数,而且其取值都以整位数断开,如企业个数、职工人数等;连续变量可以取无穷个数值,其取值是连续不断的,不能一一列举,如零件尺寸、年龄、温度等。 三、统计数据的表现形式 数量型统计数据通常有两种基本的表现形式,即绝对数与相对数。 (一)总量指标(绝对数) 1、概念:反映客观现象总规模、总水平的指标。 2、种类 按反映现象总体内容的不同,可分为: 总体单位总量:反映总体所有单位总数的指标。 总体标志总量:反映总体中各单位标志值总和的指标。 按指标反映的时间状况不同 时期指标:反映现象在一段时期发展变化的总量指标。 时点指标:反映现象在某个时点所达总量的指标。 (二)相对指标 1、概念:两个相互联系的指标数值对比的比值(相对水平) 2、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系 3、种类 计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数 第二节统计数据的搜集

第二章 定量变量的描述性统计

第二章定量变量的描述性统计(中大.公卫学院.医学统计与流行病学系.骆福添.020-********) 第一节频数分布 ·收集到的数据必须给读者介绍一下,例2-1数据 怎么讲,读出来? 介绍特征,有何特征? ·例:肿瘤什么年龄多发?对发病年龄分组整理 ·脉搏:不妨对脉搏进行分组整理 一、频数分布表 例2-1测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。 66 77 64 67 76 75 75 71 65 62 76 72 71 60 67 75 75 73 79 66 69 79 78 70 72 70 72 78 72 67 72 80 68 70 61 70 73 72 71 81 70 66 75 71 63 77 74 76 68 65 77 69 77 75 79 64 79 73 76 61 80 64 69 70 73 68 65 70 69 66 81 63 64 80 74 78 76 66 70 73 60 76 82 73 64 65 73 73 63 80 68 76 70 79 77 64 70 66 69 73 78 76 制作频数表的步骤为: 1.计算极差极差R=84 -57=27 (次/分)。 2.决定组数、组距和组段 (1)组数:10组左右 (2)组距:等组距(取方便数) (3)组段:下限(最小值)、上限(最大值.空穴)、组中值(代表值.正中)注意:组段应包含全部数据(上下封顶、取方便数) 3.列表划记特别简单、特难全对 表2-1 130名健康成年男子脉搏(次/分)的频数分布表 组段划记频数相对频数(%) 频数频数(%) (1) (2) (3) (4)=(3)/N(5)=(3) (6)=(5)/N 56~ 2 1.54 2 1.54 59~正 5 3.85 7 5.38 62~正正12 9.23 19 14.62 65~正正正15 11.54 34 26.15 68~正正正正正25 19.23 59 45.38 71~正正正正正一26 20.00 85 65.38 74~正正正19 14.62 104 80.00 77~正正正15 11.54 119 91.54 80~正正10 7.69 129 99.23 83~85 一 1 0.77 130 100.00 合计130 ·频数表有2个重要特征: (1)集中趋势划记的杠杠(数据)多数向中间集中 (2)离散趋势划记的杠杠(数据)少数向两头分散

统计学第二章数据的搜集

1 了解某年全国规模以上工业企业生产和销售情况,则调查对象为( )。 A、工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:D 我的答案:D得分:4.0分 2 了解某年全国规模以上工业企业生产和销售情况,则调查单位为( )。 A、每一个规模以上工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:A 我的答案:A得分:4.0分 3 统计调查可以收集的资料是( )。 A、数字资料 B、原始资料和次级资料 C、只能是原始资料 D、不能是次级资料 正确答案:B 我的答案:B得分:4.0分 4 按调查的组织形式分,统计调查可分为( )。 A、全面调查和非全面调查 B、连续调查和不连续调查 C、统计报表和专门调查 D、重点调查和典型调查 正确答案:C 我的答案:A得分:0.0分 5 乡镇企业局为总结推广先进管理经验,选择几个先进乡镇企业调查,这种调查为( )。 A、抽样调查 B、典型调查 C、重点调查 D、普查 正确答案:B 我的答案:B得分:4.0分 6 调查几个铁路枢纽,了解我国铁路货运量的基本情况和问题,这种调查方式属于( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 正确答案:C 我的答案:C得分:4.0分 7

抽样调查和重点调查的主要区别是( )。 A、原始资料来源不同 B、取得资料的方法不同 C、调查的单位数多少不同 D、抽取调查单位的方式方法不同 正确答案:D 我的答案:D得分:4.0分 8 经常性调查与一次性调查的划分,是以( )。 A、调查组织划分的 B、最后取得的资料是否全面来划分的 C、调查对象所包括的单位是否完全划分的 D、调查登记的时间是否连续来划分的 正确答案:D 我的答案:D得分:4.0分 9 重点调查的重点单位是指( )。 A、标志值很大的单位 B、这些单位的单位总量占总体全部单位总量的绝大比重 C、这些单位的标志总量占总体标志总量的绝大比重 D、经济发展战略中的重点部门 正确答案:C 我的答案:C得分:4.0分 10 在统计调查中,总体单位和调查单位( )。 A、是一致的 B、是不一致的 C、是一致或不一致的 D、一般是一致的 正确答案:C 我的答案:C得分:4.0分 二.多选题(共5题,20.0分) 1 统计调查( )。 A、取得的有原始资料和次级资料 B、调查中首先考虑的是取得第一手资料 C、调查的主要要求是经济性 D、可分为全面调查与非全面调查 正确答案:AD 我的答案:得分:0.0分 2 统计调查的要求是( )。 A、准确性 B、全面性 C、具体性 D、及时性 正确答案:ABD 我的答案:ABD得分:4.0分 3 普查属于( )。

统计研究的程序与数据搜集方法

一、统计研究的程序 二、数据搜集方法 A、为什么要搜集数据:数据是统计分析的基础

B 、 什么是数据搜集:根据统计研究的目的和要求,有组织、有计划地向调查对象搜集原始 资料和次级资料。 C 、 数据来源 (一)原始数据的搜集方法 1、全面调查 (1)定期统计报表制度:严格的报告制度 指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度 优点:能保证统计资料的全面性和连续性 能保证统计资料的统一性和及时性 能满足各级部门对统计资料的需要 缺点:统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量 (2)普查:指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查 由于需要大量的人力、物力和财力,不宜经常进行 最近的一次普查:2004年第一次全国经济普查 我国人口普查:1953年 1964年 1982年 1990年 2000年 2010年 2、 随机抽样调查:根据随机原则推算总体特征,又称概率抽样 抽样调查是一种非全面调查,抽样推断的理论基础是概率论。 特点: 间接来源

(1)按随机原则选样,即样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会 (2)能够保证样本对总体的代表性,即样本单位和总体具有相同的概率分布 (3)调查目的是从数量上推算总体数量特征和数量表现,它可以到全面调查的作用 (4)抽样误差可以事先计算并控制 优点: (1)能用较少的人力、物力和时间达到全面调查的目的 (2)调查资料的准确性较高、受人为干扰的可能性较小 方式: (1)简单随机抽样,每个个体被抽中的机会相等;选择一个受试对象对其他元素没有影响;使用随机数表,抽签等方式。 可以应用Excel中的随机函数rand()根据样本框安排随机样本 *样本框:抽样过程中抽取样本的所有抽样单位的名单。如,从全体学生中,直接抽取200名学生作为样本,那么,全体学生的名单(花名册)就是这次抽样的样本框。 例:在编号为1-100的学生中随机抽取 随机编号=int(rand()*100))+1 学会查看Excel的帮助文件 (2)等距抽样,又称机械抽样或系统抽样,常用于电话调查。 例如:从一个学生人数为200人的总体中抽取容量为20的样本,将学生的学号排序,假定随机选取学号起点4,然后从总体中选取样点的学号为第4,第14,第24,… (3)类型抽样,又称分层抽样,把总体某种分类标准分为若干群组,这些群组满足互斥性、完备性、和相似性要求,然后在组中按照同样的比例随机选取样本。 特点:代表性高,抽样误差低。 例如:调查对象按收入分为高、中、低三个层次,然后从每个阶层中或随机抽取 (4)整群抽样,又称聚类抽样。先对总体分类,然后用简单随机抽样选类,最后对选中的类作普查或简单随机抽样调查。较为有效。 例如:按照家庭、宿舍楼或街区来抽取调查对象,对抽到的家庭、宿舍楼或街区再作全面或随机调查。 3、非概率抽样:不按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。缺点:

第二章 统计数据的搜集习题

第二章统计数据的搜集 练习题 一、填空题 1.常用的统计调查方式主要有、、、、等。 2.典型调查有两类:一是;二是。 3.统计调查按调查对象包括的范围不同可分为、。 4.确定调查对象时,还必须确定两种单位,即和。 5.重点调查是在调查对象中选择一部分进行调查的一种调查。 6.询问调查具体包括、、、、、等。 7.访问调查的方式有、。 8.邮寄调查的问卷发放方式有、、三种。 9.根据观察者是否使用科学的观察仪器,观察可分为和。 10.调查表一般由、和三部分组成。 11.就一般的统计数据而言,其质量评价标准为、、、、、。 二、单项选择题 1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。 A普查B典型调查C抽样调查D重点调查 2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。 A统计报表B重点调查C全面调查D抽样调查 3.人口普查规定统一的标准时间是为了( )。 A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便 4.以下哪种场合宜采用标准式访问( )。 A居民入户调查B座谈会C当事人或知情者个别采访D观察法 5.某地进行国有商业企业经营情况调查,则调查对象是( )。 A该地所有商业企业B该地所有国有商业企业 C该地每一国有商业企业D该地每一商业企业 6.以下哪种调查的报告单位与调查单位是一致的( )。 A 工业普查B工业设备调查C职工调查D未安装设备调查 7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。 A原始资料来源于基层单位,次级资料来源于上级单位 B次级资料是由原始资料加工整理而成 C原始资料与次级资料之间无必然联系 D原始资料与次级资料没有区别 8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。 A单一表和复合表B单一表和一览表

第二章 统计数据的收集习题

第二章统计数据的收集、整理与显示 一、一、填空题 1、调查表一般有和两种方式。 2、统计调查的基本要求是、和。 3、是一种间接取得统计资料的方法,它的特点之一是具有较强的。 4、对调查对象的所有单位都进行调查,这是调查;而重点调查、抽样调查、典型调查都属于调查。 5、调查人员亲临现场对调查单位直接进行清点和计量,这种调查方法称为法。 6、若要调查某地区工业企业职工的生活状况,调查对象是,调查单位是 ,填报单位是。 7、典型调查中的典型单位是选取的,抽样调查中的样本单位是选取的。 8、抽样调查属于调查,但其调查目的是要达到对特征的认识。 9、调查单位是的承担者,填报单位是单位。 10、无论采用何种调查方法进行调查都要先制定。 11、重点调查实质上是的全面调查,它的目的是反映情况。 12、通过调查几个主要的产棉区来了解棉花的生长情况,这种调查方法属于调查。 13、抽样调查的组织形式有很多种,其基本形式有、、、 和。 14、人口调查中的调查单位是,填报单位是;住户调查中的调查单位是,填报单位也是。 15、统计整理是对调查得到的原始资料进行、,使其条理化、系统化的工作过程。 16、在组距列数中,表示各组界限的变量值叫,各组上限与下限之间的中点叫。 17、已知一个数列最后一组的下限为A、,其相邻组的组中值为B、,则最后一组的上限可以确定为,组中值为。 18、设考试成绩的全距为100,如果将60分以下为一组,其余按等距分成四组,则各组的组距为。 19、能够对统计总体进行分组,是由统计总体中各总体单位所具有的特点决定的。

20、对于连续变量划分组限时,相邻组的组限必须,习惯上规定各组不包括其的单位,即所谓的原则。 21、按每个变量值分别列组编制的变量分布数列叫,这样的数列其组数等于。 22、统计整理的关键在于,统计分组的关键在于。 23、为了消除异距数列中组距不同对各组次数的影响,需要计算。 二、单项选择题 1、人口普查的调查单位是()。 A、每一户 B、所有的户 C、每一个人 D、所有的人 2、对一批商品进行质量检验,最适宜采用的调查方法是()。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 3、下列调查中,调查单位与填报单位一致的是()。 A、企业设备调查 B、人口普查 C、农村耕畜调查 D、工业企业生产经营现状调查 4、抽样调查与重点调查的主要区别是()。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于()。 A、简单随机抽样 B、等距抽样 C、整群抽样 D、类型抽样 6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的()。 A、全部网点 B、每个网点 C、所有从业人员 D、每个从业人员 7、调查时限是指()。 A、调查资料所属的时间 B、进行调查工作的期限 C、调查工作登记的时间 D、调查资料的报送时间 8、对某市全部商业企业职工的生活状况进行调查,调查对象是()。 A、该市全部商业企业 B、该市全部商业企业的职工 C、该市每一个商业企业 D、该市商业企业的每一名职工 9、作为一个调查单位()。 A、只能调查一个统计标志 B、只能调查一个统计指标 C、可以调查多个统计指标 D、可以调查多个统计标志

统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案

第2章 定量资料的统计描述 案例2-1(P27) 答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。 对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下: 25507523.5(23825%20) 4.7(mol/kg) 6625.5(23850%86) 6.6(mol/kg) 602 7.5(23875%146)8.9(mol/kg) 48(%) x x L x i P L n x f f P u P u P u =+?==+?==+?==+?S

离散程度指标: 四分位间距=P75-P25=8.9-4.7=4.2umol/kg。 故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,

思考与练习(P31) 1. 答: (1) 某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布 Group Frequency Percent Cumulative Percent 49.0- 1 .8 .8 50.0- 4 3.3 4.2 51.0- 8 6.7 10.8 52.0- 6 5.0 15.8 53.0- 19 15.8 31.7 54.0- 18 15.0 46.7 55.0- 14 11.7 58.3 56.0- 26 21.7 80.0 57.0- 10 8.3 88.3 58.0- 9 7.5 95.8 59.0- 4 3.3 99.2 61.0-62.0 1 .8 100.0 Total 120 100.0

第二章 统计数据收集与整理

第二章
第二章 统计数据的初步整理
教学要点: 第一节 统计调查方案设计 第二节 统计分组 第三节 统计图表

第二章
第一节 统计调查方案设计
一、统计调查的组织形式 二、统计数据搜集的方法 三、统计调查方案设计 四、统计调查的要求

第二章
一 统 计 调 查 组 织 形 式
全面调查
(1)普查(general survey) (2)统计报表(Statistical report forms)
非全面调查
(1)抽样调查(Sampling survey) (2)重点调查(Key-point investigation) (3)典型调查(Model survey)
划类选典式(representation) 解剖麻雀式(typical survey)

第二章
二 统 计 数 据 搜 集 的 方 法
数据搜集方法有询问调查和观察实验两大类。 询问调查 (1)访问调查(如 Delghi法) (2)邮寄调查 (3)电话调查 (4)电脑、报刊等 媒体辅助调查 (5)座谈会 (6)个别深度访问 观察与实验 (1)观察法 调查人员边观察边 记录以收集信息的 方法。 (2)实验法 在设定的条件下, 对调查对象进行实 验取得所需资料的 方法。

第二章
三 统 计 调 查 方 案 设 计
1.确定调查目的 2.确定调查对象和调查单位 3.确定调查纲要及指标体系,统一 指标口径 4.确定调查项目拟定调查表
项目少而精,规范,以数字信息为主。 单一表 一览表
5.确定调查时间和调查期限 6.制定调查的组织实施计划

第2章 统计描述思考与练习参考答案

第2章统计描述 思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是( E )。 A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值 E. 写组段,如“~3,3~5, 5~,…” 2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。 A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数与的间距 4. 均数X和标准差S的关系是(A)。 A. S越小,X对样本中其他个体的代表性越好 B. S越大,X对样本中其他个体的代表性越好 C. X越小,S越大 D. X越大,S越小 E. S必小于X 5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。 A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数 6. 某医院的院内感染率为人/千人日,则这个相对数指标属于(C)。 A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从0开始的图形为(D)。

A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可 二、简答题 1. 对定量资料进行统计描述时,如何选择适宜的指标 答:详见教材表2-18。 教材表2-18 定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均数的 程度 对称分布,特别是正态分布资料 四分位数 间距居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。 答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。 当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。

二年级下册第一单元《数据收集整理》

§1 数据收集整理 第1课时数据收集整理(一) 教学目标: 1、体验数据收集、整理、描述和分析的过程,了解统计的意义。 2、能根据统计表中的数据提出并回答简单的问题,同时能够进行简单的分析。根据统计表的数据提出有价值的数学问题及解决策略。 教学重点: 使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。 教学难点: 引导学生通过合作讨论找到切实可行的解决统计问题的方法。 教法: 谈话、指导相结合法,引导学生通过对情境问题的探讨,师生互动,在具体的生活情境中让学生亲身经历发现问题、提出问题、解决问题的过程。 教学过程: 一、情境引入 教师引导提问:同学们,你们入学都要穿上我们学校的校服,你们喜欢我们校服的颜色吗?(指名3~5个学生说一说)。 师:有的同学喜欢这个颜色,有的同学不喜欢,如果我们学校要给一年级的新生订做校服,有下面4种颜色,请你们当参谋,给服装厂建议下该选哪种颜色合适。 (指名学生回答,并说明理由。) 教师引导:张三喜欢红色,学校就决定将校服做成红色的,怎么样?你有什么意见? 教师小结:你们刚才说的只是根据自己的喜好来决定你想穿的校服的颜色,不能代表学校大多数同学想穿的,那如何知道哪种颜色是大多数同学喜欢的呢?(学生可能回答,调查全校学生喜欢的颜色。) 教师追问:如果我们现在要马上把信息反馈给服装厂,你觉得调查全校的学生这个方法怎么样?(学生自由发言。)

教师小结:全校学生那么多,要调查全校的学生,范围太广了,我们可以先在班级里调查,通过班级中的数据作为代表,找出大多数同学喜欢的颜色,也能代表全校大多数学生喜欢的颜色。那这节课就以我们班级为单位,在班级中进行调查统计,看看在这四种颜色中,大多数同学最喜欢哪种颜色。 二、互动新授 1、讨论收集数据的方法。 (1)教师提问:刚才我们确定了要在班级里进行调查,我们班级的人数也不少,应该怎样调查呢?你有什么好的办法?(指名学生回答。)学生讨论收集数据的方法。 (2)出示统计表。 可以用什么方法来完成这张统计表呢? (3)学生说出各种不同的方法。(学生可能回答:把自己喜欢的颜色写在纸张上、举手、小调查等。每人报喜欢的颜色,我们在自己的表中做记号,如画“正”;举手表示自己在哪一个范围的,老师数一下,再把结果填在表中……)(4)教师提问:你认为以上各种方法中,哪一种方法最方便? 师:在这些方法里,举手表示是比较简便的方法,现在由老师发布指令,每人只能选一种颜色,最喜欢哪种颜色就举手表示。 “用举手数一数”的方法,师生合作完成统计表。 师生活动,教师说颜色,学生举手,教师数人数,学生填表格。 2、从这张统计表中,我们可以知道些什么?(让学生自由发言,说出自己的发现。) (1)师:从统计表中你能看出全班共有多少人?怎样计算?(把每种颜色喜欢的人数加起来,如果与全班人数不相符,说明我们在统计的过程中出现了错误。) (2)师:喜欢说明颜色的人数最多,那么这个班订做校服,选择该种颜色,那全校选这种颜色做校服合适吗?为什么? 组织学生分析表格,教师根据分析的情况加以引导,突出统计的意义。

第2章 统计数据的描述

第2章 统计数据的描述 练习: 2 比较哪个企业的总平均成本高?并分析其原因。 2. 11在某地区抽取的120家企业按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200~300 19 300~400 30 400~500 42 500~600 18 600以上 11 合计 120 计算120家企业利润额的均值和标准差。 2. 12对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下: 成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么? (2)比较分析哪一组的身高差异大? 答案 2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 2.11 x =426.67(万元);48.116=s (万元)。 2.12 (1)离散系数,因为它消除了不同组数据水平高地的影响。 (2)成年组身高的离散系数: 024.01.1722 .4== s v ; 幼儿组身高的离散系数: 032.03.713 .2== s v ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度 相对较大。

第5章参数估计 练习: 5.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1)样本均值的抽样标准差x σ等于多少? (2)在95%的置信水平下,允许误差是多少? 5.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差; (2)在95%的置信水平下,求允许误差; (3)如果样本均值为120元,求总体均值95%的置信区间。 5.3某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽 取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 5.4从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。 求总体均值95%的置信区间。 5.5某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样 本,他们到单位的距离(公里)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。 5.6在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视 机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。 5.7某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是否 赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%; (2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查? 答案 5.1 (1) 79 .0 = x σ;(2)E=1.55。 5.2 (1) 14 .2 = x σ;(2)E=4.2;(3)(115.8,124.2)。 5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (7.1,12.9)。 5.5 (7.18,11.57)。 5.6 (18.11%,27.89%);(17.17%,22.835)。

第二章 统计资料的搜集与整理习题

第二章统计资料的搜集与整理习题 一、填空: 1.统计数据收集是根据统计研究预定的目的和任务,运用科学的,有计划、有组织地反映客观现实的统计资料的过程。答案:调查方法,收集 2. 搜集统计数据的方法有:(1)直接观察法,(2),(3)(4)。答案:报告法,采访法,登记法 3. 统计调查按搜集资料的组织方式不同,可以分为普 查、、、。抽样调查,重点调查,统计报表制度 4.我国现行的统计调查体系是:以必要的周期性的普查为基础,经常性的为主体,同时辅之以、科学推算和部分全面报表综合运用的统计调查方法体系。答案:抽样调查,重点调查 (2),(3)(4)5.统计调查的方案一般包括如下几项内容:(1)明确调查目的, (5)(6)(7)。答案:确定调查对象和调查单位,设计调查项目,设计调查表格和问卷,确定调查时间,确定调查的组织实施计划,调查报告的撰写6.数据整理是对统计调查所搜集到的各种数据进行,或是对已有的综合统计资料进行再整理。答案:分类和汇总 7.数据整理的程序包括:(1)统计资料的审核,(2),(3)或绘制统计图,(4)统计资料的积累、保管和公布。答案:资料的分组和汇总,编制统计表 8.根据统计研究的目的和客观现象的内在特点,按(或几个标志)把被研究的总体划分为若干个的组,称为统计分组。答案:某个标志,不同性质 9.统计分组,必须遵循两个原则:和。答案:穷尽原则,互斥原则 10.统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为的那一组内,即所谓“上限在不内”原则。答案:下限值 11. 统计分组必须先对所研究现象的作出全面、深刻的分析,确定所研究现象的属性及其内部差别,而后才能够选择出反映事物本质特征的分组标志。答案:本质 二、单选题 1.统计调查对象是() A.总体各单位标志值 B.总体单位 C.现象总体 D.统计指标答案:C 2.我国统计调查体系中,作为“主体”的是() A.经常性抽样调查 B.必要的统计报表 C.重点调查及估计推算 D.周期性普查答案:A 3.要对某企业生产设备的实际生产能力进行调查,则该企业的“生产设备”是() A.调查对象 B.调查单位 C.调查项目 D.报告单位答案:A 4.对银行职工进行调查,调查对象是() A.所有银行

第2章统计数据的描述

第二章统计数据的描述 一、单项选择题 1.下列中,最粗略、计量层次最低的计量尺度是() A.间隔尺度 B.顺序尺度 C.比例尺度 D.列名尺度 2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是() A.比例尺度 B.列名尺度 C.间隔尺度 D.顺序尺度 3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是() A.列名尺度 B.间隔尺度 C.顺序尺度 D.比例尺度 4.下列中,计量层次的最高、最精确的计量尺度是() A.比例尺度 B.间隔尺度 C.顺序尺度 D.列名尺度 5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是() A.抽样调查 B.重点调查和典型调查 C.统计报表 D.普查 6.实际中应用最为广泛的一种调查方式是() A.重点调查 B.统计报表 C.普查 D.抽样调查 7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是() A.抽样调查 B.典型调查 C.重点调查 D.普查 8.一次性调查是指() A.只做过一次的调查 B.调查一次以后不再调查 C.间隔一段时间在进行一次调查 D.只隔一年就进行一次的调查 9.在统计分析中,对累积的次数分配用得最直接的是() A.供给曲线 B.需求曲线 C.洛伦茨曲线 D.边际需求曲线 10.专门用来衡量和反映收入分配平均程度的统计指标是() A.基尼系数 B.可决系数 C.相关系数 D.离散系数 11.一般认为,基尼系数在()之间是比较恰当的。

A.0.1— —0.4 C.— —0..8 12.一般认为,基尼系数等于( )是收入分配不公平的警戒线。 A.0.2 B.0.6 C. 利用公式计算众数的基本假定之一是众数组的频数在该组内呈( ) A.正态分布 分布 C.均匀分布 D.偏态分布 14.计算中位数时,假定中位数所在组的频数在该组内呈( ) A.左偏分布 B.正态分布 C.右偏分布 D.均匀分布 15.反映数据分布集中趋势的最主要的测度值是( ) A.众数 B.中位数 C.均值 D.几何平均数 16.各个变量值与均值的离差之和( ) A.大于0 B.小于0 C.等于0 D.等于一个不为0的常数 17.各个变量值与均值的离差平方和( ) A.为最大 B.为最小 C.为0 D.为一个不为0的常数 18.下列中,专门用来衡量众数代表性大小的离散程度测度值是( ) A.异众比率 B.四分位差 C.方差或标准差 D.极差 19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是( ) A.方差和标准差 B.内距 C.异众比率 D.平均差 20.下列中,适用于列名数据的集中趋势测度值是( ) A.众数 B.中位数 C.均值 D.几何均值 21.描述数据离散程度最简单的测度值是( ) A.平均差 B.方差和标准差 C.极差 D.四分位差 22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。 A.σ±X B.σ2±X C.σ3±X D.σ4±X 23.用来对两组数据的差异程度进行比较的统计分析指标是( ) A.基尼系数 B.标准差系数 C.相关系数 D.可决系数 24.测定数据分布偏斜程度需要计算( )

相关文档
最新文档