第2章 统计数据的描述
统计学简答题参考答案

统计学简答题参考答案第一章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源。
答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差。
答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.解释描述统计和推断统计的概念?(P5)答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。
推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
第二章统计数据的描述1描述次数分配表的编制过程。
答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
3.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。
统计学 第2章 统计数据的描述

第2章统计数据的描述练习:2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2.3某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
统计学第二章

按性别分组 男生 女生 合计
人数 30 20 50
百分比 % 60 40 100
三、按数量标志分组
按照数量或数值等定量指标分组,称为按数量 标志分组。
(1)单变量分组:一个变量值为一组,适合离散 变量,且变量值较少。步骤是先排序再分组。 (2)组距分组:
将全部变量值划分为若干区间,并将这一区间的变量值 作为一组,适用于连续变量或变量值较多的情况。 需要遵循“不重不漏”的原则,可采用等距分组,也可 采用不等距分组。
2.1 统计数据的整理
2.1.0 2.1.1 2.1.2 2.1.3 2.1.4 数据的预处理 统计数据的分组 次数分配 次数分配直方图 洛伦茨曲线
2.1.0 数据的预处理
一、数据的审核 对原始数据,审核完整性和准确性。前者指 调查单位是否遗漏、项目是否齐全等;后者 指数据是否真实、是否错误等。方法是逻辑 检查和计算检查。 对二手数据审核完整性和准确性外,着重审 核数据的适用性和时效性。前者应清楚数据 的来源、口径和背景,后者应注意数据的时 间,使用最新的数据。
当f-1=f+1时如图(a),当f-1>f+1时如图(b), 当f-1<f+1时如图(c)。
(a)
(b)
(c)
②公式计算:
上限公式
f f 1 M0 U ( f f 1) ( f f f f 1 M0 L ( f f 1) ( f f
1
2.1.2 次数分配
对于例2-1采用组距分组,计算组数K=1+1g30/ 1g2=5(组),组距 =(128-84)/ 5=8.8,组距取10件,整理成频数分布表2-3。
统计学习题1

第2章统计数据的描述练习:2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
2.2某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
2.3在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300 19300~400 30400~500 42500~600 18600以上11合计120计算120家企业利润额的均值和标准差。
第2章统计数据的描述

第二章统计数据的描述一、单项选择题1.下列中,最粗略、计量层次最低的计量尺度是()A.间隔尺度B.顺序尺度C.比例尺度D.列名尺度2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是()A.比例尺度B.列名尺度C.间隔尺度D.顺序尺度3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是()A.列名尺度B.间隔尺度C.顺序尺度D.比例尺度4.下列中,计量层次的最高、最精确的计量尺度是()A.比例尺度B.间隔尺度C.顺序尺度D.列名尺度5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是()A.抽样调查B.重点调查和典型调查C.统计报表D.普查6.实际中应用最为广泛的一种调查方式是()A.重点调查B.统计报表C.普查D.抽样调查7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.抽样调查B.典型调查C.重点调查D.普查8.一次性调查是指()A.只做过一次的调查B.调查一次以后不再调查C.间隔一段时间在进行一次调查D.只隔一年就进行一次的调查9.在统计分析中,对累积的次数分配用得最直接的是()A.供给曲线B.需求曲线C.洛伦茨曲线D.边际需求曲线10.专门用来衡量和反映收入分配平均程度的统计指标是()A.基尼系数B.可决系数C.相关系数D.离散系数11.一般认为,基尼系数在()之间是比较恰当的。
A.0.1—0.2B.0.2—0.4C.0.4—0.6D.0.6—0..812.一般认为,基尼系数等于()是收入分配不公平的警戒线。
A.0.2B.0.6C.0.4D.0.813.利用公式计算众数的基本假定之一是众数组的频数在该组内呈()A.正态分布B.t分布C.均匀分布D.偏态分布14.计算中位数时,假定中位数所在组的频数在该组内呈()A.左偏分布B.正态分布C.右偏分布D.均匀分布15.反映数据分布集中趋势的最主要的测度值是()A.众数B.中位数C.均值D.几何平均数16.各个变量值与均值的离差之和()A.大于0B.小于0C.等于0D.等于一个不为0的常数17.各个变量值与均值的离差平方和()A.为最大B.为最小C.为0D.为一个不为0的常数18.下列中,专门用来衡量众数代表性大小的离散程度测度值是()A.异众比率B.四分位差C.方差或标准差D.极差19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是()A.方差和标准差B.内距C.异众比率D.平均差20.下列中,适用于列名数据的集中趋势测度值是( )A.众数B.中位数C.均值D.几何均值21.描述数据离散程度最简单的测度值是( )A.平均差B.方差和标准差C.极差D.四分位差22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。
统计学第2章 统计数据的描述(1)

(4)组中值:上下限之间中点的值。
组中值=(上限+下限)/2=上限-组距/2 =下限+组距/2
“××以上”、“××以下”这样的组叫开口组。一般假 定开口组的组距与其相邻组的组距相等。其组中值计算如下: 缺下限最小组的组中值=上限-相邻组组距/2 缺上限最大组的组中值=下限+相邻组组距/2 见第37页的表2.15
第三节 统计整理
一、统计整理的概念和步骤
概念:统计整理是根据统计研究的目的和要求,把统计调查 从而得到反映事物总体特征资料的过程。
步骤: 第一,统计资料审核。包括及时性(整个工作期限、搜 集资料的时间、资料所属的时间);准确性(事实求地反映 实际情况、计算正确);完整性(规定应调查的总体单位、 每个调查单位应调查的内容)等方面的审核。 第二,统计分组 第三,统计汇总 第四,编制统计表或绘制统计图
提供统计数据的部分政府网站
美国政府机构 人口普查局 联邦储备局 预算编制办公室 商务部 网 址 数据内容
人口和家庭等 http://www.bog.frb.fed. 货币供应、信誉、 us 汇率等 http://www.whitehouse. 财政收入、支出、 gov/omb 债券等 商业、工业等
统计数据的来源主要有两个: 一是直接来源,即来源于直接的调查和科学试验, 得到第一手数据。 二是间接来源,即来源于别人调查或试验的数 据,得到第二手数据。
见第8-9页
一、统计数据的直接来源 1、普查
(1)概念 为了某一特定目的而专门组织的一次性全面调查。 (2)特点 ①具有一次性和周期性。
“一次性”是指调查现象在某一时点上的数据。
(1)对称分布:以变量值的中点为对称轴的对称分布。
(2)偏态分布:
卫生统计学课件 第二章 计量资料的统计描述(共33张PPT)

●计算公式: 13cm之间的占该地7岁男童的百分 比。
∑f · X=1638
双侧界值:P 2.5 ~ P 97..5 定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
特征: ∑(X- X)=0 估计误差之和为0。
估计的方法: 1、正态分布法
2、百分位数法
28
1.正态分布法
应用条件:正态分布或近似正态分布资料 ●计算 (双侧) 95% 正常值(医学参考值)范围公式:
(x1.96 · S,x1.96 · S )
即(x±1.96 · S ) 例:
1.96 × 3.79 )
即(156.41 cm , 171.27 cm )
1998年100名18岁健康女大学生身高的频数分布
数。 (3) 估计该地7岁男童身高在107.
确定组段:第一组段包括最小值,如本例为154 89 cm 取整数 2 cm 应用:单位不同的多组数据比较
13cm之间比的。占该地7岁男频童的数百分表(频数分布):表示各组及它们对
注意:合理分组,才能求均数,否则没有意义。
96 ·S,x 1. Q = Qu 一 Ql
单侧 上界: P 95
单侧 下界: P 5
31
习题:
1.各观察值加同一数后: A.均数不变,标准差改变 B.均数改变,标准差不
变
2.用均数和标准差可全面描述:
3.正态分布曲线下,从均数u 到u 的面积为; A.95% B.45% C. 97.5% D.47.5%
19
相关概念:离均差、离均差平方和、方差(2 S2 ) 标准差的符号: S
医学统计学--第二章 计量资料的统计描述

4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
1
lg X ) lg (
n
1
ቤተ መጻሕፍቲ ባይዱ
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
(2)加权法 公式:
G lg (
1
f lg X f
)
例2-5 69例类风湿关节炎(RA)患者血清EBV-VCAlgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均 抗体滴度。
三、频数表和频数分布图用途
1.描述频数分布的 类型 (1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
25
20 15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ Ç × µ ¹ ´ £ mmol/L£ ª å Ü ¨Ì ¼ ¨ ©
G 公式: X 1 X 2 X n
n
或
G lg
1
lg X ) (
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 10 20 40 40 160 34.8
5
G lg
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对离散变量作单变量值分组编分配表的例(3) 对离散变量作单变量值分组编分配表的例
• 下表是对某城市家庭按家庭人口数分组的统计表。 下表是对某城市家庭按家庭人口数分组的统计表。 • 家庭人口数是离散变量,且家庭人口数分布范围较小, 家庭人口数是离散变量,且家庭人口数分布范围较小, 可采用单变量分组方式进行分组。 可采用单变量分组方式进行分组。
1998年我国大陆人口性别分布表 1998年我国大陆人口性别分布表
按品质标志(顺序尺度)编分配表的例题 按品质标志(顺序尺度)编分配表的例题(2)
例2:下面是对某班学生按等级成绩分组形成的频数分 : 布表。其中左边第一列就是各组名称, 布表。其中左边第一列就是各组名称,从上而下分别 由高到低分布。第二列为各组人数的统计结果。 由高到低分布。第二列为各组人数的统计结果。第三 列为按各组人数计算的比重。 列为按各组人数计算的比重。
(2)组距分组的条件及方法 组距分组的条件及方法
对取值范围大的离散变量及连续变量都 可应用组距分组 将变量值的一个区间作为一个组 更适合于连续变量 适合于变量值较多的情况 注意遵循“不重不漏” 注意遵循“不重不漏”的原则 可采用等距分组, 可采用等距分组,也可采用不等距分组 可采用闭口分组, 可采用闭口分组,也可采用开口分组 采用 叠 组限方 这时 常 常 采 用 重 叠组 限方 式分 组 , 这时常 规 定 上限不在组内” “上限不在组内”的原则 也可以采用不重叠组限方式分组, 也可以采用不重叠组限方式分组 , 这时常 规定“实际上限为上组的下限” 上组即为 规定“实际上限为上组的下限”(上组即为 较大组-可由垂直向上的数轴确定方向 可由垂直向上的数轴确定方向) 较大组 可由垂直向上的数轴确定方向
2.4.1 统计数据的分组(P21)
按数据的四种计量尺度,采用不同的分组方法: 1.列名尺度和顺序尺度是按照事物的性质和属 1.列名尺度和顺序尺度是按照事物的性质和属 性划分的,按该两种尺度分组又称为按品质标志 性划分的,按该两种尺度分组又称为按品质标志 分组。 2.间隔尺度和比例尺度是按照事物的数量标 2.间隔尺度和比例尺度是按照事物的数量标 准划分的,按该两种尺度分组又称为按数量标志 准划分的,按该两种尺度分组又称为按数量标志 分组。
某城市家庭按人口数分组 按家庭人口数分组(人) 按家庭人口数分组( 1 2 3 4 5 合计 人数 652 1435 18624 295 83 21089 百分比(%) 百分比(%) 3.09 6.80 88.31 1.40 0.39 100.00
对连续变量作单变量值分组编分配表的例(4) 对连续变量作单变量值分组编分配表的例
表2.9 我国人口年龄阶段的分组 按年龄阶段分组 婴幼儿 少年儿童 中青年 老年 男性 0~6岁 7~17岁 17岁 18~59岁 18~59岁 60岁及以上 60岁及以上 女性 0~6岁 7~17岁 17岁 18~54岁 18~54岁 55岁及以上 55岁及以上
2.4.2 次数分配(P22)
1.次数分配表的编制: 次数分配表的编制: 次数分配表的编制 • 将数据进行分组,就是将数据按某标志进行分组,并纪 将数据进行分组,就是将数据按某标志进行分组, 录样本观察值在各组内的单位数(亦称次数 频数), 亦称次数、 录样本观察值在各组内的单位数 亦称次数、频数 ,也可 纪录样本观察值在各组内的单位数比重(亦称频率 亦称频率)。 纪录样本观察值在各组内的单位数比重 亦称频率 。这就 是次数分配的形成。 是次数分配的形成。 • 次数分配形成的首要步骤在于按某标志进行分组。所以, 次数分配形成的首要步骤在于按某标志进行分组。所以, 必须掌握分组的方法。 必须掌握分组的方法。 • 次数分配的形成的第二步骤是纪录样本观察值在各组内 的单位数,并形成分配表。 的单位数,并形成分配表。
单变量值分组的例
当变量取值范围较小时, 当变量取值范围较小时,常采取单变量分组 • 1. 家庭人口数是离散变量,其取值范围小 家庭人口数是离散变量, 中国家庭按人口数分组,可分为1人 中国家庭按人口数分组,可分为 人、2 人等八个组。 人、3人、…、8人等八个组。 人 、 人等八个组 • 2.幼儿园小朋友年龄是连续变量,其取值范 幼儿园小朋友年龄是连续变量, 幼儿园小朋友年龄是连续变量 围小 幼儿园小朋友按年龄分为3岁 幼儿园小朋友按年龄分为 岁、4岁、5岁、 岁 岁 6岁四个组 岁组包含足 岁至 岁四个组(k岁组包含足 岁至k+1岁以下 。 岁以下) 岁四个组 岁组包含足k岁至 岁以下
• P22表2.6是对某班学生按年龄分组的次数分配表。 是对某班学生按年龄分组的次数分配表。 表 是对某班学生按年龄分组的次数分配表 • 年龄是连续变量,但该班学生的年龄分布范围较小, 年龄是连续变量,但该班学生的年龄分布范围较小, 可采用单变量分组方式进行分组。并规定k岁组包含满 可采用单变量分组方式进行分组。并规定 岁组包含满 k岁至未满 岁至未满k+1岁。 岁至未满 岁
组中值的计算方法
• 1.闭口组:
• 2.开口组:
作不等组距分组的例题
• 由于年龄分布具有年龄越小,人数越多,年龄越大,人数 由于年龄分布具有年龄越小,人数越多,年龄越大, 越少的现象, 越少的现象,因此对人口按年龄进行分组也可以作不等距 分组。 分组。 • P23表2.9就是对我国人口按性别特征进行不等距的年龄 表 就是对我国人口按性别特征进行不等距的年龄 阶段分组的两个定义表(男 女两种不同划分)。 阶段分组的两个定义表 男、女两种不同划分 。
1.按品质标志分组的方法 按品质标志分组的方法
• 基本方法:按各不同性质、属性划分类别 基本方法:按各不同性质、 而分组。 而分组。 [例1] 将学生按性别 列名尺度 分为“男”、 例 将学生按性别(列名尺度 分为“ 列名尺度)分为 两组。 “女”两组。 [例2] 将学生按等级成绩 (顺序尺度 分为 顺序尺度)分为 例 顺序尺度 及格” “优”、“良”、“中”、“及格”、“不 及格”五组。并在分组表中, 及格”五组。并在分组表中,按顺序排列各 组名称。 组名称。
• 对连续变量必须采用组距分组 • 2.百分制成绩是连续变量,其取值范围大 百分制成绩是连续变量, 百分制成绩是连续变量
将百分制考试成绩分为60以下、 ~ 、 ~ 将百分制考试成绩分为 以下、60~70、70~ 以下 80、80~90、90以上等五组。(等距、开口、重 以上等五组。 等距、 、 ~ 、 以上等五组 等距 开口、 叠组限) 叠组限
2.
3.
进行组距分组的一般技巧
• ①为便于统计和分析,组距及组限宜取 或5的倍数, 为便于统计和分析,组距及组限宜取10 的倍数, 的倍数 • ②组数宜在 ~15之间, 组数宜在5~ 之间 之间, • ③最小组的下限应低于最小变量值,最大组的上限应高于 最小组的下限应低于最小变量值, 最大变量值, 最大变量值, • ④对数据稀疏且极端值较远的最大组和最小组可采用开口 式分组, 式分组, • ⑤对数据分布呈递增或递减状态的,可按其变化形式采用 对数据分布呈递增或递减状态的, 不等距分组, 不等距分组, • ⑥组名称的顺序放置一般按习惯,从上往下一般为由小到 组名称的顺序放置一般按习惯, 也可以由大到小, 大,也可以由大到小, • ⑦使用重叠组限方式分组的,一般规定“上限不在组内”, 使用重叠组限方式分组的,一般规定“上限不在组内” • ⑧使用不重叠组限方式分组的,一般规定“实际上限为上 使用不重叠组限方式分组的,一般规定“ 组的下限” 组的下限”。
2.按数量标志分组的方法 按数量标志分组的方法
• 基本方法:按数量标志的不同属性(连续变量、 基本方法:按数量标志的不同属性 连续变量 连续变量、 离散变量)进行不同类型 单变量值分组、组距 离散变量 进行不同类型(单变量值分组、 进行不同类型 单变量值分组 分组)的分组 具体有四种不同方式: 的分组。 分组 的分组。具体有四种不同方式:
1》离散变量——变量只间断取值 》离散变量 变量只间断取值 (1)取值范围小:以各变量值为组名称~单变量值分 取值范围小: 取值范围小 以各变量值为组名称~ 常用) 组(常用 常用 (2)取值范围大:以两整数值代表两整数间距~组距 取值范围大: 取值范围大 以两整数值代表两整数间距~ 分组 2》连续变量 》连续变量——变量可连续取任意数值 变量可连续取任意数值 (3)以一整数值代表相邻两整数间距~单变量值分组 以一整数值代表相邻两整数间距~ 以一整数值代表相邻两整数间距 (4)以两整数值代表两整数间距~组距分组 常用 以两整数值代表两整数间距~ 常用) 以两整数值代表两整数间距 组距分组(常用
作组距分组的一般步骤及方法
1. 确定组数: 组数的确定, 确定组数 : 组数的确定 , 应以能够显示数据的分布特征 和规律为目的 斯特格斯经验公式: ⑴斯特格斯经验公式: 其中N为数据的个数 为数据的个数, 其中 为数据的个数,结果取整数 一般情况下, ⑵ 一般情况下,5≤K ≤15 确定组距:组距是一个组的上限与下限之差, 确定组距:组距是一个组的上限与下限之差,可根据全部 数据的最大值和最小值及所分的组数来确定, 数据的最大值和最小值及所分的组数来确定 , 为便于分 析和统计,一般应使组限和组距为10的整数倍。 析和统计,一般应使组限和组距为 的整数倍。 的整数倍 全距=最大值 最小值 (可扩大为 的整数倍 可扩大为10的整数倍 全距 最大值 —最小值 可扩大为 的整数倍) 相等组距=全距÷ (可扩大为 的整数倍 可扩大为10的整数倍 相等组距=全距÷ 组数 可扩大为 的整数倍) 统计并整理成表:统计出各组的频数(各组元素个数 各组元素个数)并整 统计并整理成表:统计出各组的频数 各组元素个数 并整 理成频数分布表
(1)单变量值分组的条件及方法 单变量值分组的条件及方法
变量取值范围小时都可应用单变量值分组, 变量取值范围小时都可应用单变量值分组,但 连续变量与离散变量的分组定义不相同。 连续变量与离散变量的分组定义不相同。 • 1.在变量只取整数且取值范围较小时,可采用单 在变量只取整数且取值范围较小时 变量值分组,即每ቤተ መጻሕፍቲ ባይዱ个变量值作为一组。这时, 变量值分组,即每一个变量值作为一组。这时, 各单变量值作为组的名称,也是组的取值范围。 各单变量值作为组的名称,也是组的取值范围。 • 2.在变量连续取值且常用整数代表两相邻整数间 在 区间时 若取值范围较小, 区间时,若取值范围较小,亦可采用单变量值分 这时,各单变量值作为组的名称, 组。这时,各单变量值作为组的名称,两相邻整 数间区间才是组的取值范围。 数间区间才是组的取值范围。