统计案例--独立性检验及其初步

独立性检验的基本思想及其初步应用

知识点

1.与列联表相关的概念

(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量. (2)列联表:

①列出的两个分类变量的频数表, 称为列联表.

①一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:

y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计

a +c

b +d

a +

b +

c +d

在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0, 因此|ad -bc |越小, 关系越弱; |ad -bc |越大, 关系越强. 2.等高条形图

将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图。

等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列表数据的频率特征. 列联表和等高条形图的优劣:

列联表可以准确掌握总体中各部分的频率,但是需要计算;

等高条形图可以比较各个部分之间的差异,明确展现两个分类变量的关系。 3.独立性检验的基本思想

(1)定义:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)公式:K 2=

n ad -bc 2a +b

c +

d a +c

b +d

,其中n =a +b +c +d 为样本容量.用它的大小可以用

来决定是否拒绝原来的统计假设0H .如果K 2的值较大,就拒绝0H ,即认为A 与B 是有关的.

注:独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的.

4.独立性检验的步骤:

(1)确定分类变量,获取样本频数,得到列联表.

(2) 利用公式K2=

n ad-bc2

a+b c+d a+c b+d计算随机变量K

2的观测值k0.

(3) 根据实际问题的需要推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.

(4)作出判断.如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误

的概率不超过α的前提下不能推断“X与Y的关系”。

常见的临界值表为:

P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001 k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.828

题型一等高条形图的应用

【例1】为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:

组别阳性数阴性数总计

铅中毒病人29736

对照组92837

总计383573

试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色

素为阳性是否有关系?

【过关练习】

1.1网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主

管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末

考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?

题型二独立性检验

【例1】某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:

根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.

【过关练习】

1.某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.

(1)根据以上数据建立一个2×2列联表;

(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.

【例2】(2017·全国Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:

(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.

附:

K2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

.

【过关练习】

为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:

已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为2

3.

(1)请将上面的2×2列联表补充完整(不用写计算过程);

(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由; (3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值.

课后练习

【补救练习】

1.分类变量X和Y的列联表如下:

A.ab-bc越小,说明X与Y关系越弱

B.ad-bc越大,说明X与Y关系越强

C.(ad-bc)2越大,说明X与Y关系越强

D.(ad-bc)2越接近于0,说明X与Y关系越强

2.下列关于等高条形图的叙述正确的是()

A.从等高条形图中可以精确地判断两个分类变量是否有关系

B.从等高条形图中可以看出两个变量频数的相对大小

C.从等高条形图中可以粗略地看出两个分类变量是否有关系

D.以上说法都不对

3.通过对K2的统计量的研究得到了若干个临界值,当K2≤2.706时,我们认为() A.在犯错误的概率不超过0.05的前提下认为X与Y有关系

B.在犯错误的概率不超过0.01的前提下认为X与Y有关系

C.没有充分理由认为X与Y有关系

D.不能确定

4.下面是调查某地区男女学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图3-2-4中可以看出()

图3-2-4

A.性别与喜欢理科无关

B.女生中喜欢理科的比为80%

C.男生比女生喜欢理科的可能性大些

D.男生不喜欢理科的比为60%

【巩固练习】

1.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:

() A.a=50,b=40,c=30,d=20

B.a=50,b=30,c=40,d=20

C.a=20,b=30,c=40,d=50

D.a=20,b=30,c=50,d=40

2.在对某小学的学生进行吃零食的调查中,得到如下表数据:

3.在独立性检验中,统计量K2有两个临界值:3.841和6.635.当K2>3.841时,有95%的把握说明两个事件有关,当K2>6.635时,有99%的把握说明两个事件有关,当K2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算K2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间是________的(有关、无关).4.下列关于K2的说法中,正确的有________.

①K2的值越大,两个分类变量的相关性越大;

②K2的计算公式是K2=

n(ad-bc)

(a+b)(c+d)(a+c)(b+d)

③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;

④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.

5.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:

6.有人发现一个有趣的现象,中国人的邮箱里含有数字比较多,而外国人邮箱名称里含有数字比较少,为了研究国籍和邮箱名称里含有数字的关系,他收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.

(1)根据以上数据建立2×2列联表;

(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里

含有数字是否有关,你能帮他判断一下吗?

【拔高练习】

1.观察下列各图,其中两个分类变量x,y之间关系最强的是()

A B

C D

2.某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列叙述中正确的是()

A.有95%的把握认为“这种血清能起到预防感冒的作用”

B.若有人未使用该血清,那么他一年中有95%的可能性得感冒

C.这种血清预防感冒的有效率为95%

D.这种血清预防感冒的有效率为5%

3.某班主任对全班50名学生作了一次调查,所得数据如表:

的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.

4.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:

设H小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.

5.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:

已知在全部30人中随机抽取1人,抽到肝病患者的概率为4 15.

(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;

(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?

参考数据:

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

2独立性检验

1.2独立性检验的基本思想及其初步应用 根据表中数据得到 2 50181589 27232426 k () ??-? =≈ ??? 5.059,因为p(K2≥5.024)=0.025, 则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为() (A)97.5% (B) 95% (C)90% (D)无充分根据 2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关 A.5% B.75% C.99.5% D.95% 3.(2012?泰安一模)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位; ③线性回归方程必过; ④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系; 其中错误的个数是() A.0 B.1 C.2 D.3 4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是() A.这种疫苗能起到预防甲型H1N1流感的有效率为1% B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1 C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” 5.(2012?枣庄一模)通过随机询问100名性别不同的大学生是否爱好踢毪子运动,得到如下的列联表: 随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是 () A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3.数据离散程度的测度值中,不受极端数值影响的是() A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

回归分析及独立性检验的基本知识点及习题集锦

回归分析的基本知识点及习题 本周题目:回归分析的基本思想及其初步应用 本周重点: (1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别; (2)尝试做散点图,求回归直线方程; (3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 本周难点: (1)求回归直线方程,会用所学的知识对实际问题进行回归分析. (2)掌握回归分析的实际价值与基本思想. (3)能运用自己所学的知识对具体案例进行检验与说明. (4)残差变量的解释; (5)偏差平方和分解的思想; 本周内容: 一、基础知识梳理 1.回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。 求回归直线方程的一般步骤: ①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→ ③写出回归直线方程,并利用回归直线方程进行预测说明. 2.回归分析: 对具有相关关系的两个变量进行统计分析的一种常用方法。 建立回归模型的基本步骤是: ①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; ②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系). ③由经验确定回归方程的类型. ④按一定规则估计回归方程中的参数(最小二乘法); ⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤: (1)提出问题; (2)收集数据; (3)分析整理数据; (4)进行预测或决策。 4.残差变量的主要来源: (1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。 可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这 种由于模型近似所引起的误差包含在中。 (2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重 关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在中。 (3)观测误差。由于测量工具等原因,得到的的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可 能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在中。 上面三项误差越小,说明我们的回归模型的拟合效果越好。

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是

高中数学 第一章 统计案例 1.2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用学案 北师大版

2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用 1.了解独立性检验的基本思想方法.(重点) 2.了解独立性检验的初步应用.(难点) [基础·初探] 教材整理1 独立性检验 阅读教材P21~P24第1行部分,完成下列问题. 设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,有下面2×2列联表: B B1B2总计 A A1a b a+b A2c d c+d 总计a+c b+d n=a+b+c+d 111取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:

文艺节目 新闻节目 总计 20至40岁 40 18 58 大于40岁 15 27 42 总计 55 45 100 由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”). 【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a + b =1858,d c + d =27 42,两者相差较大,所 以,经直观分析,收看新闻节目的观众与年龄是有关的. 【答案】 是 教材整理2 独立性检验的基本思想 阅读教材P 24“练习”以下至P 25“练习”以上部分,完成下列问题. 在2×2列联表中,令χ2= n ad -bc 2 a +b c +d a +c b +d ,当数据量较大时, 在统计中,用以下结果对变量的独立性进行判断: (1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. 对分类变量X 与Y 的统计量χ2的值说法正确的是( ) A .χ2越大,“X 与Y 有关系”的把握性越小 B .χ2越小,“X 与Y 有关系”的把握性越小 C .χ2越接近于0,“X 与Y 无关系”的把握性越小

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

应用统计学试题和答案

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。= 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、 ②、33 ③、 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为,2001~2002年两年平均为,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

统计案例之独立性检验

统计案例之独立性检验 班级姓名学号 参考公式:,其中. 1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生 互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响, 采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下: 表一:男生表二:女生 (1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率; (2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.

2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北 京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动. (1)根据以上数据完成以下2×2列联表: 喜爱运动不喜爱运动总计 男10 16 女 6 14 总计30 (2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少? 3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关, 现从高一学生中抽取人做调查,得到如下列联表: 已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为, (Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关? 并说明你的理由;

(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取 人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率, 4.某学校高三年级有学生 1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表: 身高达标身高不达标总计 经常参加体育锻炼40 不经常参加体育锻炼15 总计100 (1)完成上表; 5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.

应用统计学试题及答案2

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为 7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试 成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() A.520公斤 B.530公斤 C.540公斤 D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% B.400% C.120% D.1200% 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 A.10.71% B.21.95% C.12% D.13.64% 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显著性 D.规性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如 下,你认为哪个回归方程可能是正确的?() A.y=125-10x B.y=-50+8x C.y=150-20x D.y=-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算

相关文档
最新文档