数据分析典型练习题集

1、某校积极开展“阳光体育”活动，共开设了跳绳、足球、篮球、跑步四种运动项目，为了解学生最喜爱哪一种项目，随机抽取了部分学生进行调查，并绘制了如下的条形统计图和扇形统计图（部分信息未给出）．

（1）求本次被调查的学生人数；

（2）补全条形统计图；

（3）该校共有120中学生骑电动车上学给交通安全带来隐患，为了解某中学2500个学生家长对“中学生骑电动车上学”的态度，从中随机调查400个家长，结果有360个家长持反对态度，则下列说法正确的是( )

A．调查方式是普查

B．该校只有360个家长持反对态度

C．样本是360个家长

D．该校约有90%的家长持反对态度

如果有2500名学生，请估计全校最喜爱篮球的人数比最喜爱足球的人数多多少？

2、为了了解某区八年级7000名学生的身高情况，从中抽查了500名学生的身高，就这个问题来说，下面说法正确的是（）

A. 7000名学生是总体

B. 每个学生是个体

C. 500名学生是所抽取的一个样本

D. 样本容量为500

3、某市青少年宫准备在七月一日组织市区部分学校的中小学生到本市A，B，C，D，E五个红色旅游景区“一日游”，每名学生只能在五个景区中任选一个．为估算到各景区旅游的人数，青少年宫随机抽取这些学校的部分学生，进行了“五个红色景区，你最想去哪里”的问卷调查，在统计了所有的调查问卷后将结果绘制成如图所示的统计图．

（1）求参加问卷调查的学生数，并将条形统计图补充完整；

（2）若参加“一日游”的学生为1000人，请估计到C景区旅游的人数

4、国家环保局统一规定，空气质量分为5级：当空气污染指数达0—50时为1级，质量为优；51—100时为2级，质量为良；101—200时为3级，轻度污染；201—300时为4级，中度污染；300以上时为5级，重度污染．某城市随机抽取了2015年某些天的空气质量检测结果，并整理绘制成如下两幅不完整的统计图．请根据图中信息，解答下列各题：

（1）本次调查共抽取了天的空气质量检测结果进行统计；

（2）补全条形统计图；

（3）扇形统计图中3级空气质量所对应的圆心角为 °；

（4）如果空气污染达到中度污染或者以上，将不适宜进行户外活动，根据目前的统计，请你估计2015年该城市有多少天不适宜开展户外活动．（2015年共365天）

5、某教研机构为了了解在校初中生阅读数学教科书的现状，随机抽取某校部分初中学生进行了调查，依据相关数据绘制成以下不完整的统计表，请根据图表中的信息解答下列问题：

某校初中生阅读数学教科书情况统计图表

（1）求样本容量及表格中a，b，c的值，并补全统计图；

（2）若该校共有初中生2300名，请估计该校“不重视阅读数学教科书”的初中人数；

（3）①根据上面的统计结果，谈谈你对该校初中生阅读数学教科书的现状的看法及建议；

②如果要了解全省初中生阅读数学教科书的情况，你认为应该如何进行抽样？

6、在“走基层,树新风”活动中，青年记者石剑深入边远山区，随机走访农户，调查农村儿童生活教育现状。根据收集的数据字编制了不完整的统计图表如下：

请你用学过的统计知识,解决问题：

（1）记者石剑走访了边远山区多少家农户?

（2）将统计图表中的空缺数据正确填写完整；

（3）分析数据后，请你提一条合理建议．

7．（本题8分）某生物课外活动小组的同学举行植物标本制作比赛，结果统计如下：

根据表中提供的信息，回答下列问题：

（1）该组共有学生多少人？

（2）制作标本数在6个及以上的人数在全组人数中所占比例？

（3）平均每人制作多少个标本？（4）补全图4的条形统计图．

《数据分析》练习题

《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为。 2.有10个数据的平均数为12，另有20个数据的平均数为15，那么所有这30个数据的平均数是( ) A ．12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同，那么这组数据的中位数是（） A. 6 B. 8 C.7 D. 10 4.某校在一次考试中，甲乙两班学生的数学成绩统计如下：请根据表格提供的信息回答下列问题：（1）甲班众数为分，乙班众数为分，从众数看成绩较好的是班；（2）甲班的中位数是分，乙班的中位数是分；（3）若成绩在80分以上为优秀，则成绩较好的是班；、（4）甲班的平均成绩是分，乙班的平均成绩是分，从平均分看成绩较好的是班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中，数字10和20分别表示的意义可以是( ) A ．数据的个数和方差 B ．平均数和数据的个数 C ．数据的个数和平均数 D ．数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数，那么该数组的（） A.平均数改变，方差不变 B.平均数改变，方差改变 C.平均输不变，方差改变 D.平均数不变，方差不变 7..已知7,4,3,,321x x x 的平均数是6，则_____________321=++x x x . 8..已知一组数据-3，-2，1，3，6，x 的中位数为1，则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2，方差是 3 1 ，那么另一组数据3x 1－2,3x 2－2,3x 3－2, 3x 4－2,3x 5－2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数，下列说法中正确的是（） A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对分数 50 60 70 80 90 100 人数甲 1 6 12 11 15 5 乙 3 5 15 3 13 11

数据分析期末试题及答案

数据分析期末试题及答案一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)的数据，试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解： 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系上图是以人均GDP(x1)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间没有呈线性关系。尝试多种模型后采用曲线估计，得出表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间基本呈正线性关系。上图是以疫苗接种率(x3)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间没有呈线性关系。 x）为横轴，地区平均寿命(y)为纵轴的散点图，上图是以疫苗接种率(x3)的三次方（3 3 由图可知，他们之间呈正线性关系所以可以采用如下的线性回归方法分析。

2.线性回归先用强行进入的方式建立如下线性方程设Y=β0+β1*（Xi1）+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi（i=1.2……22）相互独立，都服从正态分布N（0，σ^2）且假设其等于方差 R值为0.952，大于0.8，表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)一起表示出来。建立总体性的假设检验提出假设检验H0：β1=β2=β3=0，H1,：其中至少有一个非零得如下方差分析表上表是方差分析SAS输出结果。由表知，采用的是F分布，F=58.190，对应的检验概率P值是0.000.，小于显著性水平0.05，拒绝原假设，表示总体性假设检验通过了，平均寿命(y)与人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

分析结果的误差和处理习题

分析结果的误差和处理习题一、选择题： 1.平行实验的精密度愈高，其分析结果准确度也愈高。( ) 2.操作误差是由于错误操作引起的。( ) 3.绝对误差是指测定值与平均值之差。( ) 4.系统误差是不可避免的，随机误差(偶然)是可以避免的。( ) 5.K a=10-4.76的有效数字为两位。( ) 6.算式 7415 .5 ) 37 . 12 41 . 18 ( 67 . 27- ? 的结果为三位有效数字。( ) 7.蒸馏水中带有少量影响测定结果的杂质，实验中引进了随机误差。( ) 8.精密度只检验平行测定值之间的符合程度，和真值无关。( ) 9.分析者个人操作误差可用对照试验进行校正。( ) 10.在定量分析中，测量的精密度越好，准确度越高。( ) 11.用感量为万分之一的分析天平称样0.4000克，称量的相对误差大于0.2%。( ) 12.p K a=4.76为两位有效数字。( ) 13.因为pH=7.00，所以[H+]=1.00?10-7mol/L。( ) 14.用G检验法取舍离群值(可疑值)时，当计算G值大于查表G值时，离群值应保留。( ) 15.用感量为万分之一的分析天平称样0.1000克，称量的相对误差小于0.1%。( ) 16.精密度高的分析结果，其准确度不一定高。( ) 17.系统误差的特征之一是具有随机性。( ) 18.无限次测量的随机误差服从正态分布规律。( ) 19.偏差愈小，测定值的准确度愈高。( ) 20.使用的玻璃仪器洗不干净而引入杂质，使测量产生仪器误差。( ) 21.在无被测成分存在的条件下，按所使用的方法和步骤进行的实验称为空白实验。( ) 22.滴定分析中，精密度是准确度的先决条件。( ) 23.用蒸馏水代替试液，按所使用的方法和步骤进行的试验称为对照试验。( ) 24.理论上，被测成分的真实值是无法确定的。( ) 25.pH=8.52，则[H+]的有效数字为三位。( ) 26.用万分之一的天平进行减量法称量0.05g、0.2g物体时，引起的相对误差相同。( ) 27.溶解试样的蒸馏水含有杂质会引入随机误差。( ) 28.减小随机误差的方法可用标准方法进行对照试验求校正系数校正。( ) 29.系统误差，重复测定重复出现，并可以用某些方法检验出来。( ) 30.所有的系统误差通常都可用对照试验来校正。( ) 31.读数时，最后一位数字估计不够准确所引起的误差属于操作误差。( ) 32.蒸馏水中带有少量影响测定结果的杂质，使实验中引进了试剂误差。( ) 33.当溶液的pH=7.00时，其[H+]=1.0×10－7mol·L－1。( ) 二、选择题： 34.一组测量结果的精密度最好用( )表示。 A、绝对偏差 B、相对误差 C、相对平均偏差 D、相对标准偏差 35.算式 000 .1 ) 80 . 24 00 . 25 ( 1010 .0- 的结果应报出有效数字( )位。 A、五 B、三 C、四 D、两

数据分析与处理答案

数据分析与处理答案 Prepared on 24 November 2020

一、简答题（5×2分，共10分） 1、请解释质量控制图中三条主要控制线的意义：CL 、UCL 、LCL 未学，不考 2、请解释正交设计表“L 934” 这个符号所指代的意义。如果要做6因素4水平实验，应该选择以下哪一个正交表（不考虑交互作用）：L 1645，L 3249 L: 正交； 9：9行或9次实验； 3：3个水平； 4：4列或4个因素选L 3249 二、计算题（90分） 1、某分析人员分别进行4次平行测定，得铅含量分别是、、、、，试分别用3s 法、Dixon 法和Grubbs 检验法判断是否为离群值。（，4=， ,5=）（12分） x =, s=, 3s 法：∣ 应保留 Dixon ：70.6360.08 0.89671.8560.08 Q -= =-> ,5=, 应舍去 Grubbs: G 计= 60.0868.455/5.61-=> ，4，应舍去· ·· 2、4次测定结果为：%、%、%、%，根据这些数据估计此样品中铬的含量范围（P=95%）（8分） ( 2.353%903,10.0=?=t P ， 3.182%9530.05=?=，t P ， 5.841%9930.01=?=，t P ) x =%, s=% 3、用一种新方法测定标准试样中的氧化铁含量（%），得到以下8个数据：、、、、、、、。标准偏差为%，标准值为%问这种新方法是否可靠（P=95%，，7=）（10分）

x = 34.3034.33 1.770.048 t -==< ，7，所以新方法可靠 4、某小组做加标回收试验考查方法的准确性，测得加标前1000mL 样品浓度为L ，加入浓度为1000mg/L 的标准样品后，测得样品总浓度为L ，求回收率是多少。（8分）没讲，不考 5、两分析人员测定某试样中铁的含量，得到如下结果：已知A 的标准偏差s 1=，B 的标准偏差s 2=，请比较两个人测定结果的精密度和准确的有无显着性差异。（12分） F （,4,4）=， t （,8）= F==< F （,4,4）,故精密度无显着性差异 t=< t （,8）,故准确度无显着性差异 5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响，实验因素水平表如下表。请完成下列正交表格，并指出各因素的主次顺序，求出最优水平组合，并做方差分析，填方差分析表，并对实验结果做出讨论（可结合因素指标变化图）。（25分）