数据分析典型练习题集

数据分析典型练习题集
数据分析典型练习题集

1、某校积极开展“阳光体育”活动,共开设了跳绳、足球、篮球、跑步四种运动项目,为了解学生最喜爱哪一种项目,随机抽取了部分学生进行调查,并绘制了如下的条形统计图和扇形统计图(部分信息未给出).

(1)求本次被调查的学生人数;

(2)补全条形统计图;

(3)该校共有120中学生骑电动车上学给交通安全带来隐患,为了解某中学2500个学生家长对“中学生骑电动车上学”的态度,从中随机调查400个家长,结果有360个家长持反对态度,则下列说法正确的是( )

A.调查方式是普查

B.该校只有360个家长持反对态度

C.样本是360个家长

D.该校约有90%的家长持反对态度

如果有2500名学生,请估计全校最喜爱篮球的人数比最喜爱足球的人数多多少?

2、为了了解某区八年级7000名学生的身高情况,从中抽查了500名学生的身高,就这个问题来说,下面说法正确的是()

A. 7000名学生是总体

B. 每个学生是个体

C. 500名学生是所抽取的一个样本

D. 样本容量为500

3、某市青少年宫准备在七月一日组织市区部分学校的中小学生到本市A,B,C,D,E五个红色旅游景区“一日游”,每名学生只能在五个景区中任选一个.为估算到各景区旅游的人数,青少年宫随机抽取这些学校的部分学生,进行了“五个红色景区,你最想去哪里”的问卷调查,在统计了所有的调查问卷后将结果绘制成如图所示的统计图.

(1)求参加问卷调查的学生数,并将条形统计图补充完整;

(2)若参加“一日游”的学生为1000人,请估计到C景区旅游的人数

4、国家环保局统一规定,空气质量分为5级:当空气污染指数达0—50时为1级,质量为优;51—100时为2级,质量为良;101—200时为3级,轻度污染;201—300时为4级,中度污染;300以上时为5级,重度污染.某城市随机抽取了2015年某些天的空气质量检测结果,并整理绘制成如下两幅不完整的统计图.请根据图中信息,解答下列各题:

(1)本次调查共抽取了天的空气质量检测结果进行统计;

(2)补全条形统计图;

(3)扇形统计图中3级空气质量所对应的圆心角为 °;

(4)如果空气污染达到中度污染或者以上,将不适宜进行户外活动,根据目前的统计,请你估计2015年该城市有多少天不适宜开展户外活动.(2015年共365天)

5、某教研机构为了了解在校初中生阅读数学教科书的现状,随机抽取某校部分初中学生进行了调查,依据相关数据绘制成以下不完整的统计表,请根据图表中的信息解答下列问题:

某校初中生阅读数学教科书情况统计图表

(1)求样本容量及表格中a,b,c的值,并补全统计图;

(2)若该校共有初中生2300名,请估计该校“不重视阅读数学教科书”的初中人数;

(3)①根据上面的统计结果,谈谈你对该校初中生阅读数学教科书的现状的看法及建议;

②如果要了解全省初中生阅读数学教科书的情况,你认为应该如何进行抽样?

6、在“走基层,树新风”活动中,青年记者石剑深入边远山区,随机走访农户,调查农村儿童生活教育现状。根据收集的数据字编制了不完整的统计图表如下:

请你用学过的统计知识,解决问题:

(1)记者石剑走访了边远山区多少家农户?

(2)将统计图表中的空缺数据正确填写完整;

(3)分析数据后,请你提一条合理建议.

7.(本题8分)某生物课外活动小组的同学举行植物标本制作比赛,结果统计如下:

根据表中提供的信息,回答下列问题:

(1)该组共有学生多少人?

(2)制作标本数在6个及以上的人数在全组人数中所占比例?

(3)平均每人制作多少个标本?(4)补全图4的条形统计图.

《数据分析》练习题

《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为 。 2.有10个数据的平均数为12,另有20个数据的平均数为15,那么所有这30个数据的平均数是( ) A .12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同,那么这组数据的中位数是 ( ) A. 6 B. 8 C.7 D. 10 4.某校在一次考试中,甲乙两班学生的数学成绩统计如下: 请根据表格提供的信息回答下列问题: (1)甲班众数为 分,乙班众数为 分,从众数看成绩较好的是 班; (2)甲班的中位数是 分,乙班的中位数是 分; (3)若成绩在80分以上为优秀,则成绩较好的是 班;、 (4)甲班的平均成绩是 分,乙班的平均成绩是 分,从平均分看成绩较好的是 班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中, 数字10和20分别表示的意义可以是( ) A .数据的个数和方差 B .平均数和数据的个数 C .数据的个数和平均数 D .数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数,那么该数组的 ( ) A.平均数改变,方差不变 B.平均数改变,方差改变 C.平均输不变,方差改变 D.平均数不变,方差不变 7..已知7,4,3,,321x x x 的平均数是6,则_____________321=++x x x . 8..已知一组数据-3,-2,1,3,6,x 的中位数为1,则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是 3 1 ,那么另一组数据3x 1-2,3x 2-2,3x 3-2, 3x 4-2,3x 5-2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数,下列说法中正确的是( ) A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对 分数 50 60 70 80 90 100 人数 甲 1 6 12 11 15 5 乙 3 5 15 3 13 11

数据分析期末试题及答案

数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。

2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

分析结果的误差和处理习题

分析结果的误差和处理习题 一、选择题: 1.平行实验的精密度愈高,其分析结果准确度也愈高。( ) 2.操作误差是由于错误操作引起的。( ) 3.绝对误差是指测定值与平均值之差。( ) 4.系统误差是不可避免的,随机误差(偶然)是可以避免的。( ) 5.K a=10-4.76的有效数字为两位。( ) 6.算式 7415 .5 ) 37 . 12 41 . 18 ( 67 . 27- ? 的结果为三位有效数字。( ) 7.蒸馏水中带有少量影响测定结果的杂质,实验中引进了随机误差。( ) 8.精密度只检验平行测定值之间的符合程度,和真值无关。( ) 9.分析者个人操作误差可用对照试验进行校正。( ) 10.在定量分析中,测量的精密度越好,准确度越高。( ) 11.用感量为万分之一的分析天平称样0.4000克,称量的相对误差大于0.2%。( ) 12.p K a=4.76为两位有效数字。( ) 13.因为pH=7.00,所以[H+]=1.00?10-7mol/L。( ) 14.用G检验法取舍离群值(可疑值)时,当计算G值大于查表G值时,离群值应保留。( ) 15.用感量为万分之一的分析天平称样0.1000克,称量的相对误差小于0.1%。( ) 16.精密度高的分析结果,其准确度不一定高。( ) 17.系统误差的特征之一是具有随机性。( ) 18.无限次测量的随机误差服从正态分布规律。( ) 19.偏差愈小,测定值的准确度愈高。( ) 20.使用的玻璃仪器洗不干净而引入杂质,使测量产生仪器误差。( ) 21.在无被测成分存在的条件下,按所使用的方法和步骤进行的实验称为空白实验。( ) 22.滴定分析中,精密度是准确度的先决条件。( ) 23.用蒸馏水代替试液,按所使用的方法和步骤进行的试验称为对照试验。( ) 24.理论上,被测成分的真实值是无法确定的。( ) 25.pH=8.52,则[H+]的有效数字为三位。( ) 26.用万分之一的天平进行减量法称量0.05g、0.2g物体时,引起的相对误差相同。( ) 27.溶解试样的蒸馏水含有杂质会引入随机误差。( ) 28.减小随机误差的方法可用标准方法进行对照试验求校正系数校正。( ) 29.系统误差,重复测定重复出现,并可以用某些方法检验出来。( ) 30.所有的系统误差通常都可用对照试验来校正。( ) 31.读数时,最后一位数字估计不够准确所引起的误差属于操作误差。( ) 32.蒸馏水中带有少量影响测定结果的杂质,使实验中引进了试剂误差。( ) 33.当溶液的pH=7.00时,其[H+]=1.0×10-7mol·L-1。( ) 二、选择题: 34.一组测量结果的精密度最好用( )表示。 A、绝对偏差 B、相对误差 C、相对平均偏差 D、相对标准偏差 35.算式 000 .1 ) 80 . 24 00 . 25 ( 1010 .0- 的结果应报出有效数字( )位。 A、五 B、三 C、四 D、两

数据分析与处理答案

数据分析与处理答案 Prepared on 24 November 2020

一、简答题(5×2分, 共10分) 1、请解释质量控制图中三条主要控制线的意义:CL 、UCL 、LCL 未学,不考 2、请解释正交设计表“L 934” 这个符号所指代的意义。如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L 1645,L 3249 L: 正交; 9:9行或9次实验; 3:3个水平 ; 4:4列或4个因素 选L 3249 二、计算题(90分) 1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s 法、Dixon 法和Grubbs 检验法判断是否为离群值。(,4=, ,5=)(12分) x =, s=, 3s 法:∣ 应保留 Dixon :70.6360.08 0.89671.8560.08 Q -= =-> ,5=, 应舍去 Grubbs: G 计= 60.0868.455/5.61-=> ,4,应舍去· ·· 2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)(8分) ( 2.353%903,10.0=?=t P , 3.182%9530.05=?=,t P , 5.841%9930.01=?=,t P ) x =%, s=% 3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数 据:、、、、、、、。标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=)(10分)

x = 34.3034.33 1.770.048 t -==< ,7,所以新方法可靠 4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为L ,加入浓度为1000mg/L 的标准样品后,测得样品总浓度为L ,求回收率是多少。(8分) 没讲,不考 5、两分析人员测定某试样中铁的含量,得到如下结果: 已知A 的标准偏差s 1=,B 的标准偏差s 2=,请比较两个人测定结果的精密度和准确的有无显着性差异。(12分) F (,4,4)=, t (,8)= F==< F (,4,4),故精密度无显着性差异 t=< t (,8),故准确度无显着性差异 5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响,实验因素水平表如下表。 请完成下列正交表格,并指出各因素的主次顺序,求出最优水平组合,并做方差分析,填方差分析表,并对实验结果做出讨论(可结合因素指标变化图)。(25分)

数据分析练习题(解答)

E X 1-0 设来自样本观测值如下表: T EX1-1 某小学10名11岁学生的身高(单位:cm)数据如下: (1) 计算均值、方差、标准差、变异系数、偏度、峰度; (2) 计算中位数、上、下四分位数、四分位极差、三均数; (3) 作出直方图(范围130~145,a i-1≤x

数据分析练习题

数据分析练习题 第 小组 姓名: 练习一: 1、老师在计算学期总平均分的时候按如下标准:作业占100%、测验占30%、期中占35%、期末考试占35% x 小关 = . x 小兵 = . 2、结果如下表:(单位:小时) 求这些灯泡的平均使用寿命? . x = .小时 3、在一个样本中,2出现了x 1次,3出现了x 2次,4出现了x 3次,5出现了x 4次,则这个样本的平均数为 . 4、某人打靶,有a 次打中x 环,b 次打中y 环,则这个人平均每次中靶 环。 5、某校为了了解学生作课外作业所用时间的情况,对学生作课外作业所用时间进行调查,下表是该校初二某班50名学生某一天做数学课外作业所用时间的情况统计表 (1)、第二组数据的组中值是多少? (2)、求该班学生平均每天做数学作业所用时间 答:(1)组中值为: . (2)解: 6、某公司有15名员工,他们所在的部门及相应每人所创的年利润如下表该公司每人所创年利润的平均数是多少万元?

7、为调查居民生活环境质量,环保局对所辖的50个居民区进行了噪音(单位:分贝)水平的调查,结果如下图,求每个小区噪音的平均分贝数。 8、某公司销售部有营销人员15人,销售部为了制定某种商品的销售金额,统计了这15个人的销售量如下(单位:件) 1800、510、250、250、210、250、210、210、150、210、150、120、120、210、150 求这15个销售员该月销量的中位数和众数。 假设销售部负责人把每位营销员的月销售定额定为320件,你认为合理吗?如果不合理,请你制定一个合理的销售定额并说明理由。 练习二: 1. 数据8、9、9、8、10、8、99、8、10、7、9、9、8的中位数是 ,众数是 2. 一组数据23、27、20、18、X 、12,它的中位数是21,则X 的值是 . 3. 数据92、96、98、100、X 的众数是96,则其中位数和平均数分别是( ) A.97、96 B.96、96.4 C.96、97 D.98、97 4. 如果在一组数据中,23、25、28、22出现的次数依次为2、5、3、4次,并且没有其他的数据, 则这组数据的众数和中位数分别是( ) A.24、25 B.23、24 C.25、25 D.23、25 请你根据上述数据回答问题: (1).该组数据的中位数是什么? (2).若当气温在18℃~25℃为市民“满意温度”,则我市一年中达到市民“满意温度”的大约有多少天? 60 噪音/分贝 80 70 50 40 90

人民卫生出版社第七版-误差与数据分析处理习题答案

第二章 1.属于方法误差的有:④⑦⑩;仪器误差:①②③⑨;操作误差:⑥;偶然误差:⑧; 试剂误差:⑤ 5. ① 4 2.52 4.1015.14 6.1610 ???=2.54×10-3 此题中2.52的相对误差最大,因此计算结果应修约为三位有效数字。 ② 61090.20001120 .0325 0001120.010.514.2101.3?==?? 有效位数保留原理同上。 ③ 4 51.0 4.0310 4.022.5120.002034=-??? ④ 2 0.03248.1 2.121053.01.050 =??? 此题中8.1的相对误差最大,以8.1的有效数字作为修约标准,又因为8.1的第一个有效数字为8,其相对误差的大小和三位有效数字的相对误差近似,因此可认为8.1的有效数字为三位有效数字,结果保留三位有效数字。 ⑤ 32.2856 2.51 5.42 1.89407.5010 5.738 5.420.0142 3.5462 3.546211.14 3.1413.546 -?+-??+-= == ⑥pH=2.10,求[H +]=? 由于pH 值为对数值,所以2.10的有效数字为两位有效数字,故 [H +]=7.9×10-3mol.L -1 6. 解:根据n i=1 d=-∑i x x n 和准偏差, ①第一组1d 0.24=1,S =0.28,第二组的2d 0.24=2,S =0.31。 ②两组数据的平均偏差相等但标准偏差不相等,这是因为标准偏差可以反映出数据中较大

偏差对测定结果重复性的影响。 ③由于第一组的标准偏差较小,因此这组数据的精密度更高。 7.测定碳的原子量所得数据:12.0080、12.0095、12.0099、12.0101、12.0102、12.0106、12.0111、12.0113、12.0118及12.0120。求算:(1)平均值;(2)标准偏差;(3)平均值的标准偏差;(4)平均值在99%置信水平的置信限。 解 0104.1210 12.012012.011812.011312.011112.010612.010212.010112.00992.0095112.0080=+++++++++= X (3) (4) 置信限为: 0012 .010 0012.0250.3250 .3,9,01.0,=? ===n S t t t f f αα 8. 13 .05 11 .001.0 20.014.011.005.051 .1640 .152.171.137.162.146.12 2 2 2 2 2 =+++++= =+++++=S X 7.1613 .051 .160.1=?-= t 查表得t 0.05,5=2.571 t 计<t 0.05,5 故无显著性差异。 9.解(1)计算统计量 HPLC 法:n 1=6, 1X =98.3%, s 1=1.10 化学法:n 2=5, 2X =97.5%, s 2=0.540

定量分析的误差和分析结果的数据处理习题

第五章 定量分析的误差和分析结果的数据处理习题 1.是非判断题 1-1将、、和处理成四位有效数字时,则分别为、、和。 1-2 pH=的有效数字是四位。 1-3 [HgI 4]2-的lg 4θβ=,其标准积累稳定常数4θβ为×1030 。 1-4在分析数据中,所有的“0”均为有效数字。 1-5有效数字能反映仪器的精度和测定的准确度。 1-6欲配制·L -1K 2Cr 2O 7(M=·mol -1 )溶液,所用分析天平的准确度为+,若相对误差要求为 ±%,则称取K 2Cr 2O 7时称准至。 1-7从误差的基本性质来分可以分为系统误差,偶然误差和过失误差三大类。 1-8误差的表示方法有两种,一种是准确度与误差,一种是精密度与偏差。 1-9相对误差小,即表示分析结果的准确度高。 1-10偏差是指测定值与真实值之差。 1-11精密度是指在相同条件下,多次测定值间相互接近的程度。 1-12系统误差影响测定结果的准确度。 1-13测量值的标准偏差越小,其准确度越高。 1-14精密度高不等于准确度好,这是由于可能存在系统误差。控制了偶然误差,测定的 精密度才会有保证,但同时还需要校正系统误差,才能使测定既精密又准确。 1-15随机误差影响到测定结果的精密度。 1-16对某试样进行三次平行测定,得平均含量%,而真实含量为%,则其相对误差为%。 1-17随机误差具有单向性。 1-18某学生根据置信度为95%对其分析结果进行处理后,写出报告结果为+%,该报告的结 果是合理的。 1-19置信区间是指测量值在一定范围的可能性大小,通常用百分数表示。 1-20在滴定分析时,错误判断两个样液滴定终点时指示剂的颜色的深浅属于工作过失。 2.选择题. 2-1下列计算式的计算结果(x)应取几位有效数字:x=[×× A.一位 B.二位 C.三位 D.四位

统计分析练习题

《统计分析在Excel 中的实现》练习题 1.Excel 中提供了常用的内置函数包括__________、__________、__________等。 2. 在Excel 中制作问卷,可使用________令用户选择的结果自动填入指定位置的单元格。 3. 饼图可以展示________个数据序列。 4. _________可以用于表明针对某个社会现象的观测值在一定时间、地点条件下达到的一般水平,概括总体的数量特征。 5. 抽样方法有__________、_______________两大类。 6. 根据显著性水平得到相应的检验统计量的数值称为_________。 7. 用来衡量因素在不同水平下不同样本之间的误差叫做 _________。 8 回归分析的内容主要包括确定自变量和因变量、 _________________、_____________和预测与估计。 9 . 同一现象在不同时间的相继观测值排列而成的序列称为 __________。一.填空题: 二、选择题 1. 以下关于Excel 数据处理与分析的描述,说法不正确的是( )。 A.Excel 不仅可以利用公式进行简单的代数运算,还可以用于复杂的数学模型的分析 B. 存放在记事本中的数据,无论是否有结构,可以一次性导入为Excel 数据表

C.Excel 可以通过手动、公式生成和复制生成的方式输入数据 D.Excel 绘图功能可以根据选定的统计数据绘制统计图 2. 为了调查某学校学生的上网时间,从一年级中抽取80名学生调查,从二年级学生中抽取50名学生调查,这种调查方法是( )。 A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3. 以下关于Excel 制图的描述不正确的是( )。 A.Excel 中可以制作曲面图、面积图、气泡图等多种类型图表 B. 制作图表时,往往需要对原始数据进行调整,以符合Excel 制图对数据摆放的要求 1 C. 股价图只可以用于金融股市数据的显示,无法显示其他类型数据 D. 以上都正确 4. 反映数据分布离中趋势最主要的指标值是( ) 。 A. 全距 B. 方差 C. 标准差 D. 离散系数 5. 估计量是指( ) 。 A. 用来估计总体参数的统计量名称 B. 用来估计总体参数的统计量的具体数值 C. 总体参数的名称 D. 总体参数的具体数值 6. 假设检验是检验下列哪个假设值的成立情况的?() A. 样本指标 B. 总体指标 C. 样本方差 D. 样本平均数 7. 方差分析的目的是判断()。

第2章 数据分析(梅长林)习题题答案

第2章 习 题 一、习题 (1)回归模型 15,2,1,22110 =+++=i x x y i i i i εβββ 调用proc reg : ] 由此输出得到的回归方程为: 2100920.049600.045261.3X X y ++=∧ 由最后一列可以看出,使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显著影响。46521.30=∧ β可以理解为该化妆品作为一种必需品每个月的销售量。当购买该化妆品的人数固定时,月收入没增加一个一个单位,改化妆品的销售数量将增加个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加个单位。 p n SSE -= ∧2 σ 是2σ的无偏估计,所以2σ的估计值是. (2)调用 由此可到线性回归关系显著性检验: 0至少有一个为0:2,1:1210ββββH H ?==

的统计量/(1)/()SSR p MSR F SSE n p MSE -= =-的观测值47.56790=F ,检验的p 值 0001.0)(000<>==F F p p H 另外9989.053902 53845 2=== SST SSR R ,2R 描述了由自由变量的线性关系函数值所能反映的Y 的总变化量的比例。2R 越大,表明线性关系越明显。这些结果均表明Y 与X1,X2之间的回归关系高度显著。 (3)若置信水平05.0=α,由17881.2)12(975.0=t ,利用参数估计值得 到21,0,βββ的置信区间分别为: 对,0β2942.54516.343065.21781.245216.3±=?±,即)7458.8,8426.1(-) 对1β:01318.049600.000605.01781.249600.0±=?±,即)50198.0,48282.0( ) 2β:0021 .000920.00009681.01781.200920.0±=?±,即)00113.0,0071.0(- (4)首先检验X1对Y 是否有显著性影: 假设其约简模型为:15,2, 1,220 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 88137.484)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f 由[()()]() ()/R F F SSE R SSE F f f F SSE F f --= 求得检验统计量的值为: 3 .9012/88357.5688357 .5688137.4840=-= F 05.0))13,1(()(0000<>==>==F F P F F p p H 由此拒绝原假设,所以x2对Y 有显著影响。 ~ 同理检验X2对Y 是否有显著性影: 假设其约简模型为:15,2, 1,110 =++=i x y i i i εββ 由观测数据并利用proc reg 过程拟合此模型求得: 31872)(=R SSE 13215=-=R f 88357.56)(=F SSE 12315=-=R f 由[()()]() ()/R F F SSE R SSE F f f F SSE F f --= 求得检验统计量的值为: 12/88357.5688357.56318720-= F 05.0))13,1(()(0000<>==>==F F P F F p p H 由此拒绝原假设,所以x2对Y 有显著影响。

误差和分析数据处理习题

第二章误差和分析数据处理习题 一、最佳选择题 1. 如果要求分析结果达到0.1%的准确度,使用灵敏度为0.1mg的天平称取试样时,至少应称取() A. 0.1g B. 0.2g C. 0.05g D. 0.5g 2. 定量分析结果的标准偏差代表的是()。 A. 分析结果的准确度 B. 分析结果的精密度和准确度 C. 分析结果的精密度 D. 平均值的绝对误差 3. 对某试样进行平行三次测定,得出某组分的平均含量为30.6% ,而真实含量为30.3% ,则30.6%-30.3%=0.3% 为() A. 相对误差 B. 绝对误差 C. 相对偏差 D. 绝对偏差 4. 下列论述正确的是:() A. 准确度高,一定需要精密度好; B. 进行分析时,过失误差是不可避免的; C. 精密度高,准确度一定高; D. 精密度高,系统误差一定小; 5. 下面哪一种方法不属于减小系统误差的方法() A. 做对照实验 B. 校正仪器 C. 做空白实验 D. 增加平行测定次数 6. 下列表述中,最能说明系统误差小的是( ) A. 高精密度 B. 与已知的质量分数的试样多次分析结果的平均值一致 C. 标准差大 D. 仔细校正所用砝码和容量仪器等 7. 用下列何种方法可减免分析测定中的系统误差() A. 进行仪器校正 B. 增加测定次数 C. 认真细心操作 D. 测定时保证环境的湿度一致 8. 下列有关偶然误差的论述中不正确的是() A.偶然误差是由一些不确定的偶然因素造成的; B.偶然误差出现正误差和负误差的机会均等; C.偶然误差在分析中是不可避免的; D.偶然误差具有单向性

9. 滴定分析中出现下列情况,属于系统误差的是:() A. 滴定时有溶液溅出 B. 读取滴定管读数时,最后一位估测不准 C. 试剂中含少量待测离子 D. 砝码读错 10. 某一称量结果为0.0100mg, 其有效数字为几位?() A . 1 位 B. 2 位 C. 3 位 D. 4 位 11. 测的某种新合成的有机酸pK a值为12.35,其K a值应表示为() A. 4.467×10 -13; B. 4.47×10 -13; C.4.5×10 -13; D. 4×10 -13 12. 指出下列表述中错误的表述( A ) A. 置信水平愈高,测定的可靠性愈高 B. 置信水平愈高,置信区间愈宽 C. 置信区间的大小与测定次数的平方根成反比 D. 置信区间的位置取决于测定的平均值 13. 下列有关置信区间的描述中,正确的有:( A ) A. 在一定置信度时,以测量值的平均值为中心的包括真值的范围即为置信区间 B. 真值落在某一可靠区间的几率即为置信区间 C. 其他条件不变时,给定的置信度越高,平均值的置信区间越宽 D. 平均值的数值越大,置信置信区间越宽 14. 分析测定中,使用校正的方法,可消除的误差是( )。 A. 系统误差 B. 偶然误差 C. 过失误差 D. 随即误差 15. 关于t分布曲线和正态分布曲线形状的叙述,正确的是:( ) A. 形状完全相同,无差异; B. t分布曲线随f而变化,正态分布曲线随u而变; C. 两者相似,而t分布曲线随f而改变; D. 两者相似,都随f而改变。 16. ) 457 .2 1. 17 /( ) 25751 .0 83 .2 5. 472 (+ ? ? = y的计算结果应取有效数字的位数是( ) A. 3位 B. 4位 C. 5位 D. 6位 17. 以下情况产生的误差属于系统误差的是( )。 A. 指示剂变色点与化学计量点不一致; B. 滴定管读数最后一位估测不准; C. 称样时砝码数值记错; D. 称量过程中天平零点稍有变动。 18. 下列数据中有效数字不是四位的是( )。 A. 0.2400 B. 0.0024 C. 2.004 D. 20.40 19. 在定量分析中,精密度与准确度之间的关系是( )。

第三章 误差和分析数据的处理作业及答案(1)

第三章 误差和分析数据的处理 作业及答案 一、选择题(每题只有1个正确答案) 1. 用加热挥发法测定BaCl 2·2H 2O 中结晶水的质量分数时,使用万分之一的分析天平称样0.5000g ,问测定结果应以几位有效数字报出?( D ) [ D ] A. 一位 B. 二位 C .三位 D. 四位 2. 按照有效数字修约规则25.4507保留三位有效数字应为( B )。 [ B ] A. 25.4 B. 25.5 C. 25.0 D. 25.6 3. 在定量分析中,精密度与准确度之间的关系是( C )。 [ C ] A. 精密度高,准确度必然高 B. 准确度高,精密度不一定高 C. 精密度是保证准确度的前提 D. 准确度是保证精密度的前提 4. 以下关于随机误差的叙述正确的是( B )。 [ B ] A. 大小误差出现的概率相等 B. 正负误差出现的概率相等 C. 正误差出现的概率大于负误差 D. 负误差出现的概率大于正误差 5. 可用下列何种方法减免分析测试中的随机误差( D )。 [ D ] A. 对照实验 B. 空白实验 C. 仪器校正 D. 增加平行实验的次数 6. 在进行样品称量时,由于汽车经过天平室附近引起天平震动产生的误差属于( B )。 [ B ] A. 系统误差 B. 随机误差 C. 过失误差 D. 操作误差 7. 下列表述中,最能说明随机误差小的是( A )。 [ A ] A. 高精密度 B. 与已知含量的试样多次分析结果的平均值一致 C. 标准偏差大 D. 仔细校正所用砝码和容量仪器 8. 对置信区间的正确理解是( B )。 [ B ] A. 一定置信度下以真值为中心包括测定平均值的区间 B. 一定置信度下以测定平均值为中心包括真值的范围 C. 真值落在某一可靠区间的概率 D. 一定置信度下以真值为中心的可靠范围 9. 有一组测定数据,其总体标准偏差σ未知,要检验得到这组分析数据的分析方法是否准确可靠,应该用( C )。 [ C ] A. Q 检验法 B. G(格鲁布斯)检验法 C. t 检验法 D. F 检验法 答:t 检验法用于测量平均值与标准值之间是否存在显著性差异的检验------准确度检验 F 检验法用于两组测量内部是否存在显著性差异的检验-----精密度检验 10 某组分的质量分数按下式计算:10 ???= m M V c w 样,若c =0.1020±0.0001,V=30.02±0.02, M=50.00±0.01,m =0.2020±0.0001,则对w 样的误差来说( A )。 [ A ] A. 由“c ”项引入的最大 B. 由“V ”项引入的最大

最新初中数学数据分析经典测试题附答案

最新初中数学数据分析经典测试题附答案 一、选择题 1.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是.() A.3,2 B.3,4 C.5,2 D.5,4 【答案】B 【解析】 试题分析:平均数为(a?2 + b?2 + c?2 )=(3×5-6)=3;原来的方差: ;新的方差: ,故选 B. 考点:平均数;方差. 2.已知一组数据a、b、c的平均数为5,方差为4,那么数据a+2、b+2、c+2的平均数和方差分别为() A.7,6 B.7,4 C.5,4 D.以上都不对 【答案】B 【解析】 【分析】 根据数据a,b,c的平均数为5可知a+b+c=5×3,据此可得出1 3 (-2+b-2+c-2)的值;再由 方差为4可得出数据a-2,b-2,c-2的方差. 【详解】 解:∵数据a,b,c的平均数为5,∴a+b+c=5×3=15, ∴1 3 (a-2+b-2+c-2)=3, ∴数据a-2,b-2,c-2的平均数是3;∵数据a,b,c的方差为4, ∴1 3 [(a-5)2+(b-5)2+(c-5)2]=4, ∴a-2,b-2,c-2的方差=1 3 [(a-2-3)2+(b-2-3)2+(c--2-3)2] = 1 3 [(a-5)2+(b-5)2+(c-5)2]=4, 故选B.【点睛】

本题考查了平均数、方差,熟练掌握平均数以及方差的计算公式是解题的关键. 3.对于一组统计数据:1,1,4,1,3,下列说法中错误的是() A.中位数是1 B.众数是1 C.平均数是1.5 D.方差是1.6 【答案】C 【解析】 【分析】 将数据从小到大排列,再根据中位数、众数、平均数及方差的定义依次计算可得答案.【详解】 解:将数据重新排列为:1、1、1、3、4, 则这组数据的中位数1,A选项正确; 众数是1,B选项正确; 平均数为11134 5 ++++ =2,C选项错误; 方差为1 5 ×[(1﹣2)2×3+(3﹣2)2+(4﹣2)2]=1.6,D选项正确; 故选:C. 【点睛】 本题主要考查中位数、众数、平均数及方差,解题的关键是掌握中位数、众数、平均数及方差的定义与计算公式. 4.2022年将在北京﹣﹣张家口举办冬季奥运会,很多学校为此开设了相关的课程,下表记录了某校4名同学短道速滑成绩的平均数x和方差S2,根据表中数据,要选一名成绩好又发挥稳定的运动员参加比赛,应选择() A.队员1 B.队员2 C.队员3 D.队员4 【答案】B 【解析】 【分析】 根据方差的意义先比较出4名同学短道速滑成绩的稳定性,再根据平均数的意义即可求出答案.

数据分析师常见的7道笔试题目及答案

数据分析师常见的7道笔试题目及答案 导读:探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。以下是由小编为您整理推荐的实用的应聘笔试题目和经验,欢迎参考阅读。 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map 进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP 中,找出那个频率最大的IP,即为所求。 或者如下阐述: 算法思想:分而治之+Hash 地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)24值,把海量IP 日志分别存储到1024个小文件中。这样,每个小文件最多包含4MB个IP地址; 3.对于每一个小文件,可以构建一个IP为key,出现次数为value的Hash map,同时记录当前出现次数最多的那个IP地址; 4.可以得到1024个小文件中的出现次数最多的IP,再依据常规的排序算法得到总体上出现次数最多的IP; 2、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 典型的Top K算法,还是在这篇文章里头有所阐述, 文中,给出的最终算法是: 第一步、先对这批海量数据预处理,在O(N)的时间内用Hash表完成统计(之前写成了排序,特此订正。July、第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。 即,借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比所以,我们最终的时间复杂度是:O(N) + N’*O(logK),(N为1000万,N’为300万)。ok,更多,详情,请参考原文。 或者:采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 方案:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000个小文件(记为x0,x1,…x4999)中。这样每个文件大概是200k左右。 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树 /hash_map等),并取出出现频率最大的100个词(可以用含 100 个结点的最小堆),并把100

数据分析经典测试题含答案解析

数据分析经典测试题含答案解析 一、选择题 1.某校九年级数学模拟测试中,六名学生的数学成绩如下表所示,下列关于这组数据描述正确的是() A.众数是110 B.方差是16 C.平均数是109.5 D.中位数是109 【答案】A 【解析】 【分析】 根据众数、中位数的概念求出众数和中位数,根据平均数和方差的计算公式求出平均数和方差. 【详解】 解:这组数据的众数是110,A正确; 1 6 x=×(110+106+109+111+108+110)=109,C错误; 21 S 6 = [(110﹣109)2+(106﹣109)2+(109﹣109)2+(111﹣109)2+(108﹣109)2+ (110﹣109)2]=8 3 ,B错误; 中位数是109.5,D错误; 故选A. 【点睛】 本题考查的是众数、平均数、方差、中位数,掌握它们的概念和计算公式是解题的关键. 2.一组数据2,x,6,3,3,5的众数是3和5,则这组数据的中位数是() A.3 B.4 C.5 D.6 【答案】B 【解析】 【分析】 由众数的定义求出x=5,再根据中位数的定义即可解答. 【详解】 解:∵数据2,x,3,3,5的众数是3和5, ∴x=5,

则数据为2、3、3、5、5、6,这组数据为35 2 =4. 故答案为B. 【点睛】 本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键. 3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是() A.平均数是6 B.中位数是6.5 C.众数是7 D.平均每周锻炼超过6小时的人数占该班人数的一半 【答案】A 【解析】 【分析】 根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否. 【详解】 A、平均数为1 50 ×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意; B、∵一共有50个数据, ∴按从小到大排列,第25,26个数据的平均值是中位数, ∴中位数是6.5,故此选项正确,不合题意; C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意; D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意; 故选A. 【点睛】 此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.

数据分析与处理答案

一、简答题(5×2分,共10分) 1、请解释质量控制图中三条主要控制线的意义:CL、UCL、LCL 未学,不考 2、请解释正交设计表“L934”这个符号所指代的意义。如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L1645,L3249 L: 正交;9:9行或9次实验;3:3个水平;4:4列或4个因素 选L3249 二、计算题(90分) 1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s法、Dixon法和 Grubbs检验法判断是否为离群值。(,4=,,5=)(12分) x=, s=, 3s法:∣应保留 Dixon : 70.6360.08 0.896 71.8560.08 Q - == - > ,5=, 应舍去 Grubbs: G计= 60.0868.455/5.61 -=> ,4,应舍去···2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)?

(8分) ( 2.353%903,10.0=?=t P , 3.182%9530.05=?=,t P , 5.841%9930.01=?=,t P ) x =%, s=% 1.135 3.1820.0238/ 1.1350.038μ=±?=± 3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数据:、、、、、、、。标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=) (10分) x = 34.3034.33 1.770.048 t -==< ,7,所以新方法可靠 4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为L ,加入浓度为1000mg/L 的标准样品后,测得样品总浓度为L ,求回收率是多少。(8分) 没讲,不考 5、两分析人员测定某试样中铁的含量,得到如下结果: 已知A 的标准偏差s 1=,B 的标准偏差s 2=,请比较两个人测定结果的精密度和准确的有无显着性差异。(12分) F (,4,4)=, t (,8)= F==< F (,4,4),故精密度无显着性差异 t=< t (,8),故准确度无显着性差异

相关文档
最新文档