数据分析作业

数据分析作业
数据分析作业

一、第4题方差分析

1.1 建立数据文件

由题意可知,在同一浓度和温度下各做两次实验,将每一次的实验结果看作一个样本量,共342=24

??个样本量。

(1) 在“变量视图”下,名称分别输入“factor1”、“factor1”、“result”,类型设为“数值”,小数均为“0”,标签分别为“浓度”、“温度”、“收率”,factor1的值“1=A1,2=A2,3=A3”,factor2的值“1=B1,2=B2,3=B3,4=B4”,对齐选择“居中”。

(2) 在“数据视图”下,根据表中数据输入对应的数据。

数据文件如图1所示,其中“factor1”表示浓度,“factor2”表示温度,“result”表示收率。三种不同浓度分别用1、2、3表示,四种不同温度分别用1、2、3、4表示。

图1.1 SPSS数据文件格式

1.2 基本思路

,利用单因素方差分析,对

(1) 设“浓度对收率的影响不显著”为零假设H

该假设进行判定。

,则可

(2) 设“它们间的交互作用对收率没有显著影响”分别依次为假设H

是否成立。

以通过多因素方差分析工具,利用得出的结果即能证明假设H

1.3 操作步骤

(1) 单因素的方差分析操作

①分析—比较均值—单因素;因变量列表:收率;因子:浓度;

②两两比较:选中“LSD”复选框,定义用LSD法进行多重比较检验;显著性水平:0.05,单击“继续”;

③选项:选中“方差齐次性检验”,单击“继续”;

④单击“确定”。

(2) 有交互作用的两因素方差分析操作

①分析—一般线性模型—单变量;因变量:收率;固定因子:温度、浓度;

②绘制。水平轴:factor1,选择浓度作为均值曲线的横坐标,单图:factor2,选择温度作为曲线的分组变量;单击添加—继续。

③选项。显示均值:factor1,定义估计因素1的均值;显著性水平:0.05;单击“继续”;

④单击“确定”。

1.4 结果分析

(1) “浓度对收率有无显著影响”结果分析

执行上述操作后,生成下表。

表1.1 方差齐性检验

表1中Levene统计量的取值为0.352,Sig.的值为0.708,大于0.05,所以认为各组的方差齐次。

表1.2 单因素方差分析

从表2可以看出,观测变量收率的总离差平方和为119.58;如果仅考虑浓度单因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,它们的方差分别为19.542、3.851,相除所得的F统计量的观测值为5.074,对应的概率P值为0.016,小于显著性水平0.05,则应拒绝原假设,认为不同浓度对收率产生了显著影响,它对收率的影响效应不全为0。

仪器分析作业参考答案

第二章 电化学分析法 6.计算[OH –] = 0.05 mol/L ,p(O2)=1.0×103 Pa 时,氧电极的电极电势,已知O2 +2H2O+4e= 4OH –,φθ=0.40 V 。 解:根据能斯特方程 ()ln (Re )RT a Ox nF a d θ??=+ 代入数据计算得?=0.438V 7. 试从有关电对的电极电势,如?θ(Sn2+/Sn )、?θ(Sn4+/Sn2+)及?θ(O2/H2O ),说明为什么常在SnCl2溶液加入少量纯锡粒以防止Sn2+被空气中的氧所氧化? 答:?θ值较大的电对中的氧化态物质能和?θ值较小的电对中的还原态物质反应。所以在SnCl2溶液加入少量纯锡粒以防止Sn2+被空气中的氧所氧化\ 11. 下述电池中溶液,pH = 9.18时,测得电动势为0.418 V ,若换一个未知溶液,测得电动势为0.312 V ,计算未知溶液的pH 值 玻璃电极)(H x s a a 或+饱和甘汞电极 答:根据pH 的实用定义公式:F /RT .E E 3032s x pHs pHx -+=, 代入数据得PH=7.39 12. 将ClO4-离子选择性电极插入50.00 mL 某高氯酸盐待测溶液,与饱和甘汞电极(为负极)组成电池,测得电动势为358.7 mV ;加入 1.00 mL 、0.0500 mol /L NaClO4标准溶液后,电动势变成346.1 mV 。求待测溶液中ClO4-浓度。 答:根据 /0.059(101)s s x n E x c V c V ±?=-,代入数据 Cx=1.50?10-3mol/L 第五章 气相色谱分析法 6.当下述参数改变时: (1)增大分配比,(2) 流动相速度增加, (3)减小相比, (4) 提高柱温,是否会使色谱峰变窄?为什么? 答:(1)保留时间延长,峰形变宽; (2)保留时间缩短,峰形变窄; (3)保留时间延长,峰形变宽; (4)保留时间缩短,峰形变窄。 11. 分析某种试样时,两个组分的相对保留值r21=1.11, 柱的有效塔板高度H=1mm ,需要多长的色谱柱才能完全分离? 解:根据公式 2121212111(()r r R r r --= 得L=3.67 m

实验设计与数据处理大作业及解答

《实验设计与数据处理》大作业 班级:姓名:学号: 1、用Excel(或Origin)做出下表数据带数据点的折线散点图 (1)分别做出加药量和剩余浊度、总氮TN、总磷TP、COD Cr的变化关系图(共四张图,要求它们的格式大小一致,并以两张图并列的形式排版到Word 中,注意调整图形的大小); (2)在一张图中做出加药量和浊度去除率、总氮TN去除率、总磷TP去除率、COD Cr去除率的变化关系折线散点图。 2、对离心泵性能进行测试的实验中,得到流量Q v、压头H和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式(要求作双Y轴图)。 流量Qv、压头H和效率η的关系数据 序号123456 Q v(m3/h) H/m 0.0 15.00 0.4 14.84 0.8 14.56 1.2 14.33 1.6 13.96 2.0 13.65 η0.00.0850.1560.2240.2770.333

序号789101112 Q v(m3/h) H/m η 2.4 13.28 0.385 2.8 12.81 0.416 3.2 12.45 0.446 3.6 11.98 0.468 4.0 11.30 0.469 4.4 10.53 0.431 3、用分光光度法测定水中染料活性艳红(X-3B)浓度,测得的工作曲线和样品溶液的数据如下表: (1)列出一元线性回归方程,求出相关系数,并绘制出工作曲线图。 (2)求出未知液(样品)的活性艳红(X-3B)浓度。 4、对某矿中的13个相邻矿点的某种伴生金属含量进行测定,得到如下一组数据: 试找出某伴生金属c与含量距离x之间的关系(要求有分析过程、计算表格以及回归图形)。 提示:⑴作实验点的散点图,分析c~x之间可能的函数关系,如对数函数y=a+blgx、双曲函数(1/y)=a+(b/x)或幂函数y=dx b等;⑵对各函数关系分别建立数学模型逐步讨论,即分别将非线性关系转化成线性模型进行回归分析,分析相关系数:如果R≦0.553,则建立的回归方程无意义,否则选取标准差SD最小(或R最大)的一种模型作为某伴生金属c与含量距离x之间经验公式。 5、测定了10个苯甲腈、苯乙腈衍生物对发光细菌的毒性影响,得到如下表所示的结果,试求回归方程。已知试验指标Y与X1、X2、X3间近似满足关系式:Y=a+b1X1+b2X2+b3X3+b12X1X2+b23X2X3,试求待定系数,并将回归结果输出。

数据分析作业

一、第4题方差分析 1.1 建立数据文件 由题意可知,在同一浓度和温度下各做两次实验,将每一次的实验结果看作一个样本量,共342=24 ??个样本量。 (1) 在“变量视图”下,名称分别输入“factor1”、“factor1”、“result”,类型设为“数值”,小数均为“0”,标签分别为“浓度”、“温度”、“收率”,factor1的值“1=A1,2=A2,3=A3”,factor2的值“1=B1,2=B2,3=B3,4=B4”,对齐选择“居中”。 (2) 在“数据视图”下,根据表中数据输入对应的数据。 数据文件如图1所示,其中“factor1”表示浓度,“factor2”表示温度,“result”表示收率。三种不同浓度分别用1、2、3表示,四种不同温度分别用1、2、3、4表示。 图1.1 SPSS数据文件格式 1.2 基本思路 ,利用单因素方差分析,对 (1) 设“浓度对收率的影响不显著”为零假设H 该假设进行判定。 ,则可 (2) 设“它们间的交互作用对收率没有显著影响”分别依次为假设H 是否成立。 以通过多因素方差分析工具,利用得出的结果即能证明假设H 1.3 操作步骤 (1) 单因素的方差分析操作 ①分析—比较均值—单因素;因变量列表:收率;因子:浓度; ②两两比较:选中“LSD”复选框,定义用LSD法进行多重比较检验;显著性水平:0.05,单击“继续”; ③选项:选中“方差齐次性检验”,单击“继续”; ④单击“确定”。 (2) 有交互作用的两因素方差分析操作

①分析—一般线性模型—单变量;因变量:收率;固定因子:温度、浓度; ②绘制。水平轴:factor1,选择浓度作为均值曲线的横坐标,单图:factor2,选择温度作为曲线的分组变量;单击添加—继续。 ③选项。显示均值:factor1,定义估计因素1的均值;显著性水平:0.05;单击“继续”; ④单击“确定”。 1.4 结果分析 (1) “浓度对收率有无显著影响”结果分析 执行上述操作后,生成下表。 表1.1 方差齐性检验 表1中Levene统计量的取值为0.352,Sig.的值为0.708,大于0.05,所以认为各组的方差齐次。 表1.2 单因素方差分析 从表2可以看出,观测变量收率的总离差平方和为119.58;如果仅考虑浓度单因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,它们的方差分别为19.542、3.851,相除所得的F统计量的观测值为5.074,对应的概率P值为0.016,小于显著性水平0.05,则应拒绝原假设,认为不同浓度对收率产生了显著影响,它对收率的影响效应不全为0。

定性数据分析第二章课后答案(供参考)

第二章课后作业 【第1题】 解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者 取500块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表1.1所示: 表1.1 理论上糖果的各颜色数 由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设: 原假设::0H 类i A 所占的比例为)6,...,1(0==i p p i i 其中i A 为对应的糖果颜色,)6,...,1(0=i p i 已知,16 10=∑=i i p 则2χ检验的计算过程如下表所示: 在这里6=r 。检验的p 值等于自由度为5的2χ变量大于等于18.0567的概率。在Excel 中输入“)5,0567.18(chidist =”,得出对应的p 值为05.00028762.0<<=p ,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。 【第2题】 解:由题可知 ,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客 选择这三种肉食的概率是相同的。所以我们可以进行以下假设:

原假设 )3,2,1(3 1 :0==i p H i 则2χ检验的计算过程如下表所示: 在这里3=r 。检验的p 值等于自由度为2的2χ变量大于等于15.72921的概率。在Excel 中输入“)2,72921.15(chidist =”,得出对应的p 值为 05.00003841.0<<=p ,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是 不相同的。 【第3题】 解:由题可知 ,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选 各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设: 原假设)10,...,2,1(1.0:0==i p H i 则2χ检验的计算过程如下表所示: 在这里10=r 。检验的p 值等于自由度为9的2χ变量大于等于5.125的概率。在Excel 中输入“)9,125.5(chidist =”,得出对应的p 值为05.0823278349.0>>=p ,

大数据结构大作业报告材料

数据结构课程设计课题名称 专业名称 学生姓名 学号+电话 指导教师

评分细则

目录 评分细则----------------------------------------------------------------------------------------------------------------- 2 一、课题描述 ---------------------------------------------------------------------------------------------------------- 4 二、需求分析 ---------------------------------------------------------------------------------------------------------- 4 2.1 ------------------------------------------------------------------------------------------------------------------ 4 2.2- ------------------------------------------------------------------------------------------------------------------4 2.3--------------------------------------------------------------------------------------------------------------------4 三、概要设计 ---------------------------------------------------------------------------------------------------------- 4 3.1 结构分析 ----------------------------------------------------------------------------------------------------------- 4 3.2函数------------------------------------------------------------------------------------------------------------ 4 3.2.1 malloc() --------------------------------------------------------------------------------------------- 4 3.2.2getchar() ----------------------------------------------------------------------------------------------------- 5 3.2.3 list_create() ------------------------------------------------------------------------------------------------ 5 3.2.4 list_disp() --------------------------------------------------------------------------------------------------- 5 3.2.5 list_sort() --------------------------------------------------------------------------------------------------- 5 四、详细设计 ---------------------------------------------------------------------------------------------------------- 5 4.1课题分析 ----------------------------------------------------------------------------------------------------- 5 4.1.1选择 ------------------------------------------------------------------------------------------------- 5 4.1.2冒泡 --------------------------------------------------------------------------------------------------------- 5 4.1.3 堆------------------------------------------------------------------------------------------------------------ 6 4.1.4 快速--------------------------------------------------------------------------------------------------------- 6 4.1.5 基数--------------------------------------------------------------------------------------------------6 4.1.6 希尔--------------------------------------------------------------------------------------------------------- 6 4.1.7 归并--------------------------------------------------------------------------------------------------6 4.2课题实现 ----------------------------------------------------------------------------------------------------- 7 五、测试数据及结果------------------------------------------------------------------------------------------------- 9 六、调试分析及总结----------------------------------------------------------------------------------------------- 10

数据分析spss作业

数据分析方法及软件应用 (作业) 题目:4、8、13、16题 指导教师: 学院:交通运输学院 姓名: 学号:

4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在α=0.05显著性水平下分析 (1)给出SPSS数据集的格式(列举前3个样本即可); (2)分析浓度对收率有无显著影响; (3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。 解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。 (2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。 步骤:【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,确定。 输出: 變異數分析 收率 平方和df 平均值平方 F 顯著性 群組之間39.083 2 19.542 5.074 .016 在群組內80.875 21 3.851 總計119.958 23 显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝原假设,认为浓度对收率有显著影响。

(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,H01:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。 步骤:【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。 输出: 主旨間效果檢定 因變數: 收率 來源第 III 類平方 和df 平均值平方 F 顯著性 修正的模型70.458a11 6.405 1.553 .230 截距2667.042 1 2667.042 646.556 .000 浓度39.083 2 19.542 4.737 .030 温度13.792 3 4.597 1.114 .382 浓度 * 温度17.583 6 2.931 .710 .648 錯誤49.500 12 4.125 總計2787.000 24 校正後總數119.958 23 a. R 平方 = .587(調整的 R 平方 = .209) 第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。 浓度:显著性<0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性>0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度: 显著性>0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。 8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,

北航数理统计第二次大作业-数据分析模板

数理统计第二次大作业材料行业股票的聚类分析与判别分析 2015年12月26日

材料行业股票的聚类分析与判别分析摘要

1 引言 2 数据采集及标准化处理 2.1 数据采集 本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。 表2.1 各变量的符号说明 自变量符号 每股收益(单位:元)X1 净资产收益率(单位:%)X2 每股经营现金流(单位:元)X3 主营业务收入同比增长率(单位:%)X4 净利润同比增长率(单位:%)X5 流通股本(单位:万股)X6 每股净资产(单位:元)X7 表2.2 30支股票的财务指标 股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856

杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030 2.2 数据的标准化处理 由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。 表2.2 经Z标准化后的数据 ZX1ZX2ZX3ZX4ZX5ZX6ZX7

数值分析作业思考题汇总

¥ 数值分析思考题1 1、讨论绝对误差(限)、相对误差(限)与有效数字之间的关系。 2、相对误差在什么情况下可以用下式代替 3、查阅何谓问题的“病态性”,并区分与“数值稳定性”的不同点。 4、取 ,计算 ,下列方法中哪种最好为什么(1)(3 3-,(2)(2 7-,(3) ()3 1 3+ ,(4) ()6 1 1 ,(5)99- , 数值实验 数值实验综述:线性代数方程组的解法是一切科学计算的基础与核心问题。求解方法大致可分为直接法和迭代法两大类。直接法——指在没有舍入误差的情况下经过有限次运算可求得方程组的精确解的方法,因此也称为精确法。当系数矩阵是方的、稠密的、无任何特殊结构的中小规模线性方程组时,Gauss消去法是目前最基本和常用的方法。如若系数矩阵具有某种特殊形式,则为了尽可能地减少计算量与存储量,需采用其他专门的方法来求解。 Gauss消去等同于矩阵的三角分解,但它存在潜在的不稳定性,故需要选主元素。对正定对称矩阵,采用平方根方法无需选主元。方程组的性态与方程组的条件数有关,对于病态的方程组必须采用特殊的方法进行求解。 数值计算方法上机题目1 1、实验1. 病态问题 实验目的: 算法有“优”与“劣”之分,问题也有“好”和“坏”之别。所谓坏问题就是问题本身的解对数据变化的比较敏感,反之属于好问题。希望读者通过本实验对此有一个初步的体会。 数值分析的大部分研究课题中,如线性代数方程组、矩阵特征值问题、非线性方程及方程组等都存在病态的问题。病态问题要通过研究和构造特殊的算法来解决,当然一般要付出一些代价(如耗用更多的机器时间、占用更多的存储空间等)。 $ r e x x e x x ** * ** - == 141 . ≈)61

数据分析经典测试题含答案解析

数据分析经典测试题含答案解析 一、选择题 1.某校九年级数学模拟测试中,六名学生的数学成绩如下表所示,下列关于这组数据描述正确的是() A.众数是110 B.方差是16 C.平均数是109.5 D.中位数是109 【答案】A 【解析】 【分析】 根据众数、中位数的概念求出众数和中位数,根据平均数和方差的计算公式求出平均数和方差. 【详解】 解:这组数据的众数是110,A正确; 1 6 x=×(110+106+109+111+108+110)=109,C错误; 21 S 6 = [(110﹣109)2+(106﹣109)2+(109﹣109)2+(111﹣109)2+(108﹣109)2+ (110﹣109)2]=8 3 ,B错误; 中位数是109.5,D错误; 故选A. 【点睛】 本题考查的是众数、平均数、方差、中位数,掌握它们的概念和计算公式是解题的关键. 2.一组数据2,x,6,3,3,5的众数是3和5,则这组数据的中位数是() A.3 B.4 C.5 D.6 【答案】B 【解析】 【分析】 由众数的定义求出x=5,再根据中位数的定义即可解答. 【详解】 解:∵数据2,x,3,3,5的众数是3和5, ∴x=5,

则数据为2、3、3、5、5、6,这组数据为35 2 =4. 故答案为B. 【点睛】 本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键. 3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是() A.平均数是6 B.中位数是6.5 C.众数是7 D.平均每周锻炼超过6小时的人数占该班人数的一半 【答案】A 【解析】 【分析】 根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否. 【详解】 A、平均数为1 50 ×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意; B、∵一共有50个数据, ∴按从小到大排列,第25,26个数据的平均值是中位数, ∴中位数是6.5,故此选项正确,不合题意; C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意; D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意; 故选A. 【点睛】 此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.

中南大学《仪器分析》网上(课程)作业二及参考答案

(一) 单选题 1. 在原子吸收光谱法的理论中,以谱线峰值吸收测量替代积分吸收测量的关键条件是 什么? () (A) 光源辐射的特征谱线与原子吸收谱线比较,中心频率一样,而半峰 宽要小得多; (B) 光源辐射的特征谱线与原子吸收谱线比较,中心频率和半峰宽均为 一样; (C) 光源辐射的特征谱线与原子吸收谱线比较,中心频率一样,而半峰 宽要较大; (D) 光源辐射的特征谱线与原子吸收谱线比较,只要中心频率一样,半 峰宽大小都没影响。 参考答案: (A) 2. 下列哪种方法不是原子吸收光谱分析法的定量方法: (A) 浓度 直读 (B) 保留时间 (C) 工作曲线法 (D) 标准加入法 参考答案: (B) 3. 在原子吸收光谱法中,目前常用的光源是哪种?其主要操作参数是什么? ( ) (A) 氙弧灯,内充气体的压力; (B) 氙弧灯,灯电流 (C) 空心阴极灯,内充气体的压力 (D) 空心阴极灯,灯电流

参考答案: (D) 4. 用AAS 法测定某溶液中Cd 的浓度,在适合的条件下,测得吸光度为0.141。取 50.00ml 此试液加入1.00ml 浓度为 的Cd 标准溶液,在同样条件 下,测得吸光度为0.259。而测得蒸馏水的吸光度为0.010。由此,求得试液中Cd 的浓度及 吸收灵敏度是:() (A) (B) (C) (D) 参考答案: (C) 5. 原子吸收光谱分析中,乙炔是 (A) 燃气-助 燃气 (B) 载气 (C) 燃气 (D) 助燃气 参考答案: (C) 6. 原子吸收谱线的宽度主要决定于() (A) 自然变宽 (B) 多普勒变宽和自然变宽 (C) 多普勒变宽和压力变宽 (D) 场致变宽 参考答案: (C) 7. 下原子吸收光谱分析仪的光源是

统计与数据分析数据分析作业

《统计与数据分析》 数据分析实验作业 数据来源于大肠杆菌Escherichia coli K-12 MG1655注释的4289个编码蛋白基因的长度l(单位:核苷酸,NT)及其GC含量r(%)。其中,第1列为基因序号,第2列为基因的长度l(单位:核苷酸,NT),第3列为基因的GC含量r(%)。试针对这一组数据完成下列数据分析工作: 一. 将全部4289个基因视为总体Y,请完成如下工作: 1. 严格按照要求(注意:软件自动生成的结果视为无效作业),分别画出基因长度l和基因GC含量r的频率直方图和箱线图,并对这两类数据的异常值进行分析; 2. 分别求出基因长度l和基因GC含量r的均值、标准差、极差、中位数、众数、变异系数,并在k≤10范围内依次、完整地检验Chebyshev定理; 3. 基于总体Y,考察l与GC含量r比值l/r,请设计抽样对l/r进行比值估计与单随机变量估计的抽样效率的比较分析,并以合适的图示表示比较结果; 4. 基于总体Y,根据中心极限定理构造一个基于GC含量r值的模拟总体数据X,并以合适的图示表示,要求总体X为经过显著性水平α=0.01下的K-S检验的标准正态分布,且X的个体数目也为4289,取值可表示为R。(提示:简单随机抽样的样本均值R近似服从正态分布,样本容量n自定。) 二. 基于服从标准正态分布的总体X,请完成如下工作: 1. 从中进行1次简单随机抽样(容量n=277),求出样本均值和样本标准差,并画出这一样本的频率直方图和箱线图;由此估计总体X的正态分布参数(方法不限,需写出具体求解过程),并分别采用自举法(Bootstrap)重复抽样1000次,分别确定该样本均值和该样本标准差是否处于90%的置信区间(以上下5%分位数来定义90%的置信区间),并以合适的图示表示自举法重复抽样1000次以及该置信区间的结果; 2. 进一步地,进行100次容量为n=61的简单随机抽样,分别画出样本均值、样本标准差的频率直方图,考察同样参数估计方法所估计参数的90%置信区间的情况,并以合适的图示表示(提示:(1)相关分布的分位数表可参考本课程讲义;(2)请参考本课程讲义的表示方式。)。 三. 对于总体Y,将全部4289个基因视为从某一总体中进行1次简单随机抽样的样本(容量n=4289),给定显著性水平为10%,试考察基因长度l与GC含量r是否相互独立。要求写出具体的分析过程。(提示:相关分布的分位数表可参考本课程讲义。) 要求: (1)本次数据分析以实验报告形式打印、装订提交,请在第一页注明学号、姓名; (2)请保证独立完成本作业,鼓励自行编程完成上述数据分析,也可使用相关软件(不限);(3)本作业占课程总成绩15%。

第四章 数据分析(梅长林)习题答案

第四章 习题 一、习题4.4 解:(1)通过SAS 的proc princomp 过程对相关系数矩阵R 做主成分分析,得到个主成分的贡献率以及累计贡献率如表1所 表 1 从表中可以得到特征值向量为: ]0.2429 0.4515 0.5396 0.8091 2.8567[=*λ 第一主成分贡献率为:57.13 % 第二主成分贡献率为:16.18 % 第三主成分贡献率为: 10.79% 第四主成分贡献率为:9.03 % 第五主成分贡献率为:6.86 % 进一步得到各主成分分析结果如表2所示: 表 2

(2)由(1)中得到的结果可知前两个主成分的累积贡献率为73.32%,得到第一主成分、第二主成分为: 54212.044215.034702.024571.014636.01x x x x x Y ++++=* 55820.045257.032604.025093.012404.02x x x x x Y ++---=* 由于1*Y 是五个标准化指标的加权和,由此第一主成分更能代表三种化工股票和两种石油股票周反弹率的综合作用效果,1*Y 越大表示各股票的综合周反弹率越大。* 2Y 中关于三种化工股票的周反弹率系数为 负,而关于两种石油的系数为正,它放映了两种石油周反弹率和三种化工股票周反弹率的对比,* 2Y 的绝对值越大, 表明两种石油周反弹率和三种化工股票周反弹率的差距越大。 二、习题4.5 解:(1)利用SAS 的proc corr 过程求得相关系数矩阵如表3: 表 3 (2)从相关系数矩阵出发,通过proc princomp 过程对其进行主成分分析,表4给出了各主成分的贡献率以及累积贡献率:

仪器分析习题答案

仪器分析习题答案 P28 2. 用双硫腙光度法测定Pb 2+。Pb 2+的浓度为 mg /50mL ,用2 cm 吸收池在520 nm 下测得T=53%,求ε。 解: 1 143 1078.11000 50 2.2071008.0253100lg ---???=?????==cm mol L A εε 4. 取钢试样 g ,溶解于酸中,将其中锰氧化成高锰酸盐,准确配制成250 mL ,测得其吸光度为131000.1--??L mol 4KMnO 溶液的吸光度的倍。计算钢中锰的百分含量。 解: 设高锰酸钾的浓度为x c ,得下列方程 % 06.2%1001 10002501024.8%1024.894.54105.1105.15.110121231 33=????=??=??=??==??=-------W L g W L mol c bc A b A Mn x x εε 7. 异丙叉丙酮有两种异构体:333)(CH CO CH CH C CH --=-及3232)(CH CO CH CH C CH ---=。它们的紫外吸收光谱为:(a )最大吸收波长 在235 nm 处,1112000--??mL mol L =ε;(b )220 nm 以后没有强吸收。如何根据这两个光谱来判断上述异构体试说明理由。 解:如果体系存在共轭体系,则其最大吸收波长的位置应比非共轭体系红移,并且其摩尔吸光系数较大,有强吸收,因此判断如果符合条件(1)的,就是CH 3-C (CH 3)=CH -CO -CH 3 9.其m ax λ的顺序为:(2)>(1)>(3) 因为(2)中存在共轭体系,而(1)(3)中只有双键没有共轭体系,但(1)中有两个双键,而(3)中只有一个。 P47 9. 以Mg 作为内标测定某合金中Pb 的含量,实验数据如下:

实验设计与数据处理分析大作业(正交试验)

枣果皮中酚类物质提取工艺优化及抗氧化活性分析 1.实验数据背景叙述。 一:实验关于枣果皮中酚类物质提取工艺优化及抗氧化活性分析。酚类物质是植物体内重要的次生代谢产物,主要通过莽草酸和丙二酸途径合成,广泛分布于植物界。许多的酚类物质具有营养保健功效。现代流行病学研究证明,经常食用富含酚类物质的果蔬能够预防由活性氧导致的相关疾病如癌症、糖尿病、肥胖症等的发生。 二:实验问题:为提高枣果皮中的酚类物质的提取效率,该文以马牙枣为试验材料,对枣果皮中酚类物质提取条件进行了优化。同时分析枣果皮提取物中酚类物质的抗氧化活性。 三:实验目的:要通过实验得到枣果皮中酚类物质提取的最优条件。并对提取物中酚类物质清除DPPH,2,2'-连氮基双(3-乙基苯并噻唑啉)-6-磺酸(ABTS)自由基及铁还原能力进行探讨,同时与合成抗氧化剂2,6-二叔丁基对甲酚(BHT)的抗氧化能力进行比较。 2. 实验数据处理方法选择及论述。 一:单因素试验(获得数据,将数据输入excel中,使用excel绘制图表,以便直观感受影响因素对实验的影响趋势。)

以冻干枣果皮为材料,分别以甲醇浓度、提取温度、提取料液比和提取时 间作为因素,分析不同的提取条件对枣果皮中酚类物质提取效果的影响,检测 指标为提取物中总酚含量。 二:正交试验(设计正交试验以便获得到枣果皮中酚类物质提取的最优条件, 用excel进行结果直观分析,见表2。) 以冻干枣果皮为材料,以提取溶剂浓度(A)、提取温度(B)、料液比(C)、和浸提时间(D)作4 因素3水平的L9(34)正交设计(见表1),检测指标为 提取物中总酚含量。 表1 枣果皮中酚类物质提取因素水平表 三:统计分析 所有提取试验均重复3 次,每次提取液的测定均重复3 次。结果表示为平 均值±标准偏差。应用excel软件对所有数据进行方差分析。 3. 实验数据的处理的过程叙述。 一:在单因素试验中,将每次试验结果输入excel中,选中表格,点击“插入”柱形图。

数据分析课后习题答案

数据分析第一次上机实验报告 班级:信计091 学号:200900901023 姓名:李骏 习题一 1.1 某小学60位学生(11岁)的身高(单位:cm)数据如下: (数据略) (1)计算均值、方差、标准差、变异系数、偏度、峰度; (2)计算中位数,上、下四分位数,四分位极差,三均值; (3)做出直方图; (4)做出茎叶图; 解:(1)使用软件计算得到 变异系数=标准差/均值=5.08% (2)部分答案在解(1) 四分位极差=Q3-Q1=144.75-135=9.75 三均值=0.25*Q1+0.5*M+0.25*Q3=139.4375 (3)使用软件画图得到

(4)使用软件画图得到 身高 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 Extremes (=<120) 1.00 12 . 3 5.00 12 . 67889 7.00 13 . 1122244 18.00 13 . 555677777888899999 13.00 14 . 0112222223344 13.00 14 . 5566677778999 2.00 15 . 01 Stem width: 10.00 Each leaf: 1 case(s)

1.8 对20名中年人测量6个指标,其中3个生理指标:体重(x1)、腰围(x2)、脉搏(x3);3个训练指标:引体向上(x4)、直坐次数(x5)、跳跃次数(x6)。数据如下表 (表格略) (1)计算协方差矩阵,Pearson相关矩阵; (2)计算Spearman相关矩阵; (3)分析各指标间的相关性。 解: (1)使用软件得到下表

仪器分析2-1习题答案

1?在以下因素中,属热力学因素的是A A. 分配系数; B.扩散速度; C.柱长;D ?理论塔板数。 2. 理论塔板数反映了D A. 分离度; B.分配系数; C ?保留值;D ?柱的效能。 3. 欲使色谱峰宽减小,可以采取B A ?降低柱温; B ?减少固定液含量; C ?增加柱长; D ?增加载体粒度。 4. 如果试样中各组分无法全部出峰或只要定量测定试样中某几个组分,那么应采用下列定量分析方法中哪一种为宜?C A ?归一化法; B ?外标法; C ?内标法; D ?标准工作曲线法。 5. 俄国植物学家茨维特在研究植物色素成分时,所采用的色谱方法是B A ?液-液色谱法; B ?液-固色谱法;C?空间排阻色谱法;D ?离子交换色 谱法。 A ?极性差异; B ?沸点差异;C.热力学性质差异;D ?动力学性质差异。 7. 假如一个溶质的分配比为0.1,它分配在色谱柱的流动相中的质量分数是C ;B. 0.90;C. 0.91;D. 0.99。 8. 下列因素中,对色谱分离效率最有影响的是A A .柱温; B .载气的种类;C.柱压;D .固定液膜厚度。 9. 当载气线速越小,范式方程中,分子扩散项B越大,所以应选下列气体中哪一 种作载气最有利?D A. H2; B. He; C. Ar; D. N2。 10. 对某一组分来说,在一定的柱长下,色谱峰的宽或窄主要决定于组分在色谱柱中的B A .保留值B.扩散速度C.分配比D.理论塔板数 11. 载体填充的均匀程度主要影响A A .涡流扩散相B.分子扩散C.气相传质阻力D.液相传质阻力 正确答案: 1: (A)、2: (D)、3: (B)、4: (C)、5: (B)

相关文档
最新文档