3.农村贫困家庭代际传递研究_基于CHNS数据的分析_林闽钢

3.农村贫困家庭代际传递研究_基于CHNS数据的分析_林闽钢
3.农村贫困家庭代际传递研究_基于CHNS数据的分析_林闽钢

大数据分析平台技术要求

大数据平台技术要求 1.技术构架需求 采用平台化策略,全面建立先进、安全、可靠、灵活、方便扩展、便于部署、操作简单、易于维护、互联互通、信息共享的软件。 技术构架的基本要求: ?采用多层体系结构,应用软件系统具有相对的独立性,不依赖任何特定的操作系统、特定的数据库系统、特定的中间件应用服务器和特定的硬 件环境,便于系统今后的在不同的系统平台、不同的硬件环境下安装、 部署、升级移植,保证系统具有一定的可伸缩性和可扩展性。 ?实现B(浏览器)/A(应用服务器)/D(数据库服务器)应用模式。 ?采用平台化和构件化技术,实现系统能够根据需要方便地进行扩展。2. 功能指标需求 2.1基础平台 本项目的基础平台包括:元数据管理平台、数据交换平台、应用支撑平台。按照SOA的体系架构,实现对我校数据资源中心的服务化、构件化、定制化管理。 2.1.1元数据管理平台 根据我校的业务需求,制定统一的技术元数据和业务元数据标准,覆盖多种来源统计数据采集、加工、清洗、加载、多维生成、分析利用、发布、归档等各个环节,建立相应的管理维护机制,梳理并加载各种元数据。 具体实施内容包括: ●根据业务特点,制定元数据标准,要满足元数据在口径、分类等方面的 历史变化。 ●支持对元数据的管理,包括:定义、添加、删除、查询和修改等操作,

支持对派生元数据的管理,如派生指标、代码重新组合等,对元数据管 理实行权限控制。 ●通过元数据,实现对各类业务数据的统一管理和利用,包括: ?基础数据管理:建立各类业务数据与元数据的映射关系,实现统一的 数据查询、处理、报表管理。 ?ETL:通过元数据获取ETL规则的描述信息,包括字段映射、数据转 换、数据转换、数据清洗、数据加载规则以及错误处理等。 ?数据仓库:利用元数据实现对数据仓库结构的描述,包括仓库模式、 视图、维、层次结构维度描述、多维查询的描述、立方体(CUBE)的 结构等。 ●元数据版本控制及追溯、操作日志管理。 2.1.2数据交换平台 结合元数据管理模块并完成二次开发,构建统一的数据交换平台。实现统计数据从一套表采集平台,通过数据抽取、清洗和转换等操作,最终加载到数据仓库中,完成整个数据交换过程的配置、管理和监控功能。 具体要求包括: ●支持多种数据格式的数据交换,如关系型数据库:MS-SQLServer、MYSQL、 Oracle、DB2等;文件格式:DBF、Excel、Txt、Cvs等。 ●支持数据交换规则的描述,包括字段映射、数据转换、数据转换、数据 清洗、数据加载规则以及错误处理等。 ●支持数据交换任务的发布与执行监控,如任务的执行计划制定、定期执 行、人工执行、结果反馈、异常监控。 ●支持增量抽取的处理方式,增量加载的处理方式; ●支持元数据的管理,能提供动态的影响分析,能与前端报表系统结合, 分析报表到业务系统的血缘分析关系; ●具有灵活的可编程性、模块化的设计能力,数据处理流程,客户自定义 脚本和函数等具备可重用性; ●支持断点续传及异常数据审核、回滚等交换机制。

数值分析试题及答案汇总

数值分析试题 一、 填空题(2 0×2′) 1. ?? ????-=? ?????-=32,1223X A 设x =是精确值x *=的近似值,则x 有 2 位 有效数字。 2. 若f (x )=x 7-x 3+1,则f [20,21,22,23,24,25,26,27]= 1 , f [20,21,22,23,24,25,26,27,28]= 0 。 3. 设,‖A ‖∞=___5 ____,‖X ‖∞=__ 3_____, ‖AX ‖∞≤_15_ __。 4. 非线性方程f (x )=0的迭代函数x =?(x )在有解区间满足 |?’(x )| <1 ,则使用该迭代 函数的迭代解法一定是局部收敛的。 5. 区间[a ,b ]上的三次样条插值函数S (x )在[a ,b ]上具有直到 2 阶的连续导数。 6. 当插值节点为等距分布时,若所求节点靠近首节点,应该选用等距节点下牛顿差商 公式的 前插公式 ,若所求节点靠近尾节点,应该选用等距节点下牛顿差商公式的 后插公式 ;如果要估计结果的舍入误差,应该选用插值公式中的 拉格朗日插值公式 。 7. 拉格朗日插值公式中f (x i )的系数a i (x )的特点是:=∑=n i i x a 0)( 1 ;所以当 系数a i (x )满足 a i (x )>1 ,计算时不会放大f (x i )的误差。 8. 要使 20的近似值的相对误差小于%,至少要取 4 位有效数字。 9. 对任意初始向量X (0)及任意向量g ,线性方程组的迭代公式x (k +1)=Bx (k )+g (k =0,1,…)收 敛于方程组的精确解x *的充分必要条件是 ?(B)<1 。 10. 由下列数据所确定的插值多项式的次数最高是 5 。 11. 牛顿下山法的下山条件为 |f(xn+1)|<|f(xn)| 。 12. 线性方程组的松弛迭代法是通过逐渐减少残差r i (i =0,1,…,n )来实现的,其中的残差 r i = (b i -a i1x 1-a i2x 2-…-a in x n )/a ii ,(i =0,1,…,n )。 13. 在非线性方程f (x )=0使用各种切线法迭代求解时,若在迭代区间存在唯一解,且f (x )

EXCEL数据处理题库题目

E X C E L数据处理题库题 目 The pony was revised in January 2021

Excel数据处理 ==================================================题号:15053 注意:下面出现的所有文件都必须保存在考生文件夹下。 提示:[答题]按钮只会自动打开题中任意一个文件。 在[D:\exam\考生文件夹\Excel数据处理\1]下, 找到文件或文件: 1. 在考生文件夹下打开文件, (1)将Sheet1工作表的A1:E1单元格合并为一个单元格,内容水平居中; (2)在E4单元格内计算所有考生的平均分数 (利用AVERAGE函数,数值型,保留小数点后1位), 在E5和E6单元格内计算笔试人数和上机人数(利用COUNTIF函数), 在E7和E8单元格内计算笔试的平均分数和上机的平均分数 (先利用SUMIF函数分别求总分数,数值型,保留小数点后1位); (3)将工作表命名为:分数统计表

(4)选取"准考证号"和"分数"两列单元格区域的内容建立 "带数据标记的折线图",数据系列产生在"列", 在图表上方插入图表标题为"分数统计图",图例位置靠左, 为X坐标轴和Y坐标轴添加次要网格线, 将图表插入到当前工作表(分数统计表)内。 (5)保存工作簿文件。 2. 打开工作簿文件, 对工作表"图书销售情况表"内数据清单的内容按主要关键字 "图书名称"的升序次序和次要关键字"单价"的降序次序进行排序,对排序后的数据进行分类汇总,汇总结果显示在数据下方, 计算各类图书的平均单价,保存文件。 题号:15059 注意:下面出现的所有文件都必须保存在考生文件夹下。 提示:[答题]按钮只会自动打开题中任意一个文件。 在[.\考生文件夹\Excel数据处理\1]下,找到文件或exc文件:

大数据分析平台的需求报告模板

大数据分析平台的需求报告 提供统一的数据导入工具,数据可视化工具、数据校验工具、数据导出工具和公共的数据查询接口服务管理工具是建立大数据分析平台的方向。 一、项目范围的界定 没有明确项目边界的项目是一个不可控的项目。基于大数据分析平台的需求,需要考虑的问题主要包括下面几个方面: (1)业务边界:有哪些业务系统的数据需要接入到大数据分析平台。 (2)数据边界:有哪些业务数据需要接入大数据分析平台,具体的包括哪些表,表结构如何,表间关系如何(区别于传统模式)。 (3)功能边界:提供哪些功能,不提供哪些功能,必须明确界定,该部分详见需求分析; 二、关键业务流程分析 业务流程主要考虑包括系统间数据交互的流程、传输模式和针对大数据平台本身涉及相关数据处理的流程两大部分。系统间的数据交互流程和模式,决定了大数据平台的架构和设计,因此必须进行专项分析。大数据平台本身需要考虑的问题包括以下几个方面: 2.1 历史数据导入流程 2.2 增量数据导入流程 2.3 数据完整性校验流程

2.4 数据批量导出流程 2.5 数据批量查询流程 三、功能性需求分析 3.1.历史数据导入3.1.1 XX系统数据3.1.1.1 数据清单 (3) 3.1.1.2 关联规则 (3) 3.1.1.3 界面 (3) 3.1.1.4 输入输出 (3) 3.1.1.5 处理逻辑 (3) 3.1.1.6 异常处理 (3) 3.2 增量数据导入3.3 数据校验 3.4 数据导出 3.5 数据查询 四、非功能性需求 4.1 性能

4.2 安全性 4.3 可用性 … 五、接口需求 5.1 数据查询接口 5.2 批量任务管理接口 5.3 数据导出接口 六、集群需求 大数据平台的技术特点,决定项目的实施必须考虑单独的开发环境和生产环境,否则在后续的项目实施过程中,必将面临测试不充分和性能无法测试的窘境,因此前期需求分析阶段,必须根据数据规模和性能需求,构建单独的开发环境和生产环境。 6.1开发环境 6.1.1 查询服务器 6.1.2 命名服务器 6.1.3 数据服务器 6.2 生产环境 6.2.1 查询服务器

数值分析试卷及答案

二 1 求A的LU分解,并利用分解结果求 解由紧凑格式 故 从而 故 2求证:非奇异矩阵不一定有LU分解 证明设非奇异,要说明A不一定能做LU分解,只需举出一个反例即可。现考虑矩阵,显然A为非奇异矩阵。若A有LU分解,则 故,而,显然不能同时成立。这矛盾说明A不能做LU分解,故只假定A非奇异并不能保证A能做LU分解,只有在A的前阶顺序主子式时才能保证A一定有LU分解。 3用追赶法求解如下的三对角方程组 解设有分解 由公式 其中分别是系数矩阵的主对角线元素及其下边和上边的次对角线元素,故有 从而有 故,,, 故,,, 4设A是任一阶对称正定矩阵,证明是一种向量范数 证明(1)因A正定对称,故当时,,而当时, (2)对任何实数,有 (3)因A正定,故有分解,则 故对任意向量和,总有 综上可知,是一种向量范数。 5 设,,已知方程组的精确解为 (1)计算条件数; (2)若近似解,计算剩余; (3)利用事后误差估计式计算不等式右端,并与不等式左边比较,此结果说明了什么?解(1) (2)

(3)由事后误差估计式,右端为 而左端 这表明当A为病态矩阵时,尽管剩余很小,误差估计仍然较大。因此,当A病态时,用大小作为检验解的准确度是不可靠的。 6矩阵第一行乘以一数成为,证明当时,有最小值 证明设,则 又 故 从而当时,即时,有最小值,且 7 讨论用雅可比法和高斯-赛德尔法解方程组时的收敛性。如果收敛,比较哪一种方法收敛较快,其中 解对雅可比方法,迭代矩阵 , 故雅可比法收敛。 对高斯-赛德尔法,迭代矩阵 ,故高斯-赛德尔法收敛。 因=故高斯-赛德尔法较雅可比法收敛快。 8设,求解方程组,求雅可比迭代法与高斯-赛德尔迭代法收敛的充要条件。 解雅可比法的迭代矩阵 , 故雅可比法收敛的充要条件是。 高斯-赛德尔法的迭代矩阵 , 故高斯-赛德尔法收敛的充要条件是。 9 设求解方程组的雅可比迭代格式为,其中,求证:若,则相应的高斯-赛德尔法收敛。证明由于是雅可比法的迭代矩阵,故 又,故, 即,故故系数矩阵A按行严格对角占优,从而高斯-赛德尔法收敛。 10设A为对称正定矩阵,考虑迭代格式 求证:(1)对任意初始向量,收敛; (2)收敛到的解。 证明(1)所给格式可化为 这里存在是因为,由A对称正定,,故也对称正定。 设迭代矩阵的特征值为,为相应的特征向量,则与做内积,有 因正定,故,从而,格式收敛。

数值分析试卷及其答案

1、(本题5分)试确定7 22 作为π的近似值具有几位有效数字,并确定其相对误差限。 解 因为 7 22 =3.142857…=1103142857 .0-? π=3.141592… 所以 312102 11021005.0001264.0722--?=?=<=- π (2分) 这里,3,21,0=-=+-=n n m m 由有效数字的定义可知7 22 作为π的近似值具有3位有效数字。 (1分) 而相对误差限 3102 1 0005.00004138.0001264.07 22-?= <≈= -= π π πε r (2分) 2、(本题6分)用改进平方根法解方程组:??? ?? ??=????? ??????? ??--654131*********x x x ; 解 设???? ? ??????? ? ?????? ??===????? ??--11111 1 131321112323121 32 132 31 21 l l l d d d l l l LDL A T 由矩阵乘法得: 5 7,21,215 27 ,25,2323121321- ==-== -==l l l d d d (3分) 由y D x L b Ly T 1 ,-==解得 T T x y )9 23 ,97,910(,)563, 7,4(== (3分) 3、(本题6分)给定线性方程组???????=++-=+-+=-+-=-+17 7222382311387 510432143213 21431x x x x x x x x x x x x x x 1)写出Jacoib 迭代格式和Gauss-Seidel 迭代格式; 2)考查Jacoib 迭代格式和Gauss-Seidel 迭代格式的敛散性; 解 1)Jacoib 迭代格式为

数据挖掘考试题库【最新】

一、填空题 1.Web挖掘可分为、和3大类。 2.数据仓库需要统一数据源,包括统一、统一、统一和统一数据特征 4个方面。 3.数据分割通常按时间、、、以及组合方法进行。 4.噪声数据处理的方法主要有、和。 5.数值归约的常用方法有、、、和对数模型等。 6.评价关联规则的2个主要指标是和。 7.多维数据集通常采用或雪花型架构,以表为中心,连接多个表。 8.决策树是用作为结点,用作为分支的树结构。 9.关联可分为简单关联、和。 10.B P神经网络的作用函数通常为区间的。 11.数据挖掘的过程主要包括确定业务对象、、、及知识同化等几个步 骤。 12.数据挖掘技术主要涉及、和3个技术领域。 13.数据挖掘的主要功能包括、、、、趋势分析、孤立点分析和偏 差分析7个方面。 14.人工神经网络具有和等特点,其结构模型包括、和自组织网络 3种。 15.数据仓库数据的4个基本特征是、、非易失、随时间变化。 16.数据仓库的数据通常划分为、、和等几个级别。 17.数据预处理的主要内容(方法)包括、、和数据归约等。 18.平滑分箱数据的方法主要有、和。 19.数据挖掘发现知识的类型主要有广义知识、、、和偏差型知识五种。 20.O LAP的数据组织方式主要有和两种。 21.常见的OLAP多维数据分析包括、、和旋转等操作。 22.传统的决策支持系统是以和驱动,而新决策支持系统则是以、建 立在和技术之上。 23.O LAP的数据组织方式主要有和2种。 24.S QL Server2000的OLAP组件叫,OLAP操作窗口叫。 25.B P神经网络由、以及一或多个结点组成。 26.遗传算法包括、、3个基本算子。 27.聚类分析的数据通常可分为区间标度变量、、、、序数型以及混合 类型等。 28.聚类分析中最常用的距离计算公式有、、等。 29.基于划分的聚类算法有和。

工程大数据分析平台

工程大数据分析平台 随着大数据时代来临、无人驾驶和车联网的快速发展,汽车研发部门需要处理的数据量激增、数据类型不断扩展。相关数据涵盖车内高频CAN 数据和车外ADAS 视频非结构化数据、位置地理空间数据、车辆运营数据、用户CRM 数据、WEB 数据、APP 数据、和MES 数据等。 在此背景下,整车厂研发部门关心的是:如何将企业内部的研发、实验、测试、生产数据,社会用户的用车数据,互联网第三方数据等结合起来,将异构数据和同构数据整合到一起,并在此基础上,实现业务系统、分析系统和服务系统的一体化;怎样利用深度的驾驶员行为感知、智能的车辆预防性维护、与实时的环境状态交互,通过大数据与机器学习技术,建立面向业务服务与产品持续优化的车联网智能分析;最终利用数据来为产品研发、生产、销售、售后提供精准的智能决策支撑。这些都是整车厂在大数据时代下亟待解决的问题。 针对这一需求,恒润科技探索出以EXCEEDDATA 大数据分析平台为核心的汽车工程大数据整体解决方案。借助EXCEEDDATA 大数据分析平台,企业可以集成、处理、分析、以及可视化海量级别的数据,可实现对原始数据的高效利用,并将原始数据转化成产品所需的智能,从而改进业务流程、实现智慧决策的产业升级。 产品介绍: ●先进的技术架构 EXCEEDDATA 采用分布式架构、包含集成处理(ETL)与分析挖掘两大产品功能体系,共支持超过20 多个企业常见传统数据库和大数据源系统,超过50 多个分析处理算法、以及超过丰富的可视化智能展现库。用户可以自主的、灵活的将各种来源的原始数据与分析处

理串联应用,建立科学的数据模型,得出预测结果并配以互动的可视化智能,快速高效的将大数据智能实现至业务应用中。 平台包括分布式大数据分析引擎、智能终端展示、以及API。大数据分析引擎为MPP 架构,建立在开源的Apache Hadoop 与Apache Spark 之上,可简易的scale-out 扩展。在分析引擎的基础上包含数据源库、数据转换匹配器、数据处理操作库、机器学习算法库、可视化图形库等子模块。智能终端展示为行业通用的B/S 架构,用户通过支持跨操作系统和浏览器的HTML5/JS 界面与API 来与平台互动。

数值分析试卷及答案

二 1求A的LU分解,并利用分解结果求 解由紧凑格式 故 从而 故 2求证:非奇异矩阵不一定有LU分解 证明设非奇异,要说明A不一定能做LU分解,只需举出一个反例即可。现考虑矩阵,显然A为非奇异矩阵。若A有LU分解,则 故,而,显然不能同时成立。这矛盾说明A不能做LU分解,故只假定A非奇异并不能保证A能做LU分解,只有在A的前阶顺序主子式 时才能保证A一定有LU分解。

3用追赶法求解如下的三对角方程组 解设有分解 由公式 其中分别是系数矩阵的主对角线元素及其下边和上边的次对角线元素,故有 从而有 故,,, 故,,,

4设A是任一阶对称正定矩阵,证明是一种向量范数 证明(1)因A正定对称,故当时,,而当时, (2)对任何实数,有 (3)因A正定,故有分解,则 故对任意向量和,总有 综上可知,是一种向量范数。 5 设,,已知方程组的精确解为 (1)计算条件数; (2)若近似解,计算剩余; (3)利用事后误差估计式计算不等式右端,并与不等式左边比较,此结果说明了什么?解(1) (2) (3)由事后误差估计式,右端为 而左端

这表明当A为病态矩阵时,尽管剩余很小,误差估计仍然较大。因此,当A病态时,用大小作为检验解的准确度是不可靠的。 6矩阵第一行乘以一数成为,证明当时,有最小值 证明设,则 又 故 从而当时,即时,有最小值,且 7讨论用雅可比法和高斯-赛德尔法解方程组时的收敛性。如果收敛,比较哪一种方 法收敛较快,其中 解对雅可比方法,迭代矩阵 , 故雅可比法收敛。 对高斯-赛德尔法,迭代矩阵

,故高斯-赛德尔法收敛。 因=故高斯-赛德尔法较雅可比法收敛快。 8设,求解方程组,求雅可比迭代法与高斯-赛德尔迭代法收敛的充要条件。 解雅可比法的迭代矩阵 , 故雅可比法收敛的充要条件是。 高斯-赛德尔法的迭代矩阵 ,

数值分析整理版试题及答案

数值分析整理版试题及答案

例1、 已知函数表 x -1 1 2 ()f x -3 0 4 求()f x 的Lagrange 二次插值多项式和Newton 二次插值多项式。 解: (1)k x -1 1 2 k y -3 0 4 插值基函数分别为 ()()()()()()()()()() 1200102121()1211126 x x x x x x l x x x x x x x ----= ==-------- ()()()()()()()() ()()021******* ()1211122x x x x x x l x x x x x x x --+-= ==-+---+- ()()()()()()()()()()0122021111 ()1121213 x x x x x x l x x x x x x x --+-= ==-+--+- 故所求二次拉格朗日插值多项式为 () ()()()()()()()()()()2 20 2()11131201241162314 121123537623k k k L x y l x x x x x x x x x x x x x ==?? =-? --+?-+-+?+-????=---++-=+-∑ (2)一阶均差、二阶均差分别为

[]()()[]()()[][][]010********* 011201202303 ,11204 ,412 3 4,,5 2,,126 f x f x f x x x x f x f x f x x x x f x x f x x f x x x x x ---===-----= = =----=== --- k x ()k f x 一阶 二阶 -1 -3 1 0 3/ 2 2 4 4 5/6 故所求Newton 二次插值多项式为 ()()[]()[]()() ()()()20010012012,,,35 311126537623P x f x f x x x x f x x x x x x x x x x x x =+-+--=-+ +++-=+- 例2、 设2 ()32f x x x =++,[0,1]x ∈,试求()f x 在[0, 1]上关于()1x ρ=,{} span 1,x Φ=的最佳平方逼近多项式。 解: 若{}span 1,x Φ=,则0()1x ?=,1()x x ?=,且()1x ρ=,这样,有

实验设计与数据处理试题库

一、名词解释:(20分) 1. 准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2. 重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部 就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4?总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5. 试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1. 资料常见的特征数有:(3空)算术平均数方差变异系数 2. 划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3. 方差分析的三个基本假定是(3空)可加性正态性同质性 4. 要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5. 减小难控误差的原则是(3空)设置重复随机排列局部控制 6. 在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式 阶梯式 7. 正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8. 在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2. 统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3. 变异系数的计算方法是(B) 4. 样本平均数分布的的方差分布等于(A) 5. t检验法最多可检验(C)个平均数间的差异显著性。 6. 对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7. 进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8. 进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9. 进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10. 自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1. 回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次 效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2. 一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3. 田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争 差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1. 研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy =60, l yy=300,r=0.6。根

数值分析试卷及其答案1

1. 已知325413.0,325413*2*1==X X 都有6位有效数字,求绝对误差限。(4分) 解: 由已知可知6 5.0102 1 ,0,6,10325413.0016*1=?= =-=?=ε绝对误差限n k k X 2分 620*2102 1 ,6,0,10325413.0-?= -=-=?=ε绝对误差限n k k X 2分 2. 已知?? ???=0 01 A 220- ?????440求21,,A A A ∞ (6分) 解: {}, 88,4,1max 1==A 1分 {}, 66,6,1max ==∞A 1分 () A A A T max 2λ= 1分 ?????=0 1 A A T 4 2 ???? ? -420?????0 01 2 20 - ???? ?440= ?????0 01 80 ???? ?3200 2分 {}32 32,8,1max )(max ==A A T λ

1分 24322==A 3. 设32)()(a x x f -= (6分) ① 写出f(x)=0解的迭代格式 ② 当a 为何值时,)(1k k x x ?=+ (0,1……)产生的序列{}k x 收敛于 2 解: ①迭代格式为: x a x x x a x a x x a x x x f x f x x k k k k k k k k k k 665)(665)(6)()(')(2 2 32 1 += +=---=-=+? 3 分 ②时迭代收敛即当222,112 10)2(',665)('2<<-<-=-= a a x a x ?? 3分 4. 给定线性方程组,其中:?? ?=13A ?? ?2 2,?? ? ???-=13b 用迭代公式 )()()()1(k k k Ax b x x -+=+α(0,1……)求解,问取什么实数α ,可使 迭代收敛 (8分) 解: 所给迭代公式的迭代矩阵为?? ? --???--=-=ααααα21231A I B 2分

实验设计与数据处理试题库

一、名词解释:(20分) 1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1.资料常见的特征数有:(3空)算术平均数方差变异系数 2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3.方差分析的三个基本假定是(3空)可加性正态性同质性 4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5.减小难控误差的原则是(3空)设置重复随机排列局部控制 6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式 7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2.统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3.变异系数的计算方法是(B) 4.样本平均数分布的的方差分布等于(A) 5.t检验法最多可检验(C)个平均数间的差异显著性。 6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3.田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1.研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy=60, l yy=300,r=0.6。根据所得数据建立直线回归方程。(5分)a=2 b=1.8 y=2+1.8 x 2.完成下列方差分析表,计算出用LSR法进行多重比较时各类数据填下表:

数值分析试卷及其答案2

1、(本题5分)试确定7 22作为π的近似值具有几位有效数字,并确定其相对误差限。 解 因为 7 22=3.142857…=1103142857.0-? π=3.141592… 所以 3 12 10 2 110 21005.0001264.07 22--?= ?= <=- π (2分) 这里,3,21,0=-=+-=n n m m 由有效数字的定义可知7 22作为π的近似值具有3位有效数字。 (1分) 而相对误差限 3 10 2 10005.00004138.0001264.07 22-?= <≈= -= π π πε r (2分) 2、(本题6分)用改进平方根法解方程组:???? ? ??=????? ??????? ??--654131321 112321x x x ; 解 设???? ? ? ?????? ? ?????? ??===????? ? ?--11 1 11113 1321 11232312132 1 32 31 21 l l l d d d l l l LDL A T 由矩阵乘法得: 5 7,21,21527,25,2323121321- == - == -==l l l d d d (3分) 由y D x L b Ly T 1 ,-==解得 T T x y )9 23,97,910( ,)5 63, 7,4(== (3分) 3、(本题6分)给定线性方程组??? ? ? ??=++-=+-+=-+-=-+17722238231138751043214321 321431x x x x x x x x x x x x x x 1)写出Jacoib 迭代格式和Gauss-Seidel 迭代格式; 2)考查Jacoib 迭代格式和Gauss-Seidel 迭代格式的敛散性; 解 1)Jacoib 迭代格式为

数值分析整理版试题及答案

例1、 已知函数表 求()f x 的Lagrange 二次插值多项式和Newton 二次插值多项式。 解: (1) 故所求二次拉格朗日插值多项式为 (2)一阶均差、二阶均差分别为 例2、 设2 ()32f x x x =++,[0,1]x ∈,试求()f x 在[0,1]上关于()1x ρ=,{}span 1,x Φ=的最佳平 方逼近多项式。 解: 若{}span 1,x Φ=,则0()1x ?=,1()x x ?=,且()1x ρ=,这样,有 所以,法方程为

011231261192 34a a ??????????=?????????? ?????????? ,经过消元得012311 62110123a a ??? ???????=???????????????????? 再回代解该方程,得到14a =,011 6 a = 故,所求最佳平方逼近多项式为* 111()46S x x =+ 例3、 设()x f x e =,[0,1]x ∈,试求()f x 在[0,1]上关于()1x ρ=,{}span 1,x Φ=的最佳平方逼近 多项式。 解: 若{}span 1,x Φ=,则0()1x ?=,1()x x ?=,这样,有 所以,法方程为 解法方程,得到00.8732a =,1 1.6902a =, 故,所求最佳平方逼近多项式为 例4、 用4n = 的复合梯形和复合辛普森公式计算积分1 ? 。 解: (1)用4n =的复合梯形公式 由于2h =,( )f x =()121,2,3k x k k =+=,所以,有 (2)用4n =的复合辛普森公式 由于2h =,( )f x =()121,2,3k x k k =+=,()12 220,1,2,3k x k k + =+=,所以,有 例5、 用列主元消去法求解下列线性方程组的解。 解:先消元 再回代,得到33x =,22x =,11x = 所以,线性方程组的解为11x =,22x =,33x = 例6、 用直接三角分解法求下列线性方程组的解。 解: 设 则由A LU =的对应元素相等,有 1114u = ,1215u =,1316u =, 2111211433l u l =?=,3111311 22 l u l =?=, 2112222211460l u u u +=?=-,2113232311 545l u u u +=?=-,

大数据技术及应用题库

大数据技术及应用题库单选题: 1 从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2 下列论据中,能够支撑“大数据无所不能”的观点的是( A )。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3 数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4 大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. . 处理速度快(秒级定律)

b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5 大数据的起源是( C )。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6 大数据不是要教机器像人一样思考。相反,它是( A )。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7 人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8 数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指 的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态 c. . 新一代技术平台 d. . 新一代信息技术和服务业态

大数据分析平台技术要求

大数据平台技术要求 1. 技术构架需求 采用平台化策略,全面建立先进、安全、可靠、灵活、方便扩展、便于部署、操作简单、易于维护、互联互通、信息共享的软件。 技术构架的基本要求: 采用多层体系结构,应用软件系统具有相对的独立性,不依赖任何特定的操作系统、特定的数据库系统、特定的中间件应用服务器和特定的硬 件环境,便于系统今后的在不同的系统平台、不同的硬件环境下安装、 部署、升级移植,保证系统具有一定的可伸缩性和可扩展性。 实现B(浏览器)/A(应用服务器)/D(数据库服务器)应用模式。 采用平台化和构件化技术,实现系统能够根据需要方便地进行扩展。2. 功能指标需求 2.1基础平台 本项目的基础平台包括:元数据管理平台、数据交换平台、应用支撑平台。按照SOA的体系架构,实现对我校数据资源中心的服务化、构件化、定制化管理。 2.1.1元数据管理平台 根据我校的业务需求,制定统一的技术元数据和业务元数据标准,覆盖多种来源统计数据采集、加工、清洗、加载、多维生成、分析利用、发布、归档等各个环节,建立相应的管理维护机制,梳理并加载各种元数据。 具体实施内容包括: ●根据业务特点,制定元数据标准,要满足元数据在口径、分类等方面的 历史变化。 ●支持对元数据的管理,包括:定义、添加、删除、查询和修改等操作,

支持对派生元数据的管理,如派生指标、代码重新组合等,对元数据管 理实行权限控制。 ●通过元数据,实现对各类业务数据的统一管理和利用,包括: ?基础数据管理:建立各类业务数据与元数据的映射关系,实现统一 的数据查询、处理、报表管理。 ?ETL:通过元数据获取ETL规则的描述信息,包括字段映射、数据转 换、数据转换、数据清洗、数据加载规则以及错误处理等。 ?数据仓库:利用元数据实现对数据仓库结构的描述,包括仓库模式、 视图、维、层次结构维度描述、多维查询的描述、立方体(CUBE) 的结构等。 ●元数据版本控制及追溯、操作日志管理。 2.1.2数据交换平台 结合元数据管理模块并完成二次开发,构建统一的数据交换平台。实现统计数据从一套表采集平台,通过数据抽取、清洗和转换等操作,最终加载到数据仓库中,完成整个数据交换过程的配置、管理和监控功能。 具体要求包括: ●支持多种数据格式的数据交换,如关系型数据库:MS-SQLServer、MYSQL、 Oracle、DB2等;文件格式:DBF、Excel、Txt、Cvs等。 ●支持数据交换规则的描述,包括字段映射、数据转换、数据转换、数据 清洗、数据加载规则以及错误处理等。 ●支持数据交换任务的发布与执行监控,如任务的执行计划制定、定期执 行、人工执行、结果反馈、异常监控。 ●支持增量抽取的处理方式,增量加载的处理方式; ●支持元数据的管理,能提供动态的影响分析,能与前端报表系统结合, 分析报表到业务系统的血缘分析关系; ●具有灵活的可编程性、模块化的设计能力,数据处理流程,客户自定义 脚本和函数等具备可重用性; ●支持断点续传及异常数据审核、回滚等交换机制。

数值分析试题及答案

一、单项选择题(每小题3分,共15分) 1. 3.142和3.141分别作为π的近似数具有( )和( )位有效数字. A .4和3 B .3和2 C .3和4 D .4和4 2. 已知求积公式 ()()2 1 121 1()(2)636f x dx f Af f ≈ ++? ,则A =( ) A . 16 B .13 C .12 D .2 3 3. 通过点 ()()0011,,,x y x y 的拉格朗日插值基函数()()01,l x l x 满足( ) A . ()00l x =0, ()110l x = B . ()00l x =0, ()111l x = C .() 00l x =1,()111 l x = D . () 00l x =1,()111 l x = 4. 设求方程 ()0 f x =的根的牛顿法收敛,则它具有( )敛速。 A .超线性 B .平方 C .线性 D .三次 5. 用列主元消元法解线性方程组 1231231 220223332 x x x x x x x x ++=?? ++=??--=? 作第一次消元后得到的第3个方程( ). A . 232 x x -+= B .232 1.5 3.5 x x -+= C . 2323 x x -+= D . 230.5 1.5 x x -=- 单项选择题答案 1.A 2.D 3.D 4.C 5.B 得 分 评卷人 二、填空题(每小题3分,共15分)

1. 设T X )4,3,2(-=, 则=1||||X ,2||||X = . 2. 一阶均差 ()01,f x x = 3. 已知3n =时,科茨系数()()() 33301213,88C C C ===,那么 () 33C = 4. 因为方程()420 x f x x =-+=在区间 []1,2上满足 ,所以()0f x =在区间 内有根。 5. 取步长0.1h =,用欧拉法解初值问题 ()211y y y x y ?'=+?? ?=? 的计算公式 . 填空题答案 1. 9和29 2. ()() 0101 f x f x x x -- 3. 1 8 4. ()()120 f f < 5. ()12 00.1 1.1,0,1,210.11k k y y k k y +???? ?=+? ?=+???? =??L 得 分 评卷人 三、计算题(每题15分,共60分) 1. 已知函数 21 1y x = +的一组数据: 求分 段线性插值函数,并计算 () 1.5f 的近似值. 计算题1.答案 1. 解 []0,1x ∈, ()1010.510.50110x x L x x --=?+?=---% []1,2x ∈,()210.50.20.30.81221x x L x x --=?+?=-+--%

相关文档
最新文档