2010年下半年系统架构设计师_下午II论文解析

合集下载

2009年下半年系统架构设计师下午试题答案2

全国计算机技术与软件专业技术资格（水平）考试2009年下半年系统架构设计师下午试卷2答案试题一论基于DSSA的软件架构设计与应用写作要点一、简要叙述所参与管理和开发的软件项目，需要明确指出在其中承担的主要任务和开展的主要工作。

二、应结合自己所熟悉的领域，定义领域范围，确定领域应用需要满足的用户需求；定义领域特定的元素、领域字典和领域术语；定义领域特定的设计和实现需求约束；在些基础上，定义领域模型，产生该领域的参与架构，并说明构件的语法和语义；最后，产生、搜集可重用的产品单元，为DSSA增加构件，为问题域实现新应用提供支持。

这个DSSA的建立过程是并发、递归和反复进行的。

所给出的DSSA应该具备以下4个方面的特征：（1）一个严格定义的问题域和/或解决域；（2）具有普遍性，使其可以用于领域中某个特定应用的开发；（3）对整个领域能有合适程度的抽象；（4）具备该领域固定的、典型的架构设计时使用DSSA的情况，包换领域分析、领域设计和领域实现等活动是如何具体实施的，要给出实际的效果并进行分析。

试题二论信息系统建模方法写作要点一、应结合自己参与的信息系统项目，说明在其中所承担的工作。

二、需要较为详细地说明目前各种常见的信息系统建模方法的核心思想，并对每种方法所创建的模型进行简要描述。

（1）结构化建模方法。

结构化建模方法是以过程为中心的技术，可用于分析一个现有的系统以及定义新系统的业务需求。

结构化建模方法所绘制的模型称为数据流图（DFD）。

（2）信息工程建模方法（或数据库建模方法）。

信息工程建模方法是一种以数据为中心，但过程敏感的技术，它强调在分析和研究过程需求之前，首先研究和分析数据需求。

信息工程建模方法所创建的模型被称为实体联系图（ERD）。

（3）面向对象建模方法。

面向对象建模方法将“数据”和“过程”集成到被称为“对象”的结构中，消除了数据和过程的人为分离现象。

面向对象建模方法所创建的模型被称为对象模型。

2016年下半年下午系统架构设计师试题及答案与解析-软考考试真题-案例分析及论文

2016年下半年下午系统架构设计师考试试题-案例分析+论文-答案与解析试题一（共15分）【说明】某软件公司为某品牌手机厂商开发一套手机应用程序集成开发环境，以提高开发手机应用程序的质量和效率。

在项目之初，公司的系统分析师对该集成开发环境的需求进行了调研和分析，具体描述如下：a．需要同时支持该厂商自行定义的应用编程语言的编辑、界面可视化设计、编译、调试等模块，这些模块产生的模型或数据格式差异较大，集成环境应提供数据集成能力。

集成开发环境还要支持以适配方式集成公司现有的应用模拟器工具。

b．经过调研，手机应用开发人员更倾向于使用Windows系统，因此集成开发环境的界面需要与Windows平台上的主流开发工具的界面风格保持一致。

c．支持相关开发数据在云端存储，需要保证在云端存储数据的机密性和完整性。

d．支持用户通过配置界面依据自己的喜好修改界面风格，包括颜色、布局、代码高亮方式等，配置完成后无需重启环境。

e．支持不同模型的自动转换。

在初始需求中定义的机器性能条件下，对于一个包含50个对象的设计模型，将其转换为相应代码框架时所消耗时间不超过5秒。

f．能够连续运行的时间不小于240小时，意外退出后能够在10秒之内自动重启。

g．集成开发环境具有模块化结构，支持以模块为单位进行调试、测试与发布。

h．支持应用开发过程中的代码调试功能：开发人员可以设置断点，启动调试，编辑器可以自动卷屏并命中断点，能通过变量监视器查看当前变量取值。

在对需求进行分析后，公司的架构师小张查阅了相关的资料，认为该集成开发环境应该采用管道一过滤器(Pipe-Filter)的架构风格，公司的资深架构师王工在仔细分析后，认为应该采用数据仓储（Data Repository）的架构风格。

公司经过评审，最终采用了王工的方案。

【问题1】（10分）识别软件架构质量属性是进行架构设计的重要步骤。

请分析题干中的需求描述，填写表1-1中(1)～(5)处的空白。

(完整版)年系统架构设计师考试下午真题与答案(下半年)

2009年下半年系统架构设计师考试下午真题试题：阅读以下软件架构设计的问题，在答题纸上回答问题1和问题2.某软件开发公司欲为某电子商务企业开发一个在线交易平台,支持客户完成网上购物活动中的在线交易。

在系统开发之初,企业对该平台提出了如下要求：(1）在线交易平台必须在1s内完成客户的交易请求。

(2）该平台必须保证客户个人信息和交易信息的安全。

（3）当发生故障时,该平台的平均故障恢复时间必须小于10s.(4）由于企业业务发展较快，需要经常为该平台添加新功能或进行硬件升级.添加新功能或进行硬件升级必须在6小时内完成。

针对这些要求，该软件开发公司决定采用基于架构的软件开发方法,以架构为核心进行在线交易平台的设计与实现。

【问题1】（9分）软件质量属性是影响软件架构设计的重要因素。

请用200字以内的文字列举六种不同的软件质量属性名称，并解释其含义。

【问题2】(16分）请对该在线交易平台的4个要求进行分析，用300字以内的文字指出每个要求对应何种软件质量属性；并针对每种软件质量属性，各给出2种实现该质量属性的架构设计策略。

1.试题答案：【问题1】常见的软件质量属性有多种，例如性能（Performance)、可用性(Availability）、可靠性（Reliability）、健壮性（Robustness)、安全性（Security）、可修改性（Modification）、可变性（Changeability）、易用性（Usability）、可测试性（Testability)、功能性（Functionality）和互操作性（Inter—operation）等。

这些质量属性的具体含义是：（1）性能是指系统的响应能力,即要经过多长时间才能对某个事件做出响应，或者在某段时间内系统所能处理事件的个数.（2）可用性是系统能够正常运行的时间比例。

（3）可靠性是指软件系统在应用或错误面前，在意外或错误使用的情况下维持软件系统功能特性的基本能力.（4）健壮性是指在处理或环境中,系统能够承受压力或变更的能力。

2017年下半年软件水平考试(高级)系统架构师下午(论文)真题试

2017年下半年软件水平考试（高级）系统架构师下午（论文）真题试卷(题后含答案及解析)题型有：1. 选答题选答题（满分75分）1、从下列试题中任选1道解答，请在答卷上用“○”圈住选答的试题编号。

若答题超过1道，则按题号最小的1道题评分。

2、解答应分摘要和正文两部分。

在书写时，请注意以下两点：①、摘要字数在400字以内，可分条叙述，但不允许有图、表和流程图。

②、正文字数为2000-3000字，文中可以分条叙述，但不要全部用分条叙述的方式。

3、解答时字迹务必清楚，字迹不清，将不评分。

软件系统建模(Softare System Modeling)是软件开发中的重要环节，通过构建软件系统模型可以帮助系统开发人员理解系统、抽取业务过程和管理系统的复杂性，也可以方便各类人员之间的交流。

软件系统建模是在系统需求分析和系统实现之间架起的一座桥梁，系统开发人员按照软件系统模型开发出符合设计目标的软件系统，并基于该模型进行软件的维护和改进。

请围绕“论软件系统建模方法及其应用”论题，依次从以下三个方面进行论述。

1．概要叙述你参与的软件系统开发项目以及你所担任的主要工作。

正确答案：简要描述所参与分析和开发的软件系统开发项目，并明确指出在其中承担的主要任务和开展的主要工作。

2．说明软件系统开发中常用的建模方法有哪几类?阐述每种方法的特点及其适用范围。

正确答案：说明软件系统开发中常用的建模方法有哪几类?阐述每种方法的特点及其适用范围。

软件系统开发中常用的建模方法包括：(1)功能分解法功能分解法以系统需要提供的功能为中心来组织系统。

首先定义各种大的功能，然后把功能分解为子功能，同时定义功能间的接口。

比较大的子功能还可以被进一步分解，直到我们可以对它进行明确的定义。

总的思想就是将系统根据功能分而治之，然后根据功能的需求设计数据结构。

(2)数据流法／结构化分析建模方法基本方法是跟踪系统的数据流，研究问题域中数据如何流动以及在各个环节上进行何种处理，从而发现数据流和加工。

2010年下半年系统架构设计师答案详解

采用微内核结构的操作系统提高了系统的灵活性和可扩展性，（1）(1)A.并增强了系统的可靠性和可移植性，可运行于分布式系统中B.并增强了系统的可靠性和可移植性，但不适用于分布式系统C.但降低了系统的可靠性和可移植性，可运行于分布式系统中D.但降低了系统的可靠性和可移植性，不适用于分布式系统【答案】A【解析】本题考查操作系统的基本概念。

在设计微内核OS时，采用了面向对象的技术，其中的“封装”，“继承”，“对象类”和“多态性”，以及在对象之间采用消息传递机制等，都十分有利于提高系统的“正确性”、“可靠性”、“易修改性”、“易扩展性”等，而且还能显著地减少开发系统所付出的开销。

采用微内核结构的操作系统与传统的操作系统相比，其优点是提高了系统的灵活性、可扩充性，增强了系统的可靠性，提供了对分布式系统的支持。

其原因如下。

①灵活性和可扩展性：由于微内核OS的许多功能是由相对独立的服务器软件来实现的，当开发了新的硬件和软件时，微内核OS只需在相应的服务器中增加新的功能，或再增加一个专门的服务器。

与此同时，也必然改善系统的灵活性，不仅可在操作系统中增加新的功能，还可修改原有功能，以及删除已过时的功能，以形成一个更为精干有效的操作系统。

②增强了系统的可靠性和可移植性：由于微内核是出于精心设计和严格测试的，容易保证其正确性；另一方面是它提供了规范而精简的应用程序接口（API),为微内核外部的程序编制高质量的代码创造了条件。

此外，由于所有服务器都是运行在用户态，服务器与服务器之间采用的是消息传递通信机制，因此，当某个服务器出现错误时，不会影响内核，也不会影响其他服务器。

另外，由于在微内核结构的操作系统中，所有与特定CPU和I/O设备硬件有关的代码，均放在内核和内核下面的硬件隐藏层中，而操作系统其他绝大部分（即各种服务器）均与硬件平台无关，因而，把操作系统移植到另一个计算机硬件平台上所需作的修改是比较小的。

③提供了对分布式系统的支持：由于在微内核OS中，客户和服务器之间以及服务器和服务器之间的通信，是采用消息传递通信机制进行的，致使微内核OS能很好地支持分布式系统和网络系统。

XXXX下半年系统架构设计师考试案例分析真题及答案

XXXX下半年系统架构设计师考试案例分析真题及答案系统架构师XXXX下半年，系统架构师在下午提出了问题。

案例分析问题1:请详细阅读关于网络应用程序架构设计的说明，并回答答题纸上的问题1至3。

[注释]一家的软件公司开发并运行了一个社交网络网站系统。

该系统建立在开源软件平台LAMP(Linux+Apache+MySQL+PHP)之上。

运行一段时间后，随着用户数量和访问量的增加，系统在网络服务器负载、磁盘输入输出等方面存在明显的瓶颈。

并且不能满足大量客户端并发访问的需求。

因此，公司成立了专门的项目团队来调整系统架构，以提高系统的并发处理能力目前，系统采用传统的三层结构，系统架构如下图所示[问题1] (10分)针对当前网络服务器负载过大的问题，项目组决定在客户端和中间层网络服务器之间引入负载平衡器，通过中间层网络服务器集群提高网络请求的并发处理能力在讨论所提出的负载平衡机制时，王工提出采用基于DNS的负载平衡机制，而巩俐认为应该采用基于反向代理的负载平衡机制。

经过讨论，项目组最终决定采用巩俐提出的方案。

请用少于200字的篇幅分别简要说明这两种机制的基本原理。

这两种机制在系统执行效率、安全性和简单性方面进行了比较，比较结果如下表所示[问题2] (7分)针对并发数据库访问导致的磁盘I/O瓶颈，项目团队决定在数据层引入数据库扩展机制经过调查，已知系统数据库中存储的主要数据是通过用户标识索引的社交网络数据，并且在系统操作期间发生的大多数数据库操作是查询操作。

经过讨论，项目团队决定引入两种扩展机制:数据库分区和MySQL主从复制数据库分区可分为水平分区和垂直分区。

请用350系统架构师的字内的文字说明该系统应采用哪种方法及其原因，并分析引入主从复制机制给系统带来的好处。

[问题3)(8分)为了进一步提高数据库访问效率，项目团队决定在中间层和数据层之间引入缓存机制。

召公开始提出一种可以直接使用MySQL的查询缓存机制。

2010年系统架构设计师论文考试真题范文(三)

2010年系统架构设计师论文考试真题范文（三）系统架构设计师考试属于软考中的一项高级资格考试，考试分综合知识、案例分析和论文3个科目。

对于很多考生来说论文是一个考试难关，怎么提高自己的论文写作水平，多看历年软考论文真题范文是一个很好的练习论文写作水平的方式，希赛小编为大家整理了2010年系统架构设计师论文考试真题范文论软件的静态演化和动态演化及其应用，希望对大家有所帮助。

【摘要】知识发现与数据挖掘是人工智能、机器学习和数据库相结合的产物。

随着科学数据的大量积累和各种数据库的广泛使用，人们又逐步认识到海量数据的利用十分困难、效率低下，而且很难从中获得有价值的指导性意见。

在这种情况下，数据库挖掘技术应运而生。

本文介绍了数据库挖掘技术的现状、过程和其在现实生活中的应用。

【正文】一、引言随着数据库技术的成熟和数据引用的普及，人类积累的数据量正以指数级迅速增长。

进入九十年代，伴随着英特网（Internet）出现和发展，以及随之而来的企业内部网（Intranet）和企业外部网（Extranet）以及虚拟私有网（VPNVir tualPrivatenetwork）产生和应用，将整个世界联成一个小小的地球村，人们可以跨越时空界限在网上交换数据信息和协同工作。

这样，展现在人们面前的已不是局限于本部门，本单位和本单位的庞大数据库，而是浩瀚无垠的信息海洋，数据洪水正向人们滚滚涌来。

当数据量极度增长时，如果没有有效的方法，由计算机及信息技术来有用信息和知识，人们也会感到面对信息海洋像大海捞针一样束手无策。

据估计，一个大型企业数据库中数据，只有百分之七得到很到应用。

这样，相对于“数据过剩”和“信息爆炸”，人们又感到“信息贫乏”（Informationpoor）和“数据关在牢笼中”（datainjail），奈斯伯特(JohnNaisbett)惊呼“we are downing information，but star ving for knowledge”（人类正在被数据淹没，却饥渴于知识）。

2011年下半年系统架构设计师考试下午真题与答案

2011年下半年系统架构设计师考试下午真题试题1：阅读以下关于软件架构评估的说明，在答题纸上回答问题1和问题2。

【说明】某网上购物电子商务公司拟升级正在使用的在线交易系统，以提高用户网上购物在线支付环节的效率和安全性。

在系统的需求分析与架构设计阶段，公司提出的需求和关键质量属性场景如下：（a）正常负载情况下，系统必须在0.5秒内对用户的交易请求进行响应；（b）信用卡支付必须保证99.999%的安全性；（c）对交易请求处理时间的要求将影响系统的数据传输协议和处理过程的设计；（d）网络失效后，系统需要在1.5分钟内发现错误并启用备用系统；（e）需要在20人月内为系统添加一个新的CORBA中间件；（f）交易过程中涉及到的产品介绍视频传输必须保证画面具有600*480的分辨率，20帧/秒的速率；（g）更改加密的级别将对安全性和性能产生影响；（h）主站点断电后，需要在3秒内将访问请求重定向到备用站点；（i）假设每秒中用户交易请求的数量是10个，处理请求的时间为30毫秒，则“在1秒内完成用户的交易请求”这一要求是可以实现的；（j）用户信息数据库授权必须保证99.999%可用；（k）目前对系统信用卡支付业务逻辑的描述尚未达成共识，这可能导致部分业务功能模块的重复，影响系统的可修改性；（l）更改Web界面接口必须在4人周内完成；（m）系统需要提供远程调试接口，并支持系统的远程调试。

在对系统需求和质量属性场景进行分析的基础上，系统的架构师给出了三个候选的架构设计方案。

公司目前正在组织系统开发的相关人员对系统架构进行评估。

【问题1】（12分）在架构评估过程中，质量属性效用树（utility tree）是对系统质量属性进行识别和优先级排序的重要工具。

请给出合适的质量属性，填入图1-1中（1）、（2）空白处；并选择题干描述的（a）～（m），填入（3）～（6）空白处，完成该系统的效用树。

【问题2】（13分）在架构评估过程中，需要正确识别系统的架构风险、敏感点和权衡点，并进行合理的架构决策。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2010年下半年系统架构设计师_下午试题Ⅱ论文解析试题一、论软件的静态演化和动态演化及其应用写作要点1、简要叙述所参与管理和开发的软件项目，并明确指出自己在其中承担的主要任务和开展的主要工作。

2、软件演化可分为静态演化和动态演化两种情形。

(1)静态演化（Static Evolution）。

静态演化是指软件在停机状态下的演化。

其优点是不用考虑运行状态的迁移，同时也没有活动的进程需要处理。

然而停止一个一个用程序就意味着中断它提供的服务，造成软件暂时失效。

软件静态演化是指发生在应用程序停止时的软件修改和更新，即一般意义上的软件维护和升级。

静态演化的优点是没有状态迁移或活动线程的问题要解决，缺陷是停止应用程序意味着停止它所提供的服务，也就是使软件系统暂时失效。

在软件交付之后，静态演化（类似于一般意义上的软件维护）就成为软件变更的一个常规过程。

变更可以是一种更正代码错误的简单变更，也可以是更正设计错误的较大范围的变更，还可以是对描述错误进行修正或提供新需求这样的重大改进。

有三种不同的软件维护：改正性维护、适应性维护和完善性维护。

维护过程一般包括变更分析、版本规划、系统实现和向客户交付系统等活动。

在面向对象技术中，使用子类型方法来扩展程序，它适合于软件静态演化和代码重用。

子类型化一个类意味着保留父类中的参数和方法，并尽可能地增加新的参数和方法。

另外，使用重载和多态性作为主要的演化机制。

实际上，建立类的新版本，最简单的机制是创建它的子类，然后重载需要变更的方法，最后，使用多态性调用新创建的方法。

在基于构件的软件技术中，构件采取接口和实现相分离的技术，构件之间只能通过接口进行通信，这使得具有兼容接口的不同构件实现可以相互取代，从而成为软件静态演化的一条途径。

(2)动态演化（Dynamic Evolution）。

动态演化是指软件在执行期间的软件演化。

其优点是软件不会存在暂时的失效，有持续可用性的明显优点。

但由于涉及状态迁移等问题，比静态演化从技术上更难处理。

动态演化是最复杂也是最有实际意义的演化形式。

动态演化使得软件在运行过程中，可以根据应用需求和环境变化，动态地进行软件的配置、维护和更新，其表现形式包括系统元素数目的可变性、结构关系的可调节性和结构形态的动态可配置性。

软件的动态演化特性对于适应未来软件发展的开放性、动态性具有重要意义。

动态演化是指软件在运行期间的演化。

在许多重要的应用领域中，例如金融、电力、电信及空中交通管制等，系统的持续可用性是一个关键性的要求，运行时刻的系统演化可减少因关机和重新启动而带来的损失和风险。

此外，越来越多的其他类型的应用软件也提出了运行时刻演化的要求，在不必对应用软件进行重新编译和加载的前提下，为最终用户提供系统定制和扩展的能力。

动态演化可分为两种类型：预设的和非预设的。

在Web环境中，软件应用常常需要处理多种类型的信息，因此它们常被设计为可以动态下载并安装插件以处理当前所面临的新类型的信息；而分布式Web应用也常常需要增减内部处理节点的数目以适应多变的负载。

这些动态改变都是软件设计者能够预先设想到的，可实现为系统的固有功能。

另有一些必须对系统配置进行修改和调整的情况是直到系统投入运行以后才发现的，这就要求系统能够处理在原始设计中没有完全预料到的新需求。

这种情况下一般需要关闭整个系统，重新开发、重新装入并重新启动系统。

然而，为了进行局部的修改而关闭整个系统在某些情况下是不允许的（例如，关键运行系统）或者代价太高。

精心设计的动态演化技术可以在不关闭整个系统的前提下修改系统的结构配置，并尽量使未受影响的部分继续工作已提高系统的可用度。

为支持软件的动态演化性，已在语言、机制和环境等方面做了大量工作。

在程序语言的层次上，引进各种机制以支持软件动态演化，例如动态装载技术允许增加代码到已运行的程序中，延迟绑定是在运行时而不是编译时决定类和对象的绑定。

Java hotswap允许在运行时改变方法：当一个方法终止时，这个方法的新版本可以有效地替换旧版本，在类层次上代码的二进制兼容被支持。

Gilgul语言也允许更换运行时对象。

但程序语言层次上的动态演化机制仅局限于函数、类方法和对象等小粒度的替换，只支持预设的有限变更，变更由事件触发。

通过标准化运行级构件的规约，依靠构件运行平台（中间件平台）提供的基础设施，使软件在构件层次上的动态演化成为可能。

中间件中具有的如命名服务、反射技术和动态适配等机制，为运行态的动态替换和升级提供支撑，从而推动了软件动态演化的发展。

命名服务就是给构件实例提供一个名称，以便客户通过这些名称来获取构件实例。

对工业标准构件EJB 和CORBA构件的引用都可以通过中间件平台的命名服务进行。

同一构件标识可以被映射到多个构件实例，从而根据具体情境对某一名字的构件引用导向到不同的构件实例。

反射技术是系统的一种自描述（self-representation）和自推理的技术，它提供了关于自身行为的表示，这种表示可以被检查和调整，且与他所描述的系统行为是因果相联（causally connected）的。

因果相联，意味着对自表示的改动将立即反映在系统的实际状态和行为中，反之亦然。

将反射性引入中间件能够以可控的方式开放平台内部的实现，从而提高中间件的定制能力和运行使的适应能力。

动态适配机制中比较著名的是CORBA提供的动态接口服务：动态调用接口DII和动态骨架接口DSI。

前者支持动态客户请求调用，而后者支持将请求动态指派（Dispatch）给构件。

因此，软件构件化技术使得软件具有良好的构造性，软件演化的粒度更大。

中间件技术则为基于构件的软件动态演化提供了坚实的基础设施和方便的操作界面。

3、考生需结合自身参与项目的实际状况，指出其参与管理和开发的项目中所进行的软件演化活动的特点、演化的类型，以及所采取的对应演化技术手段。

要给出实施软件演化活动的具体过程、方法以及对实际应用效果的分析。

试题二、论数据挖掘技术的应用写作要点：1、结合自己所参与的软件项目，概要介绍该项目的背景及主要内容，并明确指出在其中所承担的主要任务和开展的主要工作。

2、数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。

(1)关联分析。

两个或两个以上变量的取值之间存在某种规律性，就称为关联。

数据关联是数据库中存在的一类重要的、可被发现的知识。

关联分析的目的是找出数据库中隐藏的关联网。

一般用支持度和可信度两个阈值来度量关联规则的相关性。

(2)聚类分析。

聚类是把数据按照相似性归纳成若干类别，同一类中的数据彼此相似，不同类中的数据相异。

聚类分析可以建立宏观的概念，发现数据的分布模式，以及可能的数据属性之间的相互关系。

(3)分类。

分类就是找出一个类别的概念描述，它代表了这类数据的整体信息，即该类的内涵描述，并用这种描述类构造模型，一般用规则或决策树模式表示。

分类是利用训练数据集通过一定的算法而求得分类规则。

分类可被用于规则描述和预测。

(4)预测。

预测是利用历史数据找出变化规律，建立模型，并由此模型对未来数据的种类及特征进行预测。

预测的精度和不确定性被重点关注，通常用预测方差来度量。

(5)时序模式。

时序模式是指通过时间序列搜索出的重复发生概率较高的模式。

与回归一样，它也是用已知的数据预测未来的值，但这些数据的区别是变量所处时间的不同。

(6)偏差分析。

在偏差中包括很多有用的知识，数据库中的数据存在很多异常情况，发现数据库中存在的异常情况是非常重要的。

偏差检验的基本方法就是寻找观察结果与参照之间的差别。

论文中须明确指出自己在该项目中应用数据挖掘技术所要解决的具体问题是什么。

3、主要的数据挖掘方法(1)神经网络方法神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘问题，因此近年来越来越受到人们的关注。

典型的神经网络模型主要分三大类：以感知机、BP反向传播模型、函数型网络为代表的用于分类、预测和模式识别的前馈式神经网络模型；以hopfield的离散模型和连续模型为代表的分别用于联想记忆和优化计算的反馈式神经网络模型；以art模型、koholon模型为代表的，用于聚类的自组织映射方法。

神经网络方法的缺点是“黑箱”性，人们难以理解网络的学习和决策过程。

(2)遗传算法遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法，是一种仿生全局优化方法。

遗传算法具有的隐含并行性、易于和其他模型结合等性质使得它在数据挖掘中被加以应用。

(3)决策树方法决策树是一种常用于预测模型的算法，它通过将大量数据有目的地分类，从中找到一些有价值的、潜在的信息。

它的主要优点是描述简单，分类速度快，特别适合大规模的数据处理。

最有影响和最早的决策树方法是由Quinlan提出的著名的基于信息熵的id3算法。

它的主要问题是：id3是非递增学习算法；id3决策树是单变量决策树，复杂概念的表达困难；同性间的相互关系强调不够；抗噪性差。

针对上述问题，出现了许多较好的改进算法，如Schlimmer 和Fisher设计了id4递增式学习算法等。

(4)粗集方法粗集理论是一种研究不精确、不确定知识的数据工具。

粗集方法有几个优点：不需要给出额外信息；简化输入信息的表达空间；算法简单，易于操作。

粗集处理的对象是类似二维关系表的信息表。

目前成熟的关系数据库管理系统和新发展起来的数据仓库管理系统为粗集的数据挖掘奠定了坚实的基础。

(5)覆盖正例排斥反例方法它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。

首先在正例集合中任选一个种子，到反例集合中逐个比较。

与字段取值构成的选择子相容则舍去，相反则保留。

按此思想循环所有正例种子，将得到正例的规则。

比较典型的算法有Michalski的aq11方法等。

(6)统计分析方法在数据字段项之间存在两种关系：函数关系（能用函数公式表示的确定性关系）和相关关系（不能用函数公式表示，但仍是相关确定性关系），对它们的分析可采用统计学方法，即利用统计学原理对数据库中的信息进行分析。

可进行常用统计（求大量数据中的最大值、最小值、总和、平均值等）、回归分析（用回归方程来表示变量间的数量关系）、相关分析（用相关系数来度量变量间的相关程度）、差异分析（从样本统计量的值得出差异来确定总体参数之间是否存在差异）等。

(7)模糊集方法利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。

系统的复杂性越高，则模糊性越强，一般模糊集合理论是用隶属度来刻画模糊事物的亦此亦彼性的。

论文中必须明确指出使用了上述7种方法中的哪种或哪几种数据挖掘方法，并给出该方法的具体实现过程；分析所选择的数据挖掘方法的实现效果。

试题三、论大规模分布式系统缓存设计策略写作要点1、论文中要具体介绍项目的总体需求（特别是应用需求中对缓存机制的要求）、系统的逻辑与物理架构、采用的技术等内容和自己担任的实际工作。