数据库和数据挖掘常用词词汇
25个大数据专业术语入门大数据必备知识

25个大数据专业术语入门大数据必备知识大数据是指跨越传统数据处理能力范围,无法使用常规数据库工具进行处理和管理的大量、高速度、多样性的结构化和非结构化数据的集合。
随着信息技术的高速发展,大数据已经成为当今社会的热门话题之一。
掌握大数据的相关专业术语对于大数据领域的从业者和对大数据感兴趣的人来说至关重要。
本文将介绍25个常见的大数据专业术语,帮助读者快速入门大数据领域。
1. 数据挖掘(Data Mining)数据挖掘是指通过分析大量数据来发现隐藏在其中的模式和关联性的过程。
通过数据挖掘技术,可以从海量数据中提取有价值的知识和信息,支持决策和业务发展。
2. 机器学习(Machine Learning)机器学习是一种人工智能的技术,通过让计算机系统从数据中学习和改进,实现自主学习和自主决策的能力。
机器学习在大数据处理中起到了重要作用,可以从大量数据中挖掘出模式和规律。
3. 云计算(Cloud Computing)云计算是一种基于互联网的计算方式,可以通过网络提供各种计算资源和服务。
云计算通过将计算任务分配给大量的计算机集群来处理大数据,提高计算效率和资源利用率。
4. 流式处理(Stream Processing)流式处理是指对实时产生的数据流进行实时分析和处理的技术。
在大数据领域,流式处理可以对海量的实时数据进行连续的计算和分析,实现实时决策和实时应用。
5. 数据湖(Data Lake)数据湖是指一个存储了各种结构化和非结构化数据的集合,可以容纳大量的原始数据。
数据湖不要求进行数据的预处理或格式转换,使得数据的获取和利用更加灵活和高效。
6. 数据仓库(Data Warehouse)数据仓库是指一个用于存储和管理各种企业数据的集中化数据存储系统。
数据仓库通过将来自不同数据源的数据进行整合和清洗,为企业决策提供可靠的数据支持。
7. 数据可视化(Data Visualization)数据可视化是指使用图表、图像和其他可视化方式将数据表达出来的过程。
关于大数据你应该知道的50个专业术语

关于大数据你应该知道的50个专业术语1. 大数据(Big Data)- 指的是规模庞大、复杂多变的数据集合。
它在各个领域中不断积累和产生,涵盖了结构化、半结构化和非结构化的数据。
2. 数据挖掘(Data Mining)- 是从大数据中自动发现和提取有用信息的过程。
它使用统计学、模式识别和机器学习等技术,帮助解读数据并发现隐藏的模式和规律。
3. 云计算(Cloud Computing)- 是通过互联网提供各种计算资源和服务的模式。
大数据通常需要庞大的计算和存储能力,云计算提供了弹性和可靠的资源解决方案。
4. 数据仓库(Data Warehouse)- 是用于存储和管理结构化数据的集中式系统。
它经过数据清洗和整合,方便用户进行复杂的分析和查询。
5. 数据湖(Data Lake)- 是指将各种类型和格式的数据存储在一个集中式的存储系统中。
与数据仓库不同,数据湖不需要事先定义数据模式和结构,可以更灵活地处理复杂的数据分析需求。
6. Hadoop- 是一个开源的分布式计算框架,用于处理大规模数据集。
它基于MapReduce算法,能够有效地分布和处理数据。
7. MapReduce- 是一种并行计算编程模型,用于处理大规模数据集。
它将数据分成多个小块,分发给多个计算节点进行并行计算,最终将结果合并返回。
8. Spark- 是一个快速、通用、高级的大数据处理引擎。
它支持内存计算,能够在大数据集上进行复杂的数据处理和分析。
9. 数据可视化(Data Visualization)- 是将数据以图表、图形和其他可视化形式展示的过程。
它能够帮助用户更好地理解和分析数据,发现潜在的信息和见解。
10. 数据清洗(Data Cleaning)- 是处理和修正数据中的错误、缺失和不一致之前的过程。
清洗后的数据更加准确可靠,有助于后续的分析和应用。
11. 数据集成(Data Integration)- 是将来自不同数据源的数据合并成一个统一的数据集的过程。
数据挖掘知识点归纳

知识点一数据仓库1.数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点上。
2.数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。
3.数据仓库围绕主题组织4.数据仓库基于历史数据提供消息,是汇总的。
5.数据仓库用称作数据立方体的多维数据结构建模,每一个维对应于模式中的一个或者一组属性,每一个单元存放某种聚集的度量值6.数据立方体提供数据的多维视图,并允许预计算和快速访问汇总数据7.提供提供多维数据视图和汇总数据的预计算,数据仓库非常适合联机分析处理,允许在不同的抽象层提供数据,这种操作适合不同的用户角度8.OLAP例子包括下钻和上卷,允许用户在不同的汇总级别上观察数据9.多维数据挖掘又叫做探索式多维数据挖掘OLAP风格在多维空间进行数据挖掘,允许在各种粒度进行多维组合探查,因此更有可能代表知识的有趣模式。
知识点二可以挖掘什么数据1.大量的数据挖掘功能,包括特征化和区分、频繁模式、关联和相关性分析挖掘、分类和回归、聚类分析、离群点分析2.数据挖掘功能用于指定数据挖掘任务发现的模式,分为描述性和预测性3.描述性挖掘任务刻画目标数据中数据的一般性质4.预测性挖掘任务在当前数据上进行归纳,以便做出预测5.数据可以与类或概念相关联6.用汇总、简洁、精确的表达描述类和概念,称为类/概念描述7.描述的方法有数据特征化(针对目标类)、数据区分(针对对比类)、数据特征化和区分8.数据特征化用来查询用户指定的数据,上卷操作用来执行用户控制的、沿着指定维的数据汇总。
面向属性的归纳技术可以用来进行数据的泛化和特征化,而不必与用户交互。
形式有饼图、条图、曲线、多维数据立方体和包括交叉表在内的多维表。
结果描述可以用广义关系或者规则(也叫特征规则)提供。
9.用规则表示的区分描述叫做区分规则。
10.数据频繁出现的模式叫做频繁模式,类型包括频繁项集、频繁子项集(又叫频繁序列)、频繁子结构。
数据挖掘data mining 核心专业词汇

1、Bilingual 双语Chinese English bilingual text 中英对照2、Data warehouse and Data Mining 数据仓库与数据挖掘3、classification 分类systematize classification 使分类系统化4、preprocess 预处理The theory and algorithms of automatic fingerprint identification system (AFIS) preprocess are systematically illustrated.摘要系统阐述了自动指纹识别系统预处理的理论、算法5、angle 角度6、organizations 组织central organizations 中央机关7、OLTP On-Line Transactional Processing 在线事物处理8、OLAP On-Line Analytical Processing 在线分析处理9、Incorporated 包含、包括、组成公司A corporation is an incorporated body 公司是一种组建的实体10、unique 唯一的、独特的unique technique 独特的手法11、Capabilities 功能Evaluate the capabilities of suppliers 评估供应商的能力12、features 特征13、complex 复杂的14、information consistency 信息整合15、incompatible 不兼容的16、inconsistent 不一致的Those two are temperamentally incompatible 他们两人脾气不对17、utility 利用marginal utility 边际效用18、Internal integration 内部整合19、summarizes 总结20、application-oritend 应用对象21、subject-oritend 面向主题的22、time-varient 随时间变化的23、tomb data 历史数据24、seldom 极少Advice is seldom welcome 忠言多逆耳25、previous 先前的the previous quarter 上一季26、implicit 含蓄implicit criticism 含蓄的批评27、data dredging 数据捕捞28、credit risk 信用风险29、Inventory forecasting 库存预测30、business intelligence(BI)商业智能31、cell 单元32、Data cure 数据立方体33、attribute 属性34、granular 粒状35、metadata 元数据36、independent 独立的37、prototype 原型38、overall 总体39、mature 成熟40、combination 组合41、feedback 反馈42、approach 态度43、scope 范围44、specific 特定的45、data mart 数据集市46、dependent 从属的47、motivate 刺激、激励Motivate and withstand higher working pressure个性积极,愿意承受压力.敢于克服困难48、extensive 广泛49、transaction 交易50、suit 诉讼suit pending 案件正在审理中51、isolate 孤立We decided to isolate the patients.我们决定隔离病人52、consolidation 合并So our Party really does need consolidation 所以,我们党确实存在一个整顿的问题53、throughput 吞吐量Design of a Web Site Throughput Analysis SystemWeb网站流量分析系统设计收藏指正54、Knowledge Discovery(KDD)55、non-trivial(有价值的)--Extraction interesting (non-trivial(有价值的), implicit(固有的), previously unknown and potentially useful) patterns or knowledge from huge amounts of data.56、archeology 考古57、alternative 替代58、Statistics 统计、统计学population statistics 人口统计59、feature 特点A facial feature 面貌特征60、concise 简洁a remarkable concise report 一份非常简洁扼要的报告61、issue 发行issue price 发行价格62、heterogeneous (异类的)--Constructed by integrating multiple, heterogeneous (异类的)data sources63、multiple 多种Multiple attachments多实习64、consistent(一贯)、encode(编码)ensure consistency in naming conventions,encoding structures, attribute measures, etc.确保一致性在命名约定,编码结构,属性措施,等等。
数据库中常用的英文单词

数据库中常用的英文单词第一篇:数据库中常用的英文单词数据库中常用的英文单词2010-06-30 16:20:05 阅读17 评论0字号:大中小订阅下列是一些数据库中经常碰到的英文单词:Access method(访问方法):此步骤包括从文件中存储和检索记录。
Alias(别名):某属性的另一个名字。
在SQL中,可以用别名替换表名。
Alternate keys(备用键,ER/关系模型):在实体/表中没有被选为主健的候选键。
Anomalies(异常)参见更新异常(update anomalies)Application design(应用程序设计):数据库应用程序生命周期的一个阶段,包括设计用户界面以及使用和处理数据库的应用程序。
Attribute(属性)(关系模型):属性是关系中命名的列。
Attribute(属性)(ER模型):实体或关系中的一个性质。
Attribute inheritance(属性继承):子类成员可以拥有其特有的属性,并且继承那些与超类有关的属性的过程。
Base table(基本表):一个命名的表,其记录物理的存储在数据库中。
Binary relationship(二元关系):一个ER术语,用于描述两个实体间的关系。
例如,panch Has Staff。
Bottom-up approach(自底向上方法):用于数据库设计,一种设计方法学,他从标识每个设计组建开始,然后将这些组件聚合成一个大的单元。
在数据库设计中,可以从表示属性开始底层设计,然后将这些属性组合在一起构成代表实体和关系的表。
Business rules(业务规则):由用户或数据库的管理者指定的附加规则。
Candidate key(候选键,ER关系模型):仅包含唯一标识实体所必须得最小数量的属性/列的超键。
Cardinality(基数):描述每个参与实体的可能的关系数目。
Centralized approach(集中化方法,用于数据库设计):将每个用户试图的需求合并成新数据库应用程序的一个需求集合Chasm trap (深坑陷阱):假设实体间存在一根,但某些实体间不存在通路。
数据分析报告常用术语

数据分析报告常用术语数据分析是当今信息时代中一项重要的技能,它为企业和组织提供了对大量数据的洞察力。
而在数据分析报告中,术语的使用将帮助读者更好地理解和解释数据。
本文将介绍一些数据分析报告中常用的术语,以帮助读者更好地应用和理解这些术语。
1. 数据集(Dataset):指存储在数据库或文件中的一组相关数据。
通常,数据集是由多个数据元素组成,每个数据元素包括多个数据字段。
2. 数据字段(Data Field):也称为列或属性,是数据集中的每个列。
每个数据字段包含特定类型的数据,例如日期、姓名、成绩等。
3. 数据行(Data Row):也称为记录,是数据集中的每行数据。
每一行包含了属于数据字段的具体值,它们按照相同的顺序排列。
4. 数据清洗(Data Cleaning):是数据分析过程中的一个重要步骤,用于检测和修复数据集中的错误、缺失或不准确的数据。
数据清洗可以提高数据质量,确保数据的准确性和一致性。
5. 数据探索(Data Exploration):也称为探索性数据分析(EDA),是数据分析的第一步。
数据探索旨在通过统计和可视化方法揭示数据集的内在特征、模式和关系,以了解数据的概况。
6. 描述统计(Descriptive Statistics):是通过总结和展示数据的集中趋势、离散程度、分布形状、相关性等统计量来描述数据集的统计学特征。
常见的描述统计量包括均值、中位数、标准差、最大值和最小值等。
7. 相关分析(Correlation Analysis):用于衡量两个或多个变量之间关系的统计分析方法。
相关系数是用来度量变量之间线性相关性的指标,其范围从-1到1,其中-1代表强负相关,1代表强正相关,0代表无相关性。
8. 数据可视化(Data Visualization):通过使用图表、图形和其他可视化工具来展示数据的过程。
数据可视化有助于有效地传达和解释数据,帮助读者更好地理解数据。
9. 数据挖掘(Data Mining):通过分析和发现数据中的模式、关联和趋势,从大量数据中提取有用的信息。
数据挖掘中的名词解释

第一章1,数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。
2,人工智能(Artificial Intelligence)它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
3,机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
4,知识工程(Knowledge Engineering)是人工智能的原理和方法,对那些需要专家知识才能解决的应用难题提供求解的手段。
5,信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
6,数据可视化(Data Visualization)是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
7,联机事务处理系统(OLTP)实时地采集处理与事务相连的数据以及共享数据库和其它文件的地位的变化。
在联机事务处理中,事务是被立即执行的,这与批处理相反,一批事务被存储一段时间,然后再被执行。
8, 联机分析处理(OLAP)使分析人员,管理人员或执行人员能够从多角度对信息进行快速一致,交互地存取,从而获得对数据的更深入了解的一类软件技术。
8,决策支持系统(decision support)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。
它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。
常用大数据术语

常用大数据术语A聚合-搜索、收集和显示数据的过程。
算法-可以对数据执行某种分析的数学公式。
分析―发现数据蕴含的洞察力。
异常检测-搜索数据集中与预测模式或预期行为不匹配的数据项。
异常又叫outlier、exception、surprise或 contaminant,它们常常提供了关键的、可付诸行动的信息。
匿名化-使数据匿名,即移除可能表明个人身份的所有数据点。
应用程序-让计算机能够执行某项任务的计算机软件。
人工智能-研发智能机器和软件,它们能够感知周围环境,并且在需要时采取相应的动作,甚至从那些动作中学习。
B行为分析-这种分析可以表明如何、为何和什么,而不是仅仅表明是谁和何时。
它可分析数据中的人性化模式。
大数据科学家-能够开发解读大数据的算法的人。
大数据初创公司―开发新颖大数据技术的新兴公司。
生物特征识别-根据人的生物特征来识别人的身份。
波字节(BB)-约等于1000尧字节,相当于未来数字化宇宙的大小。
1波字节有27个0!商业智能-让数据易于理解的一套理论、方法和过程。
C分类分析-从数据获取重要相关信息的系统化过程,又叫元数据,即描述数据的数据。
云计算-网络上用于异地存储数据的分布式计算系统。
聚类分析-识别彼此相似的对象并聚集成类的过程,以便了解数据里面的相似之处和不同之处。
冷数据存储-将很少使用的旧数据存储在低功耗服务器上。
检索数据耗时较长。
对比分析-它确保采用逐步的比较和计算过程,以便发现非常大的数据集里面的模式。
复杂的结构化数据-由两个或多个复杂的关联部分组成的数据,它们不容易被结构化查询语言和工具来解析。
计算机生成的数据-计算机生成的数据,比如日志文件。
并发-同时运行或执行多个任务或进程。
关联分析-分析数据,以便确定变量之间的关系,确定这种关系是负关系(-1.00)还是正关系(+1.00)。
客户关系管理(CRM)-管理销售和业务流程,大数据会影响CRM 策略。
D仪表板-使用图形化显示算法执行的分析的工具。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PrefaceCurriculum总课程,(学校等的)全部课程1.n.And just as important as the radical churches and the reformed sects is for Hobbes the universityand its curriculumconcept想法观念;n.1.概念;总的印象;思维的产物;发明;创造2.试作阶段的;新设想的;领导时代新潮流的1.adj.I would suggest that it's not unlike the wedge that Hirsch drives between the of meaning conceptand the of significance conceptartificial假的人工的,1.人造的,adj.矫揉造作的不真挚的,2.虚假的,人为的3.To me it's too and it's also the same story that you've seen before with indigenous groups artificialand the white colonial forces coming to destroy them or something like桴瑡尮evaluation估算;估价,评价n.1.值的计算,数>赋值2.<估计价值,鉴定3.【医学】诊断4.Mr Riggio said he wants to stay at the company whatever the outcome of the evaluationChapter1overviewMotivated1.目的明确的2.激发,促进3.有动机的4.积极的.adj What motivated data mining Performance表演注解批注,1.演出执行注解批注,2.履行成就注解批注行为,3.表现,工作情况注解批注.性能,4Different between transaction process and analysis process performanceproblem-solving问题解决1.to pull and in that will demand situationsput you habitsusualyourofmeantareexercisesThese outyoutoand solvingproblem-resourcefulnesscreativeunsuited1.ocollectio oshiftprogra2.图案2.花样,形式3.方式,仿制1.模仿;vt.以图案装饰2.使形成,促成(某行为模式)3.复写;复制4.形成图案1.vi.potentially and,previously unknowninteresting(non-trivial(有价值的),implicit(固有的)Extraction data.of huge amountsuseful)patterns or knowledge from evaluation估算;,评价n.1.估价值的计算赋值,<2.数>估计价值,鉴定3.【医学】诊断4.,,,methodcontrolfrequency sample sizeand Methods include evaluation measurement technique error-proofing transformation转变,,变质n.1.变化,弯形转变实例2.转换,变换<电>3.)式>变换(4.<数转换>5.<语And,of,transformation transformation beautifulenacted these women a lot in thisway Selection挑选选择,n.1.选集选萃,[事物];2.被挑选的人可供选择的东西3.trivial不重要的;琐碎的;微不足道的adj.1.—to with the among hardestdealthese calls issues trivial theybut are alsoNobody implicit的]不言明[含蓄adj.1.绝对的无疑问的,2.成为一部份的;内含的3.The larger,point is that the threatening thing is not really that threatening implicitpreviously以前;1.事先adv.不成熟地仓促地;美><口>2.<potentially 可能地;1.潜在地adv.权威地;古>强有力地<2.假定地1.adj. 3.potentiall centeth o happenin4.Chapter2dw conceptsmodeling)术1.造型(n.立体感)(图画等的2.模特儿职业3.制造模型的1.adj.模特儿的2.concise简明的;简炼的;简洁的1.adj.简略的;简缩的;简明的2.one and to state andelectric behaviour of represent elegant of the most the concise waysThese equationsmatterwith interact fields and how theymagneticparticular某一的,adj.1.特定的特有的特别的,特殊的2.,挑剔的)讲究的,3.(过分详尽的4.详细的,不寻常的;格外的5.个别的;各个的,各自的;独自的,个人的6.精密的;细致的7.分项的;列举的8.特殊的;9.【逻辑学】特称的详情;细目)(消息或情报等的1.[常作复数]n.详细资料;详细介绍材料2.一项;一条;一点;一部分;一个细节)(总体中的3.特殊情况;个别情况4.temperatureand high pressure poses particular problems of Deepdrillingissues债券1.争点1.配置与操作说明eful notdata that areissuesaround particular subject by excluding viewandaprovide simple conciseprocess.support the decision inexcluding不包括外除…,prep.1.certain items,Oracle earned54cents per share,more than Wall Street was expecting Excluding multiple多种多样的,多重的1.adj.多个的;由多个组成的;重合的;多数的;多层次的;多次的2.5.复杂的3.多人参加的;多人享有的4.多功能的5.倍数的,多倍的6.〈数〉倍数1.n.【电工学】并联,复联;多路系统,多次线路2.连锁商店,联号3.developed in both humans and animalstypes multiple ageing tissueThe team method a of analysing genes in heterogeneous多种多样的;混杂的1.adj.The/Wizard to heterogeneous transform import allows youand Data Transformation Services Import Export data consistency连贯性,n.1.一致性黏稠度,坚实度,浓度2.,and,for were measurements key each to ensure consistency and repeatabilityof protocolsTo this end theproduced集会)大会,n.1.(某一职业、政党等的人士召开的常规惯例,2.习俗,(换俘等)协定,协议(国家或首脑间的)公约,, 3.协议,协定【桥牌】叫牌的一套常规4.全国代表大会;政党代表大会)(美国5.The letter urged the government to ratify the at the earliest possible opportunity Conventionencoding译码编码,n.1.etc attribute measures,naming conventions,encoding structures,inensure consistencyattribute…归因于是;vt.1.认为…认为某作品出自某人之手2.]物属于某人[3.认为某事[物](to))归于,诿于…归咎于,把(过错的责任等把4.…归于;把…归因于,把…属于(品性、特征)品质归于某人,认为某人具有5.把……品性,认为产生的时间、时期或地点等…6.确定特性,属性n.1.价值2.特征、品性,品质)3.(人或物的象征,标志文艺作品中人、物、职务等的)(4.)在名词短语中修饰名词的形容词5.【语法学】定语,修饰语,限定词(【逻辑学】属性,性质6.6.conventions,naming consistency inensure etcmeasures,structures,attribute encodinghorizon地平线n.1.眼界,范围,界限2.天球地平圈,真正平圈3.)(线4.水平人工地平测量高度用的)5.(视平线透视)6.(可望见的东西7.范围;见识知识、阅历、兴趣等的)8.眼界,视线;(significantly意味深长地adv.1.值得注目地;显著地2.operational即可使用的1.adj.经营的)操作的,2.(用于军事行动的3.perspective景1.远景,n.希望前途;2.透视;透视画法;中心透视3.透视图4.想法观点,5.态度;观点;思考方法6.The time horizon(范围)for the data warehouse is significantly longer than that of operationalsystemsexplicitly明确地明白地,adv.1.implicitly暗示地;1.adv.含蓄地无疑问地;无保留地;绝对地2.implicitly ortime,of explicitlyContains anelement mapping计划,…的地图1.映射,绘制log木料,原木,木材n.1.飞行日志;(尤指)航海日志,(某时期事件的)正式记录2.,日志砍伐1.vi.vt.&记录…载入正式记录;把vt.1.…记入航海日志;把行驶,行进(若干距离或时间)小时(距离(2.航行…),飞行…);7.started,of time possible if get the agenda To getahead mind mapping a meeting summarization概要,1.摘要n.,,the,the the of abbreviations our understanding notes are the summarization and core content As we know booksrefreshing新鲜的新颖的;1.耳目一新的;adj.使恢复精神的使人精神焕发的;2.使人凉爽的3.granularity粒度间隔尺寸,n.1.The both generality granularity encompasses and itbeauty of the technique is that Chapter 3Data Warehouse Models概念(上)的;观念(上)的1.adj.model conceptual metadata元数据1.n.granularity粒度,1.间隔尺寸n.model granularity model and metadata entity统一性实际存在物.独立存在体,n.1.实体,modelrelationship Entity-commodity货物1.n.商品,有用的东西2.农产品;矿产品3.有价值的物品4.,the worshipperstime theaccording to doctrine of Timeis themost valuable commodity onecan have1.而呈现多维Multidimentionalschema图表计划,n.1.概要,model Multidimentional snowflake雪片,n.1.雪花schema Snowflake constellation.星座1n..一群杰出人物28.diit enjoodino9.变坚固3.aggregation集结集成;n.1.聚集,集成体聚集体,2.theas well and aggregation,as technique,with functionalities such as summarization, consolidation,analysisis anangles.from differentto view information ability trendline趋势线1.histogram柱状图1.n.1.圆形分格统计图表n.scatter驱散分散;,(使)vt.&vi.1.(使)散开撒1.vt.散落;三三两两;零零星星1.n.plot故事情节1.n.密谋,(2.秘密)计划小块地皮3.基址,地基4.小区,小地段5.划分;把…分成小块vt.1.标出;2.绘制密谋;策划3.密谋1.&vi.vt.设计作品情节1.vi.标绘;作图;用坐标确定位置,坐标显示2.plot Scatter hierarchy等级制度1.n.领导层统治集团,2.层次体系3.dimensionof The hierarchyarray一系列陈列,1.n.展示,服装衣服,2.阵列,数组3.大堆;大群;大量4.整队,布置排列,vt.1.部署兵力,配置兵力;装饰打扮,,2.盛装array Multidimensional10.sort类别种类;n.1.群;某种人2.分类;排序3.品级4.品质;性质;性格5.整理分类;&vi.1.vt.整理好(或安排妥当)…1.妥善处理;把vt.)连用out挑选,拣出,区分(常与2.)连用常与with,together3.把…归类(排序分类,把…根据指令的模式)把…4.【计算机】((with)]交往;友好往来vi.1.[英国方言,,the available sort are notonly Human recordshowever perspectives透视,远景,看法;1.n.的复数形式)perspective2.构面;观点展示(keep wants towhich an organization perspectives or entities with respect to Dimensions aretherecordsChapter5classification分级分类,n.1.门类种类,2.类别,(动植物等的)分类学,分类法3.classfication views,differentDifferent spatial三维空间的,空间的,立体空间的1.adj.is in,,reading and languageas well some sensory understandingand spatial recognitionasThis area involved.vision temporal时间的1.adj.非永恒的,,短暂的2.暂存的现世的;3.世俗的世间的事物暂存的事物,n.1.使世俗化vt.1.俗人n.1.,,,,certain flexibiinterlocutors a themgives hatstwowearpontiffsthatfactThe temporal andspiritual andtheir heterogeneous多种多样的;混杂的1.adj.11.and heterogeneous extremely are of the cellular enzymesthuscontainThe albumins the majority legacyn.1.遗产,遗赠物2.遗留之物3.遗留问题;后遗症in,a overcomestruggled to States which remains a prominent andsensitive issuehas the United Race,discrimination and segregation legacy of slavery Chapter6Data preprocessingreduction降价,;减少的量n.1.减少,缩小(照片、地图、图片等的)缩图,缩版2.【生物学】减数分裂3.【摄影术】减薄4.【数学】约简5.【化学】还原6.降低;降级;降职7.归纳;总括;简化8.浓缩变稠9.稀释10.is way of,hypotheses fromexplanation by or reduction deductionItofpart of the methodIdentify识别,认出1.同情,2.支持辨认;识别;认出;鉴定;验明;确定3.连用with使等同于;把…看做一致(常与4.连用with(常与5.使支持;使参与,使关系密切vi vt.&有关联1.等同于;vi.))连用with(1.同情;跟…发生共鸣;支持常与datanoisy out smooth Identify outliers and incomplete未完成的不完善的,不完整的,adj.1.不完全的,(学业成绩评分)未修毕,未完成1.n.core.incomplete is Thereforeour knowledgeof thequite occupation职业工作;n.1.业余活动消遣2.,侵占,占领期占领3.,12.expecuthamosomor datisaleincom orthogonausin13.的管辖区)(或督察员4.(巡官的)巡区;检查员视察;检阅;参观5.at the of the's for5about will cameraarmtake endthe inspection shuttle robot sensorsThey are using and a hours median在中间的;通过中点的adj.1.中间值的;中间的2.中位数1.n.(三角形的)中线2.medians bin by Smoothing suspicious疑心的,adj.1.猜疑的可疑的2.表示怀疑的3.不信任的;持怀疑态度的4.attention recent media of the with any suspicious activity in light We areconcerned redundancy多余,,过剩n.1.过多累赘,)冗长2.(尤指文字重复);(自动)多余度,冗余3.(机器的因劳动力过剩而造成的)裁员,解雇(4.备份1.a cocktail that targetsmolecules inhibitory ofadministerproblemaround this redundancy would be to wayOne mechanisms multiple pain normalization正规化;;正常化n.1.常态化decimal小数的十进位的,adj.1.小数n.1.normalization max min-scaling缩放比例n.1.respectively分别;各自;顺序为;依次为1.adv.normalization正规化;;正常化n.1.常态化caling s by decimalnormalization aggregation集结集成,;n.1.聚集集成体,2.聚集体aggregation Datacube14.discretization离散化1.n.was continuous attributes discretization of entropy of the information table,the By use of thesuper-club data and implemented heuristic(教学或教育)启发式的1.adj.of teaching pharmacology heuristic didacticsarticle reviews the applications to This compression压缩,1.挤压n.压缩冲程)(内燃机的2.压制;3.压抑a a,click,namefolder type the Folderspecify set compression exception forandfolder then Tocomponents成分零件;机器、设备等的)构成要素;n.1.(构成的组成的;adj.1.The are,compositionand build size type three components of body segmentation分割1.n.variable an explainedprocess we take In the segmentationdistinct完全分开的1.截然不同的,adj.明显的明白的,清晰的2.,的;线条分明的)(或认识3.清楚的,一清二楚的,显著的;不会搞错的;能清楚地识别不同的,个别的,各别的;有区别的,差异的;单独的,独立的,独特的4.不同的,不同性质的,不同种类的,不相似的)(或种类5.性质the,a in possibility distinct is sharp riseaIn medium terminflationChapter7Mining association rules in large databases association社团,n.1.协会交往,结合2.联合,联系;关联;交往,交际,结交3.关系)(或合伙、合作、合股4.友谊;伙伴团体,会,社,学会,联合会;联盟,同盟5.的联系或观念))联想;思想(思想、感觉、记忆等的6.(concepts mining:basic association rulecorrelation相互的关系1.n.data ofsetlargeaamongrelationships correlation orassociationinterestingfindsminingruleAssociation 15.items.implication牵涉牵连,1.卷入,n.暗指,含义,暗示2.可能的影响(或作用、结果)3.含蓄;含意;4.【逻辑学】蕴涵5.the provedeasily so other implication isBut notthreshold入门起点;门口〈喻〉开始;开端;;n.1.门槛阈;界限;起始点2.【物理学】临界值3.【地质学】海底山脊,海槛4.阈值的,临界值的1.adj.按物价指数变动工资的,工资极限的,级限的]2.[英国英语called are confidence threshold support threshold anda minimum Rulesthat satisfy both aminimum strong.occurrence出现,n.1.发生发生的事;2.事件itemsetan of occurrence The frequency algorithm运算法则n.1.算法;演算法;计算程序2.演示3.algorithm Apriori candidate候选人1.申请求职者,n.报考者2.攻读学位者3.最后命运或结局如何已显然可见者4.成为牧师候选人1.vi.a the votes ofdefeated candidate demanded recountTheabstraction抽取,n.1.抽象抽象化;抽象过程2.抽象概念;抽象名称3.抽象性,抽象的特征4.出神;心不在焉5.不切实际的想法,空想;幻想的事物6.,the,from dynamics knowsStaticsphysicist isonlyan abstraction16.learninowou17.induction以数据表示的统计学的统计的1.adj.,,就职仪式接纳会员,,入伍,n.1.就职吸入2.感应电或磁的)3.()(法4.归纳催产;催生5.data statisticalmultilayer多层n.1.拓扑学布局;1.拓扑,n.house apartment a triplex multilayer ofWe live in a initial最初的;开始的;第一的1.adj.原始的;初期的;2.【语音学】声母的,首音的3.首字母)复数](姓名或组织名称等的n.1.[首字母)2.(词的minimize]程度减至最低数量[vt.1.把…]重要性的价值[极力贬低(某事物)某事物2.对()作最低估计;And,without green laws,they try to their impact on their surroundings anyway minimizeiteration反复n.1.重述;重述的事2.循环]3.[计算机scalability可伸缩性,n.1.可量测性interpretability and robustness,scalability,speed,Chapter9Cluster Analysisoutlier外露层局外人,1.露宿者,n.离群值,异常值。