大数据技术词汇表
(完整版)工程英语词汇

(完整版)工程英语词汇一、基础工程词汇1. 工程:Engineering2. 项目:Project3. 设计:Design4. 施工:Construction5. 监理:Supervision6. 材料:Material7. 结构:Structure8. 质量:Quality9. 安全:Safety10. 进度:Schedule二、土木工程词汇1. 土壤:Soil2. 基础:Foundation3. 桥梁:Bridge4. 隧道:Tunnel5. 路面:Pavement6. 水利:Hydraulic Engineering7. 港口:Harbor8. 道路:Road9. 铁路:Railway10. 地铁:Subway三、建筑工程词汇1. 建筑物:Building2. 楼层:Floor3. 墙体:Wall4. 屋顶:Roof5. 窗户:Window6. 门:Door7. 楼梯:Stairs8. 幕墙: Curtain Wall9. 装修:Decoration10. 室内设计:Interior Design四、电气工程词汇1. 电路:Circuit2. 电线:Wire3. 开关:Switch4. 插座:Outlet5. 发电机:Generator6. 变压器:Transformer7. 电动机:Motor8. 电池:Battery9. 照明:Illumination10. 控制系统:Control System五、机械工程词汇1. 机械:Machine2. 零件:Part3. 轴承:Bearing4. 齿轮:Gear5. 润滑:Lubrication6. 紧固件:Fastener7. 焊接:Welding8. 冲压:Stamping9. 加工:Machining10. 装配:Assembly六、环境工程词汇1. 环境:Environment2. 污染:Pollution3. 废水:Wastewater4. 废气:Waste Gas5. 噪音:Noise6. 固体废物:Solid Waste7. 污染治理:Pollution Control8. 节能:Energy Saving9. 环保:Environmental Protection10. 可持续发展:Sustainable Development七、信息技术工程词汇1. 信息技术:Information Technology (IT)2. 网络:Network3. 服务器:Server4. 数据库:Database5. 编程:Programming6. 软件开发:Software Development7. 硬件:Hardware8. 云计算:Cloud Computing9. 大数据:Big Data八、化学工程词汇1. 化学反应:Chemical Reaction2. 流体力学:Fluid Mechanics3. 热力学:Thermodynamics4. 分离过程:Separation Process5. 反应器:Reactor6. 材料 science:Material Science7. 质量传递:Mass Transfer8. 能量传递:Energy Transfer9. 过程控制:Process Control10. 安全工程:Safety Engineering九、航空航天工程词汇1. 航空:Aeronautics2. 航天:Astronautics3. 飞行器:Aircraft4. 发射:Launch5. 航天器:Spacecraft6. 导航:Navigation7. 飞行控制系统:Flight Control System8. 火箭:Rocket9. 卫星:Satellite10. 航天站:Space Station十、生物医学工程词汇1. 生物医学:Biomedical2. 生物材料:Biomaterial3. 医疗设备:Medical Device4. 生物力学:Biomechanics5. 细胞工程:Cell Engineering6. 基因工程:Genetic Engineering7. 仿生学:Bionics8. 生物传感器:Biosensor9. 医学影像:Medical Imaging10. 组织工程:Tissue Engineering十一、项目管理词汇1. 项目管理:Project Management2. 项目经理:Project Manager3. 项目规划:Project Planning4. 项目预算:Project Budget5. 项目进度:Project Schedule6. 风险管理:Risk Management7. 质量管理:Quality Management8. 成本控制:Cost Control9. 团队协作:Team Collaboration10. 项目交付:Project Delivery十二、建筑信息模型(BIM)词汇1. 建筑信息模型:Building Information Modeling (BIM)2. 三维模型:3D Model3. 四维建模:4D Modeling(时间维度)4. 五维建模:5D Modeling(成本维度)5. BIM软件:BIM Software6. 模型协调:Model Coordination7. 数字化施工:Digital Construction8. BIM协作:BIM Collaboration9. 可视化:Visualization10. 仿真分析:Simulation Analysis十三、绿色建筑与可持续性词汇1. 绿色建筑:Green Building2. 可持续性:Sustainability3. 节能:Energy Efficiency4. 碳排放:Carbon Emission5. 绿色认证:Green Certification6. 生态设计:Esign7. 资源循环:Resource Recycling8. 生物多样性:Biodiversity9. 低影响开发:Low Impact Development (LID)10. 环境生命周期评估:Environmental Life Cycle Assessment十四、电子工程与自动化词汇1. 电子工程:Electronics Engineering2. 电路板:Circuit Board3. 集成电路:Integrated Circuit (IC)4. 传感器:Sensor5. 自动化:Automation6. 控制系统:Control System7. 技术:Robotics8. 伺服电机:Servo Motor9. 可编程逻辑控制器:Programmable Logic Controller (PLC)10. 工业互联网:Industrial Internet of Things (IIoT)十五、地质工程与矿业词汇1. 地质工程:Geological Engineering2. 地层:Stratum3. 岩土工程:Geotechnical Engineering4. 钻探:Drilling5. 矿业:Mining6. 采掘:Excavation7. 岩石力学:Rock Mechanics8. 地下水:Groundwater9. 防滑坡:Landslide Prevention10. 矿物加工:Mineral Processing。
科技新词汇

科技新词汇
1. 人工智能(AI)- 一种模拟人类智能的计算机系统,可执行复杂的任务和学习新知识。
2. 虚拟现实(VR)- 通过计算机生成的模拟环境,给用户提供一种身临其境的感觉。
3. 无人机(UAV)- 能够在没有人员操作的情况下飞行的无人机器。
4. 云计算(Cloud Computing)- 基于互联网的计算模型,可通过网络访问远程的计算资源。
5. 区块链(Blockchain)- 由多个互相链接的数据块组成的分布式数据库,用于记录不可篡改的交易信息。
6. 物联网(Internet of Things)- 将物理设备和物品与互联网连接,使其能够相互通信和交互。
7. 机器学习(Machine Learning)- 让计算机通过自动学习和适应数据模式来执行特定任务的方法。
8. 增强现实(Augmented Reality)- 结合现实世界和虚拟信息的技术,通过使用显示设备来提供增强的感知体验。
9. 生物识别(Biometric)- 使用个人生理特征(如指纹、面部识别等)或行为特征进行身份验证的技术。
10. 大数据(Big Data)- 处理和分析大量数据的技术和方法,用于发现隐藏的模式和洞察。
2023年度科技词汇

2023年度科技词汇
2023年度科技词汇有:
1. 大语言模型:是人工智能领域的现象级概念。
2. 生成式人工智能:是能够高效地生成全新的、真实的、有用的数据的人工智能系统。
3. 量子计算:是遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。
4. 脑机接口:是在人脑和计算机或其他电子设备之间建立直接的通信和控制路径的技术。
5. 数据要素:是数据资源,是数据来源的构成,包括数据采集、数据存储、数据清洗等。
6. 智慧城市:是运用物联网、云计算、大数据、空间地理信息集成等新一代信息技术,促进城市规划、建设、管理和服务智慧化的新理念和新模式。
7. 碳足迹:是指企业机构、活动、产品或个人通过交通运输、食品生产和消费以及各类生产过程等引起的温室气体排放的集合。
8. 柔性制造:是一种灵活、高效和个性化的制造方式,通过先进的自动化和信息技术实现生产线的智能化和柔性化。
9. 再生稻:是指利用水稻的再生能力,在头季稻收割后,让稻桩上存活的休眠芽萌发生长,抽穗结实,再收一季稻的种植方式。
10. 可控核聚变:是一种利用轻元素核在超高温和超高压环境下聚变成重元素核
并释放巨大能量的技术。
常用大数据词汇中英文对照表

常用大数据词汇中英文对照表A聚合(Aggregation)–搜索、合并、显示数据的过程算法(Algorithms)–可以完成某种数据分析的数学公式分析法(Analytics)–用于发现数据的内在涵义异常检测(Anomaly detection)–在数据集中搜索与预期模式或行为不匹配的数据项。
除了“Anomalies”,用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息匿名化(Anonymization)–使数据匿名,即移除所有与个人隐私相关的数据应用(Application)–实现某种特定功能的计算机软件人工智能(Artificial Intelligence)–研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习B行为分析法(Behavioural Analytics)–这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式大数据科学家(Big Data Scientist)–能够设计大数据算法使得大数据变得有用的人大数据创业公司(Big data startup)–指研发最新大数据技术的新兴公司生物测定术(Biometrics)–根据个人的特征进行身份识别B字节(BB: Brontobytes)–约等于1000 YB(Yottabytes),相当于未来数字化宇宙的大小。
1 B字节包含了27个0!商业智能(Business Intelligence)–是一系列理论、方法学和过程,使得数据更容易被理解C分类分析(Classification analysis)–从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(meta data),是描述数据的数据云计算(Cloud computing)–构建在网络上的分布式计算系统,数据是存储于机房外的(即云端) 聚类分析(Clustering analysis)–它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。
电子商务英语词汇表

电子商务英语词汇表电子商务英语词汇表在当今全球化的商业环境中,电子商务已经成为企业和个人发展的重要策略。
为了更好地适应这一趋势,掌握电子商务相关的英语词汇是至关重要的。
本文将为您提供一份详尽的电子商务英语词汇表,帮助您扩展商务领域的词汇量。
一、电子商务基础词汇1. Electronic Commerce(电子商务)- The buying and selling of goods and services over the internet.2. Online Shopping(网上购物)- The act of purchasing products or services through the internet.3. E-marketplace(电子市场)- An online platform where buyers and sellers come together to conduct business transactions.4. E-tailer(电子零售商)- An online retailer that sells products directly to consumers.5. B2B (Business-to-Business)(企业对企业)- Electronic transactions between businesses.6. B2C (Business-to-Consumer)(企业对消费者)- Electronic transactions between businesses and consumers.7. E-payment(电子支付)- The electronic transfer of funds for online purchases or transactions.8. SSL (Secure Sockets Layer)(安全套接层)- A security protocol that ensures secure communication between a website and its users.9. E-commerce Platform(电子商务平台)- Online software or application that enables businesses to sell products or services online.二、电子商务经营词汇1. Digital Marketing(数字营销)- Online marketing activities to promote products or services using digital channels.2. SEO (Search Engine Optimization)(搜索引擎优化)- Strategies and techniques to improve the visibility and ranking of a website in search engine results.3. SEM (Search Engine Marketing)(搜索引擎营销)- Online advertising to promote websites by increasing their visibility in search engine results.4. Social Media Marketing(社交媒体营销)- Marketing activities that utilize social media platforms to engage with the target audience and promote products or services.5. Content Marketing(内容营销)- Creating and distributing valuable and relevant content to attract and retain customers.6. Conversion Rate(转化率)- The percentage of website visitors who complete a desired action, such as making a purchase or filling out a form.7. Customer Acquisition(获客)- The process of attracting new customers to a business.8. Customer Retention(客户保留)- Strategies and activities aimed at keeping existing customers and encouraging repeat purchases.9. CRM (Customer Relationship Management)(客户关系管理)- A system or strategy to manage and analyze interactions with current and potential customers.10. Click-through Rate (CTR)(点击率)- The ratio of users who click on a specific link to the number of total users who view a page or advertisement.三、电子商务技术词汇1. E-commerce Website(电子商务网站)- An online platform that facilitates buying and selling of products or services.2. Mobile Commerce(移动商务)- Electronic transactions conducted through mobile devices, such as smartphones or tablets.3. Responsive Design(响应式设计)- A website design that adjusts and adapts to different screen sizes, ensuring optimal viewing experience across multiple devices.4. Cloud Computing(云计算)- The practice of storing and accessing data and programs over the internet instead of using local servers or hard drives.5. Big Data(大数据)- Large and complex data sets that can be analyzed to reveal patterns, trends, and associations.6. Artificial Intelligence (AI)(人工智能)- The simulation of human intelligence by computer systems to perform tasks such as natural language processing, problem-solving, and learning.7. Blockchain(区块链)- A decentralized and transparent digitalledger that records transactions across multiple computers.8. Data Encryption(数据加密)- The process of converting data into a code to prevent unauthorized access.9. API (Application Programming Interface)(应用程序接口)- A setof rules and protocols that allow different software applications to communicate with each other.结语通过掌握这些电子商务相关的英语词汇,对于参与和拓展电子商务领域的工作或学习将会非常有帮助。
14个大数据专业词汇帮你更好地理解大数据

14个大数据专业词汇帮你更好地理解大数据大数据一直以来都是一个热门的话题,它正在不断影响和改变我们的生活,工作和社会发展。
然而,由于其复杂性和专业性,有些人对大数据的理解可能不够深入。
在本文中,我将介绍14个重要的大数据专业词汇,以帮助您更好地理解大数据及其相关概念。
1. 数据挖掘(Data Mining)数据挖掘是从大量数据中发现模式、关联、异常和趋势的过程。
它帮助人们从数据中提取有用的信息,并据此做出决策。
2. 机器学习(Machine Learning)机器学习是一种通过给计算机提供大量数据和示例来使其自动学习的方法。
通过机器学习,计算机能够从数据中自动识别模式,并作出预测和决策。
3. 数据可视化(Data Visualization)数据可视化是用图表、图形和其他视觉元素将数据呈现出来,以便更好地理解数据。
它能够帮助人们从大数据中快速获取洞察,并以更直观的方式展示数据。
4. 云计算(Cloud Computing)云计算是一种通过网络提供计算资源和服务的模式。
通过云计算,用户可以随时随地访问数据和应用程序,并通过云服务商提供的服务器和存储来处理和存储数据。
5. 数据仓库(Data Warehouse)数据仓库是一个集成的、面向主题的、可变动的数据集合,用于支持管理决策。
它通过将来自多个来源的数据进行整合,并进行数据清洗和转换来提供决策支持的数据。
6. HadoopHadoop是一个开源的大数据处理框架,可在集群中处理和存储大规模的数据。
它采用分布式计算的方法,使得可以在多个计算机上并行处理大数据任务。
7. Apache SparkApache Spark是一个快速、通用的大数据处理引擎,具有内存计算功能。
它能够处理大规模数据集,并支持多种数据处理模式,如批处理、交互式查询和流数据处理。
8. 数据治理(Data Governance)数据治理是一套规范和流程,用于确保企业数据的质量、一致性、可靠性和安全性。
大数据英语词汇

兴趣图谱interest graph大众分类法folksonomy分类法taxonomy流streamOGP开放图协议open graph protocol团分析clique analysis图谱 API 管理工具Graph API Explorer字段扩展和嵌套field expansion and nesting代码库repository布局算法layout algorithm档案字段profile field字段选择器field selector国防情报defense intelligence欺诈检测fraud detection统计地图cartogram地理聚合泡泡图Dorling Cartogram自然语言工具natural language toolkit NLKT编辑距离edit distance levenshtein聚合agglomerate聚类算法clusteringalgorithm层次聚类hierarchical clustering信息检索information retrieval IR非结构化数据分析Unstructured Data Analysis UDA 环聊hangouts动态activities生活片段moments句子切分sentence segmentation分词 tokenization单词组合word chunking实体检测entity detection搭配检测collocation detection停用词stop word解释器会话interpreter session向量空间模型vector space model原始频率raw frequency雅卡尔系数 Jaccard Index似然率likelihood ratio二项分布binomial distribution逐点互信息pointwise mutual information, PMI卡方检验Chi-square样板boilerplateGoogle知识图谱google ’sknowledge graph句子解析器sentence tokenizer交叉验证cross-validation标签云tag cloud文摘摘要自动生成 the automatic creation of literature abstracts “词袋”模型“Bag of Words ”model贝叶斯分类器Bayesian classifier广度优先搜索breadth-first search置信区间 confidence interval监督式机器学习supervised machine learning线程词 thread pool图灵测试turning test拉取请求pull request点度中心度degree centrality中介中心度 betweenness centrality接近中心度closeness centrality分页的开发者文档developer documentation for pagination 被加星的库列表list repositories being starred延迟迭代lazy iterator超图 hypergraph超边 hyperedges中心度量centrality measure社交图谱social graph轴辐式图hub and spoke graph最小生成树minimum spanning tree。
大数据专业词汇

大数据专业词汇随着大数据技术的不断提高,大数据应用的不断普及,大数据与各行各业的关系越来越紧密。
大数据行业充斥着大量的专业词汇,准确掌握和了解这些词汇的含义,有助于更好的理解大数据,更好地利用大数据技术。
1.本地数据库(LDB/Local Data Base)本地数据库是指驻留于运行客户应用程序的机器的数据库。
本地数据库位于本地磁盘或局域网。
典型的本地数据库有Paradox、dBASE、FoxPro和ACCCSS。
2.数据采集(Data Acquisition,DAQ)数据采集又称数据获取,将被测试对象的各种参量通过各种传感器做适当转换后,再经过信号调理、采样、量化、编码、传输等步骤传递到控制器的过程。
数据采集的一般步骤:①用传感器感受各种物理量,并把它们转换成电信号;②通过A/D转换,模拟量的数据转变成数字量的数据;③数据的记录,打印输出或存入磁盘文件。
④生产厂商为该采集系统编制的专用程序,常用于大型专用系统;⑤固化的采集程序,常用于小型专用系统;⑥利用生产厂商提供的软件工具,用户自行编制的采集程序,主要用于组合式系统。
3.数据模型(data model)数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义。
数据模型是数据库中数据的存储方式,是数据库系统的基础。
在数据库中,数据的物理结构又称数据的存储结构,就是数据元素在计算机存储器中的表示及其配置;数据的逻辑结构则是指数据元素之间的逻辑关系,它是数据在用户或程序员面前的表现形式,数据的存储结构不一定与逻辑结构一致。
4.数据整理(Data Cleansing)数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程,是数据统计分析的基础。
5.数据处理(Data Handling)数据处理是指对数据(包括数值的和非数值的)进行分析和加工的技术过程。
也就是对数据的采集、存储、检索、加工、变换和传输,将数据转换为信息的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据技术词汇表Anomaly:见异常值词条。
Apache Software Foundation(ASF):专门为支持开源软件项目而办的一个非盈利性组织。
ARPU(Average revenue per user):每个用户的平均收入。
Artificial neural network:人工神经网络,通常简称神经网络。
Avro:一个在Hadoop上的数据序列化系统,设计用于支持大批量数据交换应用。
宝贝:淘宝和天猫网上商城对于网店商品的专门用语。
贝叶斯分析方法(Bayesian Analysis):提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。
bounce rate:见跳出率词条。
B2C:英文Business-to-Consumer的缩写,其中文含义为企业对消费者。
CART:Classification and Regression Trees的英文首字母缩写,或者称分类与回归树,是一种决策树分类算法。
CBL(China Black List):中国垃圾邮件黑名单。
Cluster(类或簇的英文):是一个数据对象的集合。
Cookie: 指的是指网站为了辨别用户身份而储存在用户本地终端浏览器上的一类数据。
CRM(用户关系管理,Customer Relationship Management)指的是公司对客户和潜在客户的管理模式。
Direct Marketing:见直效行销词条。
Discriminant analysis:见判别分析词条。
DSS(Decision Support System):决策支持系统的缩写,是辅助决策者通过数据、模型和知识,进行半结构化或非结构化决策的计算机应用系统。
独立访客:指在一天之内(00:00-24:00)访问网站的上网电脑数量(以cookie为依据)。
EB:计算机存储单位,1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes(字节),或是2的60次方字节。
EDM(Email Direct Marketing):用电子邮件进行营销的方式。
EIS(Executive Information Systems的缩写,高级管理人员信息系统):为高级管理人员设计的系统,用于深层次管理数据分析和运营趋势分析等。
Entropy:见熵。
二跳率:当网站页面展开后,用户在页面上产生的首次点击被称为“二跳”,二跳的次数即为“二跳量”,而二跳量与浏览量的比值称为页面的二跳率。
ETL:(Extract Transform Load)的缩写,是指数据的提取、转换、加载。
分布式数据库(Distributed Database):用计算机网络将物理上分散的多个数据库单元连接起来组成一个逻辑统一的数据库。
关联规则(Association rules):是形如X→Y的蕴涵式,其中X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。
根节点:决策树最上面的节点。
在它上面没有其他节点,其他所有的属性都是它的后续节点。
购物篮分析(market basket analysis):就是关联规则算法。
在市场上关联规则算法经常作为商品购物车的分析,所以在应用领域又被称为购物篮分析。
Granularity:见“粒度”。
HBase :一个在HDFS上搭建大规模结构化存储集群分布式存储系统,具有高可靠性、高性能、面向列,可伸缩特性。
HDFS:部署在廉价硬件上提供高吞吐量和高容错性的分布式文件系统,适合有超大数据集的应用程序。
Hive:基于Hadoop的数据仓库工具,可以将结构化的数据映射成数据表并提供类SQL数据库查询管理功能,适合于数据仓库的统计分析。
后验概率(Posterior Probability):当根据经验及有关材料推测出主观概率后,对其是否准确没有充分把握时,可采用概率论中的贝叶斯公式进行修正,修正前的概率称为先验概率,修正后的概率称为后验概率。
回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
计量经济学(Econometrics)是以经济学和数理统计学为方法论作为基础,对于经济问题试图用数量和经验两者进行综合的经济学分支。
基于互联网的挖掘(Web挖掘)是利用数据挖掘技术从Web文档及Web服务中自动发现并提取人们感兴趣的信息。
交叉验证(Cross-validation):主要用于建模应用中,在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。
机器学习(Machine Learning):研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
监督式学习(Supervised learning):机器学习中的一类,可以由训练资料中学到或建立一个模式(函数),并依此模式推测新的样本归类或者属性。
聚类(Clustering):将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。
由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
决策树(Decision Tree):一般都是自上而下的来生成的。
每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。
决策树剪枝(Decision tree pruning):由于在决策树生成过程中,会过度拟合训练数据,而且易受噪声数据的影响,所以剪枝操作是决策树生成过程中的一个重要步骤决策支持系统(decision support system):辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。
KDD(Knowledge discovery in database):泛指所有从源数据中发掘模式或联系的方法k近邻(k nearest):一个理论上比较成熟的方法,也是最简单的机器学习算法之一。
该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
LAMP:Linux,Apache,MySQL和PHP,四种web技术的缩写,是一些web2.0公司使用的主要技术组合。
landing page:见着陆页词条。
LBS(Location-based service)是与位置相关的软件服务的英文缩写,指的是一类利用和控制与位置及时间相关的计算机软件服务。
粒度(Granularity):指数据仓库的数据单位中保存数据的细化或综合程度的级别。
Lift:使用分类器相对于不使用分类器产生的正类的比例。
联机事务处理系统(OLTP):实时采集处理与事务相连的数据以及共享数据库和其它文件的地位的变化。
在联机事务处理中,事务是被立即执行的,这与批处理相反,一批事务被存储一段时间,然后再被执行。
联机分析处理(OLAP):使分析人员,管理人员或执行人员能够从多角度对信息进行快速一致,交互地存取,从而获得对数据的更深入了解的一类软件技术。
流量(traffic):是指网站的访问量,是用来描述访问一个网站或是网店的用户数量以及用户所浏览的网页数量等一系列指标,这些指标主要包括:独立访客数量(unique visitors)、·页面浏览数(page views)、每个访客的页面浏览数(Page Views per user)。
六度分隔理论(Six Degrees of Separation):是个假设,在人际关系脉络方面您可以通过不超出六位中间人直接与世上任意人认识LNMP:Linux,Nginx,MySQL和PHP,四种web技术的缩写,是一些web2.0公司使用的主要技术组合。
Metadata:见元数据。
MapReduce:HDFS上处理大数据集的并行计算框架。
MongoDB: 是一个基于分布式文件存储的数据库。
Nginx:开源的高性能HTTP服务器。
Outlier: 见异常点词条。
PAM:见围绕中心点的划分聚类算法判别分析(Discriminant analysis):是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
PB:计算机存储单位,1 PB = 1,024 TB = 1,048,576 GB = 1,125,899,906,842,624 Bytes(字节),或是2的50次方字节。
PU学习:正例和无标记样本学习(Learning from Positive and Unlabeled examples)一般称为LPU或PU学习,是一种半监督学习方法。
Pig:在HDFS和MapReduce上处理大规模数据集的脚本语言,它提供更高层次的抽象并转化为优化处理的MapReduce运算。
频繁集(frequent itemset):是大于最小支持度的项目集。
强关联规则:如果某条规则同时满足最小支持度(min-support)和最小置信度(min-confidence),则称它为强关联规则。
R语言:R是属于GNU系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的工具。
REST(Representational State Transfer,表现状态转移):是Roy Fielding博士在2000年他的博士论文中提出来的一种软件架构风格,在此风格中,每个资源是由全球唯一的URI 来指定,资源本身和其表现方式是完全独立的;当一个用户拿到资源的表现方式时,他有足够的信息可以修改或者删除服务器上相应的资源而且每条消息都包含了足够的信息可以描述消息的处理。
热图(heat map):热图或热力图是数据的一种二维呈现,其中的数值都用颜色表示。
一个简单的热图提供信息的即时可见概况。
人工神经网络(Artificial Neural Networks):一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。
这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
人工智能(Artificial Intelligence):研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
3C产品:3C产品指的是通讯产品(Communication),消费类电子产品(Consumer Electronics)和电脑产品(Computer),三类产品的首字母都是C,所以称3CSEMMA是数据挖掘过程(Sample, Explore, Modify, Model,and Assess)的英文缩写,意思是抽样,检查,修改,设立模型和评估。