kettle节点介绍

一。转换
1.表输入
通过表输入可以写SQL语句,引入想要查询和转换的数据内容。
2.值映射
通过值映射可以将对应字段的值转化为相应的规范标准。
3.增加常量
为从表输入的数据增加相应固定的值列。
4.获取系统信息
可以通过获取系统信息来为输入数据增加系统内部的信息。如系统时间。
5.Modified Java Script Value
通过编写相应的JS来控制输出字段的值。可以进行格式的转换,数据的修改等。
6.去除重复记录
可以将重复的记录进行过滤,保留唯一的数据内容。
7.表输出
将对应的数据按照匹配的原则输出到指定的目标表表中。
8.Json output
将相应的数据按照JSON的标准输出到指定位置。
9调用DB存储过程
可以调用数据库中建立的存储过程。如ID的自动增加。注意不需要添加返回值。
10.JSON Input
JSON对象文件输入。可以读取按照JSON标准编写数据的文件。
11.生成记录
在JOB中如果没有输入,需要添加一个生成记录来作为转换的开始。属性限制设置为1。
12.增加序列
在数据的表数据中,可以为数据自动的增加一列作为自动ID的增加。ID的内容可以从数据库获取,也可以设置为自动增加。
13.Simple evaluation
循环的判断条件。在JOB中可以根据需要作为循环的判断加入JOB。
14.Generate random value
在输入的流中,自动的增加一列信息。信息内容可以指定为UUID等值。
15.计算器
通过列值的合并来生成新值和相应的列。
16.拆分字段
将数据流中的复合字段根据相应的标准进行分割,并放置到对应的新列中。
17.字段选择
根据需要对数据流中的字段进行过滤或重命名。
18.排序记录
根据需要对数据流中的行顺序进行调整,设置升序或降序。
19.过滤记录
根据需要,对数据流中的数据进行过滤。通过添加条件和判断值来过滤数据内容。在连接时,可以根据需要将不同的数据流写入到不同的介质中。
20.Strings cut
根据需要对输入流的内容进行截取。参数类似于substring中的from和to。并可以生成需要的新列。
21.Replace in string
根据需要对输入流中的内容进行相应的替换。
22.Switch/Case
该节点进行行数据内容值的分流。并对对应的值指定相应的下一步节点和处理。
23.File exists
根据相应的文件位置信息自动的判断文件是否存在,并添加相应列来标记文件状态。
24.Add XML
该节点进行行内容自动转化为xml格式并保存到数据库字段中的工作。可以在这里设置字段是属性还是节点。
25.Append streams
该节点将两段输入流合并成一个输出流向外输出。两个输入流必须保证相同的字段,相同的数据类型,相同的行长度。
26.Clone row
该节点对输入的数据行进行克隆负责

。可以在输出时在行上添加上是否是克隆的标志位。
27.GET Files Rows Count
该节点返回文件内容中的行数。
28.GET data from XML
该节点为从本地xml文件中获取相应的数据。并按照一定的格式输出到下一个节点。
29.XML Input Stream
该节点从xml文件中获取相应的Element和value等信息并输出。
30.XSL Transformation
该节点根据XML和XSL进行相应的转换。JOB中也有相应的节点。JOB中可以读取本地XML和本地XSL,然后设置生成新的XML文件位置。
31.Data Validator
该节点对输入的数据进行date类型和data内容的判断。根据判断的结果来分别处理相应的数据内容。
32.删除
该节点可以对表中的内容根据相应的条件进行删除。条件获取的值只能是从前一节点获取。不能够直接设置。
33.xml join
该节点将相应的xml流合并,并以一个统一的格式输出。
34.复制记录到结果
该节点用于在转换之间传递数据流。可以将上一个节点的数据以流的形式传递给下一个节点。
35.从结果获取记录
该节点主要用于获取前一个转换的数据流。通常情况下与“复制记录到结果”节点一起使用。
36.Set field value
该节点主要是通过输入获取字段,并将字段内的值替换成流中的其他字段。注意只能是流中的其他字段值,不能是手动输入的值。
37.Set field value to a constant
该节点与上一个节点对应。这个节点可以替换流中的字段值,值可以自己设置,并且可以使用系统参数中的值。当使用系统参数时,只需要将Use variable in constant打上勾即可。
38.Split field to rows
该节点可以根据输入field的内容设置分割符,将原有的一行根据要求变为多行数据。
39.If field value if null
该节点可以对输入的域自动进行判断。有两种类型。1。根据字段类型判断。2。根据输入域判断。当为null时可以自动添加设置的默认值。
40.Null if
该节点可以根据输入域的内容,将特定的值转换为null值。
41.Detect empty stream
该节点主要是用来判断输入是否是空流。当输入是空流时,输出一条空行。当输入不是空流时,什么也不做。
二。工作
1。START
转换工作的开始
2。Success
转换工作的成功结束
3。Create a folder
创建一个文件夹
4。Delete folders
删除一个文件夹。
5。Wait for
等待时长。
6。DUMMY
自我感觉是过渡节点,没有实际作用,什么也不做。
7。Set variables
设置全局的环境变量,以便多个转换可以使用该环境变量。
8。JavaScript
JS脚本。它的输出结果只能是boolean。在这里面添加自身的判断。
9。DisplayMsgBox Info
显示相应的提示对话框。可以添加对话框的title和body.
10.table exist
通过连接数据库判断数据库中指定的数据库表是否存在。结果

为true和false。指定下一步的transformation.
11.Ping a host
通过ping一个主机来执行一个相应的判断。
12.Mail validator
JOB节点。主要用来判断Mail地址是否正确。
13.File Compare
JOB节点。主要用来判断两个文件是否一致。
14.JOB
该节点可以引用已经建立好的JOB来嵌套执行。当有多个JOB节点时,这些JOB是顺序执行的。

相关文档
最新文档