首页> 电脑软件> 数据操作 > Kettle spoon开源ETL工具
Kettle spoon开源ETL工具

Kettle spoon开源ETL工具

点击下载(73.6 MB)

PC软件无法在手机上运行,请前往碧蓝下载站电脑版下载

放心下载 免谷歌广告 无广告

软件详情

Kettle是一个国外著名的开源etl工具,Kettle中文版需要在java环境下运行,Kettle免费版的中文名字叫做水壶,程序员希望将所有格式的数据集中在一起,而后以一种特定的格式流出。Kettle免费版使用简单,任何用户都能快速掌控。

Kettle

【基本介绍】

Kettle Spoon是一个国外开源的ETL工具,可以帮你轻松连接数据库的工具,它是纯java编写,可以在Window、Linux、Unix上运行,因此本程序需要JAVA支持,先安装JRE虚拟机后才可以运行,Kettle Spoon内置创建数据库连接向导与复制拷贝表向导。


【官方介绍】

Kettle是一个国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取有效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把多种数据放到一个壶里,而后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation与job,transformation完成对于数据的基础转换,job则完成整个工作流的控制。


【特色介绍】

整体性能增强
新的错误处理代码(重播)阅读文本文件与Excel文件
新步骤:删除值映射,设置变量,把变量,得到的文件名,把文件
从结果中,在结果与阻塞步骤中设置文件
搜索元数据的功能在Spoon:寻找一个值或参数
多种参数的转换与工作功能
可能进出库,就算在批量备份
定位的代码转换成英语,中文,法语,德语与荷兰语
很多增强现有的步骤与工作项
测井能力
容易固定目标表映射
修正的外观与感觉的所有平台


【功能介绍】

同时设计与编辑多个转换
存储库修正包含名称、用户、对象类型排序内容的能力与修改日期
变量增强包含在很多步骤类型与视觉指标上增加支持支持变量的所有字段强大的新步骤
高性能,基于表达式的JavaScript步骤
添加xml步骤,用于从流字段生成复杂的xml结构为内部、左外、右外、满的高级连接合并连接步骤外
快速排序合并连接合并在同一密钥上的多个流使用Web服务动态检索参数的HTTP客户端查找
其他
远程监控转换与工作执行
使用xml而不需要使用存储库共享数据库连接的能力
可以回滚整个转换错误(独特的连接)


【安装步骤】

这款软件必须在java下运行,因此我们需先安装java,步骤如下:
点击执行文件后,默认继续点击【下一步】


默认选择开发工具,安装目录可以默认,也是选择安装在其他磁盘下,继续点击下一步


正在进行安装状态,需要耐心等待几分钟


默认安装jre,之钱jdk路径没有更改的话,就默认即可,继续点击下一步


安装状态显示安装进度条,需要等待一会,如果安装完成,提示已安装成功,点击关闭按钮即可




系统计算机右键菜单中点击属性--->弹出窗口高级--->点击环境变量


点击新建,弹出窗口输入:JAVA_HOME,值:输入JDK安装路径【C:\Program Files\Java\Jdk1.8.0_60】,点击确定




在系统变量中找到Path,把JAVA_HOME配置到path中,选择中path后,点击编辑,把JAVA_HOME\bin;配置到最前面


检验JDK是否配置成功,运行CDM后,输入java -version后,回车就是现实jdk版本信息说明成功了。
或者输出java回车,输出信息后,在输入javac,如果输出正常说明成功




配置kettle环境变量,找到kettle存放路径,KETTLE_HOME:D:\...(存放路径)


部署kettle,把下载完的kettle解压到指定目录中即可


在kettle跟目录中找到spoon.bat文件,找到后,并双击运行即可
因为kettle是免安装的,因此可以直接运行即可


如果配置完成后,运行启动界面与启动后界面,下图可供参考所示


【使用方法】

打开kettle
第一步解压下载下来的压缩包如:pdice320stable.zip
而后打开Spoon.bat,下图可供参考所示:
打开后请耐心等待一会儿时间。


建立转换
在文件-》新建装换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。下图可供参考所示:
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。


简单的数据表插入\更新
(1)新建表插入
在左边的面板中选择核心对象,在核心对象里面选择输入-》表输入,用鼠标拖动到右边面板。下图可供参考所示:


双击拖过来的表,可以编辑表输入。
选择数据库连接与编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。


(2)通过插入\更新输出到表。
在左边面板中选择核心对象、选择输出-》插入\更新下图可供参考所示:


编辑插入更新:
第一步:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新。


而后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个先保存了才可以运行,可以随意保存到任何一个地方。


使用作业控制上面装换执行。
使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 与转换。


双击start可以编辑,可以设置执行时间等等


打开装换,可以设置需要执行的转换任务,例如可以执行上面我们做的转换,XXX.ktr
最后点击运行就OK了。


【更新日志】

修正的性能与可扩展性
远程监控与执行转换
集群支持(MPP)
数据库分区支持(不与表划分混淆)
N多的内存与性能修正
增强的数据库支持
修正的报价算法
在步骤中分离架构/所有者与表名
数据库连接池支持

详细信息

  • 大小:73.6 MB
  • 星级:★★★☆☆
  • 版本: v3.2.0 中文版
  • 语言:简体中文
  • 更新时间:2018-10-10 11:03:24

同类热门

更多 +
举报