chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于數(shù)據(jù)分析的各類主流ETL 工具比較,哪種最適合你

電子工程師 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:工程師飛燕 ? 2018-06-23 11:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)提取、轉(zhuǎn)換與加載(ETL,Extract-Transform-Load)工具能夠使組織內(nèi)的不同數(shù)據(jù)更易于訪問(wèn)、更有意義、也更能被其他數(shù)據(jù)系統(tǒng)所使用。通常情況下,面對(duì)由此產(chǎn)生的自寫代碼、自建系統(tǒng)的相關(guān)成本和復(fù)雜性時(shí),企業(yè)會(huì)直接去選擇購(gòu)置ETL工具。

第一種選擇:您可以根據(jù)自身的情況,選擇各種開(kāi)源的ETL工具(請(qǐng)參考https://www.alooma.com/blog/open-source-etl-tools-comparison),來(lái)進(jìn)行自行搭建。不過(guò)您往往會(huì)發(fā)現(xiàn)自己需要有更多的功能、靈活性與技術(shù)支持。

第二種選擇:與現(xiàn)有供應(yīng)商合作,選擇一種能夠很好地處理當(dāng)前數(shù)據(jù)源和數(shù)據(jù)流的解決方案。此處所說(shuō)的現(xiàn)有供應(yīng)商,一般是一些大品牌的廠商。

第三種選擇:最新的ETL平臺(tái)。這些通常是基于云端的解決方案,能夠?yàn)楝F(xiàn)有數(shù)據(jù)源到云端數(shù)據(jù)倉(cāng)庫(kù)的各種數(shù)據(jù)提供端到端的ETL支持。它們也是針對(duì)日益增長(zhǎng)的、基于網(wǎng)絡(luò)的大數(shù)據(jù)流量所構(gòu)建的。

本文將深入分析各種現(xiàn)有ETL工具的優(yōu)、缺點(diǎn),并快速瀏覽各種最新的ETL平臺(tái)。

現(xiàn)有ETL工具概述

現(xiàn)有的ETL工具通常由業(yè)界知名公司(微軟,IBM等)所設(shè)計(jì),因此其預(yù)裝的客戶群也比較龐大。

這些工具一般由一整套的工具所組成,并且能夠針對(duì)具體的問(wèn)題被予以定制。由于許多公司將其數(shù)據(jù)存儲(chǔ)在傳統(tǒng)的單一數(shù)據(jù)庫(kù)和系統(tǒng)之中,因此這些工具的制造商能夠提供用相應(yīng)的數(shù)據(jù)遷移工具,并支持現(xiàn)有的批處理方法。

常見(jiàn)的ETL工具

下面雖不是一份完整的清單,但它涵蓋了主要的工具產(chǎn)品。

1.IBM InfoSphere Information Server

作為一款ETL工具,IBM InfoSphere Information Server是IBM Information Platforms Solutions套件和IBM InfoSphere的一部分。它使用圖形符號(hào)來(lái)構(gòu)建數(shù)據(jù)的整合方案,并具備各種版本(包括服務(wù)器版,企業(yè)版和MVS版)。

2.Informatica PowerCenter

Informatica PowerCenter是一款ETL產(chǎn)品套件的總稱,它包括PowerCenter客戶端工具、服務(wù)器和存儲(chǔ)數(shù)據(jù)庫(kù)。

該軟件將數(shù)據(jù)存儲(chǔ)在庫(kù)中,以便客戶端工具和服務(wù)器能夠訪問(wèn)到。各種操作一般在服務(wù)器上被執(zhí)行,其服務(wù)器分別連接到源與目標(biāo)系統(tǒng)上以獲取數(shù)據(jù),然后通過(guò)各種轉(zhuǎn)換,最終將數(shù)據(jù)加載到目標(biāo)系統(tǒng)之中。

3.iWay軟件

Information Builders的iWay集成套件具有將應(yīng)用程序與數(shù)據(jù)相集成的功能。客戶可以使用它們來(lái)管理結(jié)構(gòu)化、與非結(jié)構(gòu)化的信息。該套件包括有iWay數(shù)據(jù)遷移器、iWay服務(wù)管理器和iWay通用適配器框架。

4.Microsoft SQL Server Integration Services

Microsoft SQL Server集成服務(wù)(SSIS)是一個(gè)高性能的數(shù)據(jù)集成方案平臺(tái),它包含了用于數(shù)據(jù)倉(cāng)庫(kù)的各種ETL包。

5.OpenText

OpenText集成中心是一個(gè)具有整合能力的平臺(tái),各個(gè)企業(yè)能夠通過(guò)它來(lái)提取、增強(qiáng)、改造、整合數(shù)據(jù),并且可以將數(shù)據(jù)內(nèi)容從一個(gè)或多個(gè)存儲(chǔ)庫(kù)遷移到任何新的目標(biāo)之上。

6.Oracle GoldenGate

Oracle GoldenGate是一款比較全面的軟件包,它能夠?qū)崿F(xiàn)在異構(gòu)的IT環(huán)境中進(jìn)行實(shí)時(shí)的數(shù)據(jù)集成與復(fù)制。

7.Pervasive軟件

Pervasive的數(shù)據(jù)集成平臺(tái)是一款企業(yè)級(jí)的數(shù)據(jù)集成軟件方案,它能夠幫助公司在任何類型的數(shù)據(jù)源和應(yīng)用程序之間建立起連接。同時(shí),它還能支持各種實(shí)時(shí)集成的場(chǎng)景。

8.Pitney Bowes軟件

Pitney Bowes能夠提供大量針對(duì)數(shù)據(jù)集成的工具和解決方案。其Sagent Data Flow是一款靈活的整合引擎,它能夠采集不同來(lái)源的數(shù)據(jù),并提供一套全面的數(shù)據(jù)轉(zhuǎn)換工具,以增強(qiáng)其核心的業(yè)務(wù)價(jià)值。

9.SAP Business Objects Data Services

以前被稱為Business Objects Data Integrator的SAP業(yè)務(wù)對(duì)象數(shù)據(jù)服務(wù)(BODS)是一款可被用于數(shù)據(jù)集成、質(zhì)量控制、分析和處理的ETL工具。它能夠幫助您將可信的數(shù)據(jù)整合并轉(zhuǎn)換到各個(gè)數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)之中, 以產(chǎn)生分析報(bào)告。

10.SAS Data Management

SAS數(shù)據(jù)管理建立在SAS平臺(tái)之上,它是SAS投向ETL市場(chǎng)的一個(gè)工具。該平臺(tái)由一個(gè)包含了(20多種)SAS工具和服務(wù)的大型套件所組成。

11.Sun Java Composite Application Platform Suite

Sun的ETL與數(shù)據(jù)集成工具是大型Java復(fù)合應(yīng)用程序平臺(tái)套件(CAPS)中的一部分。它是Oracle公司的一款標(biāo)準(zhǔn)化企業(yè)服務(wù)總體套件(Enterprise Service Bus software suite)。Java CAPS的組件能夠整合現(xiàn)有應(yīng)用程序,并能在面向服務(wù)的架構(gòu)環(huán)境中提供新的業(yè)務(wù)服務(wù)。

12.SYBASE

Sybase ETL包括Sybase ETL Development和Sybase ETL Server。

Sybase ETL Development是一款用于創(chuàng)建和設(shè)計(jì)數(shù)據(jù)轉(zhuǎn)換項(xiàng)目與作業(yè)的GUI工具。該工具提供了一個(gè)完整的模擬與調(diào)試環(huán)境,旨在加速ETL轉(zhuǎn)換流程的開(kāi)發(fā)。Sybase ETL Development包含有一臺(tái)用于控制實(shí)際處理流程的ETL開(kāi)發(fā)服務(wù)器,它能夠連接到各個(gè)數(shù)據(jù)庫(kù),并執(zhí)行相關(guān)過(guò)程。

Sybase ETL Server是一種可擴(kuò)展的分布式網(wǎng)格引擎,它使用轉(zhuǎn)換流(由Sybase ETL Development所設(shè)計(jì))來(lái)連接到各個(gè)數(shù)據(jù)源,通過(guò)提取數(shù)據(jù),然后將數(shù)據(jù)加載到目標(biāo)之上。

13.Syncsort

SyncSort的云解決方案能夠訪問(wèn)并整合來(lái)自各種來(lái)源的數(shù)據(jù),從而于將數(shù)據(jù)遷移到各個(gè)云端的存儲(chǔ)數(shù)據(jù)庫(kù)之中。

現(xiàn)有ETL工具的局限性

現(xiàn)有工具最大的局限性在于:它們被設(shè)計(jì)為“批量進(jìn)行工作”,即:采集數(shù)據(jù)、上傳數(shù)據(jù)、采集更多的數(shù)據(jù)、再上傳之。這種批量加載數(shù)據(jù)在某些情況下的確適用,但是在某些單獨(dú)的方法上會(huì)存在一些問(wèn)題。

數(shù)據(jù)批處理與轉(zhuǎn)換工具很難實(shí)現(xiàn)跨平臺(tái)的數(shù)據(jù)源采集,特別是在涉及到變更數(shù)據(jù)捕獲(CDC,Change Data Capture)的情況時(shí)。當(dāng)上傳批量數(shù)據(jù)出現(xiàn)問(wèn)題時(shí),您需要跟蹤問(wèn)題、排除故障并盡快重新提交作業(yè)。而這種批量處理方式是非常致命的,因?yàn)槿绻跀?shù)據(jù)倉(cāng)庫(kù)中存在著超過(guò)24小時(shí)的、被API調(diào)用與分配的數(shù)據(jù);或者需要同時(shí)備份傳入的數(shù)據(jù),那么這些CDC信息就可能因此而丟失或被覆蓋,從而造成巨大的問(wèn)題。

而面對(duì)越來(lái)越多的數(shù)據(jù)流和其他類型的數(shù)據(jù)源時(shí),尤其是在需要盡快提供最新數(shù)據(jù)的需求下,這些批處理的工具集就更加不適合了。

最新ETL工具的概述

最新的ETL工具套件是以實(shí)時(shí)流量數(shù)據(jù)處理和云計(jì)算為基礎(chǔ)所構(gòu)建的。它們與先進(jìn)的云端數(shù)據(jù)倉(cāng)庫(kù)有著很好的集成,并能夠支持持續(xù)增長(zhǎng)的數(shù)據(jù)源和數(shù)據(jù)流。

如今的趨勢(shì)是:基于云的ETL服務(wù)。它們通常能夠提供對(duì)實(shí)時(shí)數(shù)據(jù)、智能模式檢測(cè)等方面的支持。

隨著對(duì)實(shí)時(shí)數(shù)據(jù)訪問(wèn)需求的出現(xiàn),諸如Kafka之類的最新模型,都能夠?qū)崿F(xiàn)基于數(shù)據(jù)流的處理和分布式的消息隊(duì)列。以Alooma為代表的公司,通過(guò)新的技術(shù)提供了基于SaaS平臺(tái)和本地的解決方案。面對(duì)數(shù)據(jù)流,最新的ETL平臺(tái)能夠在完成加載的數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部,進(jìn)行不同級(jí)別的轉(zhuǎn)換,并通過(guò)Python、Java等代碼以實(shí)現(xiàn)完全控制。

而對(duì)于數(shù)據(jù)的完整性,最新的ETL平臺(tái)通過(guò)強(qiáng)大的內(nèi)置安全網(wǎng)絡(luò),能夠?qū)崿F(xiàn)各種錯(cuò)誤的處理和報(bào)告。

常見(jiàn)的最新ETL平臺(tái)和工具

下面列出了常見(jiàn)的最新ETL平臺(tái)和工具:

1.Alooma

Alooma是一個(gè)為云服務(wù)構(gòu)建的企業(yè)數(shù)據(jù)管道(data pipeline)平臺(tái)。Alooma能夠提供一種現(xiàn)代的、可擴(kuò)展的、基于云端的ETL解決方案,它可以實(shí)時(shí)地將來(lái)自任何數(shù)據(jù)源的數(shù)據(jù)匯集到任何一個(gè)數(shù)據(jù)倉(cāng)庫(kù)之中。

錯(cuò)誤處理:處理、監(jiān)控/報(bào)告、整流(restreaming)

轉(zhuǎn)換:支持Python轉(zhuǎn)換的ETL

2.Confluent

Confluent是一個(gè)基于Apache Kafka的全面數(shù)據(jù)流平臺(tái)。它能夠在數(shù)據(jù)流中發(fā)布、訂閱、存儲(chǔ)并處理數(shù)據(jù)。Confluent提供了其平臺(tái)的開(kāi)源版本。

錯(cuò)誤處理:僅監(jiān)控

轉(zhuǎn)換:ETL,Kafka Streams API

3.Fivetran

Fivetran是一款SaaS類型的數(shù)據(jù)集成工具。它能夠從不同的云服務(wù)、數(shù)據(jù)庫(kù)和商業(yè)智能(BI)工具中提取數(shù)據(jù),并將其加載到數(shù)據(jù)倉(cāng)庫(kù)之中。

錯(cuò)誤處理:僅監(jiān)控

轉(zhuǎn)型:有限的ELT

4.FlyData

FlyData是一款SaaS類型的數(shù)據(jù)遷移工具。它可用于管理MySQL、PostgreSQL、MariaDB、Percona的數(shù)據(jù)加載過(guò)程,并以CSV/TSV/JSON的格式記錄到Amazon的Redshift數(shù)據(jù)倉(cāng)庫(kù)之中。

錯(cuò)誤處理:緩沖式處理

轉(zhuǎn)型:有限的ELT

5.Matillion

Matillion能夠提供云端數(shù)據(jù)的集成。它是一款專為Amazon Redshift、Google BigQuery和Snowflake構(gòu)建的ETL工具。

錯(cuò)誤處理:僅通過(guò)代碼支持,但并非內(nèi)置

轉(zhuǎn)換:圖形化構(gòu)建的ETL

6.SnapLogic

SnapLogic提供了數(shù)據(jù)集成平臺(tái)即服務(wù)(data integration platform-as-a-service)的工具,可用于連接各種云端數(shù)據(jù)源、SaaS應(yīng)用和本地的商業(yè)軟件應(yīng)用。

錯(cuò)誤處理:支持,但并非內(nèi)置

轉(zhuǎn)換:圖形化構(gòu)建的ETL

7.Stitch Data

Stitch是一款云端優(yōu)先(cloud-first)的、開(kāi)發(fā)者專用工具,可用于快速地移動(dòng)數(shù)據(jù)。

錯(cuò)誤處理:手動(dòng),記錄在拒絕表(rejection table)中

轉(zhuǎn)型:有限的準(zhǔn)ETL

8.StreamSets

StreamSets是原生云(cloud-native)的產(chǎn)品集合,可用于控制數(shù)據(jù)漂移,以及與數(shù)據(jù)、數(shù)據(jù)源、數(shù)據(jù)基礎(chǔ)架構(gòu)、數(shù)據(jù)處理有關(guān)的變化問(wèn)題。

錯(cuò)誤處理:有錯(cuò)誤記錄處理

轉(zhuǎn)換:代碼類和GUI的ETL

9.Striim

Striim(發(fā)音為“stream”)是一個(gè)實(shí)時(shí)的流媒體分析和數(shù)據(jù)集成平臺(tái)。

錯(cuò)誤處理:僅監(jiān)控

轉(zhuǎn)換:內(nèi)置和具有Java功能的ETL

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ETL工具
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7328
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1473

    瀏覽量

    35041
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PROTEL新手最適合的教程我是受益匪淺希望對(duì)有用

    PROTEL新手最適合的教程我是受益匪淺希望對(duì)有用,真的很適合新手使用我是學(xué)會(huì),下載希望您多多留言,大家一起學(xué)習(xí)
    發(fā)表于 04-21 21:36

    模數(shù)轉(zhuǎn)換器規(guī)格很多,怎樣快速弄清哪種最適合既定應(yīng)用?

    模數(shù)轉(zhuǎn)換器(ADC)有很多規(guī)格,總是很難弄清哪種ADC才最適合既定應(yīng)用。那么,選擇轉(zhuǎn)換器時(shí)只關(guān)注分辨率、信噪比(SNR)或者諧波是否可以?還有其他技術(shù)規(guī)格同樣舉足輕重嗎?
    發(fā)表于 01-15 16:29

    請(qǐng)問(wèn)哪種傳感器最適合測(cè)量速度?

    Hi-FRDS什么樣的傳感器可以用來(lái)測(cè)量速度?哪種傳感器最適合測(cè)量速度?為什么?郵寄一些資料 以上來(lái)自于百度翻譯 以下為原文hi frds what type of sensors
    發(fā)表于 06-05 06:28

    帶有CSG324封裝的PCB表面處理最適合什么應(yīng)用呢?

    我正在設(shè)計(jì)一個(gè)帶有CSG324封裝的Spartan6的FR-4 PCB。該板用于海底安裝,應(yīng)具有25年以上的使用壽命。哪種PCB表面處理最適合此應(yīng)用?我相信ENIG在平坦度方面是最好的,但我相信無(wú)鉛HASL可以提供最佳的長(zhǎng)期焊點(diǎn)
    發(fā)表于 07-31 06:28

    現(xiàn)在做企業(yè)級(jí)數(shù)據(jù)分析,離不開(kāi)秒分析數(shù)據(jù)可視化工具

    現(xiàn)在做企業(yè)級(jí)數(shù)據(jù)分析的,哪個(gè)離得開(kāi)秒分析、秒呈現(xiàn)的數(shù)據(jù)可視化工具?不說(shuō)那日增月累的億級(jí)數(shù)據(jù)分析量大的驚人,就說(shuō)
    發(fā)表于 07-21 15:06

    數(shù)據(jù)量大、分析急,該用什么軟件做數(shù)據(jù)分析?

    數(shù)據(jù)量大,現(xiàn)在的軟件分析效率太低,操作也麻煩,有沒(méi)有更適合數(shù)據(jù)分析軟件?或許BI數(shù)據(jù)分析軟件會(huì)是個(gè)好選擇。奧威軟件旗下的OurwayBI就
    發(fā)表于 12-29 11:33

    如何挑選最適合的PXI/PXIe系統(tǒng)?

    影響PXI/PXIe系統(tǒng)散熱的要素是什么?如何配置風(fēng)扇,以取得風(fēng)扇最佳性能?如何挑選最適合的PXI/PXIe系統(tǒng)?
    發(fā)表于 05-08 08:03

    如何選擇最適合自己的筆記本電腦

    如何選擇最適合自己的筆記本電腦 買筆記本其實(shí)就像找老婆,無(wú)論高低胖瘦,美貌與否都不是最重要,關(guān)鍵在于是否真正“適合,如果一個(gè)中
    發(fā)表于 02-04 16:20 ?593次閱讀

    哪種“口味”的藍(lán)牙技術(shù)最適合?

    簡(jiǎn)要為您介紹Bluetooth Low Energy技術(shù)的發(fā)展歷程,Bluetooth Smart和Bluetooth Smart Ready的消費(fèi)類電子市場(chǎng)定位,以及如何確定哪種“口味”的藍(lán)牙技術(shù)最為適合您。
    發(fā)表于 07-09 09:28 ?5154次閱讀
    <b class='flag-5'>哪種</b>“口味”的藍(lán)牙技術(shù)<b class='flag-5'>最適合</b><b class='flag-5'>你</b>?

    蘋果MacBook Pro購(gòu)買指南:哪個(gè)型號(hào)最適合?

    足夠便攜,同時(shí)又能輕松處理日常任務(wù)的機(jī)器,那就選擇MacBook Air。如果你想要的是最新的科技和最大程度的便攜性,同時(shí)又不在乎價(jià)格,那MacBook肯定最適合。
    發(fā)表于 03-18 10:44 ?2.5w次閱讀

    TI的工業(yè)通信解決方案,以最適合的器件、軟件、工具及支持

    TI的工業(yè)通信解決方案,以最適合的器件、軟件、工具及支持
    發(fā)表于 09-01 14:41 ?4次下載
    TI的工業(yè)通信解決方案,以<b class='flag-5'>最適合</b>的器件、軟件、<b class='flag-5'>工具</b>及支持

    最適合linux系統(tǒng)的筆記本

    本視頻主要詳細(xì)介紹了最適合linux系統(tǒng)的筆記本,分別是Dell筆記本、Acer筆記本、Dell游戲本。
    的頭像 發(fā)表于 03-04 14:06 ?1.9w次閱讀

    哪種Altium PCB設(shè)計(jì)軟??件最適合?

    對(duì)于哪種Altium專業(yè)PCB設(shè)計(jì)產(chǎn)品適合您而感到困惑?是不是只想用CircuitMaker?舔腳趾?您是剛開(kāi)始使用的專業(yè)PCB,還是需要AltiumDesigner?提供的所有靈活馬力的全面印刷電路板設(shè)計(jì)大師?了解Altiu
    的頭像 發(fā)表于 07-25 10:14 ?2143次閱讀

    蘋果13最適合買的配置

     隨著蘋果發(fā)布會(huì)時(shí)間的時(shí)間臨近,關(guān)于iPhone13系列版本配置也曝光了出來(lái),那么蘋果13最適合買的配置是哪個(gè)呢?下面我們一起看看不同版本配置的區(qū)別。
    的頭像 發(fā)表于 09-13 10:37 ?6590次閱讀

    數(shù)據(jù)分析工具下載

    數(shù)據(jù)分析工具下載
    發(fā)表于 10-21 17:56 ?5次下載