從本質(zhì)上說,數(shù)據(jù)湖就是一個(gè)信息資源庫。人們常常將數(shù)據(jù)湖與數(shù)據(jù)倉庫混為一談,但兩者在架構(gòu)和滿足的業(yè)務(wù)需求上都不一樣。尤其是,隨著社交媒體數(shù)據(jù)、物聯(lián)網(wǎng)機(jī)器數(shù)據(jù)和交易數(shù)據(jù)持續(xù)快速增加,云數(shù)據(jù)湖成為了現(xiàn)代數(shù)據(jù)管理戰(zhàn)略的重要組成部分。存儲、轉(zhuǎn)換和分析各類數(shù)據(jù)的能力可以為企業(yè)發(fā)現(xiàn)新業(yè)務(wù)機(jī)會和實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型鋪平道路,而數(shù)據(jù)湖正好能賦予企業(yè)這種能力。
數(shù)據(jù)湖的定義
數(shù)據(jù)湖是一個(gè)中央數(shù)據(jù)存儲庫,可以幫助解決數(shù)據(jù)孤島問題。重要的是,數(shù)據(jù)湖可以存儲大量原生或原始格式的原始數(shù)據(jù),包括結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化格式的數(shù)據(jù)。數(shù)據(jù)湖,尤其是云端的數(shù)據(jù)湖,具有成本低、易擴(kuò)展的特點(diǎn),并且常與實(shí)用機(jī)器學(xué)習(xí)分析工具一起使用。
數(shù)據(jù)湖 VS 數(shù)據(jù)倉庫
與數(shù)據(jù)湖相比,數(shù)據(jù)倉庫還提供數(shù)據(jù)管理功能,而且存儲的是經(jīng)過處理和過濾的數(shù)據(jù),這些數(shù)據(jù)事先基于預(yù)定義的業(yè)務(wù)問題或用例進(jìn)行了處理。

數(shù)據(jù)倉庫和數(shù)據(jù)湖對比
數(shù)據(jù)倉庫與數(shù)據(jù)湖通常互為補(bǔ)充。例如,當(dāng)需要存儲在數(shù)據(jù)湖中的原始數(shù)據(jù)來回答業(yè)務(wù)問題時(shí),可以將其從數(shù)據(jù)湖中提取出來,進(jìn)行清理和轉(zhuǎn)換,然后在數(shù)據(jù)倉庫中進(jìn)一步分析。
“數(shù)據(jù)湖倉一體”是近幾年出現(xiàn)的新概念,還在不斷發(fā)展,它在傳統(tǒng)數(shù)據(jù)湖的基礎(chǔ)上增添了數(shù)據(jù)管理功能。從本質(zhì)上講,數(shù)據(jù)湖庫就是數(shù)據(jù)湖和數(shù)據(jù)倉庫的融合。
除上述數(shù)據(jù)類型和流程差異外,下表還列出了數(shù)據(jù)湖與數(shù)據(jù)倉庫解決方案的一些其他區(qū)別。

審核編輯 黃宇
-
數(shù)據(jù)管理
+關(guān)注
關(guān)注
1文章
336瀏覽量
20487 -
數(shù)據(jù)倉庫
+關(guān)注
關(guān)注
0文章
64瀏覽量
10920
發(fā)布評論請先 登錄
Next Pathway成為Snowflake最高級別合作伙伴
部署Denodo與數(shù)據(jù)湖倉架構(gòu)聯(lián)用,用戶可獲得345%投資回報(bào)率(ROI),實(shí)現(xiàn)3–4倍數(shù)據(jù)洞察提速
水利水文監(jiān)測與河湖長制管理平臺解決方案
河湖生態(tài)流量監(jiān)測平臺解決方案?
微軟推出全新Microsoft Sentinel數(shù)據(jù)湖國際版
請問CYW2019B2的SPI1與SPI2有什么區(qū)別?
軟通動力攜手鴻湖萬聯(lián)亮相華為開發(fā)者大會2025
數(shù)據(jù)中心和通信網(wǎng)絡(luò)有什么區(qū)別
華為發(fā)布AI數(shù)據(jù)湖解決方案加速行業(yè)智能化 AI時(shí)代數(shù)據(jù)覺醒
GD32與STM32有什么區(qū)別
注塑機(jī)數(shù)據(jù)采集網(wǎng)關(guān)和數(shù)據(jù)中臺有哪些聯(lián)系特點(diǎn)

什么是數(shù)據(jù)湖?數(shù)據(jù)湖和數(shù)據(jù)倉庫有什么區(qū)別?
評論