chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

為什么需要數(shù)據(jù)倉庫?

智能感知與物聯(lián)網(wǎng)技術研究所 ? 來源:通信信號處理研究所 ? 2020-05-13 15:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)倉庫為組織了解其歷史業(yè)務表現(xiàn)和推動持續(xù)運營提供了一個接入窗口,為數(shù)據(jù)分析師和業(yè)務用戶提供了諸如客戶行為、業(yè)務趨勢、運營效率和銷售等方面的信息。盡管出現(xiàn)了基于Hadoop和其他一些大數(shù)據(jù)技術的數(shù)據(jù)湖這一概念,但隨著公司越來越需要從更多不同的源系統(tǒng)收集和分析業(yè)務數(shù)據(jù),這使得數(shù)據(jù)倉庫仍然具有其實用價值,甚至比以前更加重要。

但作為數(shù)據(jù)管理體系結構的一部分,在對數(shù)據(jù)倉庫平臺進行投資之前,首先還是要檢查您的組織是否真的需要一個數(shù)據(jù)倉庫平臺,以及通過實施部署,組織可以借此獲取哪些業(yè)務收益。相關的,您必須考慮不同的數(shù)據(jù)倉庫部署情況——在企業(yè)范圍內(nèi)還是部門范圍內(nèi),在本地還是在云中。

您還需要確定,通常存儲在大數(shù)據(jù)系統(tǒng)中的非結構化和半結構化數(shù)據(jù),是否會成為數(shù)據(jù)倉庫環(huán)境的組成部分,并確定是否將用于BI、企業(yè)報告和在線分析處理(OLAP)等應用的傳統(tǒng)數(shù)據(jù)倉庫,與數(shù)據(jù)處理和大數(shù)據(jù)分析管理集成在一起。最后,您必須將您的數(shù)據(jù)倉庫用例與最合適類型的數(shù)據(jù)倉庫平臺相匹配。

為什么需要數(shù)據(jù)倉庫?

數(shù)據(jù)倉庫的一般概念非常簡單:從支持業(yè)務流程的操作系統(tǒng)中定期提取數(shù)據(jù)副本,并將其加載到單獨的存儲庫中,在該存儲庫中,數(shù)據(jù)將被合并,然后可用于分析和報告。之后,業(yè)務用戶和分析師可以通過BI和分析工具、儀表板、入口和準備好的報告來訪問數(shù)據(jù)。

在下面這些情況下,數(shù)據(jù)倉庫可能更容易發(fā)揮其價值:

·公司在做出有效的商業(yè)活動報告方面遇到了難題,因為所需要的數(shù)據(jù)不容易獲得。

·不同部門和用戶組會將業(yè)務數(shù)據(jù)復制到電子表格中以進行分析,而這些電子表格并非總是相互一致的。

·數(shù)據(jù)質(zhì)量和準確性的不確定性,導致企業(yè)高管和業(yè)務經(jīng)理會質(zhì)疑報告的準確性。

·針對生產(chǎn)數(shù)據(jù)庫的BI報告會每晚延遲,或在月底進行的交易數(shù)據(jù)處理,需要擴展處理窗口。

·在工作日對數(shù)據(jù)庫運行臨時查詢會降低操作系統(tǒng)的速度,從而影響內(nèi)部用戶和客戶、供應商以及其他外部用戶。

一個正確數(shù)據(jù)倉庫實施策略可以幫助您的組織準確地回答有關業(yè)務運營的問題,如發(fā)生了什么、為什么。數(shù)據(jù)倉庫可將來自不同位置和來源的數(shù)據(jù)組合到中央存儲庫中,從而提高數(shù)據(jù)的可訪問性。當數(shù)據(jù)移至數(shù)據(jù)倉庫時,通常還會對其進行清理和轉換,以使其與分析一致,這將有助于提高查詢結果和報告中信息的質(zhì)量。

此外,一旦數(shù)據(jù)倉庫部署完成并得到積極使用,由于BI、報告和分析活動已從生產(chǎn)數(shù)據(jù)庫中移出,運營工作流程可能會變得更有效率。

數(shù)據(jù)倉庫的部署

各個組織之間的數(shù)據(jù)倉庫環(huán)境可能會有很大差異。從體系結構的角度來看,部署可以遵循多個路徑——如一個企業(yè)數(shù)據(jù)倉庫(EDW),一組較小的數(shù)據(jù)集市,或這兩種方法的組合。

EDW包含來自企業(yè)操作系統(tǒng)的所有相關數(shù)據(jù),并且可能包含一些從外部數(shù)據(jù)源收集的數(shù)據(jù)。它是用于BI和分析數(shù)據(jù)的單個統(tǒng)一存儲庫,可以在所有部門和業(yè)務部門中使用。因此,建立EDW通常是一項艱巨的任務,尤其是在大型企業(yè)中。

在EDW架構中,組織還可以在其操作系統(tǒng)和企業(yè)數(shù)據(jù)倉庫之間實施運營數(shù)據(jù)存儲(ODS)作為過渡步驟。將運營數(shù)據(jù)復制到ODS,然后提取并加載到數(shù)據(jù)倉庫中。ODS可以用作尚未經(jīng)過轉換的、無法用于分析的數(shù)據(jù)的暫存區(qū),同時可以用于運行近實時的查詢,這些查詢需要最新的業(yè)務運營的詳細相關數(shù)據(jù),而不是數(shù)據(jù)倉庫中可用的數(shù)據(jù)。

數(shù)據(jù)集市是小型化的數(shù)據(jù)倉庫,專注于各個業(yè)務部門和職能領域。當需要滿足部門對BI的特定需求時,組織通常會選擇建立數(shù)據(jù)集市,并且優(yōu)先考慮報告功能。數(shù)據(jù)集市不需要涵蓋整個企業(yè)的龐大項目,而是更加集中,并且可以更快地提供業(yè)務收益。

因此,數(shù)據(jù)集市的方法使組織可以通過一次處理一個業(yè)務的各個部分——而不是構建整體的EDW——以迭代方式開發(fā)數(shù)據(jù)倉庫體系架構。企業(yè)可以選擇部署一個或多個數(shù)據(jù)集市,具體取決于組織的規(guī)模和結構。

然后,決定組合采用這兩種方法的組織,可以將不同的數(shù)據(jù)集市彼此集成以創(chuàng)建虛擬EDW,或以物理方式填充一個EDW。另一種方式是,以EDW開始的組織可以將倉庫數(shù)據(jù)的子集提供給后來建立的數(shù)據(jù)集市,以此分離業(yè)務運營。

本地與云數(shù)據(jù)倉庫

每種可用的數(shù)據(jù)倉庫平臺類型都有不同的部署選項:數(shù)據(jù)庫管理系統(tǒng)(DBMS)軟件,通常基于關系數(shù)據(jù)庫技術;專門的分析型DBMS;數(shù)據(jù)倉庫設備將必要的硬件和DBMS軟件捆綁在一個包裝中;云數(shù)據(jù)倉庫。

將云用于數(shù)據(jù)倉庫已成為更可行的選擇。有些供應商已經(jīng)推出了特定于云的數(shù)據(jù)倉庫平臺,而且有些最初設定為本地安裝的數(shù)據(jù)倉庫數(shù)據(jù)庫,其供應商現(xiàn)在也提供了基于云的版本。此類產(chǎn)品包括組織自己在云中運行的常規(guī)數(shù)據(jù)倉庫系統(tǒng),以及供應商為用戶部署和管理的數(shù)據(jù)倉庫即服務(DWaaS)技術。

與其他類型的云系統(tǒng)一樣,與本地環(huán)境相比,云數(shù)據(jù)倉庫可以減少部署時間,并提供更輕松的可伸縮性和更大的靈活性。還可以節(jié)省一定的成本——但這并不能保證,IT經(jīng)理需要密切關注云中數(shù)據(jù)倉庫的使用,以確保成本最終不會高于預期。同樣,數(shù)據(jù)安全和隱私問題可能是決定是否在本地部署數(shù)據(jù)倉庫的考慮因素。

數(shù)據(jù)湖與數(shù)據(jù)倉庫

在Hadoop和其他大數(shù)據(jù)技術首次出現(xiàn)之后,關于它們是否會替代數(shù)據(jù)倉庫,市場上充滿了各種聲音。但是在大多數(shù)組織中,數(shù)據(jù)倉庫并沒有消失。相反,它們和大數(shù)據(jù)系統(tǒng)通常并存,每種系統(tǒng)都支持不同類型的分析用例。

數(shù)據(jù)倉庫平臺通?;陉P系DBMS,并包含源自組織的運營和交易處理系統(tǒng)的結構化數(shù)據(jù)。數(shù)據(jù)倉庫主要由希望運行基于SQL的、基本BI查詢的業(yè)務分析人員和執(zhí)行人員,以及希望創(chuàng)建儀表板和報告以向業(yè)務用戶提供分析信息的BI開發(fā)人員訪問。

另一方面,大數(shù)據(jù)系統(tǒng)通?;诜顷P系技術,例如Hadoop、Spark和NoSQL數(shù)據(jù)庫。它們包含的數(shù)據(jù)可以是結構化、非結構化或半結構化的,并且可以源自所有類型的內(nèi)部系統(tǒng),以及社交網(wǎng)絡和其他外部數(shù)據(jù)源。大數(shù)據(jù)分析旨在發(fā)現(xiàn)模式、關聯(lián)和類似的見解——例如,根據(jù)過去的活動預測未來趨勢和客戶行為。通常是由數(shù)據(jù)科學家和統(tǒng)計人員使用Python、R和Scala等語言開發(fā)的復雜分析模型完成的。

大數(shù)據(jù)技術還支持數(shù)據(jù)湖的概念,數(shù)據(jù)湖是來自各種來源的原始數(shù)據(jù)的存儲庫,可以按原樣存儲這些數(shù)據(jù),然后根據(jù)需要對其進行過濾和分析準備。

最后,大數(shù)據(jù)系統(tǒng)并不能直接替代數(shù)據(jù)倉庫和數(shù)據(jù)集市。實際上,數(shù)據(jù)倉庫和數(shù)據(jù)湖之間存在協(xié)同作用。例如,可以將在數(shù)據(jù)湖中收集的結構化數(shù)據(jù)集移動到數(shù)據(jù)倉庫中,以進行常規(guī)的OLAP存儲和分析。供應商也已開始將大數(shù)據(jù)訪問集成到數(shù)據(jù)倉庫平臺中,從而可以從一個位置訪問存儲在不同系統(tǒng)中的,不同格式的數(shù)據(jù)。

數(shù)據(jù)倉庫用例和場景

下面我們介紹一些用例和方案,這可能會影響組織的數(shù)據(jù)倉庫策略,以及決定為數(shù)據(jù)倉庫項目部署哪種類型的平臺。

初次VS長期數(shù)據(jù)倉庫用戶。希望擴展現(xiàn)有數(shù)據(jù)倉庫的公司通常會很好地繼續(xù)使用他們已經(jīng)建立的數(shù)據(jù)倉庫平臺。對于第一次實施數(shù)據(jù)倉庫的組織而言,數(shù)據(jù)倉庫設備可能是一個不錯的選擇。供應商可能會與您一起確定適合的設備規(guī)格和配置,而且這些設備的交付是非常簡易的。但是,所有數(shù)據(jù)倉庫平臺對于首次使用的用戶都是可行的選擇,您應該審查本部門中的其他用例,以開發(fā)您的特定要求和部署計劃。

公司規(guī)模。大型公司可能會選擇主流的關系DBMS、分析數(shù)據(jù)庫或混合事務/分析處理(HTAP)系統(tǒng)。這些組織擁有成功使用此類技術的基礎架構和人員。在HTAP方法中,相同的DBMS既可以用于處理業(yè)務交易,也可以用于BI和分析建模。為了支持HTAP,關系數(shù)據(jù)庫引擎可以提供內(nèi)置的列式訪問或用于分析處理的附加設備。

另一方面,較小的組織應考慮使用數(shù)據(jù)倉庫設備或云數(shù)據(jù)倉庫服務。這兩種選擇都可以最大程度地減少管理需求:設備已預先配置,并且DWaaS環(huán)境提供的云中的數(shù)據(jù)倉庫一般由云服務提供商進行設置和管理。

IT部門的規(guī)模。IT部門相對較小的大型組織往往擁有較少的數(shù)據(jù)庫管理員和其他可以建設、調(diào)整和管理數(shù)據(jù)倉庫系統(tǒng)的IT專業(yè)人員。對于他們來說,考慮使用數(shù)據(jù)倉庫設備或DWaaS產(chǎn)品也很有意義。

云用例。如果您的組織在云中運行大量應用程序,則DWaaS部署或自我管理的云數(shù)據(jù)倉庫平臺可能是您的最佳選擇。將生成和存儲在云中的業(yè)務數(shù)據(jù)保存在云中以進行數(shù)據(jù)倉庫和分析是一種符合邏輯的方法。

數(shù)據(jù)延遲要求。對于在分析應用程序中需要最小數(shù)據(jù)延遲的組織而言,優(yōu)化的數(shù)據(jù)倉庫設備可能最有價值。使用其他方法也不是說無法實現(xiàn)近實時的延遲,但是您可能需要使用其他高速硬件和軟件來擴展數(shù)據(jù)倉庫環(huán)境,以滿足您的性能目標。

一旦您的組織決定需要建設一個數(shù)據(jù)倉庫,并確定了最合理的部署方案,下一步就是研究購買數(shù)據(jù)倉庫平臺的可用技術選項。整個過程,往往需要經(jīng)過萬全的考慮。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:大數(shù)據(jù)時代,數(shù)據(jù)湖并不能完全取代數(shù)據(jù)倉庫

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    1688庫存API:多倉庫同步,庫存周轉快!

    庫存流程。 第一步:理解多倉庫同步的挑戰(zhàn) 在實際業(yè)務中,企業(yè)往往擁有多個倉庫(如華東倉、華南倉),庫存數(shù)據(jù)分散。不同步會導致超賣、缺貨等問題。傳統(tǒng)方式依賴手動更新,效率低下且易出錯。多倉庫
    的頭像 發(fā)表于 01-08 14:47 ?134次閱讀
    1688庫存API:多<b class='flag-5'>倉庫</b>同步,庫存周轉快!

    BI決策分析系統(tǒng)的關鍵組成部分:業(yè)務數(shù)據(jù)整合有何意義

    從業(yè)者不可掉以輕心;一旦設計執(zhí)行不得當,策略很容易就會出現(xiàn)漏洞。 ?美國Intelligent Solutions咨詢公司的總裁Claudia Imhoff說,數(shù)據(jù)必須及時上傳到數(shù)據(jù)倉庫為bi決策分析系統(tǒng)所使用,若時機不當,所有的工作就會毀于一旦。由于有些用戶
    的頭像 發(fā)表于 12-18 13:16 ?176次閱讀

    海微科技智能倉庫2.0項目正式啟動

    11月4日,海微智能倉庫2.0項目啟動會在海微智造舉行。項目通過數(shù)字化倉庫頂層設計與自動化技術的深度融合,實現(xiàn)了倉庫從 “人力密集”到“智能無人”的跨越。
    的頭像 發(fā)表于 11-07 15:15 ?294次閱讀

    rfid倉儲方案在倉庫管理中如何應用

    在現(xiàn)代倉儲管理領域,傳統(tǒng)人工管理模式易出現(xiàn)盤點效率低、物料追蹤難、信息滯后等問題,而rfid倉儲方案的出現(xiàn),為倉庫管理帶來了革命性的變革。作為高度自動化、智能化的無人值守倉庫管理解決方案,rfid
    的頭像 發(fā)表于 10-23 15:13 ?327次閱讀
    rfid倉儲方案在<b class='flag-5'>倉庫</b>管理中如何應用

    從“傳統(tǒng)倉庫”到“智能倉庫”,企業(yè)能獲得哪些顛覆性改變?

    對于許多制造企業(yè)而言,倉庫曾是成本中心和數(shù)據(jù)黑洞——依賴手工記賬、尋找貨物困難、庫存不準、效率瓶頸突出。而向智能倉庫的轉型,絕非僅僅是引入一些新技術,而是對企業(yè)物流與信息流的一次徹底重塑,能帶來多維
    的頭像 發(fā)表于 09-28 15:02 ?326次閱讀

    倉庫物品計數(shù)遠程監(jiān)控系統(tǒng)方案

    某工廠設置有多個產(chǎn)品倉庫分布到各個車間旁,庫存容量都不一樣。每天倉庫管理人員需要前往各個倉庫清點產(chǎn)品數(shù)量,存在工作量大、統(tǒng)計匯總困難等問題。現(xiàn)通過計數(shù)傳感器實現(xiàn)自動計數(shù),當庫存未滿時現(xiàn)
    的頭像 發(fā)表于 09-16 14:11 ?468次閱讀
    <b class='flag-5'>倉庫</b>物品計數(shù)遠程監(jiān)控系統(tǒng)方案

    ERP倉庫管理軟件如何贏得企業(yè)的信賴

    在制造、貿(mào)易乃至電商領域,倉庫早已不只是“堆放貨物的地方”。從原材料入庫到成品出庫,每一個環(huán)節(jié)的數(shù)據(jù)準確性,都直接影響著生產(chǎn)安排、客戶交付和財務結算。正因如此,越來越多企業(yè)開始關注ERP中的倉庫管理
    的頭像 發(fā)表于 08-29 09:40 ?484次閱讀
    ERP<b class='flag-5'>倉庫</b>管理軟件如何贏得企業(yè)的信賴

    為更智能的移動倉庫機器人提供動力

    程度上實現(xiàn)貨物定位、揀選和包裝流程的自動化,成為決定成功與否的關鍵。最初,工作人員需要手持條形碼掃描儀穿梭于倉庫中,找到訂單中的商品,然后將它們運回發(fā)貨區(qū)進行打包和發(fā)運。 ? 為了加速這一過程,主要零售商投資引進了能夠在倉庫內(nèi)搬
    的頭像 發(fā)表于 07-21 16:29 ?3381次閱讀
    為更智能的移動<b class='flag-5'>倉庫</b>機器人提供動力

    倉庫人車定位系統(tǒng)的優(yōu)選之解

    在當代倉儲物流的運作體系里,倉庫管理的高效性與安全性占據(jù)著核心地位。而人車定位系統(tǒng)作為提升倉庫管理效能的重要技術支撐,正逐漸成為行業(yè)聚焦的重點。新銳科創(chuàng)藍牙+LoRa人車定位系統(tǒng),借助其獨特的技術
    的頭像 發(fā)表于 07-04 16:54 ?453次閱讀
    <b class='flag-5'>倉庫</b>人車定位系統(tǒng)的優(yōu)選之解

    工業(yè)路由器賦能倉庫消防預警,智慧消防物聯(lián)網(wǎng)解決方案

    在現(xiàn)代物流與倉儲行業(yè)蓬勃發(fā)展的當下,倉庫的規(guī)模與存儲密度不斷攀升,消防預警的重要性愈發(fā)凸顯。傳統(tǒng)消防系統(tǒng)在應對復雜倉庫環(huán)境時,預警滯后、設備聯(lián)動不暢、數(shù)據(jù)管理困難等弊端逐漸暴露。為了有效解決這些
    的頭像 發(fā)表于 06-10 17:47 ?1038次閱讀
    工業(yè)路由器賦能<b class='flag-5'>倉庫</b>消防預警,智慧消防物聯(lián)網(wǎng)解決方案

    Helm倉庫管理常用配置

    Helm 倉庫(Repository)是存儲 Helm 圖表(Chart)的地方,類似于軟件包管理器的倉庫(如 apt、yum 倉庫)。
    的頭像 發(fā)表于 06-07 09:27 ?1171次閱讀

    物聯(lián)網(wǎng)、AI與自動化驅動下的軍用倉庫信息化轉型升級方案

    的勝負。 想象一下,“智慧倉庫” 就像一個超級智能管家,它的目標是把物資管理得又快又準又安全。物資從送進倉庫、存放保管,到最后送出去,全程都實現(xiàn)自動化和數(shù)字化。前線部隊需要什么物資,倉庫
    的頭像 發(fā)表于 06-04 13:49 ?389次閱讀
    物聯(lián)網(wǎng)、AI與自動化驅動下的軍用<b class='flag-5'>倉庫</b>信息化轉型升級方案

    部隊倉庫管理模式革新,RFID技術讓倉庫管理更高效

    在風雷激蕩的現(xiàn)代戰(zhàn)場,從彈藥油料到被裝口糧,每一件物資都關乎前線士兵的生命與戰(zhàn)斗的成敗。軍用倉儲管理系統(tǒng)正是這復雜物資生命線的神經(jīng)中樞,將昔日沉寂的倉庫轉變?yōu)閼?zhàn)場最敏銳的神經(jīng)末梢。它超越傳統(tǒng)倉庫
    的頭像 發(fā)表于 06-03 17:44 ?521次閱讀
    部隊<b class='flag-5'>倉庫</b>管理模式革新,RFID技術讓<b class='flag-5'>倉庫</b>管理更高效

    支持二維碼掃描的PDA數(shù)據(jù)采集器,用于倉庫,出入庫、庫存管理

    在現(xiàn)代倉庫管理中,支持二維碼掃描的PDA數(shù)據(jù)采集器已成為不可或缺的工具。這種便攜式的智能移動終端,憑借其高效、準確的數(shù)據(jù)采集能力,極大地提升了倉庫管理的效率和精度。PDA
    的頭像 發(fā)表于 02-19 15:48 ?874次閱讀
    支持二維碼掃描的PDA<b class='flag-5'>數(shù)據(jù)</b>采集器,用于<b class='flag-5'>倉庫</b>,出入庫、庫存管理

    Henry Diaper計劃在香港設立金屬倉庫

    近日,倫敦金屬交易所(LME)認證的英國倉儲運營商Henry Diaper宣布了一項重要計劃。據(jù)該公司董事長John Harvey透露,Henry Diaper有意在香港設立金屬倉庫,并已與數(shù)家香港
    的頭像 發(fā)表于 02-19 09:46 ?583次閱讀