chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

姚小熊27 ? 來源:網(wǎng)絡(luò)整理 ? 2018-02-11 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)倉庫簡介

數(shù)據(jù)倉庫,英文名稱為DataWarehouse,可簡寫為DW或DWH。數(shù)據(jù)倉庫,是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進、監(jiān)視時間、成本、質(zhì)量以及控制。

數(shù)據(jù)倉庫的用途

1.整合公司所有業(yè)務(wù)數(shù)據(jù),建立統(tǒng)一的數(shù)據(jù)中心

2.產(chǎn)生業(yè)務(wù)報表,用于作出決策

3.為網(wǎng)站運營提供運營上的數(shù)據(jù)支持

4.可以作為各個業(yè)務(wù)的數(shù)據(jù)源,形成業(yè)務(wù)數(shù)據(jù)互相反饋的良性循環(huán)

5.分析用戶行為數(shù)據(jù),通過數(shù)據(jù)挖掘來降低投入成本,提高投入效果

6.開發(fā)數(shù)據(jù)產(chǎn)品,直接或間接地為公司盈利

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

數(shù)據(jù)倉庫分層的原因

1通過數(shù)據(jù)預(yù)處理提高效率,因為預(yù)處理,所以會存在冗余數(shù)據(jù)

2如果不分層而業(yè)務(wù)系統(tǒng)的業(yè)務(wù)規(guī)則發(fā)生變化,就會影響整個數(shù)據(jù)清洗過程,工作量巨大

3通過分層管理來實現(xiàn)分步完成工作,這樣每一層的處理邏輯就簡單了

標準的數(shù)據(jù)倉庫分層:ods(臨時存儲層),pdw(數(shù)據(jù)倉庫層),mid(數(shù)據(jù)集市層),app(應(yīng)用層)

ods:歷史存儲層,它和源系統(tǒng)數(shù)據(jù)是同構(gòu)的,而且這一層數(shù)據(jù)粒度是最細的,這層的表分為兩種,一種是存儲當前需要加載的數(shù)據(jù),一種是用于存儲處理完后的數(shù)據(jù)。

pdw:數(shù)據(jù)倉庫層,它的數(shù)據(jù)是干凈的數(shù)據(jù),是一致的準確的,也就是清洗后的數(shù)據(jù),它的數(shù)據(jù)一般都遵循數(shù)據(jù)庫第三范式,數(shù)據(jù)粒度和ods的粒度相同,它會保存bi系統(tǒng)中所有歷史數(shù)據(jù)

mid:數(shù)據(jù)集市層,它是面向主題組織數(shù)據(jù)的,通常是星狀和雪花狀數(shù)據(jù),從數(shù)據(jù)粒度將,它是輕度匯總級別的數(shù)據(jù),已經(jīng)不存在明細的數(shù)據(jù)了,從廣度來說,它包含了所有業(yè)務(wù)數(shù)量。從分析角度講,大概就是近幾年

app:應(yīng)用層,數(shù)據(jù)粒度高度匯總,倒不一定涵蓋所有業(yè)務(wù)數(shù)據(jù),只是mid層數(shù)據(jù)的一個子集。

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

數(shù)據(jù)倉庫的架構(gòu)圖介紹

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

1、數(shù)據(jù)采集

數(shù)據(jù)采集層的任務(wù)就是把數(shù)據(jù)從各種數(shù)據(jù)源中采集和存儲到數(shù)據(jù)存儲上,期間有可能會做一些ETL操作。

數(shù)據(jù)源種類可以有多種:

日志:所占份額最大,存儲在備份服務(wù)器上

業(yè)務(wù)數(shù)據(jù)庫:如Mysql、Oracle

來自HTTP/FTP的數(shù)據(jù):合作伙伴提供的接口

其他數(shù)據(jù)源:如Excel等需要手工錄入的數(shù)據(jù)

2、數(shù)據(jù)存儲與分析

HDFS是大數(shù)據(jù)環(huán)境下數(shù)據(jù)倉庫/數(shù)據(jù)平臺最完美的數(shù)據(jù)存儲解決方案。

離線數(shù)據(jù)分析與計算,也就是對實時性要求不高的部分,Hive是不錯的選擇。

使用Hadoop框架自然而然也提供了MapReduce接口,如果真的很樂意開發(fā)Java,或者對SQL不熟,那么也可以使用MapReduce來做分析與計算。

Spark性能比MapReduce好很多,同時使用SparkSQL操作Hive。

3、數(shù)據(jù)共享

前面使用Hive、MR、Spark、SparkSQL分析和計算的結(jié)果,還是在HDFS上,但大多業(yè)務(wù)和應(yīng)用不可能直接從HDFS上獲取數(shù)據(jù),那么就需要一個數(shù)據(jù)共享的地方,使得各業(yè)務(wù)和產(chǎn)品能方便的獲取數(shù)據(jù)。

這里的數(shù)據(jù)共享,其實指的是前面數(shù)據(jù)分析與計算后的結(jié)果存放的地方,其實就是關(guān)系型數(shù)據(jù)庫和NOSQL數(shù)據(jù)庫。

4、數(shù)據(jù)應(yīng)用

報表:報表所使用的數(shù)據(jù),一般也是已經(jīng)統(tǒng)計匯總好的,存放于數(shù)據(jù)共享層。

接口:接口的數(shù)據(jù)都是直接查詢數(shù)據(jù)共享層即可得到。

即席查詢:即席查詢通常是現(xiàn)有的報表和數(shù)據(jù)共享層的數(shù)據(jù)并不能滿足需求,需要從數(shù)據(jù)存儲層直接查詢。一般都是通過直接操作SQL得到。

理想的數(shù)據(jù)倉庫架構(gòu)

數(shù)據(jù)倉庫的基本架構(gòu)及架構(gòu)圖介紹

增加了以下內(nèi)容:

數(shù)據(jù)采集:采用Flume收集日志,采用Sqoop將RDBMS以及NoSQL中的數(shù)據(jù)同步到HDFS上

消息系統(tǒng):可以加入Kafka防止數(shù)據(jù)丟失

實時計算:實時計算使用SparkStreaming消費Kafka中收集的日志數(shù)據(jù),實時計算結(jié)果大多保存在Redis中

機器學(xué)習(xí):使用了SparkMLlib提供的機器學(xué)習(xí)算法

多維分析OLAP:使用Kylin作為OLAP引擎

數(shù)據(jù)可視化:提供可視化前端頁面,方便運營等非開發(fā)人員直接查詢

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于阿里云數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設(shè)思路

    摘要:數(shù)加大數(shù)據(jù)直播系列課程主要以基于阿里云數(shù)加MaxCompute的企業(yè)大數(shù)據(jù)倉庫架構(gòu)建設(shè)思路為主題分享阿里巴巴的大數(shù)據(jù)是怎么演變以及怎樣利用大數(shù)
    發(fā)表于 03-15 12:43

    應(yīng)用部署架構(gòu)圖

    筆者一個項目中用到的架構(gòu)圖,Linux+Tomcat應(yīng)用服務(wù)器兩臺,MSSQL2012數(shù)據(jù)庫服務(wù)器3臺做成了故障轉(zhuǎn)移集群。
    發(fā)表于 07-15 06:58

    上海邏迅丨節(jié)能降耗 系統(tǒng)架構(gòu)圖

    上海邏迅丨節(jié)能降耗 系統(tǒng)架構(gòu)圖
    發(fā)表于 10-09 13:58

    RT-Thread 架構(gòu)圖

    RT-Thread 架構(gòu)圖:RT-Thread開發(fā)指南開源地址內(nèi)核層:RT-Thread 內(nèi)核,是 RT-Thread 的核心部分,包括了內(nèi)核系統(tǒng)中對象的實現(xiàn),例如多線程及其調(diào)度、信號量、郵箱
    發(fā)表于 12-16 08:15

    PCIE基本概念與拓撲架構(gòu)圖

    1 PCIE基本概念1.1 PCIE拓撲架構(gòu)圖1.2 PCIE Switch內(nèi)部結(jié)構(gòu)圖1.3 PCIE協(xié)議結(jié)構(gòu)圖2 PCIE枚舉原理2.1 Type0&Type1配置頭空間2.2 拓撲示例
    發(fā)表于 02-16 06:08

    電信數(shù)據(jù)倉庫設(shè)計

    本文針對佳木斯電信的業(yè)務(wù)需求,設(shè)計了佳木斯電信數(shù)據(jù)倉庫的總體架構(gòu),并以營業(yè)受理情況主題為例介紹了佳木斯電信數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計過程。
    發(fā)表于 12-18 17:01 ?14次下載

    電腦主板架構(gòu)圖

    主板架構(gòu)圖1(早期主板)
    發(fā)表于 05-31 14:15 ?1.1w次閱讀
    電腦主板<b class='flag-5'>架構(gòu)圖</b>

    主板架構(gòu)圖1(早期主板)

    主板架構(gòu)圖1(早期主板)
    發(fā)表于 05-21 11:02 ?1746次閱讀
    主板<b class='flag-5'>架構(gòu)圖</b>1(早期主板)

    主板架構(gòu)圖2(P2.P3.P4主板)

    主板架構(gòu)圖2(P2.P3.P4主板)
    發(fā)表于 05-21 11:03 ?1604次閱讀
    主板<b class='flag-5'>架構(gòu)圖</b>2(P2.P3.P4主板)

    深圳市圣奇仕科技有限公司組織架構(gòu)圖

    深圳市圣奇仕科技有限公司組織架構(gòu)圖
    發(fā)表于 11-04 15:53 ?1556次閱讀

    什么是paas平臺_paas邏輯架構(gòu)圖

    本文開始介紹了什么是PAAS平臺和PAAS的特點,其次分析了PAAS平臺的發(fā)展前景,最后介紹了詳細的介紹paas邏輯架構(gòu)圖
    的頭像 發(fā)表于 01-30 18:00 ?3w次閱讀
    什么是paas平臺_paas邏輯<b class='flag-5'>架構(gòu)圖</b>

    數(shù)據(jù)倉庫是什么_數(shù)據(jù)倉庫的特點_數(shù)據(jù)倉庫數(shù)據(jù)庫區(qū)別

    本文開始介紹數(shù)據(jù)倉庫是什么,其次詳細介紹數(shù)據(jù)倉庫的特點、數(shù)據(jù)倉庫的基本架構(gòu)
    的頭像 發(fā)表于 02-11 10:42 ?2.6w次閱讀
    <b class='flag-5'>數(shù)據(jù)倉庫</b>是什么_<b class='flag-5'>數(shù)據(jù)倉庫</b>的特點_<b class='flag-5'>數(shù)據(jù)倉庫</b>與<b class='flag-5'>數(shù)據(jù)</b>庫區(qū)別

    如何畫架構(gòu)圖

    維基百科、百度百科其實都沒有關(guān)于它的直接定義。不過我們可以進行拆分理解:架構(gòu)圖=架構(gòu)+圖這樣問題就轉(zhuǎn)化成,什么是架構(gòu),以及什么是圖?關(guān)于架構(gòu),百度百科上是這樣定義的
    的頭像 發(fā)表于 01-13 14:38 ?1894次閱讀

    如何畫技術(shù)架構(gòu)圖

    在我們做系統(tǒng)架構(gòu)設(shè)計時,如何快速的向外界傳達我們的設(shè)計思路。4+1試圖適合我們厘清思路、表達自己的想法。在我們匯報,爭取領(lǐng)導(dǎo)層的認同支持更適合用架構(gòu)圖來表述我們的觀點。架構(gòu)圖包括總體架構(gòu)
    的頭像 發(fā)表于 02-06 17:39 ?3706次閱讀

    校園智慧燈桿大樣圖_基礎(chǔ)CAD圖紙_系統(tǒng)架構(gòu)圖下載

    校園智慧燈桿大樣圖_基礎(chǔ)CAD圖紙_系統(tǒng)架構(gòu)圖_下載
    發(fā)表于 08-02 16:11 ?3次下載