chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)系統(tǒng)包括哪些

RG15206629988 ? 來源:行業(yè)學(xué)習(xí)與研究 ? 2023-02-16 18:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,主流的大數(shù)據(jù)平臺(tái)包括:Hadoop、Spark。

Hadoop是分布式(根據(jù)網(wǎng)絡(luò)資料理解:分布式與集中式相對(duì)應(yīng),對(duì)于大量數(shù)據(jù)計(jì)算,集中于一臺(tái)計(jì)算機(jī)中計(jì)算需耗費(fèi)較長(zhǎng)時(shí)間,通過將計(jì)算分布于多個(gè)計(jì)算機(jī),節(jié)約整體計(jì)算時(shí)間)系統(tǒng)基礎(chǔ)架構(gòu)。Hadoop的兩個(gè)功能包括:數(shù)據(jù)存儲(chǔ)(HDFS)、數(shù)據(jù)處理(MapReduce)。

Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用計(jì)算引擎。Spark不提供文件管理系統(tǒng),沒有數(shù)據(jù)存儲(chǔ)功能;Spark的數(shù)據(jù)計(jì)算基于內(nèi)存實(shí)現(xiàn),數(shù)據(jù)處理速度快。

一、HDFS(分布式文件存儲(chǔ))

數(shù)據(jù)通過HDFS放置于一個(gè)Hadoop集群中,Hadoop集群通常由幾臺(tái)至上千臺(tái)的計(jì)算機(jī)組成。根據(jù)課程介紹理解,百度公司最大的Hadoop集群已超過4000臺(tái)計(jì)算機(jī)。

數(shù)據(jù)在存儲(chǔ)于HDFS前,被分割成若干數(shù)據(jù)塊,每個(gè)數(shù)據(jù)塊儲(chǔ)存于一臺(tái)計(jì)算機(jī)中。不同Hadoop版本所分割的數(shù)據(jù)塊大小不同,Hadoop1.0版本中數(shù)據(jù)塊大小為64MB,Hadoop2.0版本中數(shù)據(jù)塊大小為128MB。Hadoop也可以設(shè)置數(shù)據(jù)塊大?。ê瑐€(gè)人理解)。

e1266bfa-addb-11ed-bfe3-dac502259ad0.png

圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》

二、MapReduce(分布式數(shù)據(jù)處理架構(gòu))

MapReduce是分布式計(jì)算框架。開發(fā)人員在運(yùn)用MapReduce處理數(shù)據(jù)時(shí),MapReduce將指定某一Map函數(shù),將一組鍵值對(duì)(根據(jù)網(wǎng)絡(luò)資料理解:鍵值對(duì)可以根據(jù)一個(gè)值獲得對(duì)應(yīng)的一個(gè)值)映射成一組新的鍵值對(duì),并指定并發(fā)的Reduce函數(shù),保證所有Map函數(shù)映射的結(jié)果可以進(jìn)行Reduce規(guī)約(根據(jù)網(wǎng)絡(luò)資料理解:通過某一連接動(dòng)作將所有元素匯總為一個(gè)結(jié)果的過程)運(yùn)算。

e1bec99a-addb-11ed-bfe3-dac502259ad0.png

圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》

在運(yùn)用MapReduce框架編寫計(jì)算機(jī)程序時(shí),開發(fā)人員只需考慮業(yè)務(wù)邏輯,不需考慮并行管理。

三、MapReduce的WordCount示例

WordCount是統(tǒng)計(jì)文件夾所有文本中某一詞出現(xiàn)的次數(shù)。

其中,WordCount的Map函數(shù)程序代碼如下:

Map(K, V){

For each word w in V

Collect(w,1);

}

WordCount的Map函數(shù)中的K代表文本中的詞,WordCount的Map函數(shù)的功能是將文本中的每個(gè)詞與1建立鍵值對(duì),即每個(gè)詞對(duì)應(yīng)一個(gè)“1”。

WordCount的Reduce函數(shù)程序代碼如下:

Reduce(K.V[]){

int count=0;

For each v in V

count+= v;

Collect(K,count);

}

WordCount的Reduce函數(shù)將經(jīng)過WordCount的Map函數(shù)處理的相同詞對(duì)應(yīng)的“1”求和,得出某一詞的出現(xiàn)的次數(shù)。

該WordCount示例中,Map和Reduce函數(shù)的具體運(yùn)行如圖一所示:

首先,所有數(shù)據(jù)被整理成單行數(shù)據(jù),圖一流程圖中具有三個(gè)節(jié)點(diǎn)(個(gè)人理解:節(jié)點(diǎn)可被認(rèn)為是計(jì)算機(jī)),圖一中的三行數(shù)據(jù)被分行輸入到三個(gè)節(jié)點(diǎn)中。

然后,Map函數(shù)運(yùn)行,將每個(gè)詞與1建立鍵值對(duì)。

Map函數(shù)運(yùn)行結(jié)束后,Shuffle過程運(yùn)行,Shuffle過程是MapReduce內(nèi)設(shè)過程,可將具有相同詞的鍵值對(duì)中的“1”集合至一個(gè)List(列表)中。如圖一所示,因?yàn)椤癇ear”一詞出現(xiàn)了兩次,所以經(jīng)過Shuffle過程后,“Bear”所對(duì)應(yīng)的List為(1,1)。

最后,Reduce函數(shù)運(yùn)行,將Shuffle過程所生成的List求和,完成對(duì)某一詞出現(xiàn)的次數(shù)統(tǒng)計(jì)。

e1f1375e-addb-11ed-bfe3-dac502259ad0.png

圖一,圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(9)——大數(shù)據(jù)系統(tǒng)(上)

文章出處:【微信號(hào):行業(yè)學(xué)習(xí)與研究,微信公眾號(hào):行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    黑M-狂野大數(shù)據(jù)5期|網(wǎng)盤無密Mp4+大數(shù)據(jù)直播課-狂野大數(shù)據(jù)

    科技重構(gòu)數(shù)據(jù)生產(chǎn)力:狂野大數(shù)據(jù)直播實(shí)戰(zhàn)全解析 隨著數(shù)字化時(shí)代的快速發(fā)展,大數(shù)據(jù)已經(jīng)滲透到我們生活的方方面面。無論是商業(yè)、教育,還是醫(yī)療、政府服務(wù),大數(shù)據(jù)的應(yīng)用都在不斷創(chuàng)造新的價(jià)值。而在
    的頭像 發(fā)表于 04-06 11:13 ?206次閱讀

    輕松入門大數(shù)據(jù) 一站式完成核心能力構(gòu)建 | 更新完結(jié)

    業(yè)務(wù)決策的時(shí)效性。本文從實(shí)戰(zhàn)角度出發(fā),系統(tǒng)梳理大數(shù)據(jù)查詢優(yōu)化的核心思路和實(shí)戰(zhàn)技巧,幫助讀者建立完整的優(yōu)化知識(shí)體系。 一、優(yōu)化的起點(diǎn):理解查詢的執(zhí)行過程 在動(dòng)手優(yōu)化之前,首先要理解一條查詢語句在數(shù)據(jù)平臺(tái)中是如何被執(zhí)行的
    的頭像 發(fā)表于 03-23 14:05 ?401次閱讀

    狂野大數(shù)據(jù)(六期)課程- 資源分享

    權(quán)力正在從專家手中擴(kuò)散,流向每一個(gè)業(yè)務(wù)人員、每一套自治系統(tǒng)。 我們正在步入大數(shù)據(jù)智能化的新階段:自動(dòng)建模與自治平臺(tái)時(shí)代。 從“手工作坊”到“工業(yè)流水線” 回顧數(shù)據(jù)建模的演進(jìn),很像一場(chǎng)工業(yè)革命。早期,每一次建模都是一次
    的頭像 發(fā)表于 03-11 13:31 ?325次閱讀

    大數(shù)據(jù)解決方案如何實(shí)施

    大數(shù)據(jù)解決方案實(shí)施的難點(diǎn)在于以下幾點(diǎn): ?1.很少有優(yōu)質(zhì)可用的數(shù)據(jù) ?在數(shù)聚股份看來,這幾年數(shù)據(jù)交易機(jī)構(gòu)如雨后春筍,“數(shù)據(jù)變現(xiàn)”成為很多擁有數(shù)據(jù)
    的頭像 發(fā)表于 12-25 18:22 ?1149次閱讀

    最受歡迎的大數(shù)據(jù)可視化工具

    ?在數(shù)聚股份看來,大數(shù)據(jù)可視化是進(jìn)行各種大數(shù)據(jù)分析的最重要組成部分之一。 一旦原始數(shù)據(jù)流被以圖像形式表示時(shí),以此做決策就變得容易多了。 為了滿足并超越客戶的期望,大數(shù)據(jù)可視化工具應(yīng)該具
    的頭像 發(fā)表于 12-24 17:05 ?383次閱讀
    最受歡迎的<b class='flag-5'>大數(shù)據(jù)</b>可視化工具

    大數(shù)據(jù)平臺(tái)運(yùn)營(yíng)的基礎(chǔ)是什么

    在數(shù)聚股份看來,越來越多的企業(yè)開始搭建自己的大數(shù)據(jù)平臺(tái)體系,并傾注大量資源用于平臺(tái)的迭代和運(yùn)營(yíng)。那么大數(shù)據(jù)平臺(tái)作為越來越被關(guān)注的企業(yè)新興價(jià)值點(diǎn),它應(yīng)該以何種方式看待,并且以什么樣的方式去建設(shè)和運(yùn)營(yíng)
    的頭像 發(fā)表于 12-23 16:07 ?355次閱讀

    湖北大數(shù)據(jù)集團(tuán)到訪維智科技參觀交流

    近日,湖北大數(shù)據(jù)集團(tuán)有限公司黨委書記、董事長(zhǎng)汪小波率隊(duì)到訪維智科技。雙方圍繞時(shí)空數(shù)據(jù)融合、公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)及行業(yè)應(yīng)用場(chǎng)景開發(fā)等議題展開深入探討。
    的頭像 發(fā)表于 11-03 10:02 ?776次閱讀

    東軟集團(tuán)領(lǐng)跑中國(guó)醫(yī)療大數(shù)據(jù)解決方案市場(chǎng)

    近日,國(guó)際數(shù)據(jù)公司(IDC)權(quán)威發(fā)布《中國(guó)醫(yī)療大數(shù)據(jù)解決方案市場(chǎng)份額,2024:全域數(shù)據(jù)支撐》(Doc#CHC53739825,2025年9月)報(bào)告。報(bào)告顯示,在中國(guó)醫(yī)療大數(shù)據(jù)解決方案
    的頭像 發(fā)表于 10-30 17:09 ?829次閱讀

    組態(tài)大數(shù)據(jù)平臺(tái)是什么?有什么功能?

    組態(tài)大數(shù)據(jù)平臺(tái)是融合 組態(tài)技術(shù) 與 大數(shù)據(jù)處理能力 的綜合性平臺(tái),通過圖形化、可配置的方式實(shí)現(xiàn)數(shù)據(jù)采集、存儲(chǔ)、分析、可視化及遠(yuǎn)程控制,適用于工業(yè)自動(dòng)化、能源管理、樓宇監(jiān)控等領(lǐng)域。其核心價(jià)值在于降低
    的頭像 發(fā)表于 10-30 11:29 ?322次閱讀
    組態(tài)<b class='flag-5'>大數(shù)據(jù)</b>平臺(tái)是什么?有什么功能?

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    北京華盛恒輝電磁兼容 (EMC) 大數(shù)據(jù)智能管理系統(tǒng)精簡(jiǎn)解析 在 EMC 大數(shù)據(jù)分析中,電磁兼容與電磁干擾(EMI)智能管理系統(tǒng)是保障設(shè)備穩(wěn)定、提升
    的頭像 發(fā)表于 09-17 14:58 ?768次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理平臺(tái)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?730次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)</b>分析中的智能管理平臺(tái)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?1052次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)</b>分析中的智能管理<b class='flag-5'>系統(tǒng)</b>

    御控工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)解決方案:排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)

    御控工業(yè)物聯(lián)網(wǎng)推出排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng),通過物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)構(gòu)建“感知-傳輸-分析-決策”閉環(huán)管理體系,助力排水行業(yè)數(shù)字化轉(zhuǎn)型。
    的頭像 發(fā)表于 09-12 10:04 ?801次閱讀

    華錄集團(tuán)亮相2025中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)

    近日,2025中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)(簡(jiǎn)稱數(shù)博會(huì))在貴陽開幕。中國(guó)電科以“數(shù)聚AI動(dòng)能 智引發(fā)展未來”為主題亮相成果展覽會(huì),系統(tǒng)展示數(shù)據(jù)基礎(chǔ)設(shè)施、數(shù)據(jù)要素、人工智能+等領(lǐng)域的30余項(xiàng)
    的頭像 發(fā)表于 09-01 16:55 ?1123次閱讀

    更改最大數(shù)據(jù)包大小時(shí)無法識(shí)別USB設(shè)備如何解決?

    將生產(chǎn)者 EP 端點(diǎn)描述符中的最大數(shù)據(jù)包大小從 1024 字節(jié)更改為 512 字節(jié)時(shí),無法識(shí)別 USB 設(shè)備。 請(qǐng)告知如何解決這個(gè)問題。
    發(fā)表于 05-20 08:13