chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)系統(tǒng)包括哪些

RG15206629988 ? 來源:行業(yè)學(xué)習(xí)與研究 ? 2023-02-16 18:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前,主流的大數(shù)據(jù)平臺包括:Hadoop、Spark。

Hadoop是分布式(根據(jù)網(wǎng)絡(luò)資料理解:分布式與集中式相對應(yīng),對于大量數(shù)據(jù)計(jì)算,集中于一臺計(jì)算機(jī)中計(jì)算需耗費(fèi)較長時間,通過將計(jì)算分布于多個計(jì)算機(jī),節(jié)約整體計(jì)算時間)系統(tǒng)基礎(chǔ)架構(gòu)。Hadoop的兩個功能包括:數(shù)據(jù)存儲(HDFS)、數(shù)據(jù)處理(MapReduce)。

Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用計(jì)算引擎。Spark不提供文件管理系統(tǒng),沒有數(shù)據(jù)存儲功能;Spark的數(shù)據(jù)計(jì)算基于內(nèi)存實(shí)現(xiàn),數(shù)據(jù)處理速度快。

一、HDFS(分布式文件存儲)

數(shù)據(jù)通過HDFS放置于一個Hadoop集群中,Hadoop集群通常由幾臺至上千臺的計(jì)算機(jī)組成。根據(jù)課程介紹理解,百度公司最大的Hadoop集群已超過4000臺計(jì)算機(jī)。

數(shù)據(jù)在存儲于HDFS前,被分割成若干數(shù)據(jù)塊,每個數(shù)據(jù)塊儲存于一臺計(jì)算機(jī)中。不同Hadoop版本所分割的數(shù)據(jù)塊大小不同,Hadoop1.0版本中數(shù)據(jù)塊大小為64MB,Hadoop2.0版本中數(shù)據(jù)塊大小為128MB。Hadoop也可以設(shè)置數(shù)據(jù)塊大小(含個人理解)。

e1266bfa-addb-11ed-bfe3-dac502259ad0.png

圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》

二、MapReduce(分布式數(shù)據(jù)處理架構(gòu))

MapReduce是分布式計(jì)算框架。開發(fā)人員在運(yùn)用MapReduce處理數(shù)據(jù)時,MapReduce將指定某一Map函數(shù),將一組鍵值對(根據(jù)網(wǎng)絡(luò)資料理解:鍵值對可以根據(jù)一個值獲得對應(yīng)的一個值)映射成一組新的鍵值對,并指定并發(fā)的Reduce函數(shù),保證所有Map函數(shù)映射的結(jié)果可以進(jìn)行Reduce規(guī)約(根據(jù)網(wǎng)絡(luò)資料理解:通過某一連接動作將所有元素匯總為一個結(jié)果的過程)運(yùn)算。

e1bec99a-addb-11ed-bfe3-dac502259ad0.png

圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》

在運(yùn)用MapReduce框架編寫計(jì)算機(jī)程序時,開發(fā)人員只需考慮業(yè)務(wù)邏輯,不需考慮并行管理。

三、MapReduce的WordCount示例

WordCount是統(tǒng)計(jì)文件夾所有文本中某一詞出現(xiàn)的次數(shù)。

其中,WordCount的Map函數(shù)程序代碼如下:

Map(K, V){

For each word w in V

Collect(w,1);

}

WordCount的Map函數(shù)中的K代表文本中的詞,WordCount的Map函數(shù)的功能是將文本中的每個詞與1建立鍵值對,即每個詞對應(yīng)一個“1”。

WordCount的Reduce函數(shù)程序代碼如下:

Reduce(K.V[]){

int count=0;

For each v in V

count+= v;

Collect(K,count);

}

WordCount的Reduce函數(shù)將經(jīng)過WordCount的Map函數(shù)處理的相同詞對應(yīng)的“1”求和,得出某一詞的出現(xiàn)的次數(shù)。

該WordCount示例中,Map和Reduce函數(shù)的具體運(yùn)行如圖一所示:

首先,所有數(shù)據(jù)被整理成單行數(shù)據(jù),圖一流程圖中具有三個節(jié)點(diǎn)(個人理解:節(jié)點(diǎn)可被認(rèn)為是計(jì)算機(jī)),圖一中的三行數(shù)據(jù)被分行輸入到三個節(jié)點(diǎn)中。

然后,Map函數(shù)運(yùn)行,將每個詞與1建立鍵值對。

Map函數(shù)運(yùn)行結(jié)束后,Shuffle過程運(yùn)行,Shuffle過程是MapReduce內(nèi)設(shè)過程,可將具有相同詞的鍵值對中的“1”集合至一個List(列表)中。如圖一所示,因?yàn)椤癇ear”一詞出現(xiàn)了兩次,所以經(jīng)過Shuffle過程后,“Bear”所對應(yīng)的List為(1,1)。

最后,Reduce函數(shù)運(yùn)行,將Shuffle過程所生成的List求和,完成對某一詞出現(xiàn)的次數(shù)統(tǒng)計(jì)。

e1f1375e-addb-11ed-bfe3-dac502259ad0.png

圖一,圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(9)——大數(shù)據(jù)系統(tǒng)(上)

文章出處:【微信號:行業(yè)學(xué)習(xí)與研究,微信公眾號:行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    北京華盛恒輝電磁兼容 (EMC) 大數(shù)據(jù)智能管理系統(tǒng)精簡解析 在 EMC 大數(shù)據(jù)分析中,電磁兼容與電磁干擾(EMI)智能管理系統(tǒng)是保障設(shè)備穩(wěn)定、提升
    的頭像 發(fā)表于 09-17 14:58 ?309次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?400次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)</b>分析中的智能管理<b class='flag-5'>系統(tǒng)</b>

    御控工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)解決方案:排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)

    御控工業(yè)物聯(lián)網(wǎng)推出排水設(shè)備遠(yuǎn)程監(jiān)控與大數(shù)據(jù)統(tǒng)計(jì)系統(tǒng),通過物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)構(gòu)建“感知-傳輸-分析-決策”閉環(huán)管理體系,助力排水行業(yè)數(shù)字化轉(zhuǎn)型。
    的頭像 發(fā)表于 09-12 10:04 ?351次閱讀

    更改最大數(shù)據(jù)包大小時無法識別USB設(shè)備如何解決?

    將生產(chǎn)者 EP 端點(diǎn)描述符中的最大數(shù)據(jù)包大小從 1024 字節(jié)更改為 512 字節(jié)時,無法識別 USB 設(shè)備。 請告知如何解決這個問題。
    發(fā)表于 05-20 08:13

    大數(shù)據(jù)與云計(jì)算是干嘛的?

    大數(shù)據(jù)與云計(jì)算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲、分析與價(jià)值挖掘;云計(jì)算通過虛擬化資源池提供彈性計(jì)算、存儲及服務(wù)能力。兩者結(jié)合,共同賦能企業(yè)決策、業(yè)務(wù)創(chuàng)新和效率提升。下面UU云小編將詳細(xì)剖析
    的頭像 發(fā)表于 02-20 14:48 ?1092次閱讀

    大數(shù)據(jù)云計(jì)算都需要考什么證書?

    大數(shù)據(jù)和云計(jì)算領(lǐng)域包含多種專業(yè)證書,其中大數(shù)據(jù)領(lǐng)域涵蓋數(shù)據(jù)分析類證書、大數(shù)據(jù)工程類證書、數(shù)據(jù)治理類證書。云計(jì)算領(lǐng)域領(lǐng)域涵蓋云計(jì)算技術(shù)類證書、
    的頭像 發(fā)表于 02-19 11:05 ?1020次閱讀

    工程大數(shù)據(jù)平臺

    由于無人駕駛系統(tǒng)開發(fā)需要長期迭代優(yōu)化,其過程需要大量的路試數(shù)據(jù)支撐,經(jīng)緯恒潤針對無人駕駛系統(tǒng)持續(xù)運(yùn)營和持續(xù)迭代的需求,開發(fā)并在云端部署了車路云工程大數(shù)據(jù)平臺,依托5G網(wǎng)絡(luò),具有遠(yuǎn)程
    的頭像 發(fā)表于 01-10 17:00 ?888次閱讀
    工程<b class='flag-5'>大數(shù)據(jù)</b>平臺

    緩存對大數(shù)據(jù)處理的影響分析

    緩存對大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲通常采用分布式存儲系統(tǒng),
    的頭像 發(fā)表于 12-18 09:45 ?996次閱讀

    上位機(jī)系統(tǒng)優(yōu)化技巧 上位機(jī)如何處理大數(shù)據(jù)

    1. 數(shù)據(jù)預(yù)處理 在大數(shù)據(jù)的處理過程中,數(shù)據(jù)預(yù)處理是至關(guān)重要的第一步。這包括數(shù)據(jù)清洗、轉(zhuǎn)換和歸一化,以確保
    的頭像 發(fā)表于 12-04 10:27 ?1351次閱讀

    ADS1675最大數(shù)據(jù)吞吐率是是多少?

    ADS1675 24bit的ADC的采樣率最大是4Msps,請問這款adc的最大數(shù)據(jù)吞吐率是是多少?怎么算的,在datasheet中有明確寫出來嗎
    發(fā)表于 11-28 07:56

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨(dú)立磁盤冗余陣列)在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析中
    的頭像 發(fā)表于 11-12 09:44 ?935次閱讀

    emc技術(shù)在大數(shù)據(jù)分析中的角色

    大數(shù)據(jù)分析通常涉及來自多個來源和格式的數(shù)據(jù)。這些數(shù)據(jù)可能包括結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫中的表格
    的頭像 發(fā)表于 11-01 15:22 ?901次閱讀

    物聯(lián)網(wǎng)和大數(shù)據(jù)的關(guān)系

    在數(shù)字化時代,數(shù)據(jù)已成為一種新的資源,它不僅驅(qū)動著經(jīng)濟(jì)的發(fā)展,也在改變著我們的生活方式。物聯(lián)網(wǎng)(IoT)和大數(shù)據(jù)(Big Data)作為兩個關(guān)鍵的技術(shù)趨勢,它們之間的關(guān)系日益緊密,共同推動著社會
    的頭像 發(fā)表于 10-29 10:20 ?2291次閱讀

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對智慧城市建設(shè)的支撐和推動作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)大數(shù)據(jù)技術(shù)的應(yīng)用需求。 大數(shù)據(jù)
    的頭像 發(fā)表于 10-24 15:27 ?1619次閱讀

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲、計(jì)算、分析和預(yù)測的強(qiáng)大能力。以下是對云計(jì)算在大數(shù)據(jù)分析中應(yīng)用的介紹: 一、存儲和處理海量數(shù)據(jù) 云計(jì)算提供了強(qiáng)大的存儲和計(jì)算能力,可以存儲
    的頭像 發(fā)表于 10-24 09:18 ?1388次閱讀