chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習中流式數(shù)據(jù)處理的使用場景及相關(guān)技術(shù)介紹

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 作者:數(shù)據(jù)分析與開發(fā) ? 2021-02-08 11:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在工業(yè)界,當我們提到實時數(shù)據(jù)機器學習時,常??梢月牭饺缦掠懻摚?/p>

他們希望有一個模型,這個模型利用最近歷史信息來進行預測分析。舉一個天氣的例子,如果最近幾天都是晴天,那么未來幾天極小概率會出現(xiàn)雨雪和低溫天氣

這個模型還需要是可更新的。當數(shù)據(jù)流經(jīng)系統(tǒng)時,模型是可以隨之進化升級。舉個例子,隨著業(yè)務規(guī)模的擴大,我們希望零售銷售模型仍然保持準確。

實時機器學習應用是人工智能真正落地服務化的關(guān)鍵一步,因為工業(yè)界大部分場景下數(shù)據(jù)都是實時產(chǎn)生的。因此作為一名合格的人工智能領(lǐng)域?qū)<遥莆樟魇綀鼍跋碌?a href="http://www.brongaenegriffin.com/v/tag/2562/" target="_blank">算法設計必不可少。 本文主要介紹流式數(shù)據(jù)處理的使用場景、相關(guān)技術(shù),并從服務管理的角度,介紹了針對流式計算服務的設計及關(guān)鍵指標。主要面向希望了解流式計算、服務管理的朋友們。

流式計算的使用場景

01

首先,當前業(yè)界已經(jīng)有非常多數(shù)據(jù)處理的方式了,為什么還需要流式數(shù)據(jù)處理?要回答這個問題,我們先回顧一下傳統(tǒng)的的數(shù)據(jù)處理架構(gòu)。 傳統(tǒng)的數(shù)據(jù)處理架構(gòu)是一種典型的以數(shù)據(jù)庫為中心,適應存儲事務性數(shù)據(jù)處理的場景。由于數(shù)據(jù)處理能力優(yōu)先,在該架構(gòu)下,往往數(shù)據(jù)都是以批量的方式進行處理,例如:批量寫入數(shù)據(jù)庫、批量讀取數(shù)據(jù)庫進行數(shù)據(jù)處理。這種架構(gòu)在面對實時性較低的場景中較為有效,但是在對實時性較高的場景則不太有效,例如:自動駕駛場景、工業(yè)機器人場景、基于會話的用戶統(tǒng)計等。

因此,流式計算或流式數(shù)據(jù)處理被提出。其實流處理它最接近數(shù)據(jù)產(chǎn)生的自然規(guī)律,只不過過去我們沒有流處理能力,只能做一些特殊的處理才能真正地使用流數(shù)據(jù),比如將流數(shù)據(jù)攢成批量數(shù)據(jù)再處理,不然無法進行大規(guī)模的計算。使用流數(shù)據(jù)并不新鮮,新鮮的是我們有了新技術(shù),從而可以大規(guī)模、靈活、自然和低成本地使用它們。 流式處理的核心目標有以下三點:

低延遲:近實時的數(shù)據(jù)處理能力

高吞吐:能處理大批量的數(shù)據(jù)

可以容錯:在數(shù)據(jù)計算有誤的情況下,可容忍錯誤,且可更正錯誤

流式處理框架

02

典型的流處理框架結(jié)合了消息傳輸層技術(shù)以及流處理層技術(shù)。具體如圖所示:

a4808860-5fd2-11eb-8b86-12bb97331649.jpg

消息傳輸層的引入流處理層提供了以下支持:

消息傳輸層的一個作用是作為流處理層上游的安全隊列,它相當于緩沖區(qū),可以將事件數(shù)據(jù)作為短期數(shù)據(jù)保留起來,以防數(shù)據(jù)處理過程發(fā)生中斷

具有持久性的好處之一是消息可以重播。實現(xiàn)時間穿梭

在當前典型的流處理技術(shù)中,有這么幾類:

Lambda架構(gòu)

基于Lambda架構(gòu),實現(xiàn)了離線計算的精確性的同時,且獲得了流式數(shù)據(jù)處理的實時性。但是,由于要開發(fā)同樣邏輯的代碼,開發(fā)、維護成本高

a81f2850-5fd2-11eb-8b86-12bb97331649.jpg

Kappa架構(gòu)為了解決lambda架構(gòu)中維護兩套同樣邏輯的代碼,kappa架構(gòu)提出使用流式處理解決上述問題。當需要重新處理、計算數(shù)據(jù)時,使用另一個流程處理的作業(yè)(可以是相同的、優(yōu)化的版本)進行數(shù)據(jù)處理。

a8b7e4d2-5fd2-11eb-8b86-12bb97331649.jpg

spark streaming

基于小批量進行數(shù)據(jù)處理

Flink

以上幾種技術(shù)中,flink既可以實現(xiàn)低延遲、高吞吐,還可以實現(xiàn)容錯。

Flink概況

03

Flink技術(shù)除支持流處理外,還支持批處理,其架構(gòu)如下圖所示:

a9d244e8-5fd2-11eb-8b86-12bb97331649.jpg

另外,F(xiàn)link具有分布式的特點,具體體現(xiàn)在它能夠在成百上千臺機器上運行,它將大型的計算任務分成許多小的部分,每個機器執(zhí)行一個部分。 Flink能夠自動地確保在發(fā)生機器故障或者其他錯誤時計算能持續(xù)進行,或者在修復bug或進行版本升級后有計劃地再執(zhí)行一次。這種能力使得開發(fā)人員不需要擔心失敗。 Flink本質(zhì)上使用容錯性數(shù)據(jù)流,這使得開發(fā)人員可以分析持續(xù)生成且永遠不結(jié)束的數(shù)據(jù)(即流處理)。因為不用再在編寫應用程序代碼時考慮如何解決問題,所以工程師的時間得以充分利用,整個團隊也因此受益。好處并不局限于縮短開發(fā)時間,隨著靈活性的增加,團隊整體的開發(fā)質(zhì)量得到了提高,運維工作也變得更容易、更高效。Flink讓應用程序在生產(chǎn)環(huán)境中獲得良好的性能。

總體來說,F(xiàn)link的主要特性:

符合產(chǎn)生數(shù)據(jù)的自然規(guī)律:支持流式數(shù)據(jù)處理

發(fā)生故障后仍保持準確:具體容錯機制(exactly once)

及時給出所需結(jié)果:低延遲、實時性強

時間概念

在流數(shù)據(jù)處理的體系中,時間是一個重要的概念??傮w來說,可分為以下三種時間:

事件時間:即事件實際發(fā)生的時間。更準確地說,每一個事件都有一個與它相關(guān)的時間戳,并且時間戳是數(shù)據(jù)記錄的一部分(比如手機或者服務器的記錄)。事件時間其實就是時間戳。處理時間,即事件被處理的時間。

處理時間:其實就是處理事件的機器所測量的時間

攝取時間:也叫作進入時間。它指的是事件進入流處理框架的時間

Flink允許用戶根據(jù)所需的語義和對準確性的要求選擇采用事件時間、處理時間或攝取時間定義窗口

窗口

窗口是一種機制,它用于將許多事件按照時間或者其他特征分組,從而將每一組作為整體進行分析(比如求和)

ab2e3fae-5fd2-11eb-8b86-12bb97331649.jpg

時間穿梭

處理器支持事件時間,這意味著將數(shù)據(jù)流“倒帶”,用同一組數(shù)據(jù)重新運行同樣的程序,會得到相同的結(jié)果

水印

假設第一個窗口從1000開始(即從10時0分0秒開始),需要計算從1000到1000的數(shù)值總和。當時間就是記錄的一部分時,我們怎么知道1000已到呢?換句話說,我們怎么知道蓋有時間戳1059的元素還沒到呢?Flink通過水印來推進事件時間。水印是嵌在流中的常規(guī)記錄,計算程序通過水印獲知某個時間點已到。

有狀態(tài)的計算

流式計算分為無狀態(tài)和有狀態(tài)兩種情況:

無狀態(tài)的計算觀察每個獨立事件,并根據(jù)最后一個事件輸出結(jié)果。例如,流處理應用程序從傳感器接收溫度讀數(shù),并在溫度超過90度時發(fā)出警告。

有狀態(tài)的計算則會基于多個事件輸出結(jié)果。

數(shù)據(jù)處理容錯及一致性保障

在有狀態(tài)的數(shù)據(jù)處理中,如何保障數(shù)據(jù)的一致性是一個關(guān)鍵點。保障一致性的方式有以下三種:

at most once:這其實是沒有正確性保障的委婉說法——故障發(fā)生之后,計數(shù)結(jié)果可能丟失

at least once:這表示計數(shù)結(jié)果可能大于正確值,但絕不會小于正確值。也就是說,計數(shù)程序在發(fā)生故障后可能多算,但是絕不會少算

exactly once:這指的是系統(tǒng)保證在發(fā)生故障后得到的計數(shù)結(jié)果與正確值一致

Flink如何保證exactlyonce呢?它使用一種被稱為“檢查點”的特性,在出現(xiàn)故障時將系統(tǒng)重置回正確狀態(tài)。

有限流處理是無限流處理的一種特殊情況,它只不過在某個時間點停止而已。此外,如果計算結(jié)果不在執(zhí)行過程中連續(xù)生成,而僅在末尾處生成一次,那就是批處理(分批處理數(shù)據(jù))

原文標題:流式計算、數(shù)據(jù)處理及相關(guān)技術(shù)

文章出處:【微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49011

    瀏覽量

    249331
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8502

    瀏覽量

    134584

原文標題:流式計算、數(shù)據(jù)處理及相關(guān)技術(shù)

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    取樣示波器的技術(shù)原理和應用場景

    取樣示波器,也稱為采樣示波器,是一種重要的電子測量儀器,其技術(shù)原理和應用場景可以歸納如下:技術(shù)原理取樣示波器的根本原理是利用等效取樣技術(shù),將周期性高頻(或高速)信號變換為與原來信號波形
    發(fā)表于 03-12 14:34

    頻域示波器的技術(shù)原理和應用場景

    頻域示波器,其主要技術(shù)原理基于信號的傅里葉變換理論,通過快速傅里葉變換(FFT)算法將時域信號轉(zhuǎn)換為頻域信號,從而進行頻譜分析。以下是對頻域示波器的技術(shù)原理和應用場景的詳細分析:一、技術(shù)
    發(fā)表于 03-11 14:37

    數(shù)據(jù)記錄儀的計數(shù)原理和應用場景

    數(shù)據(jù)記錄儀是一種用于測量、記錄和分析各種數(shù)據(jù)的設備,其計數(shù)原理和應用場景可以歸納如下: 一、計數(shù)原理數(shù)據(jù)記錄儀的計數(shù)原理主要基于傳感器技術(shù)
    發(fā)表于 02-24 14:28

    敏捷合成器的技術(shù)原理和應用場景

    敏捷合成器,作為一種高性能的信號發(fā)生器,其技術(shù)原理和應用場景值得深入探討。技術(shù)原理敏捷合成器的技術(shù)原理主要基于先進的頻率合成技術(shù)和數(shù)字信號
    發(fā)表于 02-20 15:25

    低電平靈敏專用儀器的技術(shù)原理和應用場景

    低電平靈敏專用儀器是一種高精度、高靈敏度的測量工具,廣泛應用于各種需要精確測量微弱信號的場合。以下是對其技術(shù)原理和應用場景的詳細介紹:一、技術(shù)原理低電平靈敏專用儀器的工作原理基于精密的
    發(fā)表于 12-06 14:45

    倍頻器的技術(shù)原理和應用場景

    倍頻器是一種用于將輸入信號的頻率倍增的電子設備,以下是關(guān)于倍頻器的技術(shù)原理和應用場景的詳細解釋:技術(shù)原理倍頻器的技術(shù)原理主要基于非線性元件(如二極管、晶體管等)的特性和頻率變換
    發(fā)表于 11-29 14:49

    射頻分析儀的技術(shù)原理和應用場景

    射頻分析儀是一種功能強大的電子測量儀器,在無線通信、電子測試等領(lǐng)域具有廣泛的應用。以下是關(guān)于射頻分析儀的技術(shù)原理和應用場景的詳細介紹:一、射頻分析儀的技術(shù)原理射頻分析儀的工作原理主要基
    發(fā)表于 11-26 14:32

    系統(tǒng)放大器的技術(shù)原理和應用場景

    系統(tǒng)放大器是一種重要的電子設備,其技術(shù)原理和應用場景都具有一定的專業(yè)性和廣泛性。以下是對系統(tǒng)放大器的技術(shù)原理和應用場景的詳細介紹:一、
    發(fā)表于 11-18 14:46

    便攜式示波器的技術(shù)原理和應用場景

    便攜式示波器作為示波器的一種,具有體積小、重量輕、便于攜帶等特點,在多個領(lǐng)域有著廣泛的應用。以下是對其技術(shù)原理和應用場景的詳細介紹:一、技術(shù)原理便攜式示波器的基本原理與傳統(tǒng)示波器相同,
    發(fā)表于 10-24 14:31

    實時示波器的技術(shù)原理和應用場景

    波形圖像。在信號處理方面,示波器首先將接收到的被測信號進行放大和濾波等處理,以確保信號的準確性和穩(wěn)定性。然后,通過A/D轉(zhuǎn)換技術(shù),將模擬信號轉(zhuǎn)換為數(shù)字信號,以便進行后續(xù)的數(shù)字處理和顯示
    發(fā)表于 10-23 14:22

    高速數(shù)字化儀的技術(shù)原理和應用場景

    高速數(shù)字化儀是一種用于采集高速模擬信號,并將其轉(zhuǎn)換為數(shù)字信號進行處理和儲存的設備。以下是對其技術(shù)原理和應用場景的詳細介紹:一、技術(shù)原理 采樣
    發(fā)表于 10-21 14:34

    光學透過率測量儀的技術(shù)原理和應用場景

    光學透過率測量儀(也稱為光透過率檢測儀)是一種專門用于測量材料透光率的儀器。以下是對其技術(shù)原理和應用場景的詳細解析:技術(shù)原理光學透過率測量儀的技術(shù)原理主要基于光的透射原理。當光線通過物
    發(fā)表于 10-16 14:38

    超聲波測厚儀的技術(shù)原理和應用場景

    超聲波測厚儀的技術(shù)原理和應用場景詳細如下:技術(shù)原理超聲波測厚儀利用超聲波脈沖反射原理來測量材料的厚度。具體工作原理如下: 發(fā)射超聲波脈沖:測厚儀的探頭(也稱為換能器)向被測物體發(fā)射一束高頻超聲波脈沖
    發(fā)表于 09-27 15:06

    智能IC卡測試設備的技術(shù)原理和應用場景

    智能IC卡測試設備的技術(shù)原理和應用場景,可以從以下幾個方面進行闡述:技術(shù)原理智能IC卡測試設備的技術(shù)原理主要圍繞IC卡的通信和數(shù)據(jù)處理機制展
    發(fā)表于 09-26 14:27

    NFC協(xié)議分析儀的技術(shù)原理和應用場景

    NFC協(xié)議分析儀的技術(shù)原理和應用場景可以詳細闡述如下:技術(shù)原理NFC(Near Field Communication,近場通信)協(xié)議分析儀是一種用于分析NFC通信協(xié)議和性能的專業(yè)設備。其技術(shù)
    發(fā)表于 09-25 14:45