chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么阿里云要做Apache Flink

算法與數(shù)據(jù)結(jié)構(gòu) ? 來源:算法與數(shù)據(jù)結(jié)構(gòu) ? 作者: 蔡芳芳 ? 2021-01-04 14:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

流批一體已經(jīng)從理論走向?qū)嵺`,并在 2020 年迎來落地元年。

短短 5 年,Apache Flink(下稱 Flink)從一個突然出現(xiàn)在大數(shù)據(jù)舞臺的“萌新”系統(tǒng),迅速成長為人人皆知的流計算引擎。

在伴隨 Flink 發(fā)展掀起的這波實(shí)時計算浪潮里,阿里是國內(nèi)走得最前、做得也最多的一個,“流批一體”是它的新賽道。今年雙 11, Flink 流批一體開始在阿里最核心的數(shù)據(jù)業(yè)務(wù)場景嶄露頭角,并抗住了 40 億條/秒的實(shí)時計算峰值。

這是第一次有互聯(lián)網(wǎng)超級大廠真正在核心數(shù)據(jù)業(yè)務(wù)上規(guī)?;涞亓髋惑w技術(shù)。同時,這也意味著 Flink 在阿里的發(fā)展已經(jīng)進(jìn)入第二個階段,從全鏈路實(shí)時化進(jìn)階到全鏈路流批一體化。

恰逢 2020 年 Flink Forward Asia 大會召開之際,InfoQ 對 Apache Flink 中文社區(qū)發(fā)起人及阿里云實(shí)時計算負(fù)責(zé)人王峰(花名莫問)、阿里云實(shí)時計算團(tuán)隊(duì)資深技術(shù)專家楊克特(花名魯尼)、天貓大數(shù)據(jù)負(fù)責(zé)人黃曉鋒進(jìn)行了獨(dú)家專訪,希望從多個角度更完整地還原 Flink 流批一體在阿里落地的過程和背后的技術(shù)挑戰(zhàn),并深入探討這個新賽道對于阿里云的價值和未來發(fā)展方向。

1 從理論到落地

流批一體的技術(shù)理念最早提出于 2015 年,它的初衷是讓開發(fā)人員能夠用同一套接口實(shí)現(xiàn)大數(shù)據(jù)的流計算和批計算,進(jìn)而保證處理過程與結(jié)果的一致性。隨后,大數(shù)據(jù)廠商 / 框架們?nèi)?Spark、Flink、Beam 等,都陸續(xù)提出了自己的解決方案,雖然實(shí)現(xiàn)方式各不相同,但在一定程度上說明流批一體的思想已經(jīng)在業(yè)界得到廣泛認(rèn)可。

然而,流批一體要真正從理論走到落地,尤其是在企業(yè)的核心數(shù)據(jù)業(yè)務(wù)場景規(guī)?;涞?,往往面臨技術(shù)和業(yè)務(wù)的雙重挑戰(zhàn)。在莫問看來,這也是為什么流批一體出現(xiàn)的很早,廠商落地案例卻不多見。

從技術(shù)層面來看,流計算和批計算從計算方式、支撐模塊、資源調(diào)度策略到流程規(guī)劃等都存在差異,不管是批流一體還是流批一體,都有不少技術(shù)問題要解決。這其中關(guān)乎研發(fā)資源投入,但大前提是需要有一個統(tǒng)一的計算引擎。雖然 Spark 是最早提出流批一體理念的計算引擎之一,但由于其本質(zhì)還是基于批(mini-batch)來實(shí)現(xiàn)流,在流計算語義和延遲上存在硬傷,難以滿足復(fù)雜、大規(guī)模實(shí)時計算場景的極致需求,因此目前很多廠商的數(shù)據(jù)業(yè)務(wù)還是選擇將流和批分開來做,流用 Flink、批用 Spark。這就導(dǎo)致前面說的大前提無法滿足,在核心場景落地流批一體更加無從談起。

從業(yè)務(wù)層面來看,如果企業(yè)有非常重的歷史包袱或者在流批一體架構(gòu)下不能取得足夠多業(yè)務(wù)價值,那它也不會有足夠的動力去做流批一體的改造和落地。

但對于阿里來說,恰恰是在技術(shù)和業(yè)務(wù)兩個因素共同推動之下,流批一體才得以在雙 11 核心業(yè)務(wù)場景正式亮相。

技術(shù)上,阿里 2019 年收購 Flink 的創(chuàng)始公司 Ververica 后,投入近百名工程師到 Flink 技術(shù)研發(fā)和社區(qū)工作中,在 Flink 基于流實(shí)現(xiàn)批計算的能力上做了非常多工作,其中有一些特性優(yōu)先在雙 11 落地,后續(xù)也會全部推進(jìn)到社區(qū)里。

業(yè)務(wù)上,今年大促期曾經(jīng)面臨離線和實(shí)時數(shù)據(jù)統(tǒng)計口徑不一致的問題,這類潛在問題會影響廣告、商務(wù)甚至公司運(yùn)營決策,這是真正的“秒秒鐘幾百萬上下”,強(qiáng)電商屬性和大業(yè)務(wù)體量倒逼著流批一體技術(shù)必須在阿里核心業(yè)務(wù)落地,方能解決痛點(diǎn)。

莫問提到,當(dāng)前流批一體已經(jīng)在許多業(yè)務(wù)場景成為剛需,而不是一個技術(shù)噱頭。這次雙十一就像一場“轉(zhuǎn)正”考試,意味著在阿里巴巴業(yè)務(wù)場景中流批一體技術(shù)從理論走向落地,同時也標(biāo)記著 Flink 在阿里開始從全鏈路實(shí)時化步入全鏈路流批一體化的新階段。

2 路走對了,就不怕遠(yuǎn)

2015 年,針對搜索推薦業(yè)務(wù)做新的大數(shù)據(jù)計算引擎選型時,阿里云實(shí)時計算團(tuán)隊(duì)對流批一體的技術(shù)方向就已經(jīng)有初步設(shè)想。

在經(jīng)過深度調(diào)研、可行性驗(yàn)證和對未來可能遇到的問題進(jìn)行推演之后,團(tuán)隊(duì)最終決定引入 Flink。魯尼表示,雖然當(dāng)時 Flink 整個系統(tǒng)還不是特別成熟,但團(tuán)隊(duì)認(rèn)為 Flink 以流計算為核心的設(shè)計理念更符合未來數(shù)據(jù)計算實(shí)時化發(fā)展的大趨勢。在阿里內(nèi)部有一句土話,叫“路走對了,就不怕遠(yuǎn)”,從后續(xù)這幾年的發(fā)展情況來看,F(xiàn)link 確實(shí)進(jìn)展順利,甚至超過團(tuán)隊(duì)當(dāng)時的預(yù)期。

當(dāng)然,從初步設(shè)想到實(shí)現(xiàn)相對完善的流批一體能力,需要一個循序漸進(jìn)的過程。

從技術(shù)本身演化的角度來看,F(xiàn)link 經(jīng)歷了流批一體 API 從無到有、從有到更優(yōu)兩個階段。在早期的 Flink 版本中,F(xiàn)link 的流和批無論在 API 還是在 Runtime 上都沒有達(dá)到徹底的統(tǒng)一。但從 1.9 版本開始,F(xiàn)link 加速在流批一體上進(jìn)行完善和升級,F(xiàn)link SQL 作為用戶使用的最主流 API,率先實(shí)現(xiàn)了流批一體語義,用戶只需學(xué)習(xí)使用一套 SQL 就可以基于 Flink 進(jìn)行流批一體的開發(fā),降低了開發(fā)的門檻。

最初 SQL 實(shí)現(xiàn)流批一體的做法是將流作業(yè)和批作業(yè)分別翻譯成 Flink 底層的兩個原生 API,包括處理流計算需求的 DataStream 和處理批計算需求的 DataSet,相對來說有些簡單粗暴,當(dāng)時也引發(fā)了一系列問題,包括開發(fā)鏈路過長導(dǎo)致迭代效率不高等。因此 Flink 社區(qū)又對底層架構(gòu)做了一些重構(gòu),并引出了 DAG API,F(xiàn)link 分布式運(yùn)行層針對 DAG 做了一系列優(yōu)化,包括增加流批一體的調(diào)度器、可插拔的 Shuffle 插件等。這樣一來,F(xiàn)link 的分布式運(yùn)行層也開始逐漸形成了流批一體的 DAG 描述能力和調(diào)度執(zhí)行能力。

87e9e1d0-4423-11eb-8b86-12bb97331649.png

目前 Flink 的流批一體方案仍然在持續(xù)改進(jìn)當(dāng)中。雖然現(xiàn)在開發(fā)者已經(jīng)可以很方便地基于 SQL API 來執(zhí)行流批一體作業(yè),但 SQL 并不能解決所有需求。一些邏輯特別復(fù)雜或定制化程度較高的作業(yè)還是需要繼續(xù)使用 DataStream API。DataStream API 雖然能更加靈活地應(yīng)對流計算場景的各種需求,但卻缺乏對批處理的高效支持。

因此,F(xiàn)link 社區(qū)在完成 SQL 流批一體升級之后,從 1.11 版本開始投入大量精力完善 DataStream API 的流批一體能力,在 DataSteam API 上增加批處理的語義,同時結(jié)合流批一體 Connector 的設(shè)計,讓 DataStream API 能夠在流批融合場景下對接 Kafka 和 HDFS 等不同類型流批數(shù)據(jù)源。在剛剛發(fā)布的 1.12 版本中,大家就可以體驗(yàn)到 DataStream 流批一體的原生支持。接下來流批一體的迭代計算 API 也將被引入到 DataStream 中,進(jìn)一步解鎖一系列機(jī)器學(xué)習(xí)場景。

此外,在當(dāng)前 Flink 主版本中,不管是 SQL 還是 DataStream API,在流批一體概念上都還是流計算和批計算功能的結(jié)合體。用戶雖然只需要編寫一套代碼,但需要在代碼中選擇使用流的方式跑,還是批的方式跑,執(zhí)行模式比較單一。但有些業(yè)務(wù)場景已經(jīng)提出更高的要求,即流批混合,需要在批和流之間自動切換,F(xiàn)link 也將在后續(xù)支持更加智能的流批融合場景和動態(tài)切換能力。

當(dāng)然,流批一體不只是一個技術(shù)問題,最終還是業(yè)務(wù)落地的問題,F(xiàn)link 的流批一體能力也是通過大規(guī)模業(yè)務(wù)鍛造出來的。

雖然選型之初,阿里云的技術(shù)團(tuán)隊(duì)看中的就是 Flink 優(yōu)秀的流計算能力,但當(dāng)時這個能力并未經(jīng)過大規(guī)模線上業(yè)務(wù)驗(yàn)證。為了快速試錯,團(tuán)隊(duì)決定開辟一個 Flink 的內(nèi)部分支(即后來為大家熟知的 Blink),最大目的是快速增加當(dāng)時急缺的功能并在線上業(yè)務(wù)驗(yàn)證,這也是在業(yè)務(wù)早期的選擇。

經(jīng)過團(tuán)隊(duì)一年的努力,基于 Flink 的搜索推薦實(shí)時計算平臺成功支持了 2016 年的搜索雙 11,保證了搜索推薦全鏈路實(shí)時化。在這之后,F(xiàn)link 開始在阿里集團(tuán)內(nèi)部服務(wù)于更多實(shí)時數(shù)據(jù)業(yè)務(wù),在更大規(guī)模的業(yè)務(wù)場景驗(yàn)證并優(yōu)化其流計算能力和穩(wěn)定性。2017 年,F(xiàn)link 成功支持了全集團(tuán)雙 11 的實(shí)時數(shù)據(jù)業(yè)務(wù),包括 GMV 大屏等最核心的數(shù)據(jù)業(yè)務(wù)場景。

在實(shí)時計算能力經(jīng)過充分驗(yàn)證之后,團(tuán)隊(duì)開始補(bǔ)充和完善 Flink 的批計算能力,并在搜索推薦的索引構(gòu)建、機(jī)器學(xué)習(xí)特征工程和樣本生成等業(yè)務(wù)場景中進(jìn)行驗(yàn)證。

經(jīng)過大規(guī)模作業(yè)驗(yàn)證之后,團(tuán)隊(duì)對 Flink 的流批一體能力更加有底,也是在這個時候,團(tuán)隊(duì)開始醞釀 Blink 的開源。后面的進(jìn)展很多人都已經(jīng)有所了解:2018 年 12 月阿里宣布開源 Flink 的內(nèi)部分支 Blink;2019 年 1 月起,阿里逐步將內(nèi)部在 Blink 沉淀的能力推回 Flink 開源社區(qū);到 2019 年 11 月發(fā)布的 Flink 1.10 版本前瞻,Blink 全部功能都已經(jīng)進(jìn)入 Flink。2020 年雙 11 天貓營銷決策核心系統(tǒng)的這場“大考”,F(xiàn)link 流批一體技術(shù)又得到了更進(jìn)一步的錘煉。

3 流批一體的雙 11“大考”

在莫問看來,F(xiàn)link 流批一體技術(shù)從最初應(yīng)用于搜索推薦場景,到今年雙 11 在天貓核心數(shù)據(jù)業(yè)務(wù)落地,升級的是業(yè)務(wù)的重要程度,而不是簡單的計算規(guī)模。

在流計算場景上,天貓大數(shù)據(jù)團(tuán)隊(duì)已經(jīng)跟實(shí)時計算團(tuán)隊(duì)配合了很多年,但之前一直沒有在批計算場景上線。魯尼透露,天貓的批處理作業(yè)優(yōu)先級在集團(tuán)內(nèi)屬于級別最高的那一檔,因此在架構(gòu)升級上會更慎重。

天貓分析場景下的報表大部分分為實(shí)時和離線兩種,商家、小二、管理層通過實(shí)時數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行不同維度、不同時間周期的比對,從而對當(dāng)前的活動情況作出判斷,這些數(shù)據(jù)是業(yè)務(wù)決策的重要判斷依據(jù)。

以前天貓整體的數(shù)據(jù)架構(gòu)使用的是 Lambda 架構(gòu),數(shù)據(jù)分析需求基于流、批兩套計算引擎產(chǎn)出,這種分離的架構(gòu)不僅會帶來兩套開發(fā)成本,也導(dǎo)致數(shù)據(jù)邏輯和口徑難以對齊。另外,產(chǎn)品搭建數(shù)據(jù)報表的時候,過程繁瑣,容易出現(xiàn)問題。這些痛點(diǎn)促使天貓大數(shù)據(jù)團(tuán)隊(duì)開始調(diào)研流批一體的技術(shù)方案。

流批一體的技術(shù)方案主要分兩種,一種是跨引擎的流批一體,比如更早以前 Storm 和 Spark 結(jié)合使用,批交給 Spark 執(zhí)行,流交給 Storm 執(zhí)行;另一種就是一個引擎本身就具備流批一體的能力,比如 Spark 和 Spark streaming、Flink 等。鑒于 Flink 的流計算能力已經(jīng)在阿里集團(tuán)內(nèi)部經(jīng)過大規(guī)模業(yè)務(wù)應(yīng)用的驗(yàn)證,以及 Flink 流批一體技術(shù)的不斷成熟,天貓大數(shù)據(jù)團(tuán)隊(duì)決定嘗試基于 Flink 的流批一體能力升級技術(shù)架構(gòu)。

8854f1be-4423-11eb-8b86-12bb97331649.png

8888b648-4423-11eb-8b86-12bb97331649.png

除了計算層,團(tuán)隊(duì)也調(diào)研了存儲層的流批一體方案,最終確定云原生實(shí)時數(shù)倉 Hologres 可以滿足天貓點(diǎn)查和 OLAP 分析這兩個場景的需求。團(tuán)隊(duì)首先設(shè)計了一個 POC 流程對整套方案進(jìn)行可行性驗(yàn)證,發(fā)現(xiàn)這套方案是 work 的,的確能對研發(fā)效能和數(shù)據(jù)質(zhì)量帶來了比較大的提升。

黃曉鋒告訴 InfoQ,從決定在雙 11 大促中規(guī)?;褂?Flink 流批一體到最終落地,天貓大數(shù)據(jù)團(tuán)隊(duì)和實(shí)時計算團(tuán)隊(duì)并肩作戰(zhàn)了 5 個月,整個改造過程大致可以劃分為四個關(guān)鍵階段。

第一個階段是設(shè)計。首先需要拆解和梳理天貓實(shí)際情況,完成流批一體模型的統(tǒng)一。然后需要在平臺這一側(cè)把源數(shù)據(jù)打通,實(shí)現(xiàn)用戶只寫一套代碼,平臺自動翻譯成 Flink Batch 任務(wù)和 Flink Stream 任務(wù),同時寫到一張 Holo 表,完成計算層表達(dá)的統(tǒng)一。

第二個階段是落地。流批一體需要依賴離線的調(diào)度,因此需要對 MaxCompute平臺做一定程度的打通。

第三個階段是優(yōu)化。包括語義層表達(dá)的優(yōu)化,比如以前寫的趨勢圖邏輯可能針對流場景做了針對性優(yōu)化,但在批上面不起作用甚至可能存在問題,這些特殊場景需要做語義對齊;也包括性能的優(yōu)化,以保證在雙 11 可以達(dá)到性能目標(biāo)。

第四階段是穩(wěn)定性。由于整條鏈路改動比較大,雙 11 場景對穩(wěn)定性的要求又特別高,因此團(tuán)隊(duì)重點(diǎn)展開了數(shù)據(jù)全鏈路的壓測,以保證 Flink 本身流批計算性能、Hologres 的查詢性能和上層 BI 層的查詢性能,都能夠滿足雙 11 的 QPS 訴求。

在整個過程中,團(tuán)隊(duì)也遇到了幾個核心挑戰(zhàn)。

其中一個挑戰(zhàn)來自性能。這是流批一體第一次大規(guī)模使用,不同系統(tǒng)的數(shù)據(jù)打通做的還不是非常完備。比如 MaxCompute 和 Flink 之間的數(shù)據(jù)中轉(zhuǎn)是通過 Tunnel 管道的方式來做的,但在規(guī)?;瘧?yīng)用的過程中才發(fā)現(xiàn) Tunnel 有連接數(shù)的限制,會極大地影響規(guī)?;茝V。后來團(tuán)隊(duì)通過在 Flink 這一層做相應(yīng)的優(yōu)化,先一次性讀取再在 Flink 內(nèi)部做分發(fā),極大地降低了連接數(shù)并優(yōu)化了讀取性能,問題得以解決。

另一個挑戰(zhàn)來自流批一體的語義統(tǒng)一。在某些場景下,開發(fā)人員對流批語義的理解和 Flink Runtime 翻譯出來的流批一體語義之間存在差異,可能會導(dǎo)致同一套 SQL 跑出來的流批結(jié)果跟業(yè)務(wù)理解的不一樣,比如對于 Index Join 和 Primarykey Join 的處理方式在流批上面的差異。后來兩個團(tuán)隊(duì)聯(lián)合修復(fù)了這個問題。

除此之外,天貓大數(shù)據(jù)團(tuán)隊(duì)也聯(lián)合 Hologres 開發(fā)團(tuán)隊(duì)對 Hologres 進(jìn)行了非常深度的優(yōu)化,包括優(yōu)化器、排隊(duì)機(jī)制、數(shù)據(jù) Shard 的劃分規(guī)則、計算層的數(shù)據(jù) shuffle 機(jī)制都做了針對性的優(yōu)化。

事實(shí)上,F(xiàn)link 流批一體成功落地雙 11 天貓核心數(shù)據(jù)場景,不僅更好地提升了開發(fā)團(tuán)隊(duì)成員的技術(shù)能力,在業(yè)務(wù)上的實(shí)踐效果也非常喜人。

時效性上,面對 58.3 萬筆 / 秒的交易峰值和上億 / 秒的無線流量洪峰,天貓的所有任務(wù)都達(dá)到了秒級延時,整個實(shí)時計算集群峰值 TPS 達(dá)到 40 億條 / 秒。同時,集群資源利用率也得到了大幅提升,批任務(wù)可以錯峰執(zhí)行。

準(zhǔn)確性上,流批任務(wù)的業(yè)務(wù)口徑做到了完全一致,數(shù)據(jù)質(zhì)量問題不復(fù)存在,成為大促期間重要的業(yè)務(wù)雷達(dá)。流批模型也實(shí)現(xiàn)了完全統(tǒng)一,產(chǎn)品搭建效率提升 400%。

靈活性上,流批一體實(shí)現(xiàn)了多個計算處理模式也只需要撰寫一套代碼,需求迭代效率提升 2 倍,大促當(dāng)天緊急需求承接效率提升 5 倍。同時,實(shí)時數(shù)倉 +OLAP 場景結(jié)合,也使得變更成本大幅下降,能更好地滿足分析師按需取數(shù)場景的需要。

在黃曉鋒的整體規(guī)劃里,F(xiàn)link 流批一體成功落地雙 11 天貓核心數(shù)據(jù)場景,僅僅只是走出了陽光大道的第一步。接下來,天貓大數(shù)據(jù)團(tuán)隊(duì)計劃繼續(xù)探索存儲層的流批一體,而在更長遠(yuǎn)的未來,團(tuán)隊(duì)希望推動流批一體往“湖倉一體”方向去演進(jìn),并把經(jīng)過內(nèi)部打磨的技術(shù)架構(gòu)和平臺,如 DataPhin、QuickBI、Flink、Hologres 整合的場景,輸出到云上服務(wù)更多外部用戶。

4 下一個規(guī)模化落地場景什么時候到來?

阿里在核心數(shù)據(jù)業(yè)務(wù)上真正規(guī)模化落地“流批一體”無疑給業(yè)界開了個好頭。

近幾年,大數(shù)據(jù)領(lǐng)域逐漸開始擁抱“融合”(或所謂“一體化”)演進(jìn)的新方向,不管是今年剛成為熱議話題的“湖倉一體”,還是更早提出的“流批一體”,其實(shí)都是這一思路的階段性成果。對于新的技術(shù)思路,大眾在一開始肯定會有質(zhì)疑和觀望情緒。莫問表示,團(tuán)隊(duì)希望通過這次成功打樣的案例向業(yè)界證明,F(xiàn)link 流批一體是真正能夠落地核心業(yè)務(wù)并為業(yè)務(wù)創(chuàng)造價值的。這或許能讓更多企業(yè)和團(tuán)隊(duì)打消觀望情緒,并使 2020 年成為流批一體落地的元年。

在黃曉鋒看來,流批一體將成為阿里集團(tuán)內(nèi)部數(shù)據(jù)技術(shù)升級的新賽道。因?yàn)樘熵埖臉I(yè)務(wù)體量和業(yè)務(wù)場景的復(fù)雜度,在整個集團(tuán)里非常具有代表性,F(xiàn)link 流批一體在天貓業(yè)務(wù)上的成功應(yīng)用,會推動整個集團(tuán)在流批一體這個賽道上的投入,也會推動更多業(yè)務(wù)去升級到流批一體架構(gòu),以解決業(yè)務(wù)上的痛點(diǎn)。

除了在阿里內(nèi)部推動更多業(yè)務(wù)落地 Flink 流批一體,莫問提到,未來還會將更多精力和焦點(diǎn)放在開源社區(qū)。下一步,阿里云實(shí)時計算團(tuán)隊(duì)會把在阿里業(yè)務(wù)場景下打磨出來的核心技術(shù)積累,在 Flink 未來的 1 到 2 個版本中逐步推回開源社區(qū),讓更多企業(yè)都能夠用上 Flink 流批一體的能力。

當(dāng)然,在 Flink 流批一體推廣和大規(guī)模落地的道路上也充滿挑戰(zhàn)。

流批一體技術(shù)本身的挑戰(zhàn)在于,原來是一個單一引擎解決單一問題(批或者流),現(xiàn)在需要一個引擎同時解決流 + 批的問題,如果未來流和批的概念逐漸淡化,那么引擎本身就需要具備針對不同場景和需求智能化選擇流批模式的能力,這在技術(shù)上是非常大的挑戰(zhàn)。不過魯尼認(rèn)為,機(jī)遇和挑戰(zhàn)是一并存在的,如果用戶能夠把更多精力從選擇引擎、維護(hù)引擎中解放出來,就可以更專注于業(yè)務(wù)本身,既能加快迭代效率也能利用流批一體引擎的靈活性解鎖更多有價值的業(yè)務(wù)場景。

另一個挑戰(zhàn)在于改變用戶的心智,莫問表示,流批一體需要用戶轉(zhuǎn)變原來固有的流批分離的思維模式,這并不是一件簡單的事情,企業(yè)在做相關(guān)的決策時肯定會更加謹(jǐn)慎,需要逐步試點(diǎn)和推進(jìn)。另外,當(dāng)前很多互聯(lián)網(wǎng)公司離線計算團(tuán)隊(duì)和實(shí)時計算團(tuán)隊(duì)是兩個獨(dú)立的團(tuán)隊(duì)、兩套獨(dú)立的體系,如果要做流批一體,就需要兩個團(tuán)隊(duì)密切合作和共建,組織架構(gòu)上的挑戰(zhàn)不亞于技術(shù)上的挑戰(zhàn)。但莫問相信,只要方向?qū)α耍磺兄皇菚r間問題。

據(jù)了解,目前 Flink 社區(qū)中字節(jié)跳動、快手、小米等幾家頭部公司都已經(jīng)開始探索基于 Flink 的流批一體架構(gòu),或正在規(guī)劃當(dāng)中。

展望 2021 年,F(xiàn)link 流批一體或?qū)⒂瓉砜焖侔l(fā)展期。隨著更多大型互聯(lián)網(wǎng)公司成功落地并向業(yè)界輸出經(jīng)驗(yàn),相信會推動更多中小企業(yè)選擇跟進(jìn)和嘗試流批一體架構(gòu)。

責(zé)任編輯:xj

原文標(biāo)題:為什么阿里云要做流批一體?

文章出處:【微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算
    +關(guān)注

    關(guān)注

    2

    文章

    457

    瀏覽量

    39831
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    789

    瀏覽量

    46338
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1028

    瀏覽量

    45475

原文標(biāo)題:為什么阿里云要做流批一體?

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數(shù)據(jù)結(jié)構(gòu)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里設(shè)備的物模型數(shù)據(jù)里面始終沒有值是哪里的問題?

    如上圖,不知道講清楚沒有。 IG502自定義TOPIC 上發(fā)到阿里沒問題。采用阿里物模型的格式來上發(fā)就不行。請大佬指教!
    發(fā)表于 08-05 06:43

    四維圖新與阿里達(dá)成戰(zhàn)略合作

    近日,北京四維圖新科技股份有限公司(以下簡稱“四維圖新”)與阿里計算有限公司(以下簡稱“阿里”)正式簽署戰(zhàn)略合作框架協(xié)議,宣布建立長期戰(zhàn)略合作伙伴關(guān)系。雙方將深度融合四維圖新在輔助
    的頭像 發(fā)表于 06-05 17:53 ?966次閱讀

    阿里是什么?企業(yè)不可不知的云端架構(gòu)服務(wù)!

    阿里是什么?中國高速連線阿里 CDN 服務(wù) 阿里為國內(nèi)云端市場中市占有率第一的
    的頭像 發(fā)表于 03-16 09:43 ?1262次閱讀

    阿里爆發(fā)式的跨越

    表示,阿里巴巴與蘋果的合作,將不僅僅局限于手機(jī)服務(wù)領(lǐng)域,未來還將涉及更多的業(yè)務(wù)板塊。 當(dāng)媒體都在驚嘆與討論蘋果為什么選擇阿里巴巴時,背后真正的主角還需要加上一個 “” 字。 長期以來,相比淘寶、天貓、菜鳥,“
    的頭像 發(fā)表于 03-12 16:54 ?608次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>爆發(fā)式的跨越

    廣和通攜手阿里推出隨身智能解決方案

    2月,廣和通與全球領(lǐng)先的解決方案提供商阿里達(dá)成合作:廣和通AI模組及解決方案,基于阿里通義千問大模型,推出“隨身智能解決方案”,賦能消
    的頭像 發(fā)表于 02-25 16:04 ?834次閱讀

    阿里代理優(yōu)惠上指南——火傘如何助力企業(yè)降本增效

    在數(shù)字化轉(zhuǎn)型的浪潮中,計算已成為企業(yè)提升效率、優(yōu)化成本的核心工具。然而,面對阿里、騰訊、華為、天翼
    的頭像 發(fā)表于 02-19 15:48 ?964次閱讀

    先進(jìn)數(shù)通:阿里多項(xiàng)合作與上貴州供應(yīng)商身份確認(rèn)

    近日,有投資者就先進(jìn)數(shù)通與阿里上貴州的合作情況提出詢問。針對這些關(guān)注點(diǎn),先進(jìn)數(shù)通在互動平臺上給出了明確回應(yīng)。 先進(jìn)數(shù)通確認(rèn),公司作為“金融核心先鋒聯(lián)盟”的首批20家成員之一,一直致力于在金融
    的頭像 發(fā)表于 02-17 09:19 ?1190次閱讀

    巨人網(wǎng)絡(luò)與阿里深化AI合作

    巨人網(wǎng)絡(luò)近日宣布與阿里進(jìn)一步深化合作關(guān)系,雙方將在游戲場景的AI落地應(yīng)用及算力生態(tài)建設(shè)等領(lǐng)域展開更為緊密的合作,共同推動AI技術(shù)與巨人網(wǎng)絡(luò)業(yè)務(wù)的深度融合。 基于近年來在“游戲+AI”領(lǐng)域的合作
    的頭像 發(fā)表于 02-14 14:06 ?894次閱讀

    阿里個人電腦,阿里個人電腦的特點(diǎn)

    ? ? 在當(dāng)代IT管理體系中,遠(yuǎn)程連接工具發(fā)揮著舉足輕重的作用。這些工具賦予系統(tǒng)管理員同時操控與監(jiān)視多臺遠(yuǎn)程計算機(jī)的能力,顯著提升了工作效率并增強(qiáng)了系統(tǒng)安全性。今天小編給大家講解阿里個人電腦的特點(diǎn)
    的頭像 發(fā)表于 02-07 15:44 ?956次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>個人電腦,<b class='flag-5'>阿里</b><b class='flag-5'>云</b>個人電腦的特點(diǎn)

    阿里官網(wǎng)電腦版,阿里電腦版的下載使用教程

    ? ? 在計算蓬勃發(fā)展的時代,阿里作為行業(yè)的領(lǐng)軍者,旗下的阿里官網(wǎng)電腦版為用戶帶來了功能強(qiáng)大且便捷的云端服務(wù)。它整合了
    的頭像 發(fā)表于 01-23 14:49 ?1843次閱讀
    <b class='flag-5'>阿里</b><b class='flag-5'>云</b>官網(wǎng)電腦版,<b class='flag-5'>阿里</b><b class='flag-5'>云</b>電腦版的下載使用教程

    服務(wù)器 Flexus X 實(shí)例,Docker 集成搭建搭建 Flink

    Apache Flink 是一個分布式大數(shù)據(jù)計算引擎,專為處理無界和有界數(shù)據(jù)流上的有狀態(tài)計算而設(shè)計,以其高吞吐量、低延遲和高性能在實(shí)時流處理和批量計算領(lǐng)域脫穎而出,Flink 支持批流一體化,即能
    的頭像 發(fā)表于 01-13 18:17 ?703次閱讀
    <b class='flag-5'>云</b>服務(wù)器 Flexus X 實(shí)例,Docker 集成搭建搭建 <b class='flag-5'>Flink</b>

    2025阿里代理政策:火傘帶來專屬優(yōu)惠

    隨著計算市場的不斷擴(kuò)張,阿里作為行業(yè)領(lǐng)軍者,于2025年發(fā)布了全新的代理政策。這一政策針對代理商體系進(jìn)行了全面升級,進(jìn)一步優(yōu)化合作模式,并提供了更多靈活性和激勵機(jī)制,旨在擴(kuò)大市場覆蓋率,推動企業(yè)
    的頭像 發(fā)表于 01-09 14:44 ?1177次閱讀

    阿里成為總臺春晚計算AI合作伙伴

    近日,中央廣播電視總臺宣布了一項(xiàng)重要合作,正式將阿里確定為總臺春晚計算AI獨(dú)家合作伙伴。這一合作標(biāo)志著總臺春晚在技術(shù)創(chuàng)新和數(shù)字化轉(zhuǎn)型方面邁出了重要一步。 作為總臺春晚史上的首次技術(shù)合作伙伴引入
    的頭像 發(fā)表于 12-27 10:32 ?684次閱讀

    探究阿里代理商的奧秘

    在數(shù)字化時代,阿里服務(wù)器以其卓越的性能和可靠的穩(wěn)定性,成為了眾多企業(yè)首選的服務(wù)提供商。然而,你是否曾好奇,為何選擇阿里服務(wù)器的代理商總
    的頭像 發(fā)表于 12-12 14:24 ?582次閱讀

    阿里代理有哪些?

    阿里作為全球領(lǐng)先的計算服務(wù)商,提供多種級別的代理商合作伙伴,以便更好地服務(wù)企業(yè)客戶。不同級別的阿里代理商在服務(wù)、技術(shù)支持和返傭方面有顯
    的頭像 發(fā)表于 12-06 15:44 ?1302次閱讀