chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

日增320TB數(shù)據(jù),從ClickHouse遷移至ByConity后,查詢性能十分穩(wěn)定!

jf_WZTOguxH ? 來源:AI前線 ? 2023-08-04 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景介紹

ByConity適合多種業(yè)務(wù)場(chǎng)景,在實(shí)時(shí)數(shù)據(jù)接入、大寬表聚合查詢、海量數(shù)據(jù)下復(fù)雜分析計(jì)算、多表關(guān)聯(lián)查詢場(chǎng)景下有非常好的性能。我們用一個(gè)實(shí)際的業(yè)務(wù)場(chǎng)景來介紹下,這套行為分析系統(tǒng)是基于用戶多維度行為分析平臺(tái),提供事件分析、留存分析、轉(zhuǎn)化分析、用戶分群、用戶留存等多種分析方式和場(chǎng)景。本文將介紹下該用戶多維度行為分析平臺(tái)在使用原ClickHouse集群遇到的問題和挑戰(zhàn),以及通過遷移ByConity后如何解決這些問題并給業(yè)務(wù)帶來的收益。

d063d910-3288-11ee-9e74-dac502259ad0.jpg

圖1 行為分析系統(tǒng)架構(gòu)設(shè)計(jì)

問題和挑戰(zhàn)

早期這套系統(tǒng)部署在ClickHouse集群,一方面,由于業(yè)務(wù)的高速發(fā)展導(dǎo)致數(shù)據(jù)量日益膨脹,每日最大新增數(shù)據(jù)超過320TB,每日新增行數(shù)超過2.3萬(wàn)億條,用戶數(shù)據(jù)維度超過2萬(wàn)多個(gè);另一方面,用戶查詢需求更加靈活和多樣化,需要同時(shí)支持明細(xì)查詢、聚合查詢以及交互式分析查詢,并快速給出響應(yīng)結(jié)果。此外,在數(shù)據(jù)量不斷增加的情況下(年增長(zhǎng)35%),我們既要能支撐這么大的數(shù)據(jù)增量帶來的挑戰(zhàn),又要把成本增速控制在一定范圍內(nèi)。

但是在已有的ClickHouse集群上我們很難做到。原因是ClickHouse是基于Shared-Nothing的架構(gòu),每個(gè)節(jié)點(diǎn)是獨(dú)立的,不會(huì)共享存儲(chǔ)資源,因而計(jì)算資源和存儲(chǔ)資源是緊耦合的,會(huì)導(dǎo)致如下問題:

擴(kuò)縮容成本變高,且會(huì)涉及到數(shù)據(jù)遷移,使我們不能實(shí)時(shí)按需的擴(kuò)縮容,而且會(huì)導(dǎo)致資源的浪費(fèi),成本不可控

緊耦合的架構(gòu)會(huì)導(dǎo)致多租戶在共享集群環(huán)境相互影響,造成用戶查詢相互影響

由于集群上節(jié)點(diǎn)的讀寫在同一個(gè)節(jié)點(diǎn)完成,導(dǎo)致讀寫相互影響

在復(fù)雜查詢上例如多表Join等操作的性能支持并不是很好,無法滿足用戶查詢多樣化的需求

技術(shù)選型

因此在2022年初業(yè)務(wù)開始使用計(jì)算存儲(chǔ)分離架構(gòu)的ByConity來作為主要的OLAP引擎。ByConity是一個(gè)開源的云原生數(shù)據(jù)倉(cāng)庫(kù),它采用計(jì)算存儲(chǔ)分離的架構(gòu),支持多個(gè)關(guān)鍵功能特性,如計(jì)算存儲(chǔ)分離、彈性擴(kuò)縮容、多租戶資源隔離和數(shù)據(jù)讀寫的強(qiáng)一致性等。通過利用主流的OLAP引擎優(yōu)化,如列存儲(chǔ)、向量化執(zhí)行、MPP執(zhí)行、查詢優(yōu)化等,ByConity可以提供優(yōu)異的讀寫性能。

d096af8e-3288-11ee-9e74-dac502259ad0.png

圖2 ByConity三層技術(shù)架構(gòu)圖

ByConity是在開源的ClickHouse架構(gòu)基礎(chǔ)上進(jìn)行了升級(jí),引入了計(jì)算與存儲(chǔ)分離的架構(gòu),將原本計(jì)算和存儲(chǔ)分別在每個(gè)節(jié)點(diǎn)本地管理的架構(gòu),轉(zhuǎn)換為在分布式存儲(chǔ)上統(tǒng)一管理整個(gè)集群內(nèi)所有數(shù)據(jù)的架構(gòu),使得每個(gè)計(jì)算節(jié)點(diǎn)成為一個(gè)無狀態(tài)的單純計(jì)算節(jié)點(diǎn),并利用分布式存儲(chǔ)的擴(kuò)展能力和計(jì)算節(jié)點(diǎn)的無狀態(tài)特性實(shí)現(xiàn)動(dòng)態(tài)的擴(kuò)縮容。正是由于這種改進(jìn),使得ByConity具有以下重要特性:

資源隔離:對(duì)不同的租戶進(jìn)行資源的隔離,租戶之間不會(huì)受到相互影響。

讀寫分離:計(jì)算資源和存儲(chǔ)資源解耦,確保讀操作和寫操作不會(huì)相互影響。

彈性擴(kuò)縮容:支持彈性的擴(kuò)縮容,能夠?qū)崟r(shí)、按需的對(duì)計(jì)算資源進(jìn)行擴(kuò)縮容,保證資源的高效利用。

數(shù)據(jù)強(qiáng)一致:數(shù)據(jù)讀寫的強(qiáng)一致性,確保數(shù)據(jù)始終是最新的,讀寫之間沒有不一致。

高性能:采用了主流的OLAP引擎優(yōu)化,例如列存、向量化執(zhí)行、MPP執(zhí)行、查詢優(yōu)化等提供優(yōu)異的讀寫性能

業(yè)務(wù)收益

在我們引入了ByConity后,整體性能可以達(dá)到91%用戶查詢都可以在10秒內(nèi)完成,通過來自用戶的反饋調(diào)研,這個(gè)性能指標(biāo)也是在用戶可接受的范圍內(nèi)。這里總結(jié)下我們遷移ByConity帶來的總體收益和經(jīng)驗(yàn):

避免資源搶占,查詢性能百分百穩(wěn)定:

在原來ClickHouse的集群上,我們經(jīng)常會(huì)遇到資源擠占的問題,由于ClickHouse并沒有做到資源隔離和租戶隔離,在多個(gè)用戶共用集群進(jìn)行查詢時(shí),當(dāng)一個(gè)用戶查詢資源開銷非常大,會(huì)涉及資源的搶占,導(dǎo)致這個(gè)集群上所有共用的用戶查詢都不穩(wěn)定,服務(wù)質(zhì)量達(dá)不到滿足。但在遷移到ByConity后,由于計(jì)算組是完全物理隔離,可以達(dá)到天然的資源隔離和租戶隔離,不同用戶的查詢相互不受到影響,整體查詢性能可以達(dá)到91%用戶查詢都可以在10秒內(nèi)完成。再者ByConity提供了自研的復(fù)雜查詢鏈路,自研 Disk Cache以減少冷數(shù)據(jù)讀取,并對(duì)于高頻使用的Array 建立索引等,而且熱讀效率也優(yōu)于原ClickHouse集群,相比在原Clickhouse集群上性能折損在10%以內(nèi)。

運(yùn)維成本低,故障節(jié)點(diǎn)秒級(jí)替換:

原本在Clickhouse集群上,如果發(fā)現(xiàn)集群中某個(gè)節(jié)點(diǎn)壞掉,需要先下掉整臺(tái)機(jī)器維修,這是因?yàn)镃lickHouse的計(jì)算資源、存儲(chǔ)資源、以及元數(shù)據(jù)信息都在這個(gè)節(jié)點(diǎn)上,相當(dāng)于集群少了一個(gè)計(jì)算資源,也少了一個(gè)存儲(chǔ)副本,在替換新的節(jié)點(diǎn)之前,需要把對(duì)壞掉節(jié)點(diǎn)的本地磁盤進(jìn)行備份遷移到新的節(jié)點(diǎn)上,維護(hù)成本比較高,且數(shù)據(jù)一致性很難得到保障。而對(duì)于ByConity來講,如果發(fā)生計(jì)算組壞掉的情況,由于計(jì)算組不存儲(chǔ)數(shù)據(jù),只包含無狀態(tài)的計(jì)算節(jié)點(diǎn),因此只需要替換新的計(jì)算組即可,數(shù)據(jù)的可靠性和一致性由HDFS來保障,且本地?zé)嶙x數(shù)據(jù)緩存的丟失對(duì)業(yè)務(wù)查詢性能是可控的,這部分也主要得益于了ByConity存儲(chǔ)和計(jì)算分離架構(gòu)實(shí)現(xiàn)。

無感擴(kuò)縮容,節(jié)約資源成本:

ByConity是可以實(shí)現(xiàn)無感擴(kuò)縮容,它是一個(gè)模塊化和容器化的部署,基于Kubernetes的彈性伸縮能力,如果有足夠的機(jī)器可以無限的擴(kuò)容,同時(shí)如果服務(wù)器發(fā)生故障,我們也不用擔(dān)心,因?yàn)锽yConity的節(jié)點(diǎn)只一個(gè)無狀態(tài)的計(jì)算節(jié)點(diǎn),直接下掉對(duì)整個(gè)集群影響不大。而且通過自適應(yīng)調(diào)度回避慢節(jié)點(diǎn),提升吞吐能力,提高節(jié)點(diǎn)資源利用率。同時(shí)ByConity的壓縮率極高,以其中一個(gè)業(yè)務(wù)為例,每日新增460TB數(shù)據(jù),壓縮后達(dá)到100TB,壓縮比達(dá)到65%,并支持低基數(shù)編碼 & ZSTD等等壓縮方式,極端情況下存儲(chǔ)占用小于parquet。

數(shù)據(jù)一致性強(qiáng)保障,維護(hù)復(fù)雜度接近為零:

在遷移到ByConity后,我們完全解決了數(shù)據(jù)一致性問題,因?yàn)锽yConity不存在本地的主備同步問題,數(shù)據(jù)一致性問題直接交給底層的對(duì)象存儲(chǔ)解決,例如HDFS/S3等。這樣對(duì)一致性維護(hù)的復(fù)雜度大大降低,錯(cuò)誤概率也更低,目前也少有用戶再反饋數(shù)據(jù)一致性問題。但在之前是經(jīng)常遇到,因?yàn)镃lickHouse集群是多個(gè)副本通過節(jié)點(diǎn)間通信去維護(hù)的,通過一致性隊(duì)列去維護(hù)一致性問題,實(shí)現(xiàn)上也很復(fù)雜,容易出錯(cuò)。另外,ByConity可以通過HDFS直接訪問到數(shù)據(jù)文件,不同計(jì)算引擎適配不同連接器,即可讀入數(shù)據(jù),具備通用能力。

未來展望

通過長(zhǎng)達(dá)一年半的實(shí)踐摸索,ByConity已經(jīng)成為內(nèi)部使用的主要OLAP引擎,后期會(huì)有大量的用戶和數(shù)據(jù)遷入,最終取代原本的ClickHouse集群。可以看出ByConity作為一款計(jì)算存儲(chǔ)分離的OLAP引擎,具有高性能、高可擴(kuò)展性和高穩(wěn)定性等優(yōu)點(diǎn),能夠滿足大規(guī)模體量的數(shù)據(jù)處理和分析的需求。

通過在社區(qū)的交流以及社區(qū)發(fā)布的 Roadmap 討論

https://github.com/ByConity/ByConity/issues/26

未來階段ByConity會(huì)主要聚焦在以下幾個(gè)方向:

支持執(zhí)行層的多Stage執(zhí)行、ETL能力等

支持?jǐn)?shù)據(jù)湖聯(lián)邦查詢?nèi)鏗udi、Iceberg等

ByConity社區(qū)擁有大量的用戶,同時(shí)是一個(gè)非常開放的社區(qū),我們邀請(qǐng)大家和我們一起在Github上討論共建,也可以加入我們的微信群、飛書群或者Discord參與交流。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7255

    瀏覽量

    91818
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4531

    瀏覽量

    87431
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    453

    瀏覽量

    39336

原文標(biāo)題:日增320TB數(shù)據(jù),從ClickHouse遷移至ByConity后,查詢性能十分穩(wěn)定!

文章出處:【微信號(hào):AI前線,微信公眾號(hào):AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    十分

    誰(shuí)能幫我看看VHDL編的十分頻圖里19行以下不理解了。一上升沿q就等于1???怎么變0
    發(fā)表于 08-31 09:46

    十分鐘學(xué)會(huì)ISE

    十分鐘學(xué)會(huì)ISE
    發(fā)表于 03-26 09:39

    十分鐘學(xué)會(huì)ISE

    十分鐘學(xué)會(huì)ISE
    發(fā)表于 09-05 22:49

    數(shù)據(jù)庫(kù)SQL Server 2008 R2版推出OSS版本數(shù)據(jù)上云

    通過外網(wǎng)遷移,則OSS會(huì)收取外網(wǎng)流出流量的費(fèi)用。使用步驟也十分簡(jiǎn)單,輕松三步搞定:一是準(zhǔn)備好本地數(shù)據(jù)庫(kù),二是將本地備份文件上傳到OSS并獲取文件的URL,三是將備份文件OSS
    發(fā)表于 01-17 11:10

    Centos7下如何搭建ClickHouse列式存儲(chǔ)數(shù)據(jù)庫(kù)

    查詢。不支持窗口函數(shù)和相關(guān)子查詢。按照主鍵對(duì)數(shù)據(jù)進(jìn)行排序,這將幫助ClickHouse以幾毫秒的低延遲對(duì)
    發(fā)表于 01-05 18:03

    輕松上云系列之二:其他云數(shù)據(jù)遷移至阿里云

    本文檔圍繞如何將您其他云廠商上的數(shù)據(jù)遷移到阿里云,提供了多個(gè)場(chǎng)景的實(shí)踐方案。文檔合集AWS 數(shù)據(jù)遷移至阿里云Amazon S3數(shù)據(jù)
    發(fā)表于 12-19 16:16 ?504次閱讀

    紅魔Mars游戲性能實(shí)測(cè) 表現(xiàn)十分穩(wěn)定

    紅魔Mars游戲性能實(shí)測(cè) 表現(xiàn)十分穩(wěn)定
    的頭像 發(fā)表于 07-02 11:20 ?5620次閱讀

    火山引擎:ClickHouse增強(qiáng)計(jì)劃之“多表關(guān)聯(lián)查詢

    相信大家都對(duì)大名鼎鼎的ClickHouse有一定的了解了,它強(qiáng)大的數(shù)據(jù)分析性能讓人印象深刻。但在字節(jié)大量生產(chǎn)使用中,發(fā)現(xiàn)了ClickHouse依然存在了一定的限制。例如: ? 缺少完整
    的頭像 發(fā)表于 10-10 17:00 ?1859次閱讀

    如何將器件庫(kù)遷移至DigiPCBA

    對(duì)于準(zhǔn)備將設(shè)計(jì)流程完全遷移至DigiPCBA平臺(tái)上的用戶來說,可能遇到的第一個(gè)挑戰(zhàn)就是如何將手上現(xiàn)有的元器件遷移至云端。這篇教程將會(huì)展示如何使用Altium Designer軟件提供的Library Migrator工具,完成一個(gè)新建Workspace的初始設(shè)置,隨后將本
    的頭像 發(fā)表于 12-23 14:23 ?1751次閱讀

    如何使用原生ClickHouse函數(shù)和表引擎在兩個(gè)數(shù)據(jù)庫(kù)之間遷移數(shù)據(jù)

    數(shù)據(jù) Postgres 遷移ClickHouse。在這篇文章中,我們將展示如何結(jié)合使用 Postgres 數(shù)據(jù)與流行的
    的頭像 發(fā)表于 05-26 11:38 ?1159次閱讀
    如何使用原生<b class='flag-5'>ClickHouse</b>函數(shù)和表引擎在兩個(gè)<b class='flag-5'>數(shù)據(jù)</b>庫(kù)之間<b class='flag-5'>遷移數(shù)據(jù)</b>

    資深開發(fā)者眼中的開源云原生數(shù)倉(cāng) ByConity

    5月22日,字節(jié)跳動(dòng)宣布開源 ByConity 云原生數(shù)據(jù)倉(cāng)庫(kù),項(xiàng)目地址:https://github.com/ByConity/ByConity。
    的頭像 發(fā)表于 06-06 16:38 ?1085次閱讀

    ClickHouse內(nèi)幕(3)基于索引的查詢優(yōu)化

    ClickHouse索引采用唯一聚簇索引的方式,即Part內(nèi)數(shù)據(jù)按照order by keys有序,在整個(gè)查詢計(jì)劃中,如果算子能夠有效利用輸入數(shù)據(jù)的有序性,對(duì)算子的執(zhí)行
    的頭像 發(fā)表于 06-11 10:46 ?1332次閱讀
    <b class='flag-5'>ClickHouse</b>內(nèi)幕(3)基于索引的<b class='flag-5'>查詢</b>優(yōu)化

    將軟件8位(字節(jié))可尋址CPU遷移至C28x CPU

    電子發(fā)燒友網(wǎng)站提供《將軟件8位(字節(jié))可尋址CPU遷移至C28x CPU.pdf》資料免費(fèi)下載
    發(fā)表于 09-06 10:42 ?0次下載
    將軟件<b class='flag-5'>從</b>8位(字節(jié))可尋址CPU<b class='flag-5'>遷移至</b>C28x CPU

    TMS320DM642遷移至TMS320DM648/DM6437

    電子發(fā)燒友網(wǎng)站提供《TMS320DM642遷移至TMS320DM648/DM6437.pdf》資料免費(fèi)下載
    發(fā)表于 10-14 09:17 ?0次下載
    <b class='flag-5'>從</b>TMS<b class='flag-5'>320</b>DM642<b class='flag-5'>遷移至</b>TMS<b class='flag-5'>320</b>DM648/DM6437

    TMS320VC5509遷移到TMS320VC5509A

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5509遷移到TMS320VC5509A.pdf》資料免費(fèi)下載
    發(fā)表于 10-17 10:38 ?0次下載
    <b class='flag-5'>從</b>TMS<b class='flag-5'>320</b>VC5509<b class='flag-5'>遷移</b>到TMS<b class='flag-5'>320</b>VC5509A