chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析? 華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

IT科技蘇辭 ? 來(lái)源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析?

華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

當(dāng)下,信息社會(huì)正在從互聯(lián)網(wǎng)時(shí)代走向物聯(lián)網(wǎng)時(shí)代,信息交互變得更加龐雜、高效和智能。對(duì)于互聯(lián)網(wǎng)公司和IOT企業(yè)來(lái)說(shuō),既是機(jī)遇,也是挑戰(zhàn)。因?yàn)椋髽I(yè)不可避免的要面對(duì)數(shù)據(jù)量劇增帶來(lái)的一系列問(wèn)題:如何高效存儲(chǔ)和擴(kuò)容,如何在對(duì)原有業(yè)務(wù)改動(dòng)最小的情況下做到智能化和實(shí)時(shí)分析。

針對(duì)挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶提供了強(qiáng)擴(kuò)展、高存儲(chǔ)、高效導(dǎo)入/導(dǎo)出和實(shí)時(shí)分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶的高度認(rèn)可和支持。本文將以其中一個(gè)客戶業(yè)務(wù)的痛點(diǎn)問(wèn)題舉例,聊聊高效存儲(chǔ)和實(shí)時(shí)分析的3個(gè)秘訣。

海量存儲(chǔ),PB級(jí)無(wú)感擴(kuò)展

該用戶在線下本地化部署使用數(shù)據(jù)庫(kù)或者使用其他的存儲(chǔ)為云盤(pán)的數(shù)據(jù)庫(kù)時(shí),常常需要在容量達(dá)到閾值時(shí),提前規(guī)劃和申購(gòu)存儲(chǔ)資源,可能還需要連帶擴(kuò)容不必要的計(jì)算資源。而使用GaussDB (for Cassandra)之后,便再無(wú)此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨(dú)擴(kuò)展存儲(chǔ),高效擴(kuò)容,業(yè)務(wù)無(wú)感,最高可擴(kuò)展到PB級(jí)。

此外,客戶為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)再寫(xiě)入一份到HDFS中,供MapReduce和Spark分析,同時(shí)需要維護(hù)兩套資源,維護(hù)和資源成本成為了痛點(diǎn)。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫(kù)存儲(chǔ)和對(duì)接大數(shù)據(jù)分析的功能,同時(shí)GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開(kāi)發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實(shí)時(shí)分析

客戶的一個(gè)使用場(chǎng)景需要將爬蟲(chóng)或用戶輸入的數(shù)據(jù),進(jìn)行在線分析和實(shí)時(shí)推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達(dá)到了50億條,但增量數(shù)據(jù)不足5億,分析對(duì)象主要是每日新增數(shù)據(jù)。在這個(gè)場(chǎng)景中,GaussDB (for Cassandra)為客戶提供了streaming服務(wù)+實(shí)時(shí)分析解決方案,在損失小部分讀寫(xiě)性能的前提下,客戶端無(wú)需改造即可做到數(shù)據(jù)讀寫(xiě)和實(shí)時(shí)分析并行,解決方案如下圖,該解決方案主要有以下幾個(gè)階段:

1.客戶業(yè)務(wù)用過(guò)開(kāi)源驅(qū)動(dòng)寫(xiě)入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對(duì)外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫(xiě)入到指定的Kafka隊(duì)列

4.Kafka隊(duì)列將streaming數(shù)據(jù)寫(xiě)入到Spark或者Flink中

5.客戶在Spark中可對(duì)增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶的另一個(gè)業(yè)務(wù)需要周期性對(duì)全量數(shù)據(jù)進(jìn)行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時(shí)處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進(jìn)行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開(kāi)源的10+倍,同時(shí)做到對(duì)業(yè)務(wù)讀寫(xiě)基本無(wú)影響。如下為互聯(lián)網(wǎng)客戶每周定期導(dǎo)出數(shù)據(jù)分析用戶畫(huà)像的解決方案,該方案有以下幾個(gè)階段:

1.客戶根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時(shí)任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過(guò)這3個(gè)秘訣,華為云GaussDB (for Cassandra)完美解決了難擴(kuò)展、高成本、變更不及時(shí)等問(wèn)題,實(shí)現(xiàn)了海量數(shù)據(jù)的高效存儲(chǔ)和實(shí)時(shí)分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2805

    瀏覽量

    19092
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華納為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD存儲(chǔ)

    游戲數(shù)據(jù)庫(kù)對(duì)速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開(kāi)發(fā)者越來(lái)越依賴NVMe SSD存儲(chǔ)來(lái)提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD
    的頭像 發(fā)表于 09-30 16:03 ?829次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫(kù)故障的數(shù)據(jù)恢復(fù)案例

    備份,僅有一些斷斷續(xù)續(xù)的歸檔日志。 Oracle數(shù)據(jù)庫(kù)恢復(fù)流程: 1、檢測(cè)數(shù)據(jù)庫(kù)故障情況; 2、嘗試掛起并修復(fù)數(shù)據(jù)庫(kù)3、解析數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 07-24 11:12 ?436次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫(kù)</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫(kù)故障: SQL Server數(shù)據(jù)庫(kù)被加密,無(wú)法使用。 數(shù)據(jù)庫(kù)MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?509次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫(kù)</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    HarmonyOS5服務(wù)技術(shù)分享--數(shù)據(jù)庫(kù)使用指南

    ??: 敏感數(shù)據(jù)啟用字段級(jí)加密(如用戶手機(jī)號(hào))。 ? ??總結(jié)?? 華為數(shù)據(jù)庫(kù)(CloudDB)讓HarmonyOS應(yīng)用的數(shù)據(jù)管理變得輕
    發(fā)表于 05-22 18:29

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)—虛擬機(jī)上hbase和hive數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 16臺(tái)某品牌R730xd服務(wù)器節(jié)點(diǎn),每臺(tái)服務(wù)器節(jié)點(diǎn)上有數(shù)臺(tái)虛擬機(jī)。 虛擬機(jī)上部署Hbase和Hive數(shù)據(jù)庫(kù)。 分布式存儲(chǔ)故障:
    的頭像 發(fā)表于 04-17 11:05 ?514次閱讀

    服務(wù)器數(shù)據(jù)庫(kù)購(gòu)買流程匯總,小白也能輕松上手!

    服務(wù)器數(shù)據(jù)庫(kù)購(gòu)買流程通常包括需求評(píng)估、供應(yīng)商選擇、配置與定價(jià)、注冊(cè)賬號(hào)、填寫(xiě)訂單信息、支付費(fèi)用以及后續(xù)的設(shè)置與配置等步驟。其核心邏輯在于通過(guò)精準(zhǔn)匹配業(yè)務(wù)需求(如性能、存儲(chǔ)、合規(guī)性)與
    的頭像 發(fā)表于 03-05 10:58 ?595次閱讀

    如何保障服務(wù)器數(shù)據(jù)庫(kù)的安全與穩(wěn)定

    在數(shù)字化時(shí)代,服務(wù)器數(shù)據(jù)庫(kù)承載著企業(yè)和個(gè)人的海量關(guān)鍵數(shù)據(jù),其安全與穩(wěn)定至關(guān)重要。一旦出現(xiàn)安全漏洞或穩(wěn)定性問(wèn)題,可能導(dǎo)致數(shù)據(jù)丟失、業(yè)務(wù)中斷等
    的頭像 發(fā)表于 02-12 10:37 ?606次閱讀

    分布式數(shù)據(jù)庫(kù)有哪些類型

    分布式數(shù)據(jù)庫(kù)有哪些類型?分布式數(shù)據(jù)庫(kù)主要類型包括:關(guān)系型分布式數(shù)據(jù)庫(kù)、非關(guān)系型分布式數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 01-15 09:43 ?879次閱讀

    彈性服務(wù)器通過(guò)什么存儲(chǔ)數(shù)據(jù)和文件?

    彈性服務(wù)器通過(guò)多種存儲(chǔ)方式存儲(chǔ)數(shù)據(jù)和文件,包括硬盤(pán)、對(duì)象存儲(chǔ)服務(wù)、分布式文件系統(tǒng)和
    的頭像 發(fā)表于 01-13 09:50 ?713次閱讀

    構(gòu)建數(shù)據(jù)庫(kù)解決方案,基于華為 Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    前言**** 華為 Flexus X 實(shí)例,融合柔性算力與智能調(diào)度,為數(shù)據(jù)庫(kù)解決方案帶來(lái)全新突破。采用容器化 MySQL 主從同步架構(gòu),實(shí)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 01-07 17:22 ?956次閱讀
    構(gòu)建<b class='flag-5'>數(shù)據(jù)庫(kù)</b>解決方案,基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類型?

    數(shù)據(jù)庫(kù)是一種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫(kù),它融合了計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 01-07 10:22 ?804次閱讀

    一般企業(yè)購(gòu)買服務(wù)器帶數(shù)據(jù)庫(kù)嗎?

    購(gòu)買服務(wù)器是否帶數(shù)據(jù)庫(kù),這主要取決于所選擇的服務(wù)提供商及其具體的套餐或服務(wù)內(nèi)容。一般來(lái)說(shuō),服務(wù)器本身是一個(gè)提供計(jì)算能力、
    的頭像 發(fā)表于 01-06 10:25 ?723次閱讀

    華為榮登Gartner?數(shù)據(jù)庫(kù)挑戰(zhàn)者象限

    近日,全球知名的信息技術(shù)研究與顧問(wèn)公司Gartner?正式發(fā)布了其備受矚目的2024年度《數(shù)據(jù)庫(kù)管理系統(tǒng)魔力象限報(bào)告》。在這份權(quán)威報(bào)告中,華為憑借其卓越的表現(xiàn)成功入選挑戰(zhàn)者象限,彰
    的頭像 發(fā)表于 12-31 13:57 ?821次閱讀

    使用華為 X 實(shí)例部署圖數(shù)據(jù)庫(kù) Virtuoso 并存儲(chǔ) 6500 萬(wàn)條大數(shù)據(jù)的完整過(guò)程與性能測(cè)評(píng)

    前言 ? 1. 部署Virtuoso圖數(shù)據(jù)庫(kù)的準(zhǔn)備工作 ? 1.1 選擇華為X實(shí)例的原因 ? 1.2 Virtuoso圖數(shù)據(jù)庫(kù)簡(jiǎn)介 ? 1.3 環(huán)境準(zhǔn)備與系統(tǒng)配置 ? 2. Virt
    的頭像 發(fā)表于 12-25 17:51 ?909次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實(shí)例部署圖<b class='flag-5'>數(shù)據(jù)庫(kù)</b> Virtuoso 并<b class='flag-5'>存儲(chǔ)</b> 6500 萬(wàn)條大<b class='flag-5'>數(shù)據(jù)</b>的完整過(guò)程與性能測(cè)評(píng)

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—ORACLE常見(jiàn)故障的數(shù)據(jù)恢復(fù)可行性分析

    Oracle數(shù)據(jù)庫(kù)常見(jiàn)故障表現(xiàn): 1、ORACLE數(shù)據(jù)庫(kù)無(wú)法啟動(dòng)或無(wú)法正常工作。 2、ORACLE ASM存儲(chǔ)破壞。 3、ORACLE數(shù)據(jù)
    的頭像 發(fā)表于 12-10 11:35 ?675次閱讀