chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析? 華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個(gè)秘訣搞定

IT科技蘇辭 ? 來源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析?

華為云數(shù)據(jù)庫GaussDB (for Cassandra) 3個(gè)秘訣搞定

當(dāng)下,信息社會(huì)正在從互聯(lián)網(wǎng)時(shí)代走向物聯(lián)網(wǎng)時(shí)代,信息交互變得更加龐雜、高效和智能。對(duì)于互聯(lián)網(wǎng)公司和IOT企業(yè)來說,既是機(jī)遇,也是挑戰(zhàn)。因?yàn)椋髽I(yè)不可避免的要面對(duì)數(shù)據(jù)量劇增帶來的一系列問題:如何高效存儲(chǔ)和擴(kuò)容,如何在對(duì)原有業(yè)務(wù)改動(dòng)最小的情況下做到智能化和實(shí)時(shí)分析。

針對(duì)挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶提供了強(qiáng)擴(kuò)展、高存儲(chǔ)、高效導(dǎo)入/導(dǎo)出和實(shí)時(shí)分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶的高度認(rèn)可和支持。本文將以其中一個(gè)客戶業(yè)務(wù)的痛點(diǎn)問題舉例,聊聊高效存儲(chǔ)和實(shí)時(shí)分析的3個(gè)秘訣。

海量存儲(chǔ),PB級(jí)無感擴(kuò)展

該用戶在線下本地化部署使用數(shù)據(jù)庫或者使用其他的存儲(chǔ)為云盤的數(shù)據(jù)庫時(shí),常常需要在容量達(dá)到閾值時(shí),提前規(guī)劃和申購存儲(chǔ)資源,可能還需要連帶擴(kuò)容不必要的計(jì)算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨(dú)擴(kuò)展存儲(chǔ),高效擴(kuò)容,業(yè)務(wù)無感,最高可擴(kuò)展到PB級(jí)。

此外,客戶為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫中的數(shù)據(jù)再寫入一份到HDFS中,供MapReduce和Spark分析,同時(shí)需要維護(hù)兩套資源,維護(hù)和資源成本成為了痛點(diǎn)。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫存儲(chǔ)和對(duì)接大數(shù)據(jù)分析的功能,同時(shí)GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實(shí)時(shí)分析

客戶的一個(gè)使用場景需要將爬蟲或用戶輸入的數(shù)據(jù),進(jìn)行在線分析和實(shí)時(shí)推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達(dá)到了50億條,但增量數(shù)據(jù)不足5億,分析對(duì)象主要是每日新增數(shù)據(jù)。在這個(gè)場景中,GaussDB (for Cassandra)為客戶提供了streaming服務(wù)+實(shí)時(shí)分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數(shù)據(jù)讀寫和實(shí)時(shí)分析并行,解決方案如下圖,該解決方案主要有以下幾個(gè)階段:

1.客戶業(yè)務(wù)用過開源驅(qū)動(dòng)寫入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對(duì)外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫入到指定的Kafka隊(duì)列

4.Kafka隊(duì)列將streaming數(shù)據(jù)寫入到Spark或者Flink中

5.客戶在Spark中可對(duì)增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶的另一個(gè)業(yè)務(wù)需要周期性對(duì)全量數(shù)據(jù)進(jìn)行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時(shí)處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進(jìn)行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開源的10+倍,同時(shí)做到對(duì)業(yè)務(wù)讀寫基本無影響。如下為互聯(lián)網(wǎng)客戶每周定期導(dǎo)出數(shù)據(jù)分析用戶畫像的解決方案,該方案有以下幾個(gè)階段:

1.客戶根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時(shí)任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過這3個(gè)秘訣,華為云GaussDB (for Cassandra)完美解決了難擴(kuò)展、高成本、變更不及時(shí)等問題,實(shí)現(xiàn)了海量數(shù)據(jù)的高效存儲(chǔ)和實(shí)時(shí)分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2825

    瀏覽量

    19157
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    恒訊科技解析:如何安裝MySQL并創(chuàng)建數(shù)據(jù)庫

    管理系統(tǒng)(RDBMS),使用結(jié)構(gòu)化查詢語言(SQL)高效地組織和管理數(shù)據(jù)。它是全球最受歡迎的開源數(shù)據(jù)庫系統(tǒng)之一,廣泛應(yīng)用于網(wǎng)頁開發(fā)、電子商務(wù)和商業(yè)應(yīng)用。 常見用例? MySQL 是多種應(yīng)用的可靠選擇,包括: 網(wǎng)絡(luò)應(yīng)用:管理用戶認(rèn)
    的頭像 發(fā)表于 01-14 14:25 ?75次閱讀

    華納香港服務(wù)器數(shù)據(jù)庫索引優(yōu)化策略

    )實(shí)施有效的索引優(yōu)化策略。無論您是IT管理員還是開發(fā)人員,了解這些技巧都能幫助您優(yōu)化數(shù)據(jù)庫效率,確保業(yè)務(wù)高效運(yùn)轉(zhuǎn)。下面,華納(hncloud)將通過結(jié)構(gòu)化分析,一步步解析香港服務(wù)器
    的頭像 發(fā)表于 10-16 17:06 ?454次閱讀

    華納為游戲數(shù)據(jù)庫選擇高性能NVMe SSD存儲(chǔ)

    游戲數(shù)據(jù)庫對(duì)速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開發(fā)者越來越依賴NVMe SSD存儲(chǔ)來提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫選擇高性能NVMe SSD
    的頭像 發(fā)表于 09-30 16:03 ?972次閱讀

    mysql數(shù)據(jù)恢復(fù)—mysql數(shù)據(jù)庫表被truncate的數(shù)據(jù)恢復(fù)案例

    ECS網(wǎng)站服務(wù)器,linux操作系統(tǒng),部署了mysql數(shù)據(jù)庫。工作人員在執(zhí)行數(shù)據(jù)庫版本更新測試時(shí),錯(cuò)誤地將本應(yīng)在測試執(zhí)行的sql腳本在生產(chǎn)
    的頭像 發(fā)表于 09-11 09:28 ?686次閱讀
    mysql<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—mysql<b class='flag-5'>數(shù)據(jù)庫</b>表被truncate的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復(fù)案例

    備份,僅有一些斷斷續(xù)續(xù)的歸檔日志。 Oracle數(shù)據(jù)庫恢復(fù)流程: 1、檢測數(shù)據(jù)庫故障情況; 2、嘗試掛起并修復(fù)數(shù)據(jù)庫; 3、解析數(shù)據(jù)庫
    的頭像 發(fā)表于 07-24 11:12 ?517次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle<b class='flag-5'>數(shù)據(jù)庫</b>故障的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

    Milvus 是一個(gè)開源的向量數(shù)據(jù)庫,專門為處理和分析大規(guī)模向量數(shù)據(jù)而設(shè)計(jì)。它適用于需要高效存儲(chǔ)
    的頭像 發(fā)表于 07-04 11:36 ?940次閱讀
    milvus向量<b class='flag-5'>數(shù)據(jù)庫</b>的主要特性和應(yīng)用場景

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)操作系統(tǒng)為Windows Server的虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 工作人員在MongoDB服務(wù)仍
    的頭像 發(fā)表于 07-01 11:13 ?543次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?587次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    MySQL數(shù)據(jù)庫是什么

    MySQL數(shù)據(jù)庫是一種 開源的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開發(fā),后被Oracle公司收購。它通過結(jié)構(gòu)化查詢語言(SQL)進(jìn)行數(shù)據(jù)存儲(chǔ)、管理和操作,廣
    的頭像 發(fā)表于 05-23 09:18 ?1067次閱讀

    HarmonyOS5服務(wù)技術(shù)分享--數(shù)據(jù)庫使用指南

    ??: 敏感數(shù)據(jù)啟用字段級(jí)加密(如用戶手機(jī)號(hào))。 ? ??總結(jié)?? 華為數(shù)據(jù)庫(CloudDB)讓HarmonyOS應(yīng)用的數(shù)據(jù)管理變得輕
    發(fā)表于 05-22 18:29

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)—虛擬機(jī)上hbase和hive數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    分布式存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 16臺(tái)某品牌R730xd服務(wù)器節(jié)點(diǎn),每臺(tái)服務(wù)器節(jié)點(diǎn)上有數(shù)臺(tái)虛擬機(jī)。 虛擬機(jī)上部署Hbase和Hive數(shù)據(jù)庫。 分布式存儲(chǔ)故障:
    的頭像 發(fā)表于 04-17 11:05 ?642次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫文件拷貝后服務(wù)無法啟動(dòng)的數(shù)據(jù)恢復(fù)

    MongoDB數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)Windows Server操作系統(tǒng)虛擬機(jī)上部署MongoDB數(shù)據(jù)庫。 MongoDB數(shù)據(jù)庫故障: 管理員在未關(guān)閉MongoDB服務(wù)的
    的頭像 發(fā)表于 04-09 11:34 ?742次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件拷貝后服務(wù)無法啟動(dòng)的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)

    服務(wù)器數(shù)據(jù)庫購買流程匯總,小白也能輕松上手!

    服務(wù)器數(shù)據(jù)庫購買流程通常包括需求評(píng)估、供應(yīng)商選擇、配置與定價(jià)、注冊(cè)賬號(hào)、填寫訂單信息、支付費(fèi)用以及后續(xù)的設(shè)置與配置等步驟。其核心邏輯在于通過精準(zhǔn)匹配業(yè)務(wù)需求(如性能、存儲(chǔ)、合規(guī)性)與
    的頭像 發(fā)表于 03-05 10:58 ?651次閱讀

    華為GaussDB助力統(tǒng)計(jì)現(xiàn)代化改革

    ,依托華為GaussDB對(duì)全國范圍內(nèi)的1多普查對(duì)象進(jìn)行普查數(shù)據(jù)采集與處理,為國家宏觀經(jīng)濟(jì)決策提供了重要基礎(chǔ)
    的頭像 發(fā)表于 02-12 10:59 ?776次閱讀

    如何保障服務(wù)器數(shù)據(jù)庫的安全與穩(wěn)定

    在數(shù)字化時(shí)代,服務(wù)器數(shù)據(jù)庫承載著企業(yè)和個(gè)人的海量關(guān)鍵數(shù)據(jù),其安全與穩(wěn)定至關(guān)重要。一旦出現(xiàn)安全漏洞或穩(wěn)定性問題,可能導(dǎo)致數(shù)據(jù)丟失、業(yè)務(wù)中斷等
    的頭像 發(fā)表于 02-12 10:37 ?674次閱讀