chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百億級(jí)數(shù)據(jù)分表后 怎樣才能分頁(yè)查詢(xún)

數(shù)據(jù)分析與開(kāi)發(fā) ? 來(lái)源:數(shù)據(jù)分析與開(kāi)發(fā) ? 作者:科技繆繆 ? 2020-11-19 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)業(yè)務(wù)規(guī)模達(dá)到一定規(guī)模之后,像淘寶日訂單量在5000萬(wàn)單以上,美團(tuán)3000萬(wàn)單以上。數(shù)據(jù)庫(kù)面對(duì)海量的數(shù)據(jù)壓力,分庫(kù)分表就是必須進(jìn)行的操作了。而分庫(kù)分表之后一些常規(guī)的查詢(xún)可能都會(huì)產(chǎn)生問(wèn)題,最常見(jiàn)的就是比如分頁(yè)查詢(xún)的問(wèn)題。一般我們把分表的字段稱(chēng)作shardingkey,比如訂單表按照用戶(hù)ID作為shardingkey,那么如果查詢(xún)條件中不帶用戶(hù)ID查詢(xún)?cè)趺醋龇猪?yè)?又比如更多的多維度的查詢(xún)都沒(méi)有shardingkey又怎么查詢(xún)?

唯一主鍵

一般我們數(shù)據(jù)庫(kù)的主鍵都是自增的,那么分表之后主鍵沖突的問(wèn)題就是一個(gè)無(wú)法避免的問(wèn)題,最簡(jiǎn)單的辦法就是以一個(gè)唯一的業(yè)務(wù)字段作為唯一的主鍵,比如訂單表的訂單號(hào)肯定是全局唯一的。 常見(jiàn)的分布式生成唯一ID的方式很多,最常見(jiàn)的雪花算法Snowflake、滴滴Tinyid、美團(tuán)Leaf。以雪花算法舉例來(lái)說(shuō),一毫秒可以生成4194304多個(gè)ID。第一位不使用,默認(rèn)都是0,41位時(shí)間戳精確到毫秒,可以容納69年的時(shí)間,10位工作機(jī)器ID高5位是數(shù)據(jù)中心ID,低5位是節(jié)點(diǎn)ID,12位序列號(hào)每個(gè)節(jié)點(diǎn)每毫秒累加,累計(jì)可以達(dá)到2^12 4096個(gè)ID。

分表

第一步,分表后要怎么保證訂單號(hào)的唯一搞定了,現(xiàn)在考慮下分表的問(wèn)題。首先根據(jù)自身的業(yè)務(wù)量和增量來(lái)考慮分表的大小。 舉個(gè)例子,現(xiàn)在我們?nèi)諉瘟渴?0萬(wàn)單,預(yù)估一年后可以達(dá)到日100萬(wàn)單,根據(jù)業(yè)務(wù)屬性,一般我們就支持查詢(xún)半年內(nèi)的訂單,超過(guò)半年的訂單需要做歸檔處理。 那么以日訂單100萬(wàn)半年的數(shù)量級(jí)來(lái)看,不分表的話我們訂單量將達(dá)到100萬(wàn)X180=1.8億,以這個(gè)數(shù)據(jù)量級(jí)部分表的話肯定單表是扛不住的,就算你能扛RT的時(shí)間你也根本無(wú)法接受吧。根據(jù)經(jīng)驗(yàn)單表幾百萬(wàn)的數(shù)量對(duì)于數(shù)據(jù)庫(kù)是沒(méi)什么壓力的,那么只要分256張表就足夠了,1.8億/256≈70萬(wàn),如果為了保險(xiǎn)起見(jiàn),也可以分到512張表。那么考慮一下,如果業(yè)務(wù)量再增長(zhǎng)10倍達(dá)到1000萬(wàn)單每天,分表1024就是比較合適的選擇。 通過(guò)分表加上超過(guò)半年的數(shù)據(jù)歸檔之后,單表70萬(wàn)的數(shù)據(jù)就足以應(yīng)對(duì)大部分場(chǎng)景了。接下來(lái)對(duì)訂單號(hào)hash,然后對(duì)256取模的就可以落到具體的哪張表了。

那么,因?yàn)槲ㄒ恢麈I都是以訂單號(hào)作為依據(jù),以前你寫(xiě)的那些根據(jù)主鍵ID做查詢(xún)的就不能用了,這就涉及到了歷史一些查詢(xún)功能的修改。不過(guò)這都不是事兒對(duì)吧,都改成以訂單號(hào)來(lái)查就行了。這都不是問(wèn)題,問(wèn)題在我們的標(biāo)題說(shuō)的點(diǎn)上。

C端查詢(xún)

說(shuō)了半天,總算到了正題了,那么分表之后查詢(xún)和分頁(yè)查詢(xún)的問(wèn)題怎么解決? 首先說(shuō)帶shardingkey的查詢(xún),比如就通過(guò)訂單號(hào)查詢(xún),不管你分頁(yè)還是怎么樣都是能直接定位到具體的表來(lái)查詢(xún)的,顯然查詢(xún)是不會(huì)有什么問(wèn)題的。 如果不是shardingkey的話,上面舉例說(shuō)的以訂單號(hào)作為shardingkey的話,像APP、小程序這種一般都是通過(guò)用戶(hù)ID查詢(xún),那這時(shí)候我們通過(guò)訂單號(hào)做的sharding怎么辦?很多公司訂單表直接用用戶(hù)ID做shardingkey,那么很簡(jiǎn)單,直接查就完了。那么訂單號(hào)怎么辦,一個(gè)很簡(jiǎn)單的辦法就是在訂單號(hào)上帶上用戶(hù)ID的屬性。舉個(gè)很簡(jiǎn)單的例子,原本41位的時(shí)間戳你覺(jué)得用不完,用戶(hù)ID是10位的,訂單號(hào)的生成規(guī)則帶上用戶(hù)ID,落具體表的時(shí)候根據(jù)訂單號(hào)中10位用戶(hù)ID hash取模,這樣無(wú)論根據(jù)訂單號(hào)還是用戶(hù)ID查詢(xún)效果都是一樣的。 當(dāng)然,這種方式只是舉例,具體的訂單號(hào)生成的規(guī)則,多少位,包含哪些因素根據(jù)自己的業(yè)務(wù)和實(shí)現(xiàn)機(jī)制來(lái)決定。

好,那么無(wú)論你是訂單號(hào)還是用戶(hù)ID作為shardingkey,按照以上的兩種方式都可以解決問(wèn)題了。那么還有一個(gè)問(wèn)題就是如果既不是訂單號(hào)又不是用戶(hù)ID查詢(xún)?cè)趺崔k?最直觀的例子就是來(lái)自商戶(hù)端或者后臺(tái)的查詢(xún),商戶(hù)端都是以商戶(hù)或者說(shuō)賣(mài)家的ID作為查詢(xún)條件來(lái)查的,后臺(tái)的查詢(xún)條件可能就更復(fù)雜了,像我碰到的有些后臺(tái)查詢(xún)條件能有幾十個(gè),這怎么查???別急,接下來(lái)分開(kāi)說(shuō)B端和后臺(tái)的復(fù)雜查詢(xún)。 現(xiàn)實(shí)中真正的流量大頭都是來(lái)自于用戶(hù)端C端,所以本質(zhì)上解決了用戶(hù)端的問(wèn)題,這個(gè)問(wèn)題就解了大半,剩下來(lái)自商戶(hù)賣(mài)家端B端、后臺(tái)支持運(yùn)營(yíng)業(yè)務(wù)的查詢(xún)流量并不會(huì)很大,這個(gè)問(wèn)題就好解。

其他端查詢(xún)

針對(duì)B端的非shardingkey的查詢(xún)有兩個(gè)辦法解決。雙寫(xiě),雙寫(xiě)就是下單的數(shù)據(jù)落兩份,C端和B端的各自保存一份,C端用你可以用單號(hào)、用戶(hù)ID做shardingkey都行,B端就用商家賣(mài)家的ID作為shardingkey就好了。有些同學(xué)會(huì)說(shuō)了,你雙寫(xiě)不影響性能嗎?因?yàn)閷?duì)于B端來(lái)說(shuō)輕微的延遲是可以接受的,所以可以采取異步的方式去落B端訂單。你想想你去淘寶買(mǎi)個(gè)東西下單了,賣(mài)家稍微延遲個(gè)一兩秒收到這個(gè)訂單的消息有什么關(guān)系嗎?你點(diǎn)個(gè)外賣(mài)商戶(hù)晚一兩秒收到這個(gè)訂單有什么太大影響嗎?

這是一個(gè)解決方案,另外一個(gè)方案就是走離線數(shù)倉(cāng)或者ES查詢(xún),訂單數(shù)據(jù)落庫(kù)之后,不管你通過(guò)binlog還是MQ消息的都形式,把數(shù)據(jù)同步到數(shù)倉(cāng)或者ES,他們支持的數(shù)量級(jí)對(duì)于這種查詢(xún)條件來(lái)說(shuō)就很簡(jiǎn)單了。同樣這種方式肯定是稍微有延遲的,但是這種可控范圍的延遲是可以接受的。

而針對(duì)管理后臺(tái)的查詢(xún),比如運(yùn)營(yíng)、業(yè)務(wù)、產(chǎn)品需要看數(shù)據(jù),他們天然需要復(fù)雜的查詢(xún)條件,同樣走ES或者數(shù)倉(cāng)都可以做得到。如果不用這個(gè)方案,又要不帶shardingkey的分頁(yè)查詢(xún),兄弟,這就只能掃全表查詢(xún)聚合數(shù)據(jù),然后手動(dòng)做分頁(yè)了,但是這樣查出來(lái)的結(jié)果是有限制的。 比如你256個(gè)片,查詢(xún)的時(shí)候循環(huán)掃描所有的分片,每個(gè)片取20條數(shù)據(jù),最后聚合數(shù)據(jù)手工分頁(yè),那必然是不可能查到全量的數(shù)據(jù)的。

總結(jié)

分庫(kù)分表后的查詢(xún)問(wèn)題,對(duì)于有經(jīng)驗(yàn)的同學(xué)來(lái)說(shuō)其實(shí)這個(gè)問(wèn)題都知道,但是我相信其實(shí)大部分同學(xué)做的業(yè)務(wù)可能都沒(méi)來(lái)到這個(gè)數(shù)量級(jí),分庫(kù)分表可能都停留在概念階段,面試被問(wèn)到后就手足無(wú)措了,因?yàn)闆](méi)有經(jīng)驗(yàn)不知道怎么辦。 分庫(kù)分表首先是基于現(xiàn)有的業(yè)務(wù)量和未來(lái)的增量做出判斷,比如拼多多這種日單量5000萬(wàn)的,半年數(shù)據(jù)得有百億級(jí)別了,那都得分到4096張表了對(duì)吧,但是實(shí)際的操作是一樣的,對(duì)于你們的業(yè)務(wù)分4096那就沒(méi)有必要了,根據(jù)業(yè)務(wù)做出合理的選擇。 對(duì)于基于shardingkey的查詢(xún)我們可以很簡(jiǎn)單的解決,對(duì)于非shardingkey的查詢(xún)可以通過(guò)落雙份數(shù)據(jù)和數(shù)倉(cāng)、ES的方案來(lái)解決,當(dāng)然,如果分表后數(shù)據(jù)量很小的話,建好索引,掃全表查詢(xún)其實(shí)也不是什么問(wèn)題。

責(zé)任編輯:xj

原文標(biāo)題:百億級(jí)數(shù)據(jù)分表后,該怎么分頁(yè)查詢(xún)?

文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94800
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1516

    瀏覽量

    36239

原文標(biāo)題:百億級(jí)數(shù)據(jù)分表后,該怎么分頁(yè)查詢(xún)?

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    儲(chǔ)能EMS控制器(7) — 如何快捷驗(yàn)證儲(chǔ)能柜內(nèi)設(shè)備接入的正確性?

    儲(chǔ)能柜項(xiàng)目,初期要接入集成設(shè)備(PCS、BMS、電表等)進(jìn)行調(diào)試,設(shè)備調(diào)試過(guò)程比較繁瑣又容易出錯(cuò),怎樣才能便捷地驗(yàn)證儲(chǔ)能柜內(nèi)設(shè)備接入的正確性?簡(jiǎn)介儲(chǔ)能柜項(xiàng)目,初期要接入集成設(shè)備(PCS、BMS、電表
    的頭像 發(fā)表于 01-23 11:40 ?201次閱讀
    儲(chǔ)能EMS控制器(7) — 如何快捷驗(yàn)證儲(chǔ)能柜內(nèi)設(shè)備接入的正確性?

    快問(wèn)快答:產(chǎn)品氣密性檢測(cè)NG了?1鐘精準(zhǔn)定位泄漏點(diǎn)的實(shí)戰(zhàn)方法

    成本,還會(huì)嚴(yán)重干擾質(zhì)量判斷。精誠(chéng)工科真水測(cè)試儀,漏點(diǎn)定位一步到位那么,當(dāng)氣密測(cè)試出現(xiàn)泄漏不良時(shí),到底怎樣才能高效、準(zhǔn)確地找到漏點(diǎn)呢?時(shí)間就是金錢(qián)。產(chǎn)線每停滯一鐘,
    的頭像 發(fā)表于 12-10 17:34 ?960次閱讀
    快問(wèn)快答:產(chǎn)品氣密性檢測(cè)NG了?1<b class='flag-5'>分</b>鐘精準(zhǔn)定位泄漏點(diǎn)的實(shí)戰(zhàn)方法

    商品類(lèi)目屬性查詢(xún)接口技術(shù)實(shí)現(xiàn)詳解

    ? ? 一、接口核心功能 該接口用于查詢(xún)電商系統(tǒng)中商品類(lèi)目的屬性信息,支持: 按類(lèi)目ID查詢(xún)屬性集合 按屬性類(lèi)型過(guò)濾(關(guān)鍵屬性$K$、銷(xiāo)售屬性$S$、普通屬性$N$) 分頁(yè)返回屬性數(shù)據(jù)
    的頭像 發(fā)表于 10-11 15:43 ?464次閱讀
    商品類(lèi)目屬性<b class='flag-5'>查詢(xún)</b>接口技術(shù)實(shí)現(xiàn)詳解

    不用編程不用聯(lián)網(wǎng),實(shí)現(xiàn)倍福(BECKHOFF)PLC對(duì)接SQL數(shù)據(jù)庫(kù),上報(bào)和查詢(xún)數(shù)據(jù)的案例

    ?IGT-DSER智能網(wǎng)關(guān)模塊,支持各種PLC、智能儀表、遠(yuǎn)程IO與數(shù)據(jù)庫(kù)之間雙向通訊,既可以讀取設(shè)備的數(shù)據(jù)上報(bào)到SQL數(shù)據(jù)庫(kù),也可以從數(shù)據(jù)庫(kù)查詢(xún)
    發(fā)表于 10-10 11:14

    別踩分頁(yè)坑!京東商品詳情接口實(shí)戰(zhàn)指南:從并發(fā)優(yōu)化到數(shù)據(jù)完整性閉環(huán)

    京東商品詳情接口(jingdong.ware.get)是電商數(shù)據(jù)開(kāi)發(fā)的核心難點(diǎn),本文詳解其權(quán)限申請(qǐng)、分頁(yè)優(yōu)化、多規(guī)格遞歸解析與完整性校驗(yàn)等實(shí)戰(zhàn)方案,結(jié)合代碼示例與性能調(diào)優(yōu)參數(shù),助你高效穩(wěn)定對(duì)接,提升數(shù)據(jù)獲取效率2.5倍以上,適用
    的頭像 發(fā)表于 09-30 15:50 ?1114次閱讀

    別再卡分頁(yè)!淘寶全量商品接口實(shí)戰(zhàn)開(kāi)發(fā)指南:從并發(fā)優(yōu)化到數(shù)據(jù)完整性閉環(huán)

    淘寶店鋪全量商品接口實(shí)戰(zhàn)指南:詳解權(quán)限申請(qǐng)、分頁(yè)優(yōu)化、并發(fā)拉取與增量更新,結(jié)合代碼實(shí)現(xiàn)高效穩(wěn)定的數(shù)據(jù)獲取,解決超時(shí)、限流、數(shù)據(jù)丟失等核心難題,助力電商數(shù)據(jù)分析避坑提效。
    的頭像 發(fā)表于 09-30 10:47 ?575次閱讀

    #紅外傳感器有哪幾種?怎么用?怎樣才能選對(duì)?

    傳感器
    iczoom
    發(fā)布于 :2025年09月02日 10:52:41

    CYT2B93CAE怎樣才能接收特定 ID 的中斷?

    你好,我正在使用 CYT2B93CAE 使用設(shè)備配置器 5.3,我選擇 RX 緩沖區(qū)來(lái)接受特定的 ID(例如,0x020)。然而,問(wèn)題是我在總線上的所有幀上都收到了中斷,而不僅僅是專(zhuān)用 ID。 當(dāng)其他所有 ID 均未發(fā)生中斷時(shí),我怎樣才能接收特定 ID 的中斷?
    發(fā)表于 07-15 07:09

    WICED IDE 6.6.1.1怎樣才能連接到自定義硬件?

    設(shè)備? 我們怎樣才能指示 WICED-IDE 使用我們的 4 通道 UART2USB 轉(zhuǎn)換器提供的 “普通” VCOM COM 端口之一? 有人能給我一些關(guān)于如何連接我們的定制硬件并驗(yàn)證基本功能的說(shuō)明和見(jiàn)解嗎。 任何幫助將不勝感激
    發(fā)表于 07-09 07:01

    將CYW20706基于硅的藍(lán)牙模塊(CYBT-343151-02)連接到定制板上的MCU,怎樣才能將鏈接配置為未確認(rèn)數(shù)據(jù)模式?

    我將 CYW20706 基于硅的藍(lán)牙模塊(CYBT-343151-02)連接到定制板上的 MCU。 它在確認(rèn)數(shù)據(jù)模式下工作,沒(méi)有問(wèn)題 但是我怎樣才能將鏈接配置為未確認(rèn)數(shù)據(jù)模式
    發(fā)表于 06-27 08:23

    使用 CY4500 EZ-PD 協(xié)議分析器實(shí)用程序來(lái)調(diào)試USB類(lèi)型C應(yīng)用程序,無(wú)法在 “詳細(xì)信息” 窗口中找到 \" HPD 狀態(tài)\"怎么解決?

    ; HPD 狀態(tài)\"。 我怎樣才能在詳細(xì)信息窗口中看到 \" HPD 狀態(tài)\"解碼結(jié)果行?
    發(fā)表于 05-28 07:05

    怎樣才能安全地按住ctrc +c日志閱讀器然后才能停止并重新啟動(dòng)日志?

    的讀取過(guò)程,我將無(wú)法在 FX3 中操作任何東西,所有命令都不起作用,所有控件寫(xiě)入/讀取都將不起作用 以下是兩個(gè)函數(shù) 我怎樣才能安全地按住 ctrc +c 我的日志閱讀器然后才能停止并重新啟動(dòng)日志
    發(fā)表于 05-27 07:11

    MySQL數(shù)據(jù)庫(kù)是什么

    MySQL數(shù)據(jù)庫(kù)是一種 開(kāi)源的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS) ,由瑞典MySQL AB公司開(kāi)發(fā),被Oracle公司收購(gòu)。它通過(guò)結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)進(jìn)行
    的頭像 發(fā)表于 05-23 09:18 ?1224次閱讀

    HarmonyOS5云服務(wù)技術(shù)分享--云數(shù)據(jù)庫(kù)使用指南

    接觸HarmonyOS開(kāi)發(fā),還是想優(yōu)化現(xiàn)有的數(shù)據(jù)管理邏輯,這篇指南都會(huì)手把手帶你玩轉(zhuǎn)數(shù)據(jù)的增刪改查,還有那些超實(shí)用的高級(jí)查詢(xún)功能! ? ??核心功能與使用場(chǎng)景?? 華為云數(shù)據(jù)庫(kù)(Clo
    發(fā)表于 05-22 18:29

    怎樣才能使用NUCLEO-H563ZI 識(shí)別出ST-LINK ?

    控制的?這個(gè)管腳默認(rèn)的值是高還是低? 怎樣才能使用NUCLEO-H563ZI ,識(shí)別出ST-LINK ?其開(kāi)發(fā)環(huán)境需要什么版本的
    發(fā)表于 03-14 13:59