美團(tuán)KV存儲分布式設(shè)計及實(shí)踐方案

KV 存儲發(fā)展歷程

美團(tuán)第一代的分布式 KV 存儲如下圖左側(cè)的架構(gòu)所示，相信很多公司都經(jīng)歷過這個階段。在客戶端內(nèi)做一致性哈希，在后端部署很多的 Memcached 實(shí)例，這樣就實(shí)現(xiàn)了最基本的 KV 存儲分布式設(shè)計。但這樣的設(shè)計存在很明顯的問題：比如在宕機(jī)摘除節(jié)點(diǎn)時，會丟數(shù)據(jù)，緩存空間不夠需要擴(kuò)容，一致性哈希也會丟失一些數(shù)據(jù)等等，這樣會給業(yè)務(wù)開發(fā)帶來的很多困擾。

隨著 Redis 項(xiàng)目的成熟，美團(tuán)也引入了 Redis 來解決我們上面提到的問題，進(jìn)而演進(jìn)出來如上圖右側(cè)這樣一個架構(gòu)。大家可以看到，客戶端還是一樣，采用了一致性哈希算法，服務(wù)器端變成了 Redis 組成的主從結(jié)構(gòu)。當(dāng)任何一個節(jié)點(diǎn)宕機(jī)，我們可以通過 Redis 哨兵完成 Failover，實(shí)現(xiàn)高可用。但有一個問題還是沒有解決，如果擴(kuò)縮容的話，一致性哈希仍然會丟數(shù)據(jù)，那么這個問題該如何解決呢？

這個時候，我們發(fā)現(xiàn)有了一個比較成熟的 KV 存儲開源項(xiàng)目：阿里 Tair 。2014年，我們引入了 Tair 來滿足業(yè)務(wù) KV 存儲方面的需求。Tair 開源版本的架構(gòu)主要分成三部分：上圖下邊是存儲節(jié)點(diǎn)，存儲節(jié)點(diǎn)會上報心跳到它的中心節(jié)點(diǎn)，中心節(jié)點(diǎn)內(nèi)部有兩個配置管理節(jié)點(diǎn)，會監(jiān)控所有的存儲節(jié)點(diǎn)。當(dāng)有任何存儲節(jié)點(diǎn)宕機(jī)或者擴(kuò)容時，它會做集群拓?fù)涞闹匦聵?gòu)建。當(dāng)客戶端啟動時，它會直接從中心節(jié)點(diǎn)拉來一個路由表。這個路由表簡單來說就是一個集群的數(shù)據(jù)分布圖，客戶端根據(jù)路由表直接去存儲節(jié)點(diǎn)讀寫。針對之前 KV 的擴(kuò)容丟數(shù)據(jù)問題，它也有數(shù)據(jù)遷移機(jī)制來保證數(shù)據(jù)的完整性。

但是，我們在使用的過程中，還遇到了一些其他問題，比如中心節(jié)點(diǎn)雖然是主備高可用的，但實(shí)際上它沒有類似于分布式仲裁的機(jī)制，所以在網(wǎng)絡(luò)分割的情況下，它是有可能發(fā)生“腦裂”的，這個也給我們的業(yè)務(wù)造成過比較大的影響。另外，在容災(zāi)擴(kuò)容時，也遇到過數(shù)據(jù)遷移影響到業(yè)務(wù)可用性的問題。另外，我們之前用過 Redis ，業(yè)務(wù)會發(fā)現(xiàn) Redis 的數(shù)據(jù)結(jié)構(gòu)特別豐富，而 Tair 還不支持這些數(shù)據(jù)結(jié)構(gòu)。雖然我們用 Tair 解決了一些問題，但是 Tair 也無法完全滿足業(yè)務(wù)需求。畢竟，在美團(tuán)這樣一個業(yè)務(wù)規(guī)模較大和業(yè)務(wù)復(fù)雜度較高的場景下，很難有開源系統(tǒng)能很好地滿足我們的需求。最終，我們決定在已應(yīng)用的開源系統(tǒng)之上進(jìn)行自研。

剛好在2015 年， Redis 官方正式發(fā)布了集群版本 Redis Cluster。所以，我們緊跟社區(qū)步伐，并結(jié)合內(nèi)部需求做了很多開發(fā)工作，演進(jìn)出了全內(nèi)存、高吞吐、低延遲的 KV 存儲 Squirrel。另外，基于 Tair，我們還加入了很多自研的功能，演進(jìn)出持久化、大容量、數(shù)據(jù)高可靠的 KV 存儲 Cellar 。因?yàn)?Tair 的開源版本已經(jīng)有四五年沒有更新了，所以，Cellar 的迭代完全靠美團(tuán)自研，而 Redis 社區(qū)一直很活躍?？偟膩碚f，Squirrel 的迭代是自研和社區(qū)并重，自研功能設(shè)計上也會盡量與官方架構(gòu)進(jìn)行兼容。后面大家可以看到，因?yàn)檫@些不同，Cellar 和 Squirrel 在解決同樣的問題時也選取了不同的設(shè)計方案。

這兩個存儲其實(shí)都是 KV 存儲領(lǐng)域不同的解決方案。在實(shí)際應(yīng)用上，如果業(yè)務(wù)的數(shù)據(jù)量小，對延遲敏感，我們建議大家用 Squirrel ；如果數(shù)據(jù)量大，對延遲不是特別敏感，我們建議用成本更低的 Cellar 。目前這兩套 KV 存儲系統(tǒng)在美團(tuán)內(nèi)部每天的調(diào)用量均已突破萬億，它們的請求峰值也都突破了每秒億級。

內(nèi)存 KV Squirrel 架構(gòu)和實(shí)踐

在開始之前，本文先介紹兩個存儲系統(tǒng)共通的地方。比如分布式存儲的經(jīng)典問題：數(shù)據(jù)是如何分布的？這個問題在 KV 存儲領(lǐng)域，就是 Key 是怎么分布到存儲節(jié)點(diǎn)上的。這里 Squirrel 跟 Cellar 是一樣的。當(dāng)我們拿到一個 Key 后，用固定的哈希算法拿到一個哈希值，然后將哈希值對 Slot 數(shù)目取模得到一個Slot id，我們兩個 KV 現(xiàn)在都是預(yù)分片16384個 Slot 。得到 Slot id 之后，再根據(jù)路由表就能查到這個 Slot 存儲在哪個存儲節(jié)點(diǎn)上。這個路由表簡單來說就是一個 Slot 到存儲節(jié)點(diǎn)的對照表。

KV 數(shù)據(jù)分布介紹

接下來講一下對高可用架構(gòu)的認(rèn)知，個人認(rèn)為高可用可以從宏觀和微觀兩個角度來看。從宏觀的角度來看，高可用就是指容災(zāi)怎么做。比如說掛掉了一個節(jié)點(diǎn)，你該怎么做？一個機(jī)房或者說某個地域的一批機(jī)房宕機(jī)了，你該怎么做？而從微觀的角度看，高可用就是怎么能保證端到端的高成功率。我們在做一些運(yùn)維升級或者擴(kuò)縮容數(shù)據(jù)遷移的時候，能否做到業(yè)務(wù)請求的高可用？本文也會從宏觀和微觀兩個角度來分享美團(tuán)做的一些高可用工作。

Squirrel 架構(gòu)

上圖就是我們的 Squirrel 架構(gòu)。中間部分跟 Redis 官方集群是一致的。它有主從的結(jié)構(gòu)， Redis 實(shí)例之間通過 Gossip 協(xié)議去通信。我們在右邊添加了一個集群調(diào)度平臺，包含調(diào)度服務(wù)、擴(kuò)縮容服務(wù)和高可用服務(wù)等，它會去管理整個集群，把管理結(jié)果作為元數(shù)據(jù)更新到 ZooKeeper。我們的客戶端會訂閱 ZooKeeper 上的元數(shù)據(jù)變更，實(shí)時獲取到集群的拓?fù)錉顟B(tài)，直接在 Redis 集群進(jìn)行讀寫操作。

Squirrel 節(jié)點(diǎn)容災(zāi)

然后再看一下 Squirrel 容災(zāi)怎么做。對于 Redis 集群而言，節(jié)點(diǎn)宕機(jī)已經(jīng)有完備的處理機(jī)制了。官方提供的方案，任何一個節(jié)點(diǎn)從宕機(jī)到被標(biāo)記為 FAIL 摘除，一般需要經(jīng)過 30 秒。主庫的摘除可能會影響數(shù)據(jù)的完整性，所以，我們需要謹(jǐn)慎一些。但是對于從庫呢？我們認(rèn)為這個過程完全沒必要。另一點(diǎn)，我們都知道內(nèi)存的 KV 存儲數(shù)據(jù)量一般都比較小。對于業(yè)務(wù)量很大的公司來說，它往往會有很多的集群。如果發(fā)生交換機(jī)故障，會影響到很多的集群，宕機(jī)之后去補(bǔ)副本就會變得非常麻煩。為了解決這兩個問題，我們做了 HA 高可用服務(wù)。

它的架構(gòu)如下圖所示，它會實(shí)時監(jiān)控集群的所有節(jié)點(diǎn)。不管是網(wǎng)絡(luò)抖動，還是發(fā)生了宕機(jī)（比如說 Redis 2 ），它可以實(shí)時更新 ZooKeeper ，告訴 ZooKeeper 去摘除 Redis 2 ，客戶端收到消息后，讀流量就直接路由到 Redis 3上。如果 Redis 2 只是幾十秒的網(wǎng)絡(luò)抖動，過幾十秒之后，如果 HA 節(jié)點(diǎn)監(jiān)控到它恢復(fù)后，會把它重新加回。

Squirrel—節(jié)點(diǎn)容災(zāi)

如果過了一段時間，HA 判斷它屬于一個永久性的宕機(jī)，HA 節(jié)點(diǎn)會直接從 Kubernetes 集群申請一個新的 Redis 4 容器實(shí)例，把它加到集群里。此時，拓?fù)浣Y(jié)構(gòu)又變成了一主兩從的標(biāo)準(zhǔn)結(jié)構(gòu)，HA 節(jié)點(diǎn)更新完集群拓?fù)渲?，就會去?ZooKeeper 通知客戶端去更新路由，客戶端就能到 Redis 4 這個新從庫上進(jìn)行讀操作。

通過上述方案，我們把從庫的摘除時間從 30 秒降低到了 5 秒。另外，我們通過 HA 自動申請容器實(shí)例加入集群的方式，把宕機(jī)補(bǔ)副本變成了一個分鐘級的自動操作，不需要任何人工的介入。

Squirrel 跨地域容災(zāi)

我們解決了單節(jié)點(diǎn)宕機(jī)的問題，那么跨地域問題如何解決呢？我們首先來看下跨地域有什么不同。第一，相對于同地域機(jī)房間的網(wǎng)絡(luò)而言，跨地域?qū)＞€很不穩(wěn)定；第二，跨地域?qū)＞€的帶寬是非常有限且昂貴的。而集群內(nèi)的復(fù)制沒有考慮極端的網(wǎng)絡(luò)環(huán)境。假如我們把主庫部署到北京，兩個從庫部署在上海，同樣一份數(shù)據(jù)要在北上專線傳輸兩次，這樣會造成巨大的專線帶寬浪費(fèi)。另外，隨著業(yè)務(wù)的發(fā)展和演進(jìn)，我們也在做單元化部署和異地多活架構(gòu)。用官方的主從同步，滿足不了我們的這些需求?；诖?，我們又做了集群間的復(fù)制方案。

如上圖所示，這里畫出了北京的主集群以及上海的從集群，我們要做的是通過集群同步服務(wù)，把北京主集群的數(shù)據(jù)同步到上海從集群上。按照流程，首先要向我們的同步調(diào)度模塊下發(fā)“在兩個集群間建立同步鏈路”的任務(wù)，同步調(diào)度模塊會根據(jù)主從集群的拓?fù)浣Y(jié)構(gòu)，把主從集群間的同步任務(wù)下發(fā)到同步集群，同步集群收到同步任務(wù)后會扮成 Redis 的 Slave，通過 Redis 的復(fù)制協(xié)議，從主集群上的從庫拉取數(shù)據(jù)，包括 RDB以及后續(xù)的增量變更。同步機(jī)收到數(shù)據(jù)后會把它轉(zhuǎn)成客戶端的寫命令，寫到上海從集群的主節(jié)點(diǎn)里。

通過這樣的方式，我們把北京主集群的數(shù)據(jù)同步到了上海的從集群。同樣的，我們要做異地多活也很簡單，再加一個反向的同步鏈路，就可以實(shí)現(xiàn)集群間的雙向同步。

接下來我們講一下如何做好微觀角度的高可用，也就是保持端到端的高成功率。對于 Squirrel ，主要講如下三個影響成功率的問題：

數(shù)據(jù)遷移造成超時抖動。

持久化造成超時抖動。

熱點(diǎn) Key 請求導(dǎo)致單節(jié)點(diǎn)過載。

Squirrel 智能遷移

對于數(shù)據(jù)遷移，我們主要遇到三個問題：

Redis Cluster 雖然提供了數(shù)據(jù)遷移能力，但是對于要遷哪些 Slot，Slot 從哪遷到哪，它并不管。

做數(shù)據(jù)遷移的時候，大家都想越快越好，但是遷移速度過快又可能影響業(yè)務(wù)正常請求。

Redis 的 Migrate 命令會阻塞工作線程，尤其在遷移大 Value 的時候會阻塞特別久。

為了解決這些問題，我們做了全新的遷移服務(wù)。

下面我們按照工作流，講一下它是如何運(yùn)行的。首先生成遷移任務(wù)，這步的核心是“就近原則”，比如說同機(jī)房的兩個節(jié)點(diǎn)做遷移肯定比跨機(jī)房的兩個節(jié)點(diǎn)快。遷移任務(wù)生成之后，會把任務(wù)下發(fā)到一批遷移機(jī)上。遷移機(jī)遷移的時候，有這樣幾個特點(diǎn)：

會在集群內(nèi)遷出節(jié)點(diǎn)間做并發(fā)，比如同時給 Redis 1、Redis 3 下發(fā)遷移命令。

每個 Migrate 命令會遷移一批 Key。

我們會用監(jiān)控服務(wù)去實(shí)時采集客戶端的成功率、耗時，服務(wù)端的負(fù)載、QPS 等，之后把這個狀態(tài)反饋到遷移機(jī)上。遷移數(shù)據(jù)的過程就類似 TCP 慢啟動的過程，它會把速度一直往上加，若出現(xiàn)請求成功率下降等情況，它的速度就會降低，最終遷移速度會在動態(tài)平衡中穩(wěn)定下來，這樣就達(dá)到了最快速的遷移，同時又盡可能小地影響業(yè)務(wù)的正常請求。

接下來，我們看一下大 Value 的遷移，我們實(shí)現(xiàn)了一個異步 Migrate 命令，該命令執(zhí)行時，Redis 的主線程會繼續(xù)處理其他的正常請求。如果此時有對正在遷移 Key 的寫請求過來，Redis 會直接返回錯誤。這樣最大限度保證了業(yè)務(wù)請求的正常處理，同時又不會阻塞主線程。

Squirrel 持久化重構(gòu)

Redis 主從同步時會生成 RDB。生成 RDB 的過程會調(diào)用 Fork 產(chǎn)生一個子進(jìn)程去寫數(shù)據(jù)到硬盤，F(xiàn)ork 雖然有操作系統(tǒng)的 COW 機(jī)制，但是當(dāng)內(nèi)存用量達(dá)到 10 G 或 20 G 時，依然會造成整個進(jìn)程接近秒級的阻塞。這對在線業(yè)務(wù)來說幾乎是無法接受的。我們也會為數(shù)據(jù)可靠性要求高的業(yè)務(wù)去開啟 AOF，而開 AOF 就可能因 IO 抖動造成進(jìn)程阻塞，這也會影響請求成功率。對官方持久化機(jī)制的這兩個問題，我們的解決方案是重構(gòu)持久化機(jī)制。

上圖是我們最新版的 Redis 持久化機(jī)制，寫請求會先寫到 DB 里，然后寫到內(nèi)存 Backlog，這跟官方是一樣的。同時它會把請求發(fā)給異步線程，異步線程負(fù)責(zé)把變更刷到硬盤的 Backlog 里。當(dāng)硬盤 Backlog 過多時，我們會主動在業(yè)務(wù)低峰期做一次 RDB ，然后把 RDB 之前生成的 Backlog 刪除。

如果這時候我們要做主從同步，去尋找同步點(diǎn)的時候，該怎么辦？第一步還是跟官方一樣，我們會從內(nèi)存 Backlog 里找有沒有要求的同步點(diǎn)，如果沒有，我們會去硬盤 Backlog 找同步點(diǎn)。由于硬盤空間很大，硬盤 Backlog 可以存儲特別多的數(shù)據(jù)，所以很少會出現(xiàn)找不到同步點(diǎn)的情況。如果硬盤 Backlog 也沒有，我們就會觸發(fā)一次類似于全量重傳的操作，但這里的全量重傳是不需要當(dāng)場生成 RDB 的，它可以直接用硬盤已存的 RDB 及其之后的硬盤 Backlog 完成全量重傳。通過這個設(shè)計，我們減少了很多的全量重傳。

另外，我們通過控制在低峰區(qū)生成 RDB ，減少了很多 RDB 造成的抖動。同時，我們也避免了寫 AOF 造成的抖動。不過，這個方案因?yàn)閷?AOF 是完全異步的，所以會比官方的數(shù)據(jù)可靠性差一些，但我們認(rèn)為這個代價換來了可用性的提升，這是非常值得的。

Squirrel 熱點(diǎn) Key

下面看一下 Squirrel 的熱點(diǎn) Key 解決方案。如下圖所示，普通主、從是一個正常集群中的節(jié)點(diǎn)，熱點(diǎn)主、從是游離于正常集群之外的節(jié)點(diǎn)。我們看一下它們之間怎么發(fā)生聯(lián)系。

當(dāng)有請求進(jìn)來讀寫普通節(jié)點(diǎn)時，節(jié)點(diǎn)內(nèi)會同時做請求 Key 的統(tǒng)計。如果某個 Key 達(dá)到了一定的訪問量或者帶寬的占用量，會自動觸發(fā)流控以限制熱點(diǎn) Key 訪問，防止節(jié)點(diǎn)被熱點(diǎn)請求打滿。同時，監(jiān)控服務(wù)會周期性的去所有 Redis 實(shí)例上查詢統(tǒng)計到的熱點(diǎn) Key。如果有熱點(diǎn)，監(jiān)控服務(wù)會把熱點(diǎn) Key 所在 Slot 上報到我們的遷移服務(wù)。遷移服務(wù)這時會把熱點(diǎn)主從節(jié)點(diǎn)加入到這個集群中，然后把熱點(diǎn) Slot 遷移到這個熱點(diǎn)主從上。因?yàn)闊狳c(diǎn)主從上只有熱點(diǎn) Slot 的請求，所以熱點(diǎn) Key的處理能力得到了大幅提升。通過這樣的設(shè)計，我們可以做到實(shí)時的熱點(diǎn)監(jiān)控，并及時通過流控去止損；通過熱點(diǎn)遷移，我們能做到自動的熱點(diǎn)隔離和快速的容量擴(kuò)充。

持久化 KV Cellar 架構(gòu)和實(shí)踐

下面看一下持久化 KV Cellar 的架構(gòu)和實(shí)踐。下圖是我們最新的 Cellar 架構(gòu)圖。

跟阿里開源的 Tair 主要有兩個架構(gòu)上的不同。第一個是OB，第二個是 ZooKeeper。我們的 OB 跟 ZooKeeper 的 Observer 是類似的作用，提供 Cellar 中心節(jié)點(diǎn)元數(shù)據(jù)的查詢服務(wù)。它可以實(shí)時與中心節(jié)點(diǎn)的 Master 同步最新的路由表，客戶端的路由表都是從 OB 去拿。這樣做的好處主要有兩點(diǎn)，第一，把大量的業(yè)務(wù)客戶端跟集群的大腦 Master 做了天然的隔離，防止路由表請求影響集群的管理。第二，因?yàn)?OB 只供路由表查詢，不參與集群的管理，所以它可以進(jìn)行水平擴(kuò)展，極大地提升了我們路由表的查詢能力。另外，我們引入了 ZooKeeper 做分布式仲裁，解決我剛才提到的 Master、Slave 在網(wǎng)絡(luò)分割情況下的“腦裂”問題，并且通過把集群的元數(shù)據(jù)存儲到 ZooKeeper，我們保證了元數(shù)據(jù)的高可靠。

Cellar 節(jié)點(diǎn)容災(zāi)

介紹完整體的架構(gòu)，我們看一下 Cellar 怎么做節(jié)點(diǎn)容災(zāi)。一個集群節(jié)點(diǎn)的宕機(jī)一般是臨時的，一個節(jié)點(diǎn)的網(wǎng)絡(luò)抖動也是臨時的，它們會很快地恢復(fù)，并重新加入集群。因?yàn)楣?jié)點(diǎn)的臨時離開就把它徹底摘除，并做數(shù)據(jù)副本補(bǔ)全操作，會消耗大量資源，進(jìn)而影響到業(yè)務(wù)請求。所以，我們實(shí)現(xiàn)了 Handoff 機(jī)制來解決這種節(jié)點(diǎn)短時故障帶來的影響。

如上圖所示，如果 A 節(jié)點(diǎn)宕機(jī)了，會觸發(fā) Handoff 機(jī)制，這時候中心節(jié)點(diǎn)會通知客戶端 A節(jié)點(diǎn)發(fā)生了故障，讓客戶端把分片 1 的請求也打到 B 上。B 節(jié)點(diǎn)正常處理完客戶端的讀寫請求之后，還會把本應(yīng)該寫入 A 節(jié)點(diǎn)的分片 1&2 數(shù)據(jù)寫入到本地的 Log 中。

如果 A 節(jié)點(diǎn)宕機(jī)后 3~5 分鐘，或者網(wǎng)絡(luò)抖動 30~50 秒之后恢復(fù)了，A 節(jié)點(diǎn)就會上報心跳到中心節(jié)點(diǎn)，中心節(jié)點(diǎn)就會通知 B 節(jié)點(diǎn)：“ A 節(jié)點(diǎn)恢復(fù)了，你去把它不在期間的數(shù)據(jù)傳給它?！边@時候，B 節(jié)點(diǎn)就會把本地存儲的 Log 回寫到 A 節(jié)點(diǎn)上。等到 A 節(jié)點(diǎn)擁有了故障期間的全量數(shù)據(jù)之后，中心節(jié)點(diǎn)就會告訴客戶端，A 節(jié)點(diǎn)已經(jīng)徹底恢復(fù)了，客戶端就可以重新把分片 1 的請求打回 A 節(jié)點(diǎn)。

通過這樣的操作，我們可以做到秒級的快速節(jié)點(diǎn)摘除，而且節(jié)點(diǎn)恢復(fù)后加回，只需補(bǔ)齊少量的增量數(shù)據(jù)。另外如果 A 節(jié)點(diǎn)要做升級，中心節(jié)點(diǎn)先通過主動 Handoff 把 A 節(jié)點(diǎn)流量切到 B 節(jié)點(diǎn)，A 升級后再回寫增量 Log，然后切回流量加入集群。這樣通過主動觸發(fā) Handoff 機(jī)制，我們就實(shí)現(xiàn)了靜默升級的功能。

Cellar 跨地域容災(zāi)

下面我介紹一下 Cellar 跨地域容災(zāi)是怎么做的。Cellar 跟 Squirrel 面對的跨地域容災(zāi)問題是一樣的，解決方案同樣也是集群間復(fù)制。以下圖一個北京主集群、上海從集群的跨地域場景為例，比如說客戶端的寫操作到了北京的主集群 A 節(jié)點(diǎn)，A 節(jié)點(diǎn)會像正常集群內(nèi)復(fù)制一樣，把它復(fù)制到 B 和 D 節(jié)點(diǎn)上。同時 A 節(jié)點(diǎn)還會把數(shù)據(jù)復(fù)制一份到從集群的 H 節(jié)點(diǎn)。H 節(jié)點(diǎn)處理完集群間復(fù)制寫入之后，它也會做從集群內(nèi)的復(fù)制，把這個寫操作復(fù)制到從集群的 I 、K 節(jié)點(diǎn)上。通過在主從集群的節(jié)點(diǎn)間建立這樣一個復(fù)制鏈路，我們完成了集群間的數(shù)據(jù)復(fù)制，并且這個復(fù)制保證了最低的跨地域帶寬占用。同樣的，集群間的兩個節(jié)點(diǎn)通過配置兩個雙向復(fù)制的鏈路，就可以達(dá)到雙向同步異地多活的效果。

Cellar 強(qiáng)一致

我們做好了節(jié)點(diǎn)容災(zāi)以及跨地域容災(zāi)后，業(yè)務(wù)又對我們提出了更高要求：強(qiáng)一致存儲。我們之前的數(shù)據(jù)復(fù)制是異步的，在做故障摘除時，可能因?yàn)楣收瞎?jié)點(diǎn)數(shù)據(jù)還沒復(fù)制出來，導(dǎo)致數(shù)據(jù)丟失。但是對于金融支付等場景來說，它們是不容許數(shù)據(jù)丟失的。面對這個難題，我們該怎么解決？目前業(yè)界主流的解決方案是基于 Paxos 或 Raft 協(xié)議的強(qiáng)一致復(fù)制。我們最終選擇了 Raft 協(xié)議。主要是因?yàn)?Raft 論文是非常詳實(shí)的，是一篇工程化程度很高的論文。業(yè)界也有不少比較成熟的 Raft 開源實(shí)現(xiàn)，可以作為我們研發(fā)的基礎(chǔ)，進(jìn)而能夠縮短研發(fā)周期。

下圖是現(xiàn)在 Cellar 集群 Raft 復(fù)制模式下的架構(gòu)圖，中心節(jié)點(diǎn)會做 Raft 組的調(diào)度，它會決定每一個 Slot 的三副本存在哪些節(jié)點(diǎn)上。

大家可以看到 Slot 1 在存儲節(jié)點(diǎn) 1、2、4 上，Slot 2 在存儲節(jié)點(diǎn)2、3、4上。每個 Slot 組成一個 Raft 組，客戶端會去 Raft Leader 上進(jìn)行讀寫。由于我們是預(yù)分配了 16384 個 Slot，所以，在集群規(guī)模很小的時候，我們的存儲節(jié)點(diǎn)上可能會有數(shù)百甚至上千個 Slot 。

這時候如果每個 Raft 復(fù)制組都有自己的復(fù)制線程、復(fù)制請求和 Log等，那么資源消耗會非常大，寫入性能會很差。所以我們做了 Multi Raft 實(shí)現(xiàn)， Cellar 會把同一個節(jié)點(diǎn)上所有的 Raft 復(fù)制組寫一份 Log，用同一組線程去做復(fù)制，不同 Raft 組間的復(fù)制包也會按照目標(biāo)節(jié)點(diǎn)做整合，以保證寫入性能不會因 Raft 組過多而變差。Raft 內(nèi)部其實(shí)是有自己的選主機(jī)制，它可以控制自己的主節(jié)點(diǎn)，如果有任何節(jié)點(diǎn)宕機(jī)，它可以通過選舉機(jī)制選出新的主節(jié)點(diǎn)。

那么，中心節(jié)點(diǎn)是不是就不需要管理 Raft 組了嗎？不是的。這里講一個典型的場景，如果一個集群的部分節(jié)點(diǎn)經(jīng)過幾輪宕機(jī)恢復(fù)的過程， Raft Leader 在存儲節(jié)點(diǎn)之間會變得極其不均。而為了保證數(shù)據(jù)的強(qiáng)一致，客戶端的讀寫流量又必須發(fā)到 Raft Leader，這時候集群的節(jié)點(diǎn)流量會很不均衡。所以我們的中心節(jié)點(diǎn)還會做 Raft 組的 Leader 調(diào)度。比如說 Slot 1 存儲在節(jié)點(diǎn) 1、2、4，并且節(jié)點(diǎn) 1 是 Leader。如果節(jié)點(diǎn) 1 掛了，Raft 把節(jié)點(diǎn) 2 選成了 Leader。然后節(jié)點(diǎn) 1 恢復(fù)了并重新加入集群，中心節(jié)點(diǎn)這時會讓節(jié)點(diǎn) 2 把 Leader 還給節(jié)點(diǎn) 1 。這樣，即便經(jīng)過一系列宕機(jī)和恢復(fù)，我們存儲節(jié)點(diǎn)之間的 Leader 數(shù)目仍然能保證是均衡的。

接下來，我們看一下 Cellar 如何保證它的端到端高成功率。這里也講三個影響成功率的問題。Cellar 遇到的數(shù)據(jù)遷移和熱點(diǎn) Key 問題與 Squirrel 是一樣的，但解決方案不一樣。這是因?yàn)?Cellar 走的是自研路徑，不用考慮與官方版本的兼容性，對架構(gòu)改動更大些。另一個問題是慢請求阻塞服務(wù)隊(duì)列導(dǎo)致大面積超時，這是 Cellar 網(wǎng)絡(luò)、工作多線程模型設(shè)計下會遇到的不同問題。

Cellar 智能遷移

上圖是 Cellar 智能遷移架構(gòu)圖。我們把桶的遷移分成了三個狀態(tài)。第一個狀態(tài)就是正常的狀態(tài)，沒有任何遷移。如果這時候要把 Slot 2 從 A 節(jié)點(diǎn)遷移到 B節(jié)點(diǎn)，A 會給 Slot 2 打一個快照，然后把這個快照全量發(fā)到 B 節(jié)點(diǎn)上。在遷移數(shù)據(jù)的時候， B 節(jié)點(diǎn)的回包會帶回 B 節(jié)點(diǎn)的狀態(tài)。B 的狀態(tài)包括什么？引擎的壓力、網(wǎng)卡流量、隊(duì)列長度等。A 節(jié)點(diǎn)會根據(jù) B 節(jié)點(diǎn)的狀態(tài)調(diào)整自己的遷移速度。像 Squirrel 一樣，它經(jīng)過一段時間調(diào)整后，遷移速度會達(dá)到一個動態(tài)平衡，達(dá)到最快速的遷移，同時又盡可能小地影響業(yè)務(wù)的正常請求。

當(dāng) Slot 2 遷移完后，會進(jìn)入圖中 Slot 3 的狀態(tài)?？蛻舳诉@時可能還沒更新路由表，當(dāng)它請求到了 A 節(jié)點(diǎn)，A 節(jié)點(diǎn)會發(fā)現(xiàn)客戶端請求錯了節(jié)點(diǎn)，但它不會返回錯誤，它會把請求代理到 B 節(jié)點(diǎn)上，然后把 B 的響應(yīng)包再返回客戶端。同時它會告訴客戶端，需要更新一下路由表了，此后客戶端就能直接訪問到 B 節(jié)點(diǎn)。這樣就解決了客戶端路由更新延遲造成的請求錯誤。

Cellar 快慢列隊(duì)

下圖上方是一個標(biāo)準(zhǔn)的線程隊(duì)列模型。網(wǎng)絡(luò)線程池接收網(wǎng)絡(luò)流量解析出請求包，然后把請求放到工作隊(duì)列里，工作線程池會從工作隊(duì)列取請求來處理，然后把響應(yīng)包放回網(wǎng)絡(luò)線程池發(fā)出。

我們分析線上發(fā)生的超時案例時發(fā)現(xiàn)，一批超時請求當(dāng)中往往只有一兩個請求是引擎處理慢導(dǎo)致的，大部分請求，只是因?yàn)樵陉?duì)列等待過久導(dǎo)致整體響應(yīng)時間過長而超時了。從線上分析來看，真正的慢請求占超時請求的比例只有 1/20。

我們的解法是什么樣？很簡單，拆線程池、拆隊(duì)列。我們的網(wǎng)絡(luò)線程在收到包之后，會根據(jù)它的請求特點(diǎn)，是讀還是寫，快還是慢，分到四個隊(duì)列里。讀寫請求比較好區(qū)分，但快慢怎么分開？我們會根據(jù)請求的 Key 個數(shù)、Value大小、數(shù)據(jù)結(jié)構(gòu)元素數(shù)等對請求進(jìn)行快慢區(qū)分。然后用對應(yīng)的四個工作線程池處理對應(yīng)隊(duì)列的請求，就實(shí)現(xiàn)了快慢讀寫請求的隔離。這樣如果我有一個讀的慢請求，不會影響另外三種請求的正常處理。不過這樣也會帶來一個問題，我們的線程池從一個變成四個，那線程數(shù)是不是變成原來的四倍？其實(shí)并不是的，我們某個線程池空閑的時候會去幫助其它的線程池處理請求。所以，我們線程池變成了四個，但是線程總數(shù)并沒有變。我們線上驗(yàn)證中這樣的設(shè)計能把服務(wù) TP999 的延遲降低 86%，可大幅降低超時率。

Cellar 熱點(diǎn) Key

上圖是 Cellar 熱點(diǎn) Key 解決方案的架構(gòu)圖。我們可以看到中心節(jié)點(diǎn)加了一個職責(zé)，多了熱點(diǎn)區(qū)域管理，它現(xiàn)在不只負(fù)責(zé)正常的數(shù)據(jù)副本分布，還要管理熱點(diǎn)數(shù)據(jù)的分布，圖示這個集群在節(jié)點(diǎn) C、D 放了熱點(diǎn)區(qū)域。我們通過讀寫流程看一下這個方案是怎么運(yùn)轉(zhuǎn)的。如果客戶端有一個寫操作到了 A 節(jié)點(diǎn)，A 節(jié)點(diǎn)處理完成后，會根據(jù)實(shí)時的熱點(diǎn)統(tǒng)計結(jié)果判斷寫入的 Key 是否為熱點(diǎn)。

如果這個 Key 是一個熱點(diǎn)，那么它會在做集群內(nèi)復(fù)制的同時，還會把這個數(shù)據(jù)復(fù)制有熱點(diǎn)區(qū)域的節(jié)點(diǎn)，也就是圖中的 C、D 節(jié)點(diǎn)。同時，存儲節(jié)點(diǎn)在返回結(jié)果給客戶端時，會告訴客戶端，這個 Key 是熱點(diǎn)，這時客戶端內(nèi)會緩存這個熱點(diǎn) Key。當(dāng)客戶端有這個 Key 的讀請求時，它就會直接去熱點(diǎn)區(qū)域做數(shù)據(jù)的讀取。通過這樣的方式，我們可以做到只對熱點(diǎn)數(shù)據(jù)做擴(kuò)容，不像 Squirrel ，要把整個 Slot 遷出來做擴(kuò)容。有必要的話，中心節(jié)點(diǎn)也可以把熱點(diǎn)區(qū)域放到集群的所有節(jié)點(diǎn)上，所有的熱點(diǎn)讀請求就能均衡的分到所有節(jié)點(diǎn)上。另外，通過這種實(shí)時的熱點(diǎn)數(shù)據(jù)復(fù)制，我們很好地解決了類似客戶端緩存熱點(diǎn) KV 方案造成的一致性問題。

發(fā)展規(guī)劃和業(yè)界趨勢

最后，一起來看看我們項(xiàng)目的規(guī)劃和業(yè)界的技術(shù)趨勢。這部分內(nèi)容會按照服務(wù)、系統(tǒng)、硬件三層來進(jìn)行闡述。首先在服務(wù)層，主要有三點(diǎn)：

Redis Gossip 協(xié)議優(yōu)化。大家都知道 Gossip 協(xié)議在集群的規(guī)模變大之后，消息量會劇增，它的 Failover 時間也會變得越來越長。所以當(dāng)集群規(guī)模達(dá)到 TB 級后，集群的可用性會受到很大的影響，所以我們后面會重點(diǎn)在這方面做一些優(yōu)化。

我們已經(jīng)在 Cellar 存儲節(jié)點(diǎn)的數(shù)據(jù)副本間做了 Raft 復(fù)制，可以保證數(shù)據(jù)強(qiáng)一致，后面我們會在 Cellar 的中心點(diǎn)內(nèi)部也做一個 Raft 復(fù)制，這樣就不用依賴于 ZooKeeper 做分布式仲裁、元數(shù)據(jù)存儲了，我們的架構(gòu)也會變得更加簡單、可靠。

Squirrel 和 Cellar 雖然都是 KV 存儲，但是因?yàn)樗鼈兪腔诓煌拈_源項(xiàng)目研發(fā)的，所以 API 和訪問協(xié)議不同，我們之后會考慮將 Squirrel 和 Cellar 在 SDK 層做整合，雖然后端會有不同的存儲集群，但業(yè)務(wù)側(cè)可以用一套 SDK 進(jìn)行訪問。

在系統(tǒng)層面，我們正在調(diào)研并去落地一些 Kernel Bypass 技術(shù)，像 DPDK、SPDK 這種網(wǎng)絡(luò)和硬盤的用戶態(tài) IO 技術(shù)。它可以繞過內(nèi)核，通過輪詢機(jī)制訪問這些設(shè)備，可以極大提升系統(tǒng)的 IO 能力。存儲作為 IO 密集型服務(wù)，性能會獲得大幅的提升。

在硬件層面，像支持 RDMA 的智能網(wǎng)卡能大幅降低網(wǎng)絡(luò)延遲和提升吞吐；還有像 3D XPoint 這樣的閃存技術(shù)，比如英特爾新發(fā)布的 AEP 存儲，其訪問延遲已經(jīng)比較接近內(nèi)存了，以后閃存跟內(nèi)存之間的界限也會變得越來越模糊；最后，看一下計算型硬件，比如通過在閃存上加 FPGA 卡，把原本應(yīng)該 CPU 做的工作，像數(shù)據(jù)壓縮、解壓等，下沉到卡上執(zhí)行，這種硬件能在解放 CPU 的同時，也可以降低服務(wù)的響應(yīng)延遲。

作者簡介

澤斌，美團(tuán)點(diǎn)評高級技術(shù)專家，2014 年加入美團(tuán)。
編輯：hfy

閱讀全文

存儲技術(shù)(45615) 存儲技術(shù)(45615)
美團(tuán)(10138) 美團(tuán)(10138)
Redis(10465) Redis(10465)

分布式存儲方案的主要特點(diǎn)是什么？

接口與外設(shè)在一個視頻監(jiān)控系統(tǒng)中，選擇什么樣的存儲解決方案直接決定了整個系統(tǒng)的系統(tǒng)架構(gòu)以及系統(tǒng)的性能和穩(wěn)定程度，目前視頻監(jiān)控系統(tǒng)中的存儲方案大致上有兩種。視頻監(jiān)控系統(tǒng)存儲方案一種是在攝像監(jiān)控前端采用有

2019-11-08 07:24:35

分布式存儲器和觸發(fā)器的一些解決方案？

大家好！xilinx軟錯誤緩解控制器IPcore V4.1用于配置內(nèi)存以避免SEU。我想知道，有關(guān)塊存儲器，分布式存儲器和觸發(fā)器的一些解決方案是否有關(guān)于SEU的解決方案？非常感謝你！

2020-08-05 07:40:29

分布式Hadoop的搭建步驟

搭建分布式Hadoop

2019-05-22 13:11:34

分布式KVM坐席拼控系統(tǒng)解決方案

，形成一個信息共享的云管理平臺。視通科技經(jīng)過多年來對技術(shù)的深入研究和對用戶使用習(xí)慣的積累，推出了AS-ADS 4K分布式KVM坐席拼控解決方案，本系統(tǒng)是一套技術(shù)先進(jìn)、功能完善、性能穩(wěn)定、安全可靠、操作

2021-02-26 15:15:11

分布式MySQL的InnoDB cluster

分布式MySQL——InnoDB cluster和性能測試

2020-04-15 08:43:00

分布式RAM中怎么異步讀取

使用分布式RAM，因?yàn)槲臋n說只要“我們”為低，讀取地址就可以在任何時間被斷言，讀取存儲器數(shù)據(jù)在延遲后可用，Tilo ..請幫忙..問候KAPS以上來自于谷歌翻譯以下為原文I plan to use

2019-04-16 09:52:29

分布式RAM綜合問題

大家好 ...我在實(shí)現(xiàn)大小為65535 * 3的分布式RAM時出現(xiàn)問題，在大約2小時內(nèi)合成時發(fā)生了很大的延遲并且沒有停止，對這個問題有什么解釋嗎？提前致謝以上來自于谷歌翻譯以下為原文Hello

2019-06-25 11:03:45

分布式光伏發(fā)電安全性

作為更為貼近人民日常生活的分布式光伏發(fā)電與光伏地面電站相比，其安全性如何呢?請看南京研旭在本文內(nèi)的具體介紹。從使用的角度，分布式光伏發(fā)電特有的優(yōu)點(diǎn)：1、分布式光伏發(fā)電可實(shí)現(xiàn)就近供電，不必長距離輸送

2018-10-12 15:35:24

分布式光纖傳感器的特點(diǎn)應(yīng)用

MOI是一家美國公司，其長期致力于分布式光纖傳感器的研究及生產(chǎn)。目前MOI北京代表處提供相關(guān)方案及產(chǎn)品：分布式光纖應(yīng)力應(yīng)變、溫度、壓力傳感測試系統(tǒng)。1.特點(diǎn)：精度高，靈敏度好，可靠性高，測量點(diǎn)多

2019-06-25 08:12:12

分布式發(fā)電技術(shù)與微型電網(wǎng)

幾種分布式發(fā)電簡介2.分布式發(fā)電與配電網(wǎng)互聯(lián)問題3.微型電網(wǎng)技術(shù)4.分布式發(fā)電（電源）技術(shù)應(yīng)用的障礙和瓶頸5.分布式發(fā)電（電源）技術(shù)發(fā)展方向6.結(jié)語

2011-03-11 13:37:39

分布式聲波傳感系統(tǒng)DAS產(chǎn)品介紹

分布式聲波傳感系統(tǒng)DAS

2020-12-21 07:48:43

分布式數(shù)據(jù)庫有什么優(yōu)缺點(diǎn)？

分布式數(shù)據(jù)庫系統(tǒng)（DDBS）是數(shù)據(jù)庫技術(shù)和網(wǎng)絡(luò)技術(shù)兩者相互滲透和有機(jī)結(jié)合的結(jié)果。涉及數(shù)據(jù)庫基本理論和網(wǎng)絡(luò)通信理論。分布式數(shù)據(jù)庫由一組數(shù)據(jù)組成，這些數(shù)據(jù)在物理上分布在計算機(jī)網(wǎng)絡(luò)的不同節(jié)點(diǎn)上，邏輯上是屬于同一個系統(tǒng)。

2019-09-24 09:13:39

分布式文件系統(tǒng)和fastDFS

項(xiàng)目（1）（分布式文件系統(tǒng)、fastDFS，代碼實(shí)現(xiàn)fastDFS 文件上傳和下載）

2019-05-10 08:51:28

分布式電源分布式電源裝置是指什么？有何特點(diǎn)

區(qū)的電力供應(yīng)，節(jié)約輸變電投資，提高供電可靠性等。含義簡明的分布式電源定義為：35kV及以下電壓等級的電源，不能直接連接到中央輸電系統(tǒng)，主要包括發(fā)電設(shè)備和儲能裝置。特點(diǎn)分布式能源系統(tǒng)不是簡單地采用傳統(tǒng)的發(fā)電技術(shù)，而是基于自動控制系統(tǒng)、先進(jìn)的材料技術(shù)、靈活的制造技術(shù)等新技術(shù)，具有低污染排放

2021-12-29 06:51:27

分布式系統(tǒng)時鐘解決方案

)Naive HLC改進(jìn)HLC本文將首先依次簡單介紹分布式系統(tǒng)下的物理時鐘（Physical Time，也稱PT），邏輯時鐘（Logical Clock，也稱LC），向量時鐘（Vector Clock，也稱VC

2021-06-28 10:46:04

分布式系統(tǒng)的優(yōu)勢是什么？

當(dāng)討論分布式系統(tǒng)時，我們面臨許多以下這些形容詞所描述的同類型： 分布式的、刪絡(luò)的、并行的、并發(fā)的和分散的。分布式處理是一個相對較新的領(lǐng)域，所以還沒有‘致的定義。與順序計算相比、并行的、并發(fā)的和分布式的計算包括多個PE問的集體協(xié)同動作。這些術(shù)語在范圍一卜相互覆蓋，有時也交換使用?！?/div>

2020-03-31 09:01:18

分布式系統(tǒng)的組合相位噪聲性能怎么評估？

在分布式系統(tǒng)中，共同噪聲源是相關(guān)的，而分布式噪聲源如果不相關(guān)，在RF信號組合時就會降低。對于系統(tǒng)中的大部分組件，這都可以非常直觀地加以評估。對于鎖相環(huán)，環(huán)路中的每個組件都有與之相關(guān)聯(lián)的噪聲傳遞函數(shù)

2019-08-02 08:35:04

分布式系統(tǒng)硬件資源池原理和接入實(shí)踐

/distributedhardware_distributed_hardware_fwk 四、硬件資源池接入實(shí)踐 4.1 接口定義通過前文分析，可以看到分布式硬件與南向硬件的交互涉及\"硬件信息采集\"和\"驅(qū)動注冊\"兩類業(yè)務(wù)，與此

2023-12-06 10:02:45

分布式軟件系統(tǒng)

。更重要的是，NI LabVIEW 8的分布式智能提供的解決方案不僅令這些挑戰(zhàn)迎刃而解，且易于實(shí)施。LabVIEW 8的分布式智能具體包括: 可對分布式系統(tǒng)中的所有結(jié)點(diǎn)編程——包括主機(jī)和終端。尤為可貴

2009-07-22 14:53:12

分布式軟總線實(shí)現(xiàn)近場設(shè)備間統(tǒng)一的分布式通信管理能力如何？

現(xiàn)實(shí)中多設(shè)備間通信方式多種多樣(WIFI、藍(lán)牙等)，不同的通信方式使用差異大，導(dǎo)致通信問題多；同時還面臨設(shè)備間通信鏈路的融合共享和沖突無法處理等挑戰(zhàn)。那么分布式軟總線實(shí)現(xiàn)近場設(shè)備間統(tǒng)一的分布式通信管理能力如何呢？分布式軟總線組件架構(gòu)圖

2022-03-16 11:03:13

ARM Neoverse IP的AWS實(shí)例上etcd分布式鍵對值存儲性能提升

1、基于ARM Neoverse IP的AWS實(shí)例上etcd性能提升etcd是一個分布式鍵值對存儲，設(shè)計用來可靠而快速的保存關(guān)鍵數(shù)據(jù)并提供給分布式系統(tǒng)訪問，尤其被當(dāng)前最流行的容器編排

2022-07-06 17:37:31

HDC2021技術(shù)分論壇：分布式調(diào)試、調(diào)優(yōu)能力解決方案

作者：yangjianwei 華為高級工程師HarmonyOS致力于提供1+8+N智慧全場景解決方案，打造設(shè)備流轉(zhuǎn)、多端協(xié)同的分布式體驗(yàn)，實(shí)現(xiàn)一次開發(fā)、多端部署，讓分布式應(yīng)用的開發(fā)更加簡單。針對分布式

2021-11-22 17:17:01

HDC2021技術(shù)分論壇：如何高效完成HarmonyOS分布式應(yīng)用測試？

：分布式應(yīng)用涉及多臺設(shè)備協(xié)同時，由于缺乏全面且高效的隱私合規(guī)檢測方案，安全隱私問題攔截難度較大。鑒于以上HarmonyOS分布式應(yīng)用測試面臨的挑戰(zhàn)，華為DevEco Testing提供了一套

2021-12-13 14:55:05

HDC技術(shù)分論壇：分布式調(diào)試、調(diào)優(yōu)能力解決方案

HarmonyOS致力于提供1+8+N智慧全場景解決方案，打造設(shè)備流轉(zhuǎn)、多端協(xié)同的分布式體驗(yàn)，實(shí)現(xiàn)一次開發(fā)、多端部署，讓分布式應(yīng)用的開發(fā)更加簡單。針對分布式應(yīng)用的調(diào)試問題，DevEco Studio

2021-10-28 16:20:20

HarmonyOS分布式——跨設(shè)備遷移

2021-06-26 14:34:39

HarmonyOS分布式應(yīng)用框架深入解讀

KB級到GB級設(shè)備）。針對上述挑戰(zhàn)，HarmonyOS作為一款面向萬物互聯(lián)時代的、全新的分布式操作系統(tǒng)，將迎刃而解，這得益于HarmonyOS的分布式應(yīng)用框架，這些多設(shè)備組成一個超級終端，充分發(fā)揮

2021-11-22 15:15:05

HarmonyOS分布式數(shù)據(jù)庫，為啥這么牛？

考慮到照片數(shù)據(jù)在多設(shè)備間是怎么存儲、怎么共享和怎么訪問？ HarmonyOS 分布式數(shù)據(jù)管理的目標(biāo)就是為開發(fā)者在系統(tǒng)層面解決這些問題，讓應(yīng)用開發(fā)變得簡單。它能夠保證多設(shè)備間的數(shù)據(jù)安全，解決多設(shè)備

2020-11-19 15:38:55

HarmonyOS應(yīng)用開發(fā)-分布式設(shè)計

設(shè)計理念HarmonyOS 是面向未來全場景智慧生活方式的分布式操作系統(tǒng)。對消費(fèi)者而言，HarmonyOS 將生活場景中的各類終端進(jìn)行能力整合，形成“One Super Device”，以實(shí)現(xiàn)

2020-09-22 17:11:07

LED分布式恒流原理

本帖最后由 eehome 于 2013-1-5 09:49 編輯 1. 分布式恒流技術(shù)分布式恒流就是：在各并聯(lián)支路點(diǎn)均設(shè)立獨(dú)立恒流源，從而管理、維持、控制支路與整體線路穩(wěn)定。在使用上可視為一個

2011-03-09 16:47:54

OpenHarmony3.1分布式技術(shù)資料合集

)：對接分布式數(shù)據(jù)服務(wù)，用于存儲信任體系內(nèi)，本機(jī)和周邊設(shè)備同步過來的設(shè)備硬件信息。分布式硬件部件管理(ComponentManager)：對接各分布式硬件實(shí)例化的部件，實(shí)現(xiàn)對分布式硬件的動態(tài)加載和使能

2022-04-11 11:50:05

Qorvo分布式Wi-Fi網(wǎng)格解決方案

實(shí)現(xiàn)互聯(lián)世界的創(chuàng)新RF解決方案提供商Qorvo宣布，正使用 802.11ax 產(chǎn)品組合擴(kuò)大分布式 Wi-Fi 解決方案在住宅中的適用范圍。該產(chǎn)品組合可改善 Wi-Fi 覆蓋范圍，幫助實(shí)現(xiàn)更小的器件

2020-11-02 07:01:11

RTX在分布式實(shí)時仿真系統(tǒng)中的應(yīng)用是什么？

基于反射內(nèi)存實(shí)時局域網(wǎng)的特點(diǎn)是什么？基于反射內(nèi)存卡實(shí)時局域網(wǎng)的實(shí)現(xiàn)機(jī)制RTX在分布式實(shí)時仿真系統(tǒng)中的應(yīng)用

2021-05-19 06:46:01

TSP分布式控制有什么優(yōu)勢？

TSP分布式控制有什么優(yōu)勢？TSP分布式控制提高了測試速度并且降低了測試成本。

2021-05-12 06:19:56

docker的分布式zabbix安裝流程

docker安裝分布式zabbix

2019-10-24 07:33:40

labview分布式壓力測量

基于labview的分布式壓力采集系統(tǒng)，用于假肢接受腔內(nèi)部接觸面的壓力測量，選擇哪種壓力傳感器和采集卡比較合適，求推薦。

2015-05-19 14:31:25

【學(xué)習(xí)打卡】OpenHarmony的分布式任務(wù)調(diào)度

、同步、注冊、調(diào)用）機(jī)制。分布式任務(wù)調(diào)度程序是能夠跨多個服務(wù)器啟動調(diào)度作業(yè)或工作負(fù)載的軟件解決方案，整個過程是不需要人來值守的。舉個例子，我們可以在一臺或多臺機(jī)器上安裝分布式調(diào)度器，用戶可以通過它在

2022-07-18 17:06:45

【學(xué)習(xí)打卡】OpenHarmony的分布式數(shù)據(jù)管理介紹

分布式數(shù)據(jù)管理，英文縮寫是DDM，是對一個系統(tǒng)中創(chuàng)建和收集的數(shù)據(jù)的提取、存儲、組織和維護(hù)的過程進(jìn)行的有效控制和管理。有效的數(shù)據(jù)管理對于運(yùn)行應(yīng)用程序，以及提供分析信息來幫助整個系統(tǒng)進(jìn)行規(guī)劃和決策，從而

2022-07-15 15:49:32

一行代碼，保障分布式事務(wù)一致性—GTS:微服務(wù)架構(gòu)下分布式事務(wù)解決方案

、grpc等。1 分布式事務(wù)解決方案及其弊端雖然微服務(wù)現(xiàn)在如火如荼，但對其實(shí)踐其實(shí)仍處于初級階段。即使互聯(lián)網(wǎng)巨頭的實(shí)踐也大多是試驗(yàn)層面，鮮有核心業(yè)務(wù)系統(tǒng)微服務(wù)化的案例。而對于很多中小型互聯(lián)網(wǎng)公司

2018-06-05 19:14:05

使用分布式I/O進(jìn)行實(shí)時部署系統(tǒng)的設(shè)計

的8插槽機(jī)箱，與LabVIEW Real-Time的強(qiáng)大功能相結(jié)合，為確定性分布式I/O提供了便捷的解決方案。介紹當(dāng)你需要在實(shí)時控制系統(tǒng)中設(shè)計分布式I/O時，你將怎么辦？首要問題就是如何在添加I/O

2011-03-12 17:47:04

關(guān)于分布式系統(tǒng)的全面介紹

操作系統(tǒng)-----分布式系統(tǒng)概述

2019-07-25 06:59:49

分享一款不錯的基于無線傳感器網(wǎng)絡(luò)的分布式電磁探測系統(tǒng)方案

分享一款不錯的基于無線傳感器網(wǎng)絡(luò)的分布式電磁探測系統(tǒng)方案

2021-05-26 06:06:16

華為鴻蒙系統(tǒng) HarmonyOS 2.0 京東、美團(tuán)、優(yōu)酷等軟件，分布式跨設(shè)備交互演示及簡單說明

華為鴻蒙系統(tǒng) HarmonyOS 2.0京東、美團(tuán)、優(yōu)酷等軟件，分布式跨設(shè)備交互演示及簡單說明

2021-01-14 09:52:00

華為鴻蒙系統(tǒng) HarmonyOS 2.0 京東、美團(tuán)、優(yōu)酷等軟件，分布式跨設(shè)備交互演示及簡單說明

華為鴻蒙系統(tǒng) HarmonyOS 2.0 京東、美團(tuán)、優(yōu)酷等軟件，分布式跨設(shè)備交互演示及簡單說明

2021-01-27 08:00:00

各種分布式電源的電氣特性

PS：滲透率的概念：從字面上理解，“滲透”就是由分布式電源發(fā)出的功率進(jìn)入（滲入）到配電系統(tǒng)，所謂的“率”就是由分布式電源發(fā)出的電和整個系統(tǒng)所消耗的電（或者說總發(fā)電量）的一個比值。各種分布式電源的電氣

2021-07-12 07:54:19

在NI分布式管理器創(chuàng)建共享變量失敗，想請教各位原因

在NI分布式管理器創(chuàng)建共享變量失?。涸谶@里創(chuàng)建了一個變量爐批次號但現(xiàn)實(shí)質(zhì)量是進(jìn)程失敗并且關(guān)閉了NI分布式管理器后就沒有這個變量了，請問這是什么情況?

2018-11-06 13:27:10

基于分布式調(diào)用鏈監(jiān)控技術(shù)的全息排查功能

鏈路的分布式鏈路追蹤功能結(jié)合周邊的本地堆棧排查，性能Metrics統(tǒng)計，業(yè)務(wù)全息排查三大附加功能，形成了完整的鏈路監(jiān)控解決方案。為方便用戶了解ARMS 基于分布式鏈路追蹤技術(shù)的全息排查功能

2018-08-07 17:02:57

基于Druid的Kylin存儲引擎實(shí)踐的三個部分分析

美團(tuán)點(diǎn)評：基于Druid的Kylin存儲引擎實(shí)踐

2019-07-18 10:40:44

基于ZigBee的分布式電子警察系統(tǒng)該如何去設(shè)計？

一種基于ZigBee和ModBus的分布式電子警察系統(tǒng)設(shè)計

2021-05-31 06:24:15

基于充電樁的分布式能源解決方案分享

本論文主要就區(qū)塊鏈在電能方面的具體應(yīng)用進(jìn)行系統(tǒng)性的研究及分析，構(gòu)造出新型的智能化產(chǎn)品。本文從基于區(qū)塊鏈的充電樁的角度出發(fā)，對其產(chǎn)品設(shè)計，電能傳輸流程，價值產(chǎn)生方式進(jìn)行了具體的展開。并從電能的入口即分布式太陽能發(fā)電、電能傳輸、充電樁電能輸出及價值轉(zhuǎn)移等角度進(jìn)行了詳細(xì)的方案設(shè)計。

2021-12-29 07:51:51

基于閃存存儲的Apache Kafka性能提升方法

據(jù)生態(tài)系統(tǒng)中最常用的分布式消息傳遞系統(tǒng)之一的Apache Kafka進(jìn)行評估，測試如何以最佳方式將美光固態(tài)存儲應(yīng)用于 Apache Kafka，以及將產(chǎn)生怎樣的收益。A

2019-07-24 06:58:39

多個Profinet遠(yuǎn)程分布式IO模塊能否共用一個GSD文件

華杰智控Profinet遠(yuǎn)程分布式IO模塊上有一個modbus互轉(zhuǎn)Profinet網(wǎng)關(guān)，有什么作用？多個Profinet遠(yuǎn)程分布式IO模塊能否共用一個GSD文件？

2021-09-27 08:45:14

如何使用Jmeter進(jìn)行分布式測試；檢索日志？

使用 Jmeter 進(jìn)行分布式測試；檢索日志

2023-05-10 13:00:46

如何利用FPGA設(shè)計無線分布式采集系統(tǒng)？

近些年來，隨著電子技術(shù)的發(fā)展，無線通信技術(shù)、計算機(jī)網(wǎng)絡(luò)的發(fā)展，分布式無線數(shù)據(jù)采集網(wǎng)絡(luò)技術(shù)開始興起，并迅速的應(yīng)用到各個領(lǐng)域。在一些地形復(fù)雜，不適合人類出現(xiàn)的區(qū)域需要進(jìn)行數(shù)據(jù)采集的情況下，都可以適當(dāng)

2019-10-14 07:10:38

如何去實(shí)現(xiàn)一種分布式計算技術(shù)

分布式計算技術(shù)是什么？如何去實(shí)現(xiàn)一種分布式計算技術(shù)？

2021-09-24 07:52:34

如何去設(shè)計分布式車身控制系統(tǒng)？

分布式車身控制系統(tǒng)的結(jié)構(gòu)是怎樣構(gòu)成的？分布式車身控制系統(tǒng)有哪些功能？

2021-05-13 07:03:30

如何對分布式天線系統(tǒng)(DAS)進(jìn)行優(yōu)化？

什么是分布式天線系統(tǒng)？如何對分布式天線系統(tǒng)(DAS)進(jìn)行優(yōu)化？

2021-05-24 06:03:56

如何設(shè)計分布式干擾系統(tǒng)？

什么是分布式干擾系統(tǒng)？分布式干擾系統(tǒng)是一種綜合化、一體化、小型化、網(wǎng)絡(luò)化和智能化系統(tǒng)，是將眾多體積小，重量輕，廉價的小功率偵察干擾機(jī)裝置在易于投放的小型平臺上，撒布在接近***擾目標(biāo)空域地，通過指令

2019-08-08 06:57:44

如何設(shè)計基于分布式算法的FIR濾波器？

FIR濾波器的原理及結(jié)構(gòu)是什么基于分布式算法的FIR濾波器的實(shí)現(xiàn)

2021-05-08 08:39:41

如何高效完成HarmonyOS分布式應(yīng)用測試？

2021-12-13 18:07:58

常見的分布式供電技術(shù)有哪些？

　　分布式供電技術(shù)是指將發(fā)電設(shè)備建設(shè)在用戶或供電系統(tǒng)端，將發(fā)電與負(fù)荷直接相連，通過局部供電的方式滿足用戶的電力需求。其主要特點(diǎn)是將傳統(tǒng)的集中式供電方式改為分散式供電方式，不僅既有大型電站向小型分布式

2023-04-10 16:28:30

微服務(wù)架構(gòu)下分布式事務(wù)解決方案 —— 阿里GTS

摘要：本文將深入和大家探討微服務(wù)架構(gòu)下，分布式事務(wù)的各種解決方案，并重點(diǎn)為大家解讀阿里巴巴提出的分布式事務(wù)解決方案----GTS。該方案中提到的GTS是全新一代解決微服務(wù)問題的分布式事務(wù)互聯(lián)網(wǎng)

2018-03-16 11:14:19

怎么入門DevEco Studio 分布式跨設(shè)備應(yīng)用開發(fā)？

想知道怎么入門DevEco Studio 分布式跨設(shè)備應(yīng)用開發(fā)？

2020-09-18 15:50:30

怎么實(shí)現(xiàn)一種分布式視頻服務(wù)器的設(shè)計？

本文討論了一種分布式視頻服務(wù)器的設(shè)計與實(shí)現(xiàn)。

2021-06-08 06:55:11

怎樣去設(shè)計分布式電容共面波導(dǎo)結(jié)構(gòu)式移相器？

BST材料的特性是什么？怎樣去設(shè)計分布式電容共面波導(dǎo)結(jié)構(gòu)式移相器？

2021-06-08 06:55:30

怎樣去設(shè)計一種小容量分布式光伏電站信息采集系統(tǒng)

小容量分布式光伏電站信息采集系統(tǒng)是由哪些部分組成的？怎樣去設(shè)計一種小容量分布式光伏電站信息采集系統(tǒng)？

2021-10-22 06:22:39

我國分布式光伏發(fā)電發(fā)展現(xiàn)狀

我國分布式光伏發(fā)電發(fā)展現(xiàn)狀光伏產(chǎn)業(yè)產(chǎn)能過剩的矛盾由來已久。我國光伏組件產(chǎn)量自2007年以來，連續(xù)5年位居世界第一。2011年，我國光伏組件產(chǎn)量是當(dāng)年新增安裝容量的10倍，90%的光伏組件需要銷往國外

2014-04-22 14:38:48

求一種分布式光伏發(fā)電監(jiān)測系統(tǒng)解決方案

分布式電站的形成基礎(chǔ)，在碳中和方案的可選項(xiàng)中，分布式光伏由于其靈活性必將被大力發(fā)展，目前已有河北、甘肅、安徽、浙江、

2021-09-10 06:33:15

求一種基于FPGA分布式算法的濾波器設(shè)計的實(shí)現(xiàn)方案

分布式的濾波器算法是什么？一種基于FPGA分布式算法的濾波器設(shè)計實(shí)現(xiàn)

2021-04-29 07:13:23

求一種獨(dú)特的DCS分布式系統(tǒng)的測試方案

本文介紹一種獨(dú)特的DCS分布式系統(tǒng)的測試方案，對分布在一個網(wǎng)絡(luò)中多臺電腦上的各個系統(tǒng)模塊（每臺電腦運(yùn)行多個系統(tǒng)模塊）同時測試，監(jiān)視其覆蓋率、內(nèi)存泄漏、運(yùn)行性能等重要測試指標(biāo)。測試工具選用美國Metrowerks公司的CodeTest嵌入式測試工具。

2021-04-26 06:57:33

淺談分布式緩存技術(shù)

存儲成本分布式緩存應(yīng)用場景1，用于緩存網(wǎng)頁的內(nèi)容片段，包括HTML，CSS和圖像等，主要用于社交網(wǎng)站;2，緩存系統(tǒng)作為ORM框架的二級緩存提供外部服務(wù)，減輕了數(shù)據(jù)庫的負(fù)載壓力，加快了應(yīng)用訪問;3.緩存

2018-11-16 15:45:55

萌新求助，求一個分布式光伏發(fā)電監(jiān)測系統(tǒng)解決方案

萌新求助，求一個分布式光伏發(fā)電監(jiān)測系統(tǒng)解決方案

2021-10-22 07:59:10

請問一下HarmonyOS的分布式數(shù)據(jù)庫是存在每個設(shè)備上的嗎

請問一下HarmonyOS的分布式數(shù)據(jù)庫是存在每個設(shè)備上的嗎？數(shù)據(jù)同步時數(shù)據(jù)又是怎么存儲的？求解答

2022-03-18 11:14:01

請問怎么設(shè)計一種分布式無線測控系統(tǒng)？

怎么設(shè)計一種分布式無線測控系統(tǒng)？無線測控網(wǎng)絡(luò)系統(tǒng)具有哪些優(yōu)點(diǎn)及應(yīng)用？

2021-04-13 06:29:32

鴻蒙分布式任務(wù)調(diào)度

鴻蒙分布式任務(wù)調(diào)度，實(shí)現(xiàn)跨設(shè)備FA拉起

2021-06-12 17:28:39

分布式存儲架構(gòu)：第一節(jié) 什么是分布式存儲??#云計算培訓(xùn)?#大數(shù)據(jù)?#分布式存儲?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:28:10

分布式存儲架構(gòu)：第二節(jié) 分布式存儲優(yōu)勢??#云計算?#大數(shù)據(jù)??#分布式存儲?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:28:31

分布式存儲架構(gòu)：第三節(jié) 分布式文件模型?#分布式架構(gòu)??#分布式存儲系統(tǒng)?#分布式系統(tǒng)?#硬聲創(chuàng)作季

云計算存儲系統(tǒng)分布式系統(tǒng)分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:28:49

分布式存儲架構(gòu)：第四節(jié) 分布式數(shù)據(jù)分片?#云計算?#大數(shù)據(jù)??#分布式存儲#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:29:06

分布式存儲架構(gòu)：第五節(jié) 分布式數(shù)據(jù)存儲引擎?#云計算?#大數(shù)據(jù)?#分布式存儲?#硬聲創(chuàng)作季

云計算數(shù)據(jù)存儲引擎分布式存儲數(shù)據(jù)存儲技術(shù)數(shù)據(jù)存儲器分布式存儲系統(tǒng)數(shù)據(jù)存儲方式

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:29:23

分布式存儲架構(gòu)：第六節(jié) 分布式CAP原則?#云計算??#分布式存儲??#cap?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:29:39

分布式存儲架構(gòu)：第八節(jié) 分布式數(shù)據(jù)即刻修復(fù)?#分布式存儲?#數(shù)據(jù)修復(fù)?#大數(shù)據(jù)?#硬聲創(chuàng)作季

云計算修復(fù)分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:30:38

分布式存儲架構(gòu)：第九節(jié) 分布式數(shù)據(jù)存儲方式?#大數(shù)據(jù)?#分布式存儲?#分布式?#硬聲創(chuàng)作季

云計算數(shù)據(jù)存儲分布式存儲數(shù)據(jù)存儲技術(shù)數(shù)據(jù)存儲器分布式存儲系統(tǒng)數(shù)據(jù)存儲方式

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:31:06

分布式存儲架構(gòu)：第十一節(jié) Ceph 功能優(yōu)勢??#分布式存儲?#大數(shù)據(jù)?#ceph分布式存儲?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:31:58

分布式存儲架構(gòu)：第十一節(jié) Ceph 功能優(yōu)勢??#分布式存儲?#大數(shù)據(jù)?#ceph分布式存儲?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:32:27

分布式存儲架構(gòu)：第十二節(jié) Ceph 應(yīng)用場景??#分布式存儲?#大數(shù)據(jù)?#ceph分布式存儲?#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:57:46

分布式存儲架構(gòu)：第十三節(jié) Ceph 分布式存儲架構(gòu)?#分布式存儲?#大數(shù)據(jù)?#ceph分布式存#硬聲創(chuàng)作季

云計算分布式存儲分布式存儲系統(tǒng)

學(xué)習(xí)硬聲知識發(fā)布于 2022-10-21 14:58:13

什么是分布式存儲技術(shù)？有哪些應(yīng)用？

分布式存儲概念與目前常見的集中式存儲技術(shù)不同，分布式存儲技術(shù)并不是將數(shù)據(jù)存儲在某個或多個特定的節(jié)點(diǎn)上，而是通過網(wǎng)絡(luò)使用企業(yè)中的每臺機(jī)器上的磁盤空間，并將這些分散的存儲資源構(gòu)成一個虛擬的存儲設(shè)備

2017-11-17 09:26:41