chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

工業(yè)互聯(lián)網時代,我們?yōu)槭裁葱枰獣r序數(shù)據庫之二:適合的就是最好的

格創(chuàng)東智 ? 2019-04-28 19:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在上周的格物匯文章中,我們給大家介紹過,目前國內外主流工業(yè)互聯(lián)網平臺幾乎都是采用時序數(shù)據庫來承接海量涌入的工業(yè)數(shù)據。那為什么強大的Oracle、PostgreSQL 等傳統(tǒng)關系型數(shù)據庫搞不定時序數(shù)據?為什么不用HBase、MongoDB、Cassandra等先進的分布式數(shù)據庫來解決工業(yè)數(shù)據問題?


作為資深“杠精”,當然需要先知道要“杠”的到底是什么?就時序數(shù)據庫而言,就是要“杠”兩個東西:1、“杠”數(shù)據;2、“杠”數(shù)據庫。


先從數(shù)據“杠”起,數(shù)據可是一個高深莫測的東西。


想當年圖靈用他深邃的眼睛,看穿了世間萬物的計算本質:凡是可以計算的,通過迭代,最終都可以表示為0、1的邏輯判斷。圖靈機需要一個無限長的紙帶來表征和記錄計算,這無限長的紙帶上記錄的0、1的組合,就是數(shù)據最原始的抽象。圖靈機指出了數(shù)據的3個核心需求:1、數(shù)據存儲;2、數(shù)據寫入;3、數(shù)據讀取。


可以說,目前所有數(shù)據庫、文件系統(tǒng)等等,都是為了以最佳性價比來滿足數(shù)據的這三個核心需求。對時序數(shù)據而言,其三個核心需求特征十分明顯:


數(shù)據寫入

  • 時間是一個主坐標軸,數(shù)據通常按照時間順序抵達

  • 大多數(shù)測量是在觀察后的幾秒或幾分鐘內寫入的,抵達的數(shù)據幾乎總是作為新條目被記錄

  • 95%到99%的操作是寫入,有時更高

  • 更新幾乎沒有


數(shù)據讀取

  • 隨機位置的單個測量讀取、刪除操作幾乎沒有

  • 讀取和刪除是批量的,從某時間點開始的一段時間內

  • 時間段內讀取的數(shù)據有可能非常巨大


數(shù)據存儲

  • 數(shù)據結構簡單,價值隨時間推移迅速降低

  • 通過壓縮、移動、刪除等手段降低存儲成本


關系數(shù)據庫主要應對的數(shù)據特點:

1)數(shù)據寫入:大多數(shù)操作都是DML操作,插入、更新、刪除等;

(2)數(shù)據讀?。鹤x取邏輯一般都比較復雜;

(3)數(shù)據存儲:很少壓縮,一般也不設置數(shù)據生命周期管理。


因此,從數(shù)據本質的角度而言,時序數(shù)據庫(不變性, 唯一性以及可排序性)和關系型數(shù)據庫的服務需求完全不同。


再說說數(shù)據庫。數(shù)據庫系統(tǒng)的發(fā)展從20世紀60年代中期開始到現(xiàn)在,經歷若干代演變,造就了C.W. Bachman(巴克曼)、E.F.Codd(考特)和J. Gray(格雷)三位圖靈獎得主,發(fā)展了以數(shù)據科學、數(shù)據建模和數(shù)據庫管理系統(tǒng)(DBMS)等為核心理論、技術和產品的一個巨大的軟件產業(yè)(詳見下圖,資料來源:https://db-engines.com/en/ranking_categories)。


圖片 1.png


從上圖可以得出一個結論,針對不同的數(shù)據需求,應該有不同的數(shù)據庫系統(tǒng)應對之。否則,也沒有必要出現(xiàn)這么多種的數(shù)據庫系統(tǒng)了。


時間序列數(shù)據跟關系型數(shù)據庫有太多不同,但是很多公司并不想放棄關系型數(shù)據庫。于是就產生了一些特殊的用法,比如:用 MySQL 的 VividCortex, 用 Postgres 的 TimescaleDB;當然,還有人依賴K-V、NoSQL數(shù)據庫或者列式數(shù)據庫的,比如:OpenTSDB的HBase,而Druid則是一個不折不扣的列式存儲系統(tǒng);更多人覺得特殊的問題需要特殊的解決方法,于是很多時間序列數(shù)據庫從頭寫起,不依賴任何現(xiàn)有的數(shù)據庫, 比如: Graphite,InfluxDB。


圖片 2.png


對選擇數(shù)據庫的開發(fā)者和使用者而言,針對時序數(shù)據庫和關系型數(shù)據庫之間選擇,也主要考慮以下幾個因素:


性能

研究過Oracle的存儲結構和索引結構的都知道Oracle的ACID強一致性和B-Tree,保證強一致性導致數(shù)據持久化、可靠性、可用性實現(xiàn)的邏輯復雜,而加速數(shù)據訪問,則需要Oracle 數(shù)據庫使用 B-Tree 存儲索引。


B-Tree 結構的有很多優(yōu)勢:在索引中從任何地方檢索任何記錄都大約花費相同的時間;B-Tree對大范圍查詢提供優(yōu)秀的檢索性能,包括精確匹配和訪問查詢;插入、更新和刪除操作有效,維護鍵的順序,以便快速檢索;B-Tree性能對小表和大表都很好,不會隨著表的增長而降低。從Tree這個名字就可以看出,這種B-Tree就是為了解決隨機讀寫問題的。


而時序數(shù)據庫,核心問題去解決批量讀寫,對于 95% 以上場景都是寫入的時序數(shù)據庫,B-Tree 很明顯是不合適的,業(yè)界主流都是采用 LSM Tree(Log Structured Merge Tree)或者LSM的“升級版”TSM(Time Sort Merge Tree) 替換 B-Tree,比如 Hbase、Cassandra、InfluxDB等。LSM Tree 核心思想就是通過內存寫和后續(xù)磁盤的順序寫入獲得更高的寫入性能,避免了隨機寫入。


LSM Tree 簡單操作流程如下:

  • 數(shù)據寫入和更新時首先寫入位于內存里的數(shù)據結構。同時,為了避免數(shù)據丟失也會先寫到磁盤文件中。

  • 內存里的數(shù)據結構會定時或者達到固定大小會刷到磁盤。

  • 隨著磁盤上積累的文件越來越多,會定時的進行合并操作,減少文件數(shù)量。

  • 在內存or文件中,對數(shù)據進行壓縮、去重等操作。


還有一個提升性能的關鍵點,即:分布式處理。這里以InfluxDB為例來說明。(順便吐槽一下:InfluxDB單機版開源,集群版收費……,扔個魚餌,“吃相”難看呀。)


圖片 3.png


上圖是InfluxDB的邏輯存儲架構圖,通過RP、ShardGroup、Shard的逐層分解,寫入數(shù)據被盡可能的分布攤平。最后,每個Shard的TSM引擎負責對數(shù)據進行處理。Shard Group實現(xiàn)了數(shù)據分區(qū),但是Shard才是InfluxDB中真正存儲數(shù)據以及提供讀寫服務的服務。Shard是InfluxDB的TSM Engine,負責數(shù)據的編碼存儲、讀寫服務等。

圖片 4.png

通常分布式數(shù)據庫一般有兩種Sharding策略:Range Sharding和Hash Sharding,前者對于基于主鍵的范圍掃描比較高效;后者對于離散大規(guī)模寫入以及隨即讀取相對比較友好。


InfluxDB的Sharding策略是典型的兩層Sharding,上層使用Range Sharding,下層使用Hash Sharding。對于時序數(shù)據庫來說,基于時間的Range Sharding是最合理的考慮,但如果僅僅使用Time Range Sharding,會存在一個很嚴重的問題,即寫入會存在熱點,基于TimeRange Sharding的時序數(shù)據庫寫入必然會落到最新的Shard上,其他老Shard不會接收寫入請求。對寫入性能要求很高的時序數(shù)據庫來說,熱點寫入肯定不是最優(yōu)的方案。解決這個問題最自然的思路就是再使用Hash進行一次分區(qū),基于Key的Hash分區(qū)方案可以通過散列很好地解決熱點寫入的問題。


Shard分區(qū)好了,就可以采用分布式集群架構予以支撐,分攤壓力,提高并行度。



成本和功能

很多時間序列數(shù)據都沒有多大用處,特別是當系統(tǒng)長時間正常運行時,完整的歷史數(shù)據意義并不大。而這些低價值數(shù)據,占據大量高價值存儲空間,會讓企業(yè)“抓狂”。因此,一些共通的對時間序列數(shù)據分析的功能和操作:數(shù)據壓縮、數(shù)據保留策略、連續(xù)查詢、靈活的時間聚合等,都是為了解決時序數(shù)據庫的性價比問題的。同時,有些數(shù)據庫比如 RDDTool 和 Graphite 會自動刪除高精度的數(shù)據,只保留低精度的。而這些“功能”對關系型數(shù)據庫而言,簡直是不可想象的。


還有一些成本很多人會忘記考慮,比如:License,用需要License的關系型數(shù)據庫來存儲時序數(shù)據,成本根本沒法承受。


至此,我們得出的結論就一個:選擇到底用什么數(shù)據庫來支持時序數(shù)據,還是需要對時序數(shù)據的需求進行透徹的分析,然后根據時序數(shù)據的特點,來選擇適合的數(shù)據庫。


啟用名言作為本文結尾:適合的,就是最好的。


640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1

本文作者:格創(chuàng)東智首席架構師王錦博士。格創(chuàng)東智是由智能產品制造及互聯(lián)網應用服務領軍企業(yè)TCL孵化的創(chuàng)新型科技公司,致力于深度融合人工智能AI)、大數(shù)據、云計算等前沿技術與制造行業(yè)經驗,打造行業(yè)領先的“制造x”工業(yè)互聯(lián)網平臺,同時為各類制造業(yè)企業(yè)提供優(yōu)質、安全、高效的管理IT服務,助力傳統(tǒng)制造業(yè)智能化轉型升級。(轉載請注明作者及來源)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    工業(yè)互聯(lián)網的重要價值

    工業(yè)互聯(lián)網作為新一代信息通信技術與工業(yè)經濟深度融合的新型基礎設施、應用模式和工業(yè)生態(tài),其重要價值體現(xiàn)在經濟、產業(yè)、社會和技術四個層面,具體如下: 經濟價值:驅動增長新引擎 創(chuàng)造顯著經濟
    的頭像 發(fā)表于 11-20 09:51 ?163次閱讀

    工業(yè)互聯(lián)網架構是怎么樣的

    工業(yè)互聯(lián)網架構是支撐工業(yè)全要素、全產業(yè)鏈、全價值鏈互聯(lián)互通的核心框架,通過“數(shù)據+算力+模型”驅動工業(yè)
    的頭像 發(fā)表于 10-18 09:37 ?291次閱讀

    工業(yè)互聯(lián)網中的智能網關有什么功能

    工業(yè)互聯(lián)網中的智能網關是連接物理設備與工業(yè)互聯(lián)網的核心組件,具備數(shù)據采集、協(xié)議轉換、邊緣計算、安全防護、遠程管理等多重功能,是實現(xiàn)
    的頭像 發(fā)表于 10-14 11:00 ?288次閱讀
    <b class='flag-5'>工業(yè)</b><b class='flag-5'>互聯(lián)網</b>中的智能網關有什么功能

    工業(yè)互聯(lián)網平臺與數(shù)據中臺的關系

    工業(yè)互聯(lián)網平臺與數(shù)據中臺在工業(yè)數(shù)字化轉型中扮演不同角色,但者通過技術融合與能力互補形成協(xié)同效應,共同推動
    的頭像 發(fā)表于 09-26 09:45 ?261次閱讀

    數(shù)字化轉型為什么需要工業(yè)互聯(lián)網

    數(shù)字化轉型需要工業(yè)互聯(lián)網,是因為工業(yè)互聯(lián)網通過連接設備、數(shù)據和流程,為制造業(yè)及
    的頭像 發(fā)表于 06-21 09:12 ?522次閱讀

    鯤云科技入選AII工業(yè)互聯(lián)網應用案例

    )重磅發(fā)布 “2023-2024 年工業(yè)互聯(lián)網應用案例”,鯤云科技憑借 “基于可重構數(shù)據流AI芯片的智慧工地監(jiān)管平臺” 成功入選,成為推動工地安全監(jiān)管數(shù)字化轉型的標桿范例。
    的頭像 發(fā)表于 06-16 17:12 ?1096次閱讀

    工業(yè)互聯(lián)網工業(yè)聯(lián)網有什么區(qū)別

    工業(yè)互聯(lián)網工業(yè)聯(lián)網(IIoT)在概念、側重點、應用范圍、技術架構、數(shù)據價值等方面存在一定區(qū)別,以下是詳細介紹: 概念
    的頭像 發(fā)表于 06-12 09:32 ?1280次閱讀

    研華科技亮相2025工業(yè)互聯(lián)網大會

    研華科技受邀出席工業(yè)互聯(lián)網大會,研華(中國)工業(yè)聯(lián)網事業(yè)群總經理蔡奇男參與《人工智能時代,工業(yè)
    的頭像 發(fā)表于 05-23 15:27 ?811次閱讀

    TDengine 發(fā)布時序數(shù)據分析 AI 智能體 TDgpt,核心代碼開源

    組成部分,標志著時序數(shù)據庫在原生集成 AI 能力方面邁出了關鍵一步。 TDgpt 是內嵌于 TDengine 中的時序數(shù)據分析 AI 智能體,具備時序數(shù)據預測、異常檢測、數(shù)據補全、分類
    的頭像 發(fā)表于 03-27 10:30 ?548次閱讀
    TDengine 發(fā)布<b class='flag-5'>時序數(shù)據</b>分析 AI 智能體 TDgpt,核心代碼開源

    MySQL數(shù)據庫的安裝

    MySQL數(shù)據庫的安裝 【一】各種數(shù)據庫的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【】MySQL 介紹
    的頭像 發(fā)表于 01-14 11:25 ?846次閱讀
    MySQL<b class='flag-5'>數(shù)據庫</b>的安裝

    數(shù)據庫是哪種數(shù)據庫類型?

    數(shù)據庫是一種部署在虛擬計算環(huán)境中的數(shù)據庫,它融合了云計算的彈性和可擴展性,為用戶提供高效、靈活的數(shù)據庫服務。云數(shù)據庫主要分為兩大類:關系型數(shù)據庫
    的頭像 發(fā)表于 01-07 10:22 ?779次閱讀

    時序數(shù)據庫TDengine 2024年保持高增長,實現(xiàn)收入翻倍

    近日,時序數(shù)據庫 (Time Series Database) TDengine 正式公布了 2024 年重大成就和發(fā)展成績盤點。在這一年中,TDengine 以持續(xù)創(chuàng)新的技術能力、迅猛增長的市場
    的頭像 發(fā)表于 01-02 13:50 ?789次閱讀
    <b class='flag-5'>時序數(shù)據庫</b>TDengine 2024年保持高增長,實現(xiàn)收入翻倍