chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Prometheus Metric的實(shí)踐總結(jié)

馬哥Linux運(yùn)維 ? 來(lái)源:馬哥Linux運(yùn)維 ? 2023-01-06 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

使用 Promethues 實(shí)現(xiàn)應(yīng)用監(jiān)控的一些實(shí)踐

在這篇文章中我們介紹了如何利用 Prometheus 監(jiān)控應(yīng)用。在后續(xù)的工作中隨著監(jiān)控的深入,我們結(jié)合自己的經(jīng)驗(yàn)和官方文檔總結(jié)了一些 Metrics 的實(shí)踐。希望這些實(shí)踐能給大家提供參考。

確定監(jiān)控對(duì)象

在具體設(shè)計(jì) Metrics 之前,首先需要明確需要測(cè)量的對(duì)象。需要測(cè)量的對(duì)象應(yīng)該依據(jù)具體的問題背景、需求和需監(jiān)控的系統(tǒng)本身來(lái)確定。

從需求出發(fā)

Google 針對(duì)大量分布式監(jiān)控的經(jīng)驗(yàn)總結(jié)出四個(gè)監(jiān)控的黃金指標(biāo),這四個(gè)指標(biāo)對(duì)于一般性的監(jiān)控測(cè)量對(duì)象都具有較好的參考意義。這四個(gè)指標(biāo)分別為:

延遲:服務(wù)請(qǐng)求的時(shí)間。

通訊量:監(jiān)控當(dāng)前系統(tǒng)的流量,用于衡量服務(wù)的容量需求。

錯(cuò)誤:監(jiān)控當(dāng)前系統(tǒng)所有發(fā)生的錯(cuò)誤請(qǐng)求,衡量當(dāng)前系統(tǒng)錯(cuò)誤發(fā)生的速率。

飽和度:衡量當(dāng)前服務(wù)的飽和度。主要強(qiáng)調(diào)最能影響服務(wù)狀態(tài)的受限制的資源。例如,如果系統(tǒng)主要受內(nèi)存影響,那就主要關(guān)注系統(tǒng)的內(nèi)存狀態(tài)。

以上四種指標(biāo),其實(shí)是為了滿足四個(gè)監(jiān)控需求:

反映用戶體驗(yàn),衡量系統(tǒng)核心性能。如:在線系統(tǒng)的時(shí)延,作業(yè)計(jì)算系統(tǒng)的作業(yè)完成時(shí)間等。

反映系統(tǒng)的吞吐量。如:請(qǐng)求數(shù),發(fā)出和接收的網(wǎng)絡(luò)包大小等。

幫助發(fā)現(xiàn)和定位故障和問題。如:錯(cuò)誤計(jì)數(shù)、調(diào)用失敗率等。

反映系統(tǒng)的飽和度和負(fù)載。如:系統(tǒng)占用的內(nèi)存、作業(yè)隊(duì)列的長(zhǎng)度等。

除了以上常規(guī)需求,還可根據(jù)具體的問題場(chǎng)景,為了排除和發(fā)現(xiàn)以前出現(xiàn)過或可能出現(xiàn)的問題,確定相應(yīng)的測(cè)量對(duì)象。比如,系統(tǒng)需要經(jīng)常調(diào)用的一個(gè)庫(kù)的接口可能耗時(shí)較長(zhǎng),或偶有失敗,可制定 Metrics 以測(cè)量這個(gè)接口的時(shí)延和失敗數(shù)。

從需要監(jiān)控的系統(tǒng)出發(fā)

為了滿足相應(yīng)的需求,不同系統(tǒng)需要觀測(cè)的測(cè)量對(duì)象也是不同的。在 官方文檔 的最佳實(shí)踐中,將需要監(jiān)控的應(yīng)用分為了三類:

線上服務(wù)系統(tǒng)(Online-serving systems):需對(duì)請(qǐng)求做即時(shí)的響應(yīng),請(qǐng)求發(fā)起者會(huì)等待響應(yīng)。如 web 服務(wù)器。

離線計(jì)算系統(tǒng)(Offline processing):請(qǐng)求發(fā)起者不會(huì)等待響應(yīng),請(qǐng)求的作業(yè)通常會(huì)耗時(shí)較長(zhǎng)。如批處理計(jì)算框架 Spark 等。

批處理作業(yè)(Batch jobs):這類應(yīng)用通常為一次性的,不會(huì)一直運(yùn)行,運(yùn)行完成后便會(huì)結(jié)束運(yùn)行。如數(shù)據(jù)分析的 MapReduce 作業(yè)。

對(duì)于每一類應(yīng)用其通常情況下測(cè)量的對(duì)象是不太一樣的。其總結(jié)如下:

線上服務(wù)系統(tǒng):主要有請(qǐng)求、出錯(cuò)的數(shù)量,請(qǐng)求的時(shí)延等。

線下計(jì)算系統(tǒng):最后開始處理作業(yè)的時(shí)間,目前正在處理作業(yè)的數(shù)量,發(fā)出了多少 items, 作業(yè)隊(duì)列的長(zhǎng)度等。

批處理作業(yè):最后成功執(zhí)行的時(shí)刻,每個(gè)主要 stage 的執(zhí)行時(shí)間,總的耗時(shí),處理的記錄數(shù)量等。

除了系統(tǒng)本身,有時(shí)還需監(jiān)控子系統(tǒng):

使用的庫(kù)(Libraries): 調(diào)用次數(shù),成功數(shù),出錯(cuò)數(shù),調(diào)用的時(shí)延。

日志(Logging):計(jì)數(shù)每一條寫入的日志,從而可找到每條日志發(fā)生的頻率和時(shí)間。

Failures: 錯(cuò)誤計(jì)數(shù)。

線程池:排隊(duì)的請(qǐng)求數(shù),正在使用的線程數(shù),總線程數(shù),耗時(shí),正在處理的任務(wù)數(shù)等。

緩存:請(qǐng)求數(shù),命中數(shù),總時(shí)延等。

選擇 Vector

選用 Vec 的原則:

數(shù)據(jù)類型類似但資源類型、收集地點(diǎn)等不同

Vec 內(nèi)數(shù)據(jù)單位統(tǒng)一

例子:

不同資源對(duì)象的請(qǐng)求延遲

不同地域服務(wù)器的請(qǐng)求延遲

不同 http 請(qǐng)求錯(cuò)誤的計(jì)數(shù)

此外,官方文檔 中建議,對(duì)于一個(gè)資源對(duì)象的不同操作,如 Read/Write、Send/Receive, 應(yīng)采用不同的 Metric 去記錄,而不要放在一個(gè) Metric 里。原因是監(jiān)控時(shí)一般不會(huì)對(duì)這兩者做聚合,而是分別去觀測(cè)。 不過對(duì)于 request 的測(cè)量,通常是以 Label 做區(qū)分不同的 action。

確定 Label

常見 Label 的選擇有:

resource

region

type

確定 Label 的一個(gè)重要原則是:同一維度 Label 的數(shù)據(jù)是可平均和可加和的,也即單位要統(tǒng)一。如風(fēng)扇的風(fēng)速和電壓就不能放在一個(gè) Label 里。

此外,不建議下列做法:

my_metric{label=a} 1 my_metric{label=b} 6 my_metric{label=total} 7

即在 Label 中同時(shí)統(tǒng)計(jì)了分和總的數(shù)據(jù),建議采用 PromQL 在服務(wù)器端聚合得到總和的結(jié)果。或者用另外的 Metric 去測(cè)量總的數(shù)據(jù)。

命名 Metrics 和 Label

好的命名能夠見名知義,因此命名也是良好設(shè)計(jì)的一環(huán)。

Metric 的命名:

需要符合 pattern: a-zA-Z:

應(yīng)該包含一個(gè)單詞作為前綴,表明這個(gè) Metric 所屬的域。

如:

prometheus_notifications_total

process_cpu_seconds_total

ipamd_request_latency

應(yīng)該包含一個(gè)單位的單位作為后綴,表明這個(gè) Metric 的單位。

如:

http_request_duration_seconds

node_memory_usage_bytes

http_requests_total (for a unit-less accumulating count)

邏輯上與被測(cè)量的變量含義相同。

盡量使用基本單位,如 seconds,bytes。而不是 Milliseconds, megabytes。

Label 的命名:

依據(jù)選擇的維度命名,如:

region: shenzhen/guangzhou/beijing

owner: user1/user2/user3

stage: extract/transform/load

Buckets 選擇

適宜的 buckets 能使 histogram 的百分位數(shù)計(jì)算更加準(zhǔn)確。

理想情況下,桶會(huì)使得數(shù)據(jù)分布呈階梯狀,即各桶區(qū)間內(nèi)數(shù)據(jù)個(gè)數(shù)大致相同。
buckets 的設(shè)計(jì)可遵從如下經(jīng)驗(yàn):

需要知道數(shù)據(jù)的大致分布,若事先不知道可先用默認(rèn)桶 ({.005, .01, .025, .05, .1, .25, .5, 1, 2.5, 5, 10})或 2 倍數(shù)桶({1,2,4,8…})觀察數(shù)據(jù)分布再調(diào)整 buckets。

數(shù)據(jù)分布較密處桶間隔制定的較窄一些,分布稀疏處可制定的較寬一些。

對(duì)于多數(shù)時(shí)延數(shù)據(jù),一般具有長(zhǎng)尾的特性,較適宜用指數(shù)形式的桶(ExponentialBuckets)。

初始桶上界一般覆蓋10%左右的數(shù)據(jù),若不關(guān)注頭部數(shù)據(jù)也可以讓初始上界更大一些。

若為了更準(zhǔn)確計(jì)算特定百分位數(shù),如90%,可在90%的數(shù)據(jù)處加密分布桶,即減少桶的間隔。

比如我在監(jiān)控我們某些任務(wù)耗時(shí)的時(shí)候,就是選根據(jù)實(shí)際情況估算出大致的 bucket 取值,上線后觀察數(shù)據(jù)和監(jiān)控再去調(diào)整 bucket, 這樣經(jīng)過幾次調(diào)整應(yīng)該就能調(diào)整到比較合適的 bucket。

Grafana 使用技巧

查看所有維度

如果你想知道是否還能按其它維度分組,并快速查看還有哪些維度,可采用以下技巧:在 query 的表達(dá)式上只保留指標(biāo)名稱,不做任何計(jì)算,Legend format 也留空。這樣就能顯示出原始的 metric 數(shù)據(jù)。如下圖所示

70392922-8d89-11ed-bfe3-dac502259ad0.png

標(biāo)尺聯(lián)動(dòng)

在 Settings 面板中,有一個(gè) Graph Tooltip 設(shè)置項(xiàng),默認(rèn)使用 Default。

7062b2d8-8d89-11ed-bfe3-dac502259ad0.png

下面將圖形展示工具分別調(diào)整為 Shared crosshair 和 Shared Tooltip 看看效果??梢钥吹綐?biāo)尺能聯(lián)動(dòng)展示了,方便排查問題時(shí)確認(rèn) 2 個(gè)指標(biāo)的關(guān)聯(lián)性。

將圖形展示工具調(diào)整為 Shared Tooltip:

7091a458-8d89-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 測(cè)量
    +關(guān)注

    關(guān)注

    10

    文章

    5433

    瀏覽量

    115547
  • Prometheus
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    1994

原文標(biāo)題:Prometheus Metric 的實(shí)踐總結(jié),搞定監(jiān)控需注意~

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Zabbix與Prometheus運(yùn)維監(jiān)控系統(tǒng)的對(duì)比

    在當(dāng)今云原生和微服務(wù)架構(gòu)盛行的時(shí)代,監(jiān)控系統(tǒng)已成為運(yùn)維工程師不可或缺的核心工具。面對(duì)市場(chǎng)上眾多監(jiān)控解決方案,Zabbix和Prometheus作為兩大主流選擇,各自擁有獨(dú)特的優(yōu)勢(shì)和適用場(chǎng)景。本文將從架構(gòu)設(shè)計(jì)、性能表現(xiàn)、功能特性、運(yùn)維成本等多個(gè)維度進(jìn)行深入對(duì)比,為你的監(jiān)控系統(tǒng)選型提供專業(yè)指導(dǎo)。
    的頭像 發(fā)表于 09-18 14:57 ?248次閱讀

    常用PromQL查詢案例總結(jié)

    在云原生時(shí)代,Prometheus已經(jīng)成為監(jiān)控領(lǐng)域的事實(shí)標(biāo)準(zhǔn)。作為一名資深運(yùn)維工程師,我見過太多團(tuán)隊(duì)在PromQL查詢上踩坑,也見過太多因?yàn)楸O(jiān)控不到位導(dǎo)致的生產(chǎn)事故。今天分享10個(gè)實(shí)戰(zhàn)中最常用的PromQL查詢案例,每一個(gè)都是血淚經(jīng)驗(yàn)的總結(jié)
    的頭像 發(fā)表于 09-18 14:54 ?309次閱讀

    如何構(gòu)建高可用Prometheus監(jiān)控體系

    在云原生時(shí)代,傳統(tǒng)監(jiān)控工具已經(jīng)無(wú)法滿足微服務(wù)架構(gòu)的復(fù)雜需求。Prometheus憑借其Pull模式、多維數(shù)據(jù)模型和強(qiáng)大的查詢語(yǔ)言PromQL,成為了CNCF畢業(yè)項(xiàng)目中的監(jiān)控標(biāo)桿。
    的頭像 發(fā)表于 08-01 09:10 ?530次閱讀

    【「Yocto項(xiàng)目實(shí)戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗(yàn)】01總結(jié)實(shí)踐記錄

    ,運(yùn)行一下,輸入密碼之后就跑出來(lái)了界面了: 選擇terminal看看效果: 看一下文件管理器: 附上書本內(nèi)容: 四 總結(jié) 這本書還是非常不錯(cuò)的,關(guān)于Yocto的介紹和首次實(shí)踐也都成功了,這里
    發(fā)表于 06-30 11:38

    相關(guān)協(xié)議信號(hào)總結(jié)

    電子發(fā)燒友網(wǎng)站提供《相關(guān)協(xié)議信號(hào)總結(jié).xlsx》資料免費(fèi)下載
    發(fā)表于 06-25 15:34 ?5次下載

    詳解Prometheus的數(shù)據(jù)類型

    對(duì)于 Prometheus 生態(tài)的監(jiān)控系統(tǒng),PromQL 是必備技能,本文著重點(diǎn)講解這個(gè)查詢語(yǔ)言,摻雜一些生產(chǎn)實(shí)踐場(chǎng)景,希望對(duì)你有所幫助。
    的頭像 發(fā)表于 05-13 09:50 ?1117次閱讀
    詳解<b class='flag-5'>Prometheus</b>的數(shù)據(jù)類型

    使用Prometheus與Grafana實(shí)現(xiàn)MindIE服務(wù)可視化監(jiān)控功能

    在 MindIE 服務(wù)化運(yùn)行過程中,為了及時(shí)掌握服務(wù)的運(yùn)行狀態(tài)、性能表現(xiàn)以及發(fā)現(xiàn)潛在問題,提供了服務(wù)監(jiān)控指標(biāo)查詢接口(普羅 (Prometheus) 格式)。該接口能夠幫助開發(fā)者和運(yùn)維人員獲取豐富的服務(wù)監(jiān)控指標(biāo)數(shù)據(jù),為優(yōu)化服務(wù)配置、保障服務(wù)質(zhì)量提供有力支持。
    的頭像 發(fā)表于 04-21 11:48 ?1624次閱讀
    使用<b class='flag-5'>Prometheus</b>與Grafana實(shí)現(xiàn)MindIE服務(wù)可視化監(jiān)控功能

    SOLIDWORKS 2025教育版:緊密的產(chǎn)學(xué)研合作,搭建理論與實(shí)踐的橋梁

    在工程技術(shù)教育領(lǐng)域,理論與實(shí)踐的結(jié)合一直是培養(yǎng)高素質(zhì)人才的關(guān)鍵。SOLIDWORKS 2025教育版作為一款CAD軟件,通過緊密的產(chǎn)學(xué)研合作,成功搭建起了理論與實(shí)踐之間的橋梁,為學(xué)生、教師和行業(yè)專家提供了一個(gè)無(wú)縫對(duì)接的學(xué)習(xí)與創(chuàng)新平臺(tái)
    的頭像 發(fā)表于 03-26 17:21 ?534次閱讀
    SOLIDWORKS 2025教育版:緊密的產(chǎn)學(xué)研合作,搭建理論與<b class='flag-5'>實(shí)踐</b>的橋梁

    GaN E-HEMTs的PCB布局經(jīng)驗(yàn)總結(jié)

    GaN E-HEMTs的PCB布局經(jīng)驗(yàn)總結(jié)
    的頭像 發(fā)表于 03-13 15:52 ?896次閱讀
    GaN E-HEMTs的PCB布局經(jīng)驗(yàn)<b class='flag-5'>總結(jié)</b>

    云服務(wù)器計(jì)算池的運(yùn)維團(tuán)隊(duì)需要掌握的網(wǎng)絡(luò)工具

    和性能指標(biāo),幫助運(yùn)維團(tuán)隊(duì)及時(shí)發(fā)現(xiàn)并解決問題。 Prometheus + Grafana Prometheus 是一款開源的監(jiān)控系統(tǒng),適用于云原生和容器化環(huán)境,支持多維數(shù)據(jù)模型和強(qiáng)大的查詢語(yǔ)言PromQL。Grafana 是一款開源的可視化工具,可以與
    的頭像 發(fā)表于 02-17 15:50 ?493次閱讀

    從零入門Prometheus:構(gòu)建企業(yè)級(jí)監(jiān)控與報(bào)警系統(tǒng)的最佳實(shí)踐指南

    測(cè)試環(huán)境 prometheus-2.26.0.linux-amd64.tar.gz下載地址:https://github.com/prometheus/prometheus/releases
    的頭像 發(fā)表于 02-10 11:28 ?1037次閱讀
    從零入門<b class='flag-5'>Prometheus</b>:構(gòu)建企業(yè)級(jí)監(jiān)控與報(bào)警系統(tǒng)的最佳<b class='flag-5'>實(shí)踐</b>指南

    做ADS解碼專用 實(shí)踐ADS1605

    實(shí)踐ADS1605 因?yàn)樵O(shè)計(jì)要做ADS解碼專用,所以找來(lái)找去用到了ADS1605這個(gè)芯片,并口設(shè)計(jì),信號(hào)可以識(shí)別小信號(hào)的。 因?yàn)橘I的是專業(yè)板子,所以上面都集成好了。 板子流程圖。 用到解碼流程圖 效果還不錯(cuò),就是數(shù)據(jù)容易受到干擾的。
    發(fā)表于 01-21 07:58

    構(gòu)建便捷海外IP代理池:策略與實(shí)踐

    構(gòu)建便捷海外IP代理池是一個(gè)涉及多方面策略與實(shí)踐的過程。
    的頭像 發(fā)表于 11-14 07:34 ?738次閱讀

    4G模組之UDP應(yīng)用的最佳實(shí)踐

    今天說(shuō)的是4G模組之UDP應(yīng)用,展示最佳實(shí)踐,送你參考。
    的頭像 發(fā)表于 11-08 09:24 ?1519次閱讀
    4G模組之UDP應(yīng)用的最佳<b class='flag-5'>實(shí)踐</b>!

    MES系統(tǒng)的最佳實(shí)踐案例

    效率、降低成本、保證產(chǎn)品質(zhì)量。 MES系統(tǒng)的最佳實(shí)踐案例 引言 在當(dāng)今競(jìng)爭(zhēng)激烈的制造業(yè)環(huán)境中,企業(yè)必須不斷尋求創(chuàng)新和改進(jìn)的方法來(lái)保持競(jìng)爭(zhēng)力。MES系統(tǒng)作為一種關(guān)鍵的信息技術(shù)工具,已經(jīng)被廣泛應(yīng)用于各種制造行業(yè),以實(shí)現(xiàn)生產(chǎn)過程的優(yōu)化和管理。本文將探討MES系統(tǒng)的最佳實(shí)踐
    的頭像 發(fā)表于 10-27 09:33 ?3383次閱讀