chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何處理服務(wù)存在內(nèi)存泄漏問題?

GReq_mcu168 ? 來源:玩轉(zhuǎn)單片機(jī) ? 作者:玩轉(zhuǎn)單片機(jī) ? 2021-03-02 10:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周像往常一樣例行檢查線上機(jī)器性能,突然發(fā)現(xiàn)一個服務(wù)的內(nèi)存使用率是這樣的:

很顯然該服務(wù)存在內(nèi)存泄漏問題,趕緊排查問題。

問題排查

首先確定內(nèi)存泄漏問題出現(xiàn)的時間,發(fā)現(xiàn)在該時間點的上線有兩次代碼提交,其中一個就是我的。于是立刻排查這兩次代碼的改動,確定了另一個同事的代碼不可能會有內(nèi)存問題后(因為另一個同事的上線僅僅修改了配置)我知道肯定是自己的代碼出現(xiàn)了問題。

確定了問題所在后趕緊把自己的代碼回滾掉,接下來就可以放心debug了。

Debug

什么是內(nèi)存泄漏?

簡單的講就是程序員申請的內(nèi)存在使用完后沒有還給操作系統(tǒng),由于筆者使用的是C++語言,因此內(nèi)存泄漏一般是這樣的:

obj* o = new obj(); ... // 使用完obj后沒有delete

肯定有什么地方申請了內(nèi)存后沒有調(diào)用delete釋放內(nèi)存。

在這里介紹一下筆者的代碼改動,我的任務(wù)其實是重構(gòu)一段代碼,把這段代碼并行化。也就是舊的邏輯是在一個線程中串行執(zhí)行的,現(xiàn)在我要把這段邏輯放到兩個線程中并行執(zhí)行,這是最讓人頭疼的任務(wù)之一,并行化改造是比較容易出bug的。

接下來梳理了一遍中所有內(nèi)存的申請和釋放,這其中包括:

使用new/delete分配釋放的內(nèi)存

使用內(nèi)存池分配釋放的內(nèi)存

仔細(xì)梳理一遍后沒有發(fā)現(xiàn)任何問題,該釋放的內(nèi)存都已經(jīng)釋放掉了,這時筆者已經(jīng)開始懷疑人生了 :) ,很顯然還有一段沒有注意到的地方出現(xiàn)了問題,這是必然的,雖然知道問題必然出現(xiàn)在改動的這些代碼里但是我并不能確定出現(xiàn)的位置。

沒有辦法,到這里基本上已經(jīng)要放棄自己人肉debug了,想利用一些內(nèi)存檢測工具來幫助自己確定問題。

常見的內(nèi)存泄漏檢測工具包括valgrind、gperftools等,valgrind的好處在于無需重新編譯代碼即可進(jìn)行內(nèi)存檢測,但是缺點是會使得程序運(yùn)行非常緩慢,官方文檔給的說法是會比正常的程序運(yùn)行慢20-30倍;gperftools則需要重新編譯可執(zhí)行程序。這些工具需要下載安裝測試,其中還涉及到申請機(jī)器權(quán)限等問題,筆者覺得還是比較麻煩,況且這個問題也不是大海撈針一樣,問題肯定出在了并行化的這段代碼中。

到這里我決定再換一個思路來排查問題,既然代碼重構(gòu)后開始并行執(zhí)行,那么出現(xiàn)問題大概率是因為多線程問題,遇到多線程問題首先重點排查的就是線程間的共享數(shù)據(jù)。

多線程問題的關(guān)鍵——共享數(shù)據(jù)

我們知道如果線程之間沒有共享數(shù)據(jù)那么就不會有線程安全問題,我們使用的鎖、信號量、條件變量等其實都是用來保護(hù)共享數(shù)據(jù)的,比如鎖通常是用來包括臨界區(qū)的,臨界區(qū)中的代碼操作的就是線程共享數(shù)據(jù);信號量使用的一個經(jīng)典場景就是生產(chǎn)者消費(fèi)者問題,生產(chǎn)者線程以及消費(fèi)者線程都會操作同一個隊列,這里的隊列就是共享數(shù)據(jù)。

沿著這個思路開始找在兩個線程中都使用到的共享數(shù)據(jù),果不其然,在一個角落中發(fā)現(xiàn)了這樣一段代碼:

auto* pb = global->mutable_obj();

這是分配protobuf對象的一段代碼,protobuf是Google開發(fā)是一種類似于JSON、XML的技術(shù),因此常用于網(wǎng)絡(luò)通信和數(shù)據(jù)交換等場景,比如RPC等。

如果你不了解protobuf也沒有關(guān)系,實際上上面的這段代碼的要做的事情是這樣的:

if (global->obj == NULL) { global->obj = new obj();}return global->obj;

值得注意的是這段代碼現(xiàn)在會在兩個線程中執(zhí)行,顯然問題就出現(xiàn)在了這里。

那么問題是怎么出現(xiàn)的呢?

我們假設(shè)有兩個線程,線程A和線程B,當(dāng)這樣一段代碼在線程AB中同時執(zhí)行時可能會有以下場景:

線程A拿到global->obj并檢測到此時的global->obj為空,因此決定為其分配內(nèi)存,但不巧的是此時發(fā)生線程切換,線程A在為global->obj分配內(nèi)存前被暫停運(yùn)行,如下所示:

if (global->obj == NULL) { <------- 線程切換,線程A被暫停執(zhí)行 global->obj = new obj();}return global->obj;

線程A被暫停運(yùn)行后線程B開始執(zhí)行,這段代碼同樣會在線程B中執(zhí)行一遍,因此線程B會首先檢查global->obj發(fā)現(xiàn)為空,因此為global->obj分配內(nèi)存,分配完內(nèi)存后發(fā)生線程切換,線程B被暫停運(yùn)行,如下所示:

if (global->obj == NULL) { global->obj = new obj(); <------- 線程切換,線程B被暫停執(zhí)行 }return global->obj;

線程B被暫停運(yùn)行后調(diào)度器決定重新運(yùn)行線程A,此時線程A開始從被中斷的地方繼續(xù)運(yùn)行,還記得線程A是從哪里被中斷的嗎,沒錯,就是在為global->obj分配內(nèi)存前被中斷的,此時線程A繼續(xù)運(yùn)行,也就是說global->obj = new obj()這段代碼又被執(zhí)行了一次,雖然線程B已經(jīng)為global->obj分配了內(nèi)存。

Oops,典型的內(nèi)存泄漏,線程B分配的內(nèi)存再也無法被正常釋放掉了。

至此,我們已經(jīng)找到了問題的原因,罪魁禍?zhǔn)拙褪枪蚕頂?shù)據(jù),關(guān)鍵的一點是要意識到你的線程會隨時被中斷執(zhí)行,CPU會隨時切換到其它線程。

代碼修復(fù)也非常簡單,再新增一個變量,兩個線程不在使用共享數(shù)據(jù),到這里問題就解決了,從發(fā)現(xiàn)問題到完成修復(fù)耗時大概4小時。

經(jīng)驗教訓(xùn)

代碼的并行化重構(gòu)是一件非常棘手的任務(wù),很容易出現(xiàn)線程安全問題,解決線程安全問題首先要考慮的不是要不要加鎖,而是多個線程是否真的有必要使用共享數(shù)據(jù),沒有必要的話多個線程操作私有數(shù)據(jù)根本就不會出現(xiàn)線程安全問題。

當(dāng)出現(xiàn)線程安全問題時,第一時間重點排查線程使用的共享數(shù)據(jù)。

內(nèi)存泄漏檢測工具

雖然這些沒有使用檢測工具全靠人肉debug其實還是因為問題排查范圍比較小,如果我們根本就不知道問題出現(xiàn)在了那次代碼改動那么檢測工具就非常重要了,在這里簡單介紹一下valgrind的使用,詳細(xì)的介紹請參考官方文檔。

假設(shè)有這樣一段問題代碼:

#include voidf(void) { int* x = malloc(10 * sizeof(int)); x[10] = 0; // 問題1: 越界} // 問題2: 內(nèi)存泄漏,x沒有被釋放掉 intmain(){ f(); return 0;}

這段代碼中有兩個問題:一個是數(shù)據(jù)的越界訪問;另一個是內(nèi)存泄漏。將該程序編譯為myprog。

接下來使用valgrind來檢查該程序,使用以下命令:

valgrind --leak-check=yes myprog

運(yùn)行完成后valgrind會給出檢測報告,關(guān)于程序越界訪問會給出這樣的輸出:

==19182== Invalid write of size 4==19182== at 0x804838F: f (example.c:6)==19182== by 0x80483AB: main (example.c:11)==19182== Address 0x1BA45050 is 0 bytes after a block of size 40 alloc'd==19182== at 0x1B8FF5CD: malloc (vg_replace_malloc.c:130)==19182== by 0x8048385: f (example.c:5)==19182== by 0x80483AB: main (example.c:11)

第一行告訴你代碼中存在Invalid write,也就是無效的寫,并給出了問題出現(xiàn)的位置。

關(guān)于內(nèi)存泄漏問題會給出這樣的輸出:

==19182== 40 bytes in 1 blocks are definitely lost in loss record 1 of 1==19182== at 0x1B8FF5CD: malloc (vg_replace_malloc.c:130)==19182== by 0x8048385: f (example.c:5)==19182== by 0x80483AB: main (example.c:11)

這里第一行報告了內(nèi)存"definitely lost",也就是說一定會存在內(nèi)存泄漏,并給出了問題出現(xiàn)的位置。

實際上除了"definitely lost",valgrind還會給出"probably lost"的報告,這兩種報告的含義是這樣的:

"definitely lost":你的程序一定存在內(nèi)存泄漏問題,修復(fù)。

"probably lost":你的程序看起來像是有內(nèi)存泄漏,有可能你在使用指針完成一些特定操作,因此不一定100%存在問題。

原文標(biāo)題:一個耗時4小時的內(nèi)存泄漏問題

文章出處:【微信公眾號:玩轉(zhuǎn)單片機(jī)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94761
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10253

    瀏覽量

    91482
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3210

    瀏覽量

    76361

原文標(biāo)題:一個耗時4小時的內(nèi)存泄漏問題

文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    容易造成單片機(jī)內(nèi)存溢出的幾個陷阱介紹

    面的知識點,用來互相學(xué)習(xí),更用來提醒自己,并作為自己的一個經(jīng)驗總結(jié)。 我們知道我們的程序一般是儲存在flash里面的,但是運(yùn)行的時候是在內(nèi)存(RAM)里運(yùn)行的,我們的程序一般有這么幾個部分組成:宏定義
    發(fā)表于 01-23 07:25

    請問沒有用到的I/0如何處理

    沒有用到的I/0如何處理?
    發(fā)表于 01-12 06:29

    化工廠液體泄漏識別預(yù)警系統(tǒng)

    化工廠液體泄漏識別預(yù)警系統(tǒng)基于人工智能分析技術(shù),化工廠液體泄漏識別預(yù)警系統(tǒng)自動識別監(jiān)控視頻中機(jī)械管道是否存在液體泄漏行為。如檢測到液體泄漏,
    的頭像 發(fā)表于 12-17 18:29 ?326次閱讀
    化工廠液體<b class='flag-5'>泄漏</b>識別預(yù)警系統(tǒng)

    大語言模型如何處理上下文窗口中的輸入

    本博客介紹了五個基本概念,闡述了大語言模型如何處理上下文窗口中的輸入。通過明確的例子和實踐中獲得的見解,本文介紹了多個與上下文窗口有關(guān)的基本概念,如詞元化、序列長度和注意力等。
    的頭像 發(fā)表于 12-03 13:48 ?593次閱讀
    大語言模型如<b class='flag-5'>何處理</b>上下文窗口中的輸入

    內(nèi)存與數(shù)據(jù)處理優(yōu)化藝術(shù)

    高精度的場合使用精度較低的類型,可以減少內(nèi)存使用并提升計算速度。 字節(jié)對齊與批量拷貝也是提升內(nèi)存操作效率的重要手段。例如,通過一次處理多個字節(jié)(如四字節(jié))而非逐字節(jié)拷貝,可以大量減少循環(huán)迭代次數(shù)和
    發(fā)表于 11-14 07:46

    WebGL/Canvas 內(nèi)存泄露分析

    在構(gòu)建高性能、長周期運(yùn)行的 WebGL/Canvas 應(yīng)用(如 3D 編輯器、數(shù)據(jù)可視化平臺)時,內(nèi)存管理是一個至關(guān)重要且極具挑戰(zhàn)性的課題。 開發(fā)者通常面臨的內(nèi)存泄漏問題,其根源遠(yuǎn)比簡單
    的頭像 發(fā)表于 10-21 11:40 ?408次閱讀
    WebGL/Canvas <b class='flag-5'>內(nèi)存</b>泄露分析

    Stduio使用wifi模塊出錯如何處理?

    外設(shè)為潘多拉IOT開發(fā)板,使用Stduio配置了wifi框架,但是代碼里在配置wifi模式時,沒有找到wlan0這個設(shè)備,wifi整個功能也用不了,請問應(yīng)該如何處理。使用正點原子資料包里的rtthread測試demo,wifi工作正常,wifi模塊硬件沒有問題。
    發(fā)表于 10-10 08:18

    at_device 包 ml307長時間運(yùn)行有內(nèi)存泄漏問題怎么解決?

    使用 at_device 包中的 ml307 包長時間運(yùn)行有大量內(nèi)存泄漏問題,大概漲了20K,求助解決。
    發(fā)表于 09-24 07:41

    NUC972DF62Y LCD FIFO欠載中斷如何處理

    我使用 NUC972DF62Y 并使用 LCM 和 GE2D 模塊。 是什么原因?qū)е?FIFO 欠運(yùn)行中斷,我必須如何處理它? 清除旗幟UNDERRUN_INT后,它再次設(shè)置。
    發(fā)表于 08-29 07:44

    在M480系列中,GPIO配置為準(zhǔn)雙向模組時,如何處理功耗過大?

    在M480系列中,GPIO配置為準(zhǔn)雙向模組時,用戶應(yīng)該如何處理功耗過大?
    發(fā)表于 08-28 08:05

    靜力水準(zhǔn)儀在測量過程中遇到誤差如何處理?

    靜力水準(zhǔn)儀在測量過程中遇到誤差如何處理?靜力水準(zhǔn)儀在工程沉降監(jiān)測中出現(xiàn)數(shù)據(jù)偏差時,需采取系統(tǒng)性處理措施。根據(jù)實際工況,誤差主要源于環(huán)境干擾、設(shè)備狀態(tài)、安裝缺陷及操作不當(dāng)四類因素,需針對性解決。靜力
    的頭像 發(fā)表于 08-14 13:01 ?860次閱讀
    靜力水準(zhǔn)儀在測量過程中遇到誤差如<b class='flag-5'>何處理</b>?

    在OpenVINO? C++代碼中啟用 AddressSanitizer 時的內(nèi)存泄漏怎么解決?

    在 OpenVINO? C++代碼中啟用 AddressSanitizer 時遇到內(nèi)存泄漏: \"#0 0xaaaab8558370 in operator new(unsigned
    發(fā)表于 06-23 07:16

    HarmonyOS應(yīng)用圖像stride處理方案

    當(dāng)圖像存儲在內(nèi)存中時,內(nèi)存緩沖區(qū)可能在每行像素之后包含額外的填充字節(jié)。填充字節(jié)會影響圖像在內(nèi)存中的存儲方式,但不會影響圖像的顯示方式。stride是內(nèi)存中一行像素到
    的頭像 發(fā)表于 06-10 14:17 ?1228次閱讀
    HarmonyOS應(yīng)用圖像stride<b class='flag-5'>處理</b>方案

    STM32WLE5CBU6在待機(jī)模式下使用頻率校準(zhǔn)命令失敗如何處理

    STM32WLE5CBU6在待機(jī)模式下使用頻率校準(zhǔn)命令失敗,用get_error命令獲取信息發(fā)現(xiàn)HSE32啟動失敗,進(jìn)而導(dǎo)致校準(zhǔn)失敗,應(yīng)該如何處理
    發(fā)表于 03-07 07:06

    使用OpenVINO?進(jìn)行推理時的內(nèi)存泄漏怎么解決?

    使用 OpenVINO? 進(jìn)行推理時,內(nèi)存會隨著時間的推移而增加,并導(dǎo)致程序崩潰。
    發(fā)表于 03-06 08:29