chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux內(nèi)核睡眠的三種狀態(tài)講解

B4Pb_gh_6fde77c ? 來源:Linux內(nèi)核遠航者 ? 作者:Linux內(nèi)核遠航者 ? 2021-08-16 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1開場白

環(huán)境:

處理器架構(gòu):arm64

內(nèi)核源碼:linux-5.10.50

ubuntu版本:20.04.1

代碼閱讀工具:vim+ctags+cscope

無論是任務(wù)處于用戶態(tài)還是內(nèi)核態(tài),經(jīng)常會因為等待某些事件而睡眠(可能是等待IO讀寫完成,也可能等待其他內(nèi)核路徑釋放一把鎖等)。本文來探討一下,任務(wù)處于睡眠中有哪些狀態(tài)?睡眠對于任務(wù)來說究竟意味著什么?內(nèi)核是如何管理睡眠的任務(wù)的?我們會結(jié)合內(nèi)核源代碼來分析任務(wù)的睡眠,力求全方位角度來剖析。

注:由于篇幅問題,文章分為上下兩篇,且這里不區(qū)分進程和任務(wù),統(tǒng)一使用任務(wù)來表示進程。

主要講解以下內(nèi)容:

睡眠的三種狀態(tài)

睡眠的內(nèi)核原理

用戶態(tài)睡眠

內(nèi)核態(tài)睡眠

總結(jié)

2. 睡眠的三種狀態(tài)

任務(wù)睡眠有三種狀態(tài):

淺度睡眠

中度睡眠

深度睡眠

2.1 淺度睡眠

進程描述符的state使用TASK_INTERRUPTIBLE表示這種狀態(tài)。

為可中斷的睡眠狀態(tài),這里可中斷是可以被信號所打斷(喚醒)。

這里給出被信號打斷/喚醒的代碼路徑:

kernel/signal.c

SYSCALL_DEFINE2(kill, pid_t, pid, int, sig)

->kill_something_info

->__kill_pgrp_info

->group_send_sig_info

->do_send_sig_info

->send_signal

->__send_signal

->complete_signal

->signal_wake_up

-> signal_wake_up_state(t, resume ? TASK_WAKEKILL : 0)

->wake_up_state(t, state | TASK_INTERRUPTIBLE)

->try_to_wake_up

可以看到在信號傳遞的時候,會通過signal_wake_up喚醒從處于可中斷睡眠狀態(tài)的任務(wù)。

2.2 中度睡眠

進程描述符的state使用TASK_KILLABLE表示這種狀態(tài)。

可以被致命信號所打斷。

這里給出被致命信號打斷/喚醒的代碼路徑:

include/linux/sched.h

#define TASK_KILLABLE (TASK_WAKEKILL | TASK_UNINTERRUPTIBLE)

kernel/signal.c

SYSCALL_DEFINE2(kill, pid_t, pid, int, sig)

->kill_something_info

->__kill_pgrp_info

->group_send_sig_info

->do_send_sig_info

->send_signal

->__send_signal

->complete_signal

->

if (sig_fatal(p, sig) &&

| ?。╯ignal->flags & SIGNAL_GROUP_EXIT) &&

| !sigismember(&t->real_blocked, sig) &&

| (sig == SIGKILL || !p->ptrace)) { //致命信號

...

signal_wake_up(t, 1);

-> signal_wake_up_state(t, resume ? TASK_WAKEKILL : 0) // resume == 1

-> wake_up_state(t, state | TASK_INTERRUPTIBLE)

->try_to_wake_up

...

}

2.3 深度睡眠

進程描述符的state使用TASK_UNINTERRUPTIBLE表示這種狀態(tài)。

為不可中斷的睡眠狀態(tài),不能被任何信號所喚醒(特定條件沒有滿足發(fā)生信號喚醒可能導(dǎo)致數(shù)據(jù)不一致等問題,這種場景使用這種睡眠狀態(tài),如等待IO讀寫完成)。

3. 睡眠的內(nèi)核原理

睡眠都是主動發(fā)生調(diào)度,即主動調(diào)用主調(diào)度器。

睡眠的主要步驟如下:

1)設(shè)置任務(wù)狀態(tài)為睡眠狀態(tài)

2)記錄睡眠的任務(wù)

3)發(fā)起主動調(diào)度

下面我們來詳細解讀下這幾個步驟:

3.1 設(shè)置任務(wù)狀態(tài)為睡眠狀態(tài)

這一步很有必要,一來標(biāo)識進入了睡眠狀態(tài),二來是主調(diào)度器會根據(jù)睡眠標(biāo)志將任務(wù)從運行隊列刪除。

注:睡眠狀態(tài)描述見上一小節(jié)!

3.2 記錄睡眠的任務(wù)

這一步也非常有必要,內(nèi)核會將即將睡眠的任務(wù)記錄下來,要么加入到鏈表中管理,要么使用數(shù)據(jù)結(jié)構(gòu)記錄。

如延遲睡眠場景,內(nèi)核將即將睡眠的任務(wù)記錄在定時器相關(guān)的數(shù)據(jù)結(jié)構(gòu)中;可睡眠的信號量場景中,內(nèi)核將即將睡眠的任務(wù)加入到信號量的相關(guān)鏈表中。

記錄的目的在于:當(dāng)喚醒條件滿足時,喚醒函數(shù)能夠找到想要喚醒的任務(wù)。

3.3 發(fā)起主動調(diào)度

這一步是真正進行睡眠的操作,主要是調(diào)用主調(diào)度器來發(fā)起主動調(diào)度讓出處理器。

下面我們來看下主調(diào)度器為任務(wù)睡眠所作的處理:

kernel/sched/core.c

__schedule

->

prev_state = prev->state; //獲得前一個任務(wù)狀態(tài)

if (!preempt && prev_state) { //如果是主動調(diào)度 且任務(wù)狀態(tài)不為0

if (signal_pending_state(prev_state, prev)) { //有掛起的信號

prev->state = TASK_RUNNING; //設(shè)置狀態(tài)為可運行

} else {

deactivate_task(rq, prev, DEQUEUE_SLEEP | DEQUEUE_NOCLOCK); //cpu運行隊列中刪除任務(wù)

}

}

next = pick_next_task(rq, prev, &rf); //選擇下一個任務(wù)

context_switch //進行上下文切換

來看下deactivate_task對于睡眠任務(wù)做的主要工作:

deactivate_task

->deactivate_task(rq, prev, DEQUEUE_SLEEP | DEQUEUE_NOCLOCK)

->p->on_rq = (flags & DEQUEUE_SLEEP) ? 0 : TASK_ON_RQ_MIGRATING; //設(shè)置任務(wù)的on_rq 為0 標(biāo)識是睡眠

dequeue_task(rq, p, flags);

->p->sched_class->dequeue_task(rq, p, flags)

->dequeue_task_fair

->dequeue_entity

...

if (se != cfs_rq->curr) //不是cpu當(dāng)前 任務(wù)

__dequeue_entity(cfs_rq, se); //cfs運行隊列刪除

->se->on_rq = 0; //標(biāo)識調(diào)度實體不在運行隊列!?。?/p>

->if (?。╢lags & DEQUEUE_SLEEP))

se->vruntime -= cfs_rq->min_vruntime; //調(diào)度實體的虛擬運行時間 減去 cfs運行隊列的最小虛擬運行時間

deactivate_task會設(shè)置任務(wù)的on_rq 為0來 標(biāo)識是睡眠 ,然后 調(diào)用到調(diào)度類的dequeue_task方法,在cfs中設(shè)置se->on_rq = 0標(biāo)識調(diào)度實體不在cfs隊列。

可以看到,發(fā)起主動調(diào)度的時候,在主調(diào)度器中會做判斷:如果是主動調(diào)度且任務(wù)狀態(tài)不為0 (即為不是可運行的TASK_RUNNING)時,如果沒有掛起的信號,就會將任務(wù)從cpu的運行隊列中“刪除”,然后選擇下一個任務(wù),進行上下文切換。

將即將睡眠的任務(wù)從cpu的運行隊列中“刪除”意義重大:主調(diào)度器再次選擇下一個任務(wù)的時候不會在選擇睡眠的任務(wù)(因為主調(diào)度器總是在運行隊列中選擇任務(wù)運行,除非任務(wù)被喚醒,重新加入運行隊列)。

注意:1.這里的刪除指的是設(shè)置對應(yīng)標(biāo)志如p->on_rq=0,se->on_rq = 0,當(dāng)選擇下一個任務(wù)的時候不會在加入運行隊列中。2.即將睡眠的任務(wù)是cpu上的當(dāng)前任務(wù)(curr指向)。3.調(diào)用主調(diào)度器后,即將睡眠的任務(wù)不會再次加入cpu運行隊列,除非被喚醒。

再來看下選擇下一個任務(wù)的時候會做哪些事情和睡眠有關(guān)(暫不考慮組調(diào)度情況):

pick_next_task

->class->pick_next_task

->pick_next_task_fair //kernel/sched/fair.c

->if (prev)

put_prev_task(rq, prev); //對前一個任務(wù)處理

se = pick_next_entity(cfs_rq, NULL); //選擇下一個任務(wù)

set_next_entity(cfs_rq, se);

主要看下put_prev_task:

put_prev_task

->prev->sched_class->put_prev_task(rq, prev)

->put_prev_task_fair

->put_prev_entity

-> if (prev->on_rq) { //前一個任務(wù)的調(diào)度實體on_rq不為0?

update_stats_wait_start(cfs_rq, prev);

/* Put ‘current’ back into the tree. */

__enqueue_entity(cfs_rq, prev); //重新加入cfs運行隊列

/* in !on_rq case, update occurred at dequeue */

update_load_avg(cfs_rq, prev, 0);

}

cfs_rq->curr = NULL; //設(shè)置cfs運行隊列的curr為NULL

put_prev_task所做的主要工作就是將前一個任務(wù)從cfs運行隊列中刪除,在這里就是通過調(diào)用__enqueue_entity將對應(yīng)的調(diào)度實體重新加入cfs隊列的紅黑樹,但是對于即將睡眠的任務(wù)之前在主調(diào)度器中通過deactivate_task將prev->on_rq設(shè)置為0了,所以對于即將睡眠的任務(wù)來說,它對應(yīng)的調(diào)度實體不會在重新加入cfs運行隊列的紅黑樹。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    4

    文章

    1431

    瀏覽量

    42289
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11579

    瀏覽量

    217019

原文標(biāo)題:深入理解Linux內(nèi)核之進程睡眠(上)

文章出處:【微信號:gh_6fde77c41971,微信公眾號:FPGA干貨】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何將 GPIO PWM 和 GPIO Capture 驅(qū)動程序?qū)?Linux 內(nèi)核,實現(xiàn) PWM 輸出并檢測引腳的變化狀態(tài)

    如何將 GPIO PWM 和 GPIO Capture 驅(qū)動程序?qū)?Linux 內(nèi)核,實現(xiàn) PWM 輸出并檢測引腳的變化狀態(tài)
    發(fā)表于 08-20 08:20

    睡眠障礙調(diào)控系列之經(jīng)顱振蕩直流電刺激(toDCS)

    1.睡眠障礙的類型與表征睡眠障礙其類型超80,其中最常見的三種類型及其表征如下:類型核心表征具體描述慢性失眠癥長期入睡困難或睡眠維持障礙持
    的頭像 發(fā)表于 08-13 19:16 ?515次閱讀
    <b class='flag-5'>睡眠</b>障礙調(diào)控系列之經(jīng)顱振蕩直流電刺激(toDCS)

    MEMS中的三種測溫方式

    在集成MEMS芯片的環(huán)境溫度測量領(lǐng)域,熱阻、熱電堆和PN結(jié)原理是三種主流技術(shù)。熱阻是利用熱敏電阻,如金屬鉑或注入硅的溫度電阻系數(shù)恒定,即電阻隨溫度線性變化的特性測溫,電阻變化直接對應(yīng)絕對溫度,需恒流源供電。
    的頭像 發(fā)表于 07-16 13:58 ?1115次閱讀
    MEMS中的<b class='flag-5'>三種</b>測溫方式

    介紹三種常見的MySQL高可用方案

    在生產(chǎn)環(huán)境中,為了確保數(shù)據(jù)庫系統(tǒng)的連續(xù)可用性、降低故障恢復(fù)時間以及實現(xiàn)業(yè)務(wù)的無縫切換,高可用(High Availability, HA)方案至關(guān)重要。本文將詳細介紹三種常見的 MySQL 高可用
    的頭像 發(fā)表于 05-28 17:16 ?834次閱讀

    redis三種集群方案詳解

    在Redis中提供的集群方案總共有三種(一般一個redis節(jié)點不超過10G內(nèi)存)。
    的頭像 發(fā)表于 03-31 10:46 ?1133次閱讀
    redis<b class='flag-5'>三種</b>集群方案詳解

    CMOS,Bipolar,F(xiàn)ET這三種工藝的優(yōu)缺點是什么?

    在我用photodiode工具選型I/V放大電路的時候,系統(tǒng)給我推薦了AD8655用于I/V,此芯片為CMOS工藝 但是查閱資料很多都是用FET工藝的芯片,所以請教下用于光電信號放大轉(zhuǎn)換(主要考慮信噪比和帶寬)一般我們用哪種工藝的芯片, CMOS,Bipolar,F(xiàn)ET這三種工藝的優(yōu)缺點是什么?
    發(fā)表于 03-25 06:23

    GaN、超級SI、SiC這三種MOS器件的用途區(qū)別

    如果想要說明白GaN、超級SI、SiC這三種MOS器件的用途區(qū)別,首先要做的是搞清楚這三種功率器件的特性,然后再根據(jù)材料特性分析具體應(yīng)用。
    的頭像 發(fā)表于 03-14 18:05 ?1898次閱讀

    示波器的三種觸發(fā)模式

    示波器的觸發(fā)方式不僅影響波形捕捉的時機,還決定了顯示的波形是否穩(wěn)定。 常見的觸發(fā)模式有三種: 單次觸發(fā) (Single)、 正常觸發(fā) (Normal)和 自動觸發(fā) (Auto)。下面將對這三種觸發(fā)
    的頭像 發(fā)表于 01-07 11:04 ?1.1w次閱讀
    示波器的<b class='flag-5'>三種</b>觸發(fā)模式

    極管狀態(tài):輕松掌握電子基礎(chǔ)

    極管的三種狀態(tài)分別是截止狀態(tài)、放大狀態(tài)和飽和狀態(tài),這三種
    的頭像 發(fā)表于 01-06 10:30 ?2485次閱讀

    嵌入式學(xué)習(xí)-飛凌嵌入式ElfBoard ELF 1板卡-Linux內(nèi)核移植之內(nèi)核簡介

    用戶提供移植好的板級開發(fā)包。板卡廠商也會對移植好的內(nèi)核版本進行維護,例如一些BUG修復(fù)或者物料替換。接下來講一下獲取這三種源碼的方法:獲取linux官網(wǎng)源碼 地址:https
    發(fā)表于 12-16 13:08

    飛凌嵌入式ElfBoard ELF 1板卡-Linux內(nèi)核移植之內(nèi)核簡介

    用戶提供移植好的板級開發(fā)包。板卡廠商也會對移植好的內(nèi)核版本進行維護,例如一些BUG修復(fù)或者物料替換。接下來講一下獲取這三種源碼的方法:獲取linux官網(wǎng)源碼地址:https
    發(fā)表于 12-13 09:03

    三種封裝形式下的400G光模塊概述

    本文主要就三種封裝形式(QSFP-DD、OSFP、QSFP112)的400G光模塊做了簡單的梳理,從為什么會有400G光模塊問世?400G光模塊在三種封裝形式下的各個具體型號(以短距離為主,最遠2km),三種封裝形式的對比。歡迎
    的頭像 發(fā)表于 11-11 11:35 ?1630次閱讀
    <b class='flag-5'>三種</b>封裝形式下的400G光模塊概述

    什么是PID調(diào)節(jié)器的三種模式

    (Proportional)、積分(Integral)和微分(Derivative)。這三種控制動作可以單獨使用,也可以組合使用,形成三種基本的控制模式:比例控制(P)、積分控制(I)和微分控制(D)。 1. 比例控制(P) 比例控制是PID調(diào)節(jié)器中最基本的控制模式。在比
    的頭像 發(fā)表于 11-06 10:38 ?2349次閱讀

    一文搞懂Linux進程的睡眠和喚醒

    ): 進程在等待某個條件滿足(如I/O操作),可以被信號喚醒。 Linux通過內(nèi)核提供的系統(tǒng)調(diào)用來控制進程的睡眠。常用的系統(tǒng)調(diào)用有: sleep(): 使進程暫停指定的秒數(shù)。 usleep(): 使進程暫停
    發(fā)表于 11-04 15:15

    deepin社區(qū)亮相第19屆中國Linux內(nèi)核開發(fā)者大會

    中國 Linux 內(nèi)核開發(fā)者大會,作為中國 Linux 內(nèi)核領(lǐng)域最具影響力的峰會之一,一直以來都備受矚目。
    的頭像 發(fā)表于 10-29 16:35 ?1181次閱讀