Linux內核中的軟中斷、tasklet和工作隊列詳解【轉】

本文轉載自查看原文 2020-09-02 11:14 454 【linux內核】

轉自：https://blog.csdn.net/godleading/article/details/52971179

TOC]
本文基於Linux2.6.32內核版本。

引言

軟中斷、tasklet和工作隊列並不是Linux內核中一直存在的機制，而是由更早版本的內核中的“下半部”（bottom half）演變而來。下半部的機制實際上包括五種，但2.6版本的內核中，下半部和任務隊列的函數都消失了，只剩下了前三者。
介紹這三種下半部實現之前，有必要說一下上半部與下半部的區別。
上半部指的是中斷處理程序，下半部則指的是一些雖然與中斷有相關性但是可以延后執行的任務。舉個例子：在網絡傳輸中，網卡接收到數據包這個事件不一定需要馬上被處理，適合用下半部去實現；但是用戶敲擊鍵盤這樣的事件就必須馬上被響應，應該用中斷實現。
兩者的主要區別在於：中斷不能被相同類型的中斷打斷，而下半部依然可以被中斷打斷；中斷對於時間非常敏感，而下半部基本上都是一些可以延遲的工作。由於二者的這種區別，所以對於一個工作是放在上半部還是放在下半部去執行，可以參考下面4條：

如果一個任務對時間非常敏感，將其放在中斷處理程序中執行。
如果一個任務和硬件相關，將其放在中斷處理程序中執行。
如果一個任務要保證不被其他中斷（特別是相同的中斷）打斷，將其放在中斷處理程序中執行。
其他所有任務，考慮放在下半部去執行。
有寫內核任務需要延后執行，因此才有的下半部，進而實現了三種實現下半部的方法。這就是本文要討論的軟中斷、tasklet和工作隊列。

下表可以更直觀的看到它們之間的關系。
執行緒關系

軟中斷

軟中斷作為下半部機制的代表，是隨着SMP（share memory processor）的出現應運而生的，它也是tasklet實現的基礎（tasklet實際上只是在軟中斷的基礎上添加了一定的機制）。軟中斷一般是“可延遲函數”的總稱，有時候也包括了tasklet（請讀者在遇到的時候根據上下文推斷是否包含tasklet）。它的出現就是因為要滿足上面所提出的上半部和下半部的區別，使得對時間不敏感的任務延后執行，而且可以在多個CPU上並行執行，使得總的系統效率可以更高。它的特性包括：

產生后並不是馬上可以執行，必須要等待內核的調度才能執行。軟中斷不能被自己打斷(即單個cpu上軟中斷不能嵌套執行)，只能被硬件中斷打斷（上半部）。
可以並發運行在多個CPU上（即使同一類型的也可以）。所以軟中斷必須設計為可重入的函數（允許多個CPU同時操作），因此也需要使用自旋鎖來保其數據結構。

實現原理和實例

軟中斷的調度時機:

do_irq完成I/O中斷時調用irq_exit。
系統使用I/O APIC,在處理完本地時鍾中斷時。
local_bh_enable，即開啟本地軟中斷時。
SMP系統中，cpu處理完被CALL_FUNCTION_VECTOR處理器間中斷所觸發的函數時。
ksoftirqd/n線程被喚醒時。
下面以從中斷處理返回函數irq_exit中調用軟中斷為例詳細說明。
觸發和初始化的的流程如圖所示:

軟中斷處理流程

asmlinkage void __do_softirq(void) { struct softirq_action *h; __u32 pending; int max_restart = MAX_SOFTIRQ_RESTART; int cpu; pending = local_softirq_pending(); account_system_vtime(current); __local_bh_disable((unsigned long)__builtin_return_address(0)); lockdep_softirq_enter(); cpu = smp_processor_id(); restart: /* Reset the pending bitmask before enabling irqs */ set_softirq_pending(0); local_irq_enable(); h = softirq_vec; do { if (pending & 1) { int prev_count = preempt_count(); kstat_incr_softirqs_this_cpu(h - softirq_vec); trace_softirq_entry(h, softirq_vec); h->action(h); trace_softirq_exit(h, softirq_vec); if (unlikely(prev_count != preempt_count())) { printk(KERN_ERR "huh, entered softirq %td %s %p" "with preempt_count %08x," " exited with %08x?\n", h - softirq_vec, softirq_to_name[h - softirq_vec], h->action, prev_count, preempt_count()); preempt_count() = prev_count; } rcu_bh_qs(cpu); } h++; pending >>= 1; } while (pending); local_irq_disable(); pending = local_softirq_pending(); if (pending && --max_restart) goto restart; if (pending) wakeup_softirqd(); lockdep_softirq_exit(); account_system_vtime(current); _local_bh_enable(); }

首先調用local_softirq_pending函數取得目前有哪些位存在軟件中斷。
調用__local_bh_disable關閉軟中斷，其實就是設置正在處理軟件中斷標記，在同一個CPU上使得不能重入__do_softirq函數。
重新設置軟中斷標記為0，set_softirq_pending重新設置軟中斷標記為0，這樣在之后重新開啟中斷之后硬件中斷中又可以設置軟件中斷位。
調用local_irq_enable，開啟硬件中斷。
之后在一個循環中，遍歷pending標志的每一位，如果這一位設置就會調用軟件中斷的處理函數。在這個過程中硬件中斷是開啟的，隨時可以打斷軟件中斷。這樣保證硬件中斷不會丟失。
之后關閉硬件中斷(local_irq_disable)，查看是否又有軟件中斷處於pending狀態，如果是，並且在本次調用__do_softirq函數過程中沒有累計重復進入軟件中斷處理的次數超過max_restart=10次，就可以重新調用軟件中斷處理。如果超過了10次，就調用wakeup_softirqd()喚醒內核的一個進程來處理軟件中斷。設立10次的限制，也是為了避免影響系統響應時間。
調用_local_bh_enable開啟軟中斷。

軟中斷內核線程

之前我們分析的觸發軟件中斷的位置其實是中斷上下文中，而在軟中斷的內核線程中實際已經是進程的上下文。
這里說的軟中斷上下文指的就是系統為每個CPU建立的ksoftirqd進程。
軟中斷的內核進程中主要有兩個大循環，外層的循環處理有軟件中斷就處理，沒有軟件中斷就休眠。內層的循環處理軟件中斷，每循環一次都試探一次是否過長時間占據了CPU，需要調度就釋放CPU給其它進程。具體的操作在注釋中做了解釋。

    set_current_state(TASK_INTERRUPTIBLE); //外層大循環。 while (!kthread_should_stop()) { preempt_disable();//禁止內核搶占，自己掌握cpu if (!local_softirq_pending()) { preempt_enable_no_resched(); //如果沒有軟中斷在pending中就讓出cpu schedule(); //調度之后重新掌握cpu preempt_disable(); } __set_current_state(TASK_RUNNING); while (local_softirq_pending()) { /* Preempt disable stops cpu going offline. If already offline, we'll be on wrong CPU: don't process */ if (cpu_is_offline((long)__bind_cpu)) goto wait_to_die; //有軟中斷則開始軟中斷調度 do_softirq(); //查看是否需要調度，避免一直占用cpu preempt_enable_no_resched(); cond_resched(); preempt_disable(); rcu_sched_qs((long)__bind_cpu); } preempt_enable(); set_current_state(TASK_INTERRUPTIBLE); } __set_current_state(TASK_RUNNING); return 0; wait_to_die: preempt_enable(); /* Wait for kthread_stop */ set_current_state(TASK_INTERRUPTIBLE); while (!kthread_should_stop()) { schedule(); set_current_state(TASK_INTERRUPTIBLE); } __set_current_state(TASK_RUNNING); return 0;

tasklet

由於軟中斷必須使用可重入函數，這就導致設計上的復雜度變高，作為設備驅動程序的開發者來說，增加了負擔。而如果某種應用並不需要在多個CPU上並行執行，那么軟中斷其實是沒有必要的。因此誕生了彌補以上兩個要求的tasklet。它具有以下特性：
a）一種特定類型的tasklet只能運行在一個CPU上，不能並行，只能串行執行。
b）多個不同類型的tasklet可以並行在多個CPU上。
c）軟中斷是靜態分配的，在內核編譯好之后，就不能改變。但tasklet就靈活許多，可以在運行時改變（比如添加模塊時）。
tasklet是在兩種軟中斷類型的基礎上實現的，因此如果不需要軟中斷的並行特性，tasklet就是最好的選擇。也就是說tasklet是軟中斷的一種特殊用法，即延遲情況下的串行執行。

實現原理

調度原理

static inline void tasklet_schedule(struct tasklet_struct *t) { if (!test_and_set_bit(TASKLET_STATE_SCHED, &t->state)) __tasklet_schedule(t); } void __tasklet_schedule(struct tasklet_struct *t) { unsigned long flags; local_irq_save(flags); t->next = NULL; *__get_cpu_var(tasklet_vec).tail = t; __get_cpu_var(tasklet_vec).tail = &(t->next);//加入低優先級列表 raise_softirq_irqoff(TASKLET_SOFTIRQ);//觸發軟中斷 local_irq_restore(flags); }

tasklet執行過程
TASKLET_SOFTIRQ對應執行函數為tasklet_action，HI_SOFTIRQ為tasklet_hi_action，以tasklet_action為例說明，tasklet_hi_action大同小異。

static void tasklet_action(struct softirq_action *a) { struct tasklet_struct *list; local_irq_disable(); list = __get_cpu_var(tasklet_vec).head; __get_cpu_var(tasklet_vec).head = NULL; __get_cpu_var(tasklet_vec).tail = &__get_cpu_var(tasklet_vec).head;//取得tasklet鏈表 local_irq_enable(); while (list) { struct tasklet_struct *t = list; list = list->next; if (tasklet_trylock(t)) { if (!atomic_read(&t->count)) { //執行tasklet if (!test_and_clear_bit(TASKLET_STATE_SCHED, &t->state)) BUG(); t->func(t->data); tasklet_unlock(t); continue; } tasklet_unlock(t); } //如果t->count的值不等於0，說明這個tasklet在調度之后，被disable掉了，所以會將tasklet結構體重新放回到tasklet_vec鏈表，並重新調度TASKLET_SOFTIRQ軟中斷，在之后enable這個tasklet之后重新再執行它 local_irq_disable(); t->next = NULL; *__get_cpu_var(tasklet_vec).tail = t; __get_cpu_var(tasklet_vec).tail = &(t->next); __raise_softirq_irqoff(TASKLET_SOFTIRQ); local_irq_enable(); } }

tasklet執行流程

工作隊列

從上面的介紹看以看出，軟中斷運行在中斷上下文中，因此不能阻塞和睡眠，而tasklet使用軟中斷實現，當然也不能阻塞和睡眠。但如果某延遲處理函數需要睡眠或者阻塞呢？沒關系工作隊列就可以如您所願了。
把推后執行的任務叫做工作（work），描述它的數據結構為work_struct ，這些工作以隊列結構組織成工作隊列（workqueue），其數據結構為workqueue_struct ，而工作線程就是負責執行工作隊列中的工作。系統默認的工作者線程為events。
工作隊列(work queue)是另外一種將工作推后執行的形式。工作隊列可以把工作推后，交由一個內核線程去執行—這個下半部分總是會在進程上下文執行，但由於是內核線程，其不能訪問用戶空間。最重要特點的就是工作隊列允許重新調度甚至是睡眠。
通常，在工作隊列和軟中斷/tasklet中作出選擇非常容易。可使用以下規則：
- 如果推后執行的任務需要睡眠，那么只能選擇工作隊列。
- 如果推后執行的任務需要延時指定的時間再觸發，那么使用工作隊列，因為其可以利用timer延時(內核定時器實現)。
- 如果推后執行的任務需要在一個tick之內處理，則使用軟中斷或tasklet，因為其可以搶占普通進程和內核線程，同時不可睡眠。
- 如果推后執行的任務對延遲的時間沒有任何要求，則使用工作隊列，此時通常為無關緊要的任務。
實際上，工作隊列的本質就是將工作交給內核線程處理，因此其可以用內核線程替換。但是內核線程的創建和銷毀對編程者的要求較高，而工作隊列實現了內核線程的封裝，不易出錯，所以我們也推薦使用工作隊列。

實現原理

工作隊列的組織結構
即workqueue_struct、cpu_workqueue_struct與work_struct的關系。
一個工作隊列對應一個work_queue_struct，工作隊列中每cpu的工作隊列由cpu_workqueue_struct表示，而work_struct為其上的具體工作。
關系如下圖所示:

2.工作隊列的工作過程
應用實例
linux各個接口的狀態(up/down)的消息需要通知netdev_chain上感興趣的模塊同時上報用戶空間消息。這里使用的就是工作隊列。
具體流程圖如下所示：

是否處於中斷中在Linux中是通過preempt_count來判斷的,具體如下：在linux系統的進程數據結構里，有這么一個數據結構:
#define preempt_count() (current_thread_info()->preempt_count)
利用preempt_count可以表示是否處於中斷處理或者軟件中斷處理過程中,如下所示：
# define hardirq_count() (preempt_count() & HARDIRQ_MASK)
#define softirq_count() (preempt_count() & SOFTIRQ_MASK)
#define irq_count() (preempt_count() & (HARDIRQ_MASK | SOFTIRQ_MASK | NMI_MASK))
#define in_irq() (hardirq_count())
#define in_softirq() (softirq_count())
#define in_interrupt() (irq_count())

preempt_count的8～23位記錄中斷處理和軟件中斷處理過程的計數。如果有計數，表示系統在硬件中斷或者軟件中斷處理過程中。 ↩

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 《深入理解Linux內核》軟中斷/tasklet/工作隊列六、系統軟中斷、tasklet、工作隊列work queue的區別及使用 Linux內核實踐之工作隊列【轉】 kworker內核工作隊列詳解 Linux中斷管理 (3)workqueue工作隊列 linux內核工作隊列使用總結中斷下半部之工作隊列 linux工作隊列聊一聊Linux中的工作隊列 linux驅動中的工作隊列理解

Linux內核中的軟中斷、tasklet和工作隊列詳解【轉】

引言

軟中斷

相關數據結構

相關API

實現原理和實例

軟中斷處理流程

軟中斷內核線程

tasklet

相關數據結構

相關API

實現原理

工作隊列

相關數據結構

相關API

實現原理

免責聲明！