序言就像我們在操作系統里學習的那樣,如果多個程序(進程或線程)同時訪問臨界區數據就會發生競爭。存在競爭條件的程序會產生不可預料的結果。消除競爭的方法一般就是同步的訪問臨界區數據(原子訪問)。Linux內核提供了多種技術用來實現內核同步操作。下面我們就分別介紹。
內核同步技術Linux內核是多進程、多線程的操作系統,它提供了相當完整的內核同步方法。作為一個總結,我們先列出內核同步方法列表,這樣我們可以從總體上對內核同步技術有個了解,然后我們這分別對每個同步技術做詳細介紹。
同步技術 |
同步技術描述 |
自旋鎖 |
|
讀寫自旋鎖 |
|
信號量 |
|
讀寫信號量
|
|
原子操作
|
|
內存屏障 |
|
完成變量
|
|
大內核鎖 |
|
seq鎖
|
|
鎖機制是一種廣泛使用的同步技術,Linux內核中最常見的鎖就是自旋鎖(spin lock)。自旋鎖被設計工作在多個處理器上(SMP),它只能被一個CPU上的一個進程(線程)所持有。它也可以工作在支持搶占的單處理器上。如果另一個進程或線程試圖獲取一個被持有的自旋鎖,那么它就會在該鎖上自旋(循環的執行一小段代碼)直到該鎖被釋放。從這個意義上說,自旋鎖是忙等待的,這就會特別浪費處理器的時間,因此自旋鎖不應該被長時間持有。對于單處理器并且不可搶占的內核來說,自旋鎖什么也不作。
需要強調的是,自旋鎖別設計用于多處理器的同步機制,對于單處理器,內核在編譯時不會引入自旋鎖機制,對于可搶占的內核,它僅僅被用于設置內核的搶占機制是否開啟的一個開關,也就是說加鎖和解鎖實際變成了禁止或開啟內核搶占功能。如果內核不支持搶占,那么自旋鎖根本就不會編譯到內核中。
內核中使用spinlock_t類型來表示自旋鎖,它定義在<linux/spinlock_types.h>:
typedef struct { raw_spinlock_t raw_lock; #if defined(CONFIG_PREEMPT) && defined(CONFIG_SMP) unsigned int break_lock; #endif } spinlock_t; |
對于不支持SMP的內核來說,struct raw_spinlock_t什么也沒有,是一個空結構。對于支持多處理器的內核來說,struct raw_spinlock_t定義為
typedef struct { unsigned int slock; } raw_spinlock_t; |
slock表示了自旋鎖的狀態,“1”表示自旋鎖處于解鎖狀態(UNLOCK),“0”表示自旋鎖處于上鎖狀態(LOCKED)。
break_lock表示當前是否由進程在等待自旋鎖,顯然,它只有在支持搶占的SMP內核上才起作用。
自旋鎖的實現是一個復雜的過程,說它復雜不是因為需要多少代碼或邏輯來實現它,其實它的實現代碼很少。自旋鎖的實現跟體系結構關系密切,核心代碼基本也是由匯編語言寫成,與體協結構相關的核心代碼都放在相關的<asm/>目錄下,比如<asm/spinlock.h>。對于我們驅動程序開發人員來說,我們沒有必要了解這么spinlock的內部細節,如果你對它感興趣,請參考閱讀Linux內核源代碼。對于我們驅動的spinlock接口,我們只需包括<linux/spinlock.h>頭文件。在我們詳細的介紹spinlock的API之前,我們先來看看自旋鎖的一個基本使用格式:
#include <linux/spinlock.h> spinlock_t lock = SPIN_LOCK_UNLOCKED;
spin_lock(&lock); .... spin_unlock(&lock); |
從使用上來說,spinlock的API還很簡單的,一般我們會用的的API如下表,其實它們都是定義在<linux/spinlock.h>中的宏接口,真正的實現在<asm/spinlock.h>中
#include <linux/spinlock.h> SPIN_LOCK_UNLOCKED DEFINE_SPINLOCK spin_lock_init( spinlock_t *) spin_lock(spinlock_t *) spin_unlock(spinlock_t *) spin_lock_irq(spinlock_t *) spin_unlock_irq(spinlock_t *) spin_lock_irqsace(spinlock_t *,unsigned long flags) spin_unlock_irqsace(spinlock_t *, unsigned long flags) spin_trylock(spinlock_t *) spin_is_locked(spinlock_t *) |
spinlock有兩種初始化形式,一種是靜態初始化,一種是動態初始化。對于靜態的spinlock對象,我們用 SPIN_LOCK_UNLOCKED來初始化,它是一個宏。當然,我們也可以把聲明spinlock和初始化它放在一起做,這就是 DEFINE_SPINLOCK宏的工作,因此,下面的兩行代碼是等價的。
DEFINE_SPINLOCK (lock); spinlock_t lock = SPIN_LOCK_UNLOCKED; |
spin_lock_init 函數一般用來初始化動態創建的spinlock_t對象,它的參數是一個指向spinlock_t對象的指針。當然,它也可以初始化一個靜態的沒有初始化的spinlock_t對象。
spinlock_t *lock ...... spin_lock_init(lock); |
內核提供了三個函數用于獲取一個自旋鎖。
spin_lock:獲取指定的自旋鎖。
spin_lock_irq:禁止本地中斷并獲取自旋鎖。
spin_lock_irqsace:保存本地中斷狀態,禁止本地中斷并獲取自旋鎖,返回本地中斷狀態。
自旋鎖是可以使用在中斷處理程序中的,這時需要使用具有關閉本地中斷功能的函數,我們推薦使用 spin_lock_irqsave,因為它會保存加鎖前的中斷標志,這樣就會正確恢復解鎖時的中斷標志。如果spin_lock_irq在加鎖時中斷是關閉的,那么在解鎖時就會錯誤的開啟中斷。
另外兩個同自旋鎖獲取相關的函數是:
spin_trylock():嘗試獲取自旋鎖,如果獲取失敗則立即返回非0值,否則返回0。
spin_is_locked():判斷指定的自旋鎖是否已經被獲取了。如果是則返回非0,否則,返回0。
同獲取鎖相對應,內核提供了三個相對的函數來釋放自旋鎖。
spin_unlock:釋放指定的自旋鎖。
spin_unlock_irq:釋放自旋鎖并激活本地中斷。
spin_unlock_irqsave:釋放自旋鎖,并恢復保存的本地中斷狀態。
如果臨界區保護的數據是可讀可寫的,那么只要沒有寫操作,對于讀是可以支持并發操作的。對于這種只要求寫操作是互斥的需求,如果還是使用自旋鎖顯然是無法滿足這個要求(對于讀操作實在是太浪費了)。為此內核提供了另一種鎖-讀寫自旋鎖,讀自旋鎖也叫共享自旋鎖,寫自旋鎖也叫排他自旋鎖。
讀寫自旋鎖的使用也普通自旋鎖的使用很類似,首先要初始化讀寫自旋鎖對象:
// 靜態初始化 rwlock_t rwlock = RW_LOCK_UNLOCKED; //動態初始化 rwlock_t *rwlock; ... rw_lock_init(rwlock); |
在讀操作代碼里對共享數據獲取讀自旋鎖:
read_lock(&rwlock); ... read_unlock(&rwlock); |
在寫操作代碼里為共享數據獲取寫自旋鎖:
write_lock(&rwlock); ... write_unlock(&rwlock); |
需要注意的是,如果有大量的寫操作,會使寫操作自旋在寫自旋鎖上而處于寫饑餓狀態(等待讀自旋鎖的全部釋放),因為讀自旋鎖會自由的獲取讀自旋鎖。
讀寫自旋鎖的函數類似于普通自旋鎖,這里就不一一介紹了,我們把它列在下面的表中。
RW_LOCK_UNLOCKED rw_lock_init(rwlock_t *) read_lock(rwlock_t *) read_unlock(rwlock_t *) read_lock_irq(rwlock_t *) read_unlock_irq(rwlock_t *) read_lock_irqsave(rwlock_t *, unsigned long) read_unlock_irqsave(rwlock_t *, unsigned long) write_lock(rwlock_t *) write_unlock(rwlock_t *) write_lock_irq(rwlock_t *) write_unlock_irq(rwlock_t *) write_lock_irqsave(rwlock_t *, unsigned long) write_unlock_irqsave(rwlock_t *, unsigned long) rw_is_locked(rwlock_t *) |
信號量,或旗標,就是我們在操作系統里學習的經典的P/V原語操作。
P:如果信號量值大于0,則遞減信號量的值,程序繼續執行,否則,睡眠等待信號量大于0。
V:遞增信號量的值,如果遞增的信號量的值大于0,則喚醒等待的進程。
信號量的值確定了同時可以有多少個進程可以同時進入臨界區,如果信號量的初始值始1,這信號量就是互斥信號量(MUTEX)。對于大于1的非0值信號量,也可稱為計數信號量(counting semaphore)。對于一般的驅動程序使用的信號量都是互斥信號量。