Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序是Linux操作系統(tǒng)網(wǎng)絡(luò)應(yīng)用中的一個(gè)重要組成部分。分析其運(yùn)行機(jī)理,對(duì)于設(shè)計(jì)Linux網(wǎng)絡(luò)應(yīng)用程序是很有幫助的。我們可以在網(wǎng)絡(luò)驅(qū)動(dòng)程序這一級(jí)做一些與應(yīng)用相關(guān)聯(lián)的特殊事情,例如在設(shè)計(jì)Linux防火墻和網(wǎng)絡(luò)
入侵檢測(cè)系統(tǒng)時(shí),可以在網(wǎng)絡(luò)驅(qū)動(dòng)程序的基礎(chǔ)上攔截網(wǎng)絡(luò)數(shù)據(jù)包,繼而對(duì)其進(jìn)行分析。由于Linux是開(kāi)放源代碼的,所以給我們提供了一個(gè)分析和改造網(wǎng)絡(luò)驅(qū)動(dòng)程序,并使其滿(mǎn)足特殊應(yīng)用的絕好機(jī)會(huì)。本文對(duì)
Linux內(nèi)核中的網(wǎng)絡(luò)驅(qū)動(dòng)程序部分進(jìn)行了詳細(xì)討論,并給出了實(shí)現(xiàn)Linux網(wǎng)絡(luò)驅(qū)動(dòng)程序的重要過(guò)程、一種實(shí)現(xiàn)模式和具體實(shí)例。
運(yùn)行機(jī)理
1.體系結(jié)構(gòu)
Linux網(wǎng)絡(luò)驅(qū)動(dòng)程序的體系結(jié)構(gòu)如圖1所示。可以劃分為四層,從上到下分別為
協(xié)議接口層、網(wǎng)絡(luò)設(shè)備接口層、提供實(shí)際功能的設(shè)備驅(qū)動(dòng)功能層,以及網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)媒介層。在設(shè)計(jì)網(wǎng)絡(luò)驅(qū)動(dòng)程序時(shí),最主要的工作就是完成設(shè)備驅(qū)動(dòng)功能層,使其滿(mǎn)足我們自己所需的功能。在Linux中,把所有網(wǎng)絡(luò)設(shè)備都抽象為一個(gè)接口。這個(gè)接口提供了對(duì)所有網(wǎng)絡(luò)設(shè)備的操作集合。由
數(shù)據(jù)結(jié)構(gòu) struct device來(lái)表示網(wǎng)絡(luò)設(shè)備在內(nèi)核中的運(yùn)行情況,即網(wǎng)絡(luò)設(shè)備接口。它既包括純軟件網(wǎng)絡(luò)設(shè)備接口,如環(huán)路(Loopback),也可以包括硬件網(wǎng)絡(luò)設(shè)備接口,如
以太網(wǎng)卡。它由以dev_base為頭指針的設(shè)備鏈表來(lái)集中管理所有網(wǎng)絡(luò)設(shè)備。該設(shè)備鏈表中的每個(gè)元素代表一個(gè)網(wǎng)絡(luò)設(shè)備接口。數(shù)據(jù)結(jié)構(gòu)device中有很多供系統(tǒng)訪問(wèn)和協(xié)議層調(diào)用的設(shè)備方法,包括供設(shè)備初始化和往系統(tǒng)注冊(cè)用的init函數(shù)、打開(kāi)和關(guān)閉網(wǎng)絡(luò)設(shè)備的open和stop函數(shù)、處理數(shù)據(jù)包發(fā)送的函數(shù)hard_ start_xmit,以及中斷處理函數(shù)等。有關(guān)device數(shù)據(jù)結(jié)構(gòu)(在內(nèi)核中也就是net_device)的詳細(xì)內(nèi)容,請(qǐng)參看/linux/include/linux/netdevice.h
2.初始化
網(wǎng)絡(luò)設(shè)備的初始化主要是由device數(shù)據(jù)結(jié)構(gòu)中的init函數(shù)指針?biāo)傅某跏蓟瘮?shù)來(lái)完成的。當(dāng)內(nèi)核啟動(dòng)或加載網(wǎng)絡(luò)驅(qū)動(dòng)模塊的時(shí)候,就會(huì)調(diào)用初始化過(guò)程。這個(gè)過(guò)程將首先檢測(cè)網(wǎng)絡(luò)物理設(shè)備是否存在。它通過(guò)檢測(cè)物理設(shè)備的硬件特征來(lái)完成,然后再對(duì)設(shè)備進(jìn)行資源配置。這些完成之后就要構(gòu)造設(shè)備的device數(shù)據(jù)結(jié)構(gòu),用檢測(cè)到的數(shù)值來(lái)對(duì)device中的變量初始化。這一步很重要。最后向Linux內(nèi)核注冊(cè)該設(shè)備并申請(qǐng)內(nèi)存空間。
3. 數(shù)據(jù)包的發(fā)送與接收
數(shù)據(jù)包的發(fā)送和接收是實(shí)現(xiàn)Linux網(wǎng)絡(luò)驅(qū)動(dòng)程序中兩個(gè)最關(guān)鍵的過(guò)程。對(duì)這兩個(gè)過(guò)程處理的好壞將直接影響到驅(qū)動(dòng)程序的整體運(yùn)行質(zhì)量。圖1中也很明確地說(shuō)明了網(wǎng)絡(luò)數(shù)據(jù)包的傳輸過(guò)程。首先在網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)加載時(shí),通過(guò)device域中的init函數(shù)指針調(diào)用網(wǎng)絡(luò)設(shè)備的初始化函數(shù),對(duì)設(shè)備進(jìn)行初始化。如果操作成功就可以通過(guò)device域中的open函數(shù)指針調(diào)用網(wǎng)絡(luò)設(shè)備的打開(kāi)函數(shù)打開(kāi)設(shè)備,再通過(guò)device域中的建立硬件包頭函數(shù)指針hard_header來(lái)建立硬件包頭信息。最后通過(guò)協(xié)議接口層函數(shù)dev_queue_xmit(詳見(jiàn)/linux/net/core/dev.c)來(lái)調(diào)用device域中的hard_start_xmit函數(shù)指針,完成數(shù)據(jù)包的發(fā)送。該函數(shù)將把存放在套接字緩沖區(qū)中的數(shù)據(jù)發(fā)送到物理設(shè)備。該緩沖區(qū)是由數(shù)據(jù)結(jié)構(gòu)sk_buff (詳見(jiàn)/linux/include/linux/sk_buff.h)來(lái)表示的。
數(shù)據(jù)包的接收是通過(guò)中斷機(jī)制來(lái)完成的。當(dāng)有數(shù)據(jù)到達(dá)時(shí),就產(chǎn)生中斷信號(hào),網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)功能層就調(diào)用中斷處理程序,即數(shù)據(jù)包接收程序來(lái)處理數(shù)據(jù)包的接收。然后,
網(wǎng)絡(luò)協(xié)議接口層調(diào)用netif_rx函數(shù)(詳見(jiàn)/linux/net/core/dev.c),把接收到的數(shù)據(jù)包傳輸?shù)骄W(wǎng)絡(luò)協(xié)議的上層進(jìn)行處理。
實(shí)現(xiàn)模式
實(shí)現(xiàn)Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)功能主要有兩種形式:一是通過(guò)內(nèi)核來(lái)進(jìn)行加載,當(dāng)內(nèi)核啟動(dòng)的時(shí)候,就開(kāi)始加載網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序,內(nèi)核啟動(dòng)完成之后,網(wǎng)絡(luò)驅(qū)動(dòng)功能也隨即實(shí)現(xiàn)了;再就是通過(guò)模塊加載的形式。比較兩者,第二種形式更加靈活。在此著重對(duì)模塊加載形式進(jìn)行討論。
模塊設(shè)計(jì)是Linux中特有的技術(shù),它使Linux內(nèi)核功能更容易擴(kuò)展。采用模塊來(lái)設(shè)計(jì)Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序會(huì)很輕松,并且能夠形成固定的模式。任何人只要依照這個(gè)模式去設(shè)計(jì),都能設(shè)計(jì)出優(yōu)良的網(wǎng)絡(luò)驅(qū)動(dòng)程序。先簡(jiǎn)要介紹一下基于模塊加載網(wǎng)絡(luò)驅(qū)動(dòng)程序的設(shè)計(jì)步驟,后面還結(jié)合具體實(shí)例來(lái)講解。首先通過(guò)模塊加載命令insmod來(lái)把網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序插入到內(nèi)核之中。然后,insmod將調(diào)用init_module()函數(shù)首先對(duì)網(wǎng)絡(luò)設(shè)備的init函數(shù)指針初始化,再通過(guò)調(diào)用register_netdev()函數(shù)在Linux系統(tǒng)中注冊(cè)該網(wǎng)絡(luò)設(shè)備。如果成功,再調(diào)用init函數(shù)指針?biāo)傅木W(wǎng)絡(luò)設(shè)備初始化函數(shù)來(lái)對(duì)設(shè)備初始化,將設(shè)備的device數(shù)據(jù)結(jié)構(gòu)插入到dev_base鏈表的末尾。最后可以通過(guò)執(zhí)行模塊卸載命令rmmod,來(lái)調(diào)用網(wǎng)絡(luò)驅(qū)動(dòng)程序中的cleanup_module()函數(shù),對(duì)網(wǎng)絡(luò)驅(qū)動(dòng)程序模塊進(jìn)行卸載。具體實(shí)現(xiàn)過(guò)程見(jiàn)圖2所示。
通過(guò)模塊初始化網(wǎng)絡(luò)接口是在編譯內(nèi)核時(shí)標(biāo)記為編譯為模塊。系統(tǒng)在啟動(dòng)時(shí)并不知道該接口的存在,需要用戶(hù)在/etc/rc.d/目錄中定義的初始啟動(dòng)腳本中寫(xiě)入命令或手動(dòng)將模塊插入內(nèi)核空間來(lái)激活網(wǎng)絡(luò)接口。這也給我們?cè)诤螘r(shí)加載網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序提供了靈活性。
應(yīng)用實(shí)例
我們以NE2000兼容網(wǎng)卡為例,來(lái)具體介紹基于模塊的網(wǎng)絡(luò)驅(qū)動(dòng)程序的設(shè)計(jì)過(guò)程。可以參考文件linux/drivers/net/ne.c和linux/drivers/net/8390.c。
1.模塊加載和卸載
NE2000網(wǎng)卡的模塊加載功能由init_module()函數(shù)完成。具體過(guò)程及解釋如下:
int init_module(void)
{
int this_dev, found = 0;
//循環(huán)檢測(cè)ne2000類(lèi)型的網(wǎng)絡(luò)設(shè)備接口
for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++)
{
//獲得網(wǎng)絡(luò)接口對(duì)應(yīng)的net-device結(jié)構(gòu)指針
struct net_device *dev = &dev_ne[this_dev];
dev->irq = irq[this_dev]; //初始化該接口的中斷請(qǐng)求號(hào)
dev->mem_end = bad[this_dev]; //初始化接收緩沖區(qū)的終點(diǎn)位置
dev->base_addr = io[this_dev]; //初始化網(wǎng)絡(luò)接口的I/O基地址
dev->init = ne_probe; //初始化init為ne_probe,后面介紹此函數(shù)
//調(diào)用registre_netdevice()向系統(tǒng)登記網(wǎng)絡(luò)接口,在這個(gè)函數(shù)中將分配給網(wǎng)絡(luò)接口在系統(tǒng)中惟一
的名稱(chēng)。并且將該網(wǎng)絡(luò)接口設(shè)備添加到系統(tǒng)管理的鏈表dev-base中進(jìn)行管理。
if (register_netdev(dev) == 0) {
found++;
continue; }
… //省略
}
return 0;}
模塊卸載功能由cleanup_module()函數(shù)來(lái)實(shí)現(xiàn)。如下所示:
void cleanup_module(void)
{
int this_dev;
//遍歷整個(gè)dev-ne數(shù)組
for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++) {
//獲得net-device結(jié)構(gòu)指針
struct net_device *dev = &dev_ne[this_dev];
if (dev->priv != NULL) {
void *priv = dev->priv;
struct pci_dev *idev = (struct pci_dev *)ei_status.priv;
//調(diào)用函數(shù)指針 idev->deactive將已經(jīng)激活的網(wǎng)卡關(guān)閉使用
if (idev) idev->deactivate(idev);
free_irq(dev->irq, dev);
//調(diào)用函數(shù)release_region()釋放該網(wǎng)卡占用的I/O地址空間
release_region(dev->base_addr, NE_IO_EXTENT);
//調(diào)用unregister_netdev()注銷(xiāo) 這個(gè)net_device()結(jié)構(gòu)
unregister_netdev(dev);
kfree(priv); //釋放priv空間
}
}
}
2.網(wǎng)絡(luò)接口初始化
實(shí)現(xiàn)此功能是由ne_probe()函數(shù)來(lái)完成的。前面已經(jīng)提到過(guò),在init_module()函數(shù)中用它來(lái)初始化init函數(shù)指針。它主要對(duì)網(wǎng)卡進(jìn)行檢測(cè),并且初始化系統(tǒng)中網(wǎng)絡(luò)設(shè)備信息,用于后面的網(wǎng)絡(luò)數(shù)據(jù)的發(fā)送和接收。具體過(guò)程及解釋如下:
int __init ne_probe(struct net_device *dev)
{
unsigned int base_addr = dev->base_addr;
//初始化dev-owner成員,因?yàn)槭褂媚K類(lèi)型驅(qū)動(dòng),會(huì)將dev-owner指向?qū)ο髆odules結(jié)構(gòu)指針。
SET_MODULE_OWNER(dev);
//檢測(cè)dev->base_addr是否合法,是則執(zhí)行ne-probe1()函數(shù)檢測(cè)過(guò)程。不是,則需要自動(dòng)檢測(cè)。
if (base_addr > 0x1ff)
return ne_probe1(dev, base_addr);
else if (base_addr != 0)
return -ENXIO;
//如果有ISAPnP設(shè)備,則調(diào)用ne_probe_isapnp()檢測(cè)這種類(lèi)型的網(wǎng)卡。
if (isapnp_present() && (ne_probe_isapnp(dev) == 0))
return 0;
…//省略
return -ENODEV;
}
這其中兩個(gè)函數(shù)ne_probe_isapnp()和ne_probe19()的區(qū)別在于檢測(cè)中斷號(hào)上。PCI方式只需指定I/O基地址就可以自動(dòng)獲得IRQ,是由BIOS自動(dòng)分配的;而ISA方式需要獲得空閑的中斷資源才能分配。
3.網(wǎng)絡(luò)接口設(shè)備打開(kāi)和關(guān)閉
網(wǎng)絡(luò)接口設(shè)備打開(kāi)就是激活網(wǎng)絡(luò)接口,使它能接收來(lái)自網(wǎng)絡(luò)的數(shù)據(jù)并且傳遞到網(wǎng)絡(luò)協(xié)議棧的上面,也可以將數(shù)據(jù)發(fā)送到網(wǎng)絡(luò)上。設(shè)備關(guān)閉就是停止操作。
在NE2000網(wǎng)絡(luò)驅(qū)動(dòng)程序中,網(wǎng)絡(luò)設(shè)備打開(kāi)由dev_open()和ne_open()完成,設(shè)備關(guān)閉有dev_close()和ne_close()完成。它們相應(yīng)調(diào)用底層函數(shù)ei_open()和ei_close()來(lái)完成。其實(shí)現(xiàn)過(guò)程相對(duì)簡(jiǎn)單,不再贅述。