以文本方式查看主題 - 曙海教育集團論壇 (http://www.hufushizhe.com/bbs/index.asp) -- Linux驅動開發(fā) (http://www.hufushizhe.com/bbs/list.asp?boardid=33) ---- 設計Linux系統(tǒng)網(wǎng)絡設備驅動程序 (http://www.hufushizhe.com/bbs/dispbbs.asp?boardid=33&id=1733) |
-- 作者:wangxinxin -- 發(fā)布時間:2010-11-24 11:28:57 -- 設計Linux系統(tǒng)網(wǎng)絡設備驅動程序 Linux網(wǎng)絡設備驅動程序是Linux操作系統(tǒng)網(wǎng)絡應用中的一個重要組成部分。分析其運行機理,對于設計Linux網(wǎng)絡應用程序是很有幫助的。我們可以在網(wǎng)絡驅動程序這一級做一些與應用相關聯(lián)的特殊事情,例如在設計Linux防火墻和網(wǎng)絡入侵檢測系統(tǒng)時,可以在網(wǎng)絡驅動程序的基礎上攔截網(wǎng)絡數(shù)據(jù)包,繼而對其進行分析。由于Linux是開放源代碼的,所以給我們提供了一個分析和改造網(wǎng)絡驅動程序,并使其滿足特殊應用的絕好機會。本文對Linux內核中的網(wǎng)絡驅動程序部分進行了詳細討論,并給出了實現(xiàn)Linux網(wǎng)絡驅動程序的重要過程、一種實現(xiàn)模式和具體實例。 運行機理 1.體系結構 Linux網(wǎng)絡驅動程序的體系結構如圖1所示。可以劃分為四層,從上到下分別為協(xié)議接口層、網(wǎng)絡設備接口層、提供實際功能的設備驅動功能層,以及網(wǎng)絡設備和網(wǎng)絡媒介層。在設計網(wǎng)絡驅動程序時,最主要的工作就是完成設備驅動功能層,使其滿足我們自己所需的功能。在Linux中,把所有網(wǎng)絡設備都抽象為一個接口。這個接口提供了對所有網(wǎng)絡設備的操作集合。由數(shù)據(jù)結構 struct device來表示網(wǎng)絡設備在內核中的運行情況,即網(wǎng)絡設備接口。它既包括純軟件網(wǎng)絡設備接口,如環(huán)路(Loopback),也可以包括硬件網(wǎng)絡設備接口,如以太網(wǎng)卡。它由以dev_base為頭指針的設備鏈表來集中管理所有網(wǎng)絡設備。該設備鏈表中的每個元素代表一個網(wǎng)絡設備接口。數(shù)據(jù)結構device中有很多供系統(tǒng)訪問和協(xié)議層調用的設備方法,包括供設備初始化和往系統(tǒng)注冊用的init函數(shù)、打開和關閉網(wǎng)絡設備的open和stop函數(shù)、處理數(shù)據(jù)包發(fā)送的函數(shù)hard_ start_xmit,以及中斷處理函數(shù)等。有關device數(shù)據(jù)結構(在內核中也就是net_device)的詳細內容,請參看/linux/include/linux/netdevice.h 2.初始化 網(wǎng)絡設備的初始化主要是由device數(shù)據(jù)結構中的init函數(shù)指針所指的初始化函數(shù)來完成的。當內核啟動或加載網(wǎng)絡驅動模塊的時候,就會調用初始化過程。這個過程將首先檢測網(wǎng)絡物理設備是否存在。它通過檢測物理設備的硬件特征來完成,然后再對設備進行資源配置。這些完成之后就要構造設備的device數(shù)據(jù)結構,用檢測到的數(shù)值來對device中的變量初始化。這一步很重要。最后向Linux內核注冊該設備并申請內存空間。 3. 數(shù)據(jù)包的發(fā)送與接收 數(shù)據(jù)包的發(fā)送和接收是實現(xiàn)Linux網(wǎng)絡驅動程序中兩個最關鍵的過程。對這兩個過程處理的好壞將直接影響到驅動程序的整體運行質量。圖1中也很明確地說明了網(wǎng)絡數(shù)據(jù)包的傳輸過程。首先在網(wǎng)絡設備驅動加載時,通過device域中的init函數(shù)指針調用網(wǎng)絡設備的初始化函數(shù),對設備進行初始化。如果操作成功就可以通過device域中的open函數(shù)指針調用網(wǎng)絡設備的打開函數(shù)打開設備,再通過device域中的建立硬件包頭函數(shù)指針hard_header來建立硬件包頭信息。最后通過協(xié)議接口層函數(shù)dev_queue_xmit(詳見/linux/net/core/dev.c)來調用device域中的hard_start_xmit函數(shù)指針,完成數(shù)據(jù)包的發(fā)送。該函數(shù)將把存放在套接字緩沖區(qū)中的數(shù)據(jù)發(fā)送到物理設備。該緩沖區(qū)是由數(shù)據(jù)結構sk_buff (詳見/linux/include/linux/sk_buff.h)來表示的。 數(shù)據(jù)包的接收是通過中斷機制來完成的。當有數(shù)據(jù)到達時,就產(chǎn)生中斷信號,網(wǎng)絡設備驅動功能層就調用中斷處理程序,即數(shù)據(jù)包接收程序來處理數(shù)據(jù)包的接收。然后,網(wǎng)絡協(xié)議接口層調用netif_rx函數(shù)(詳見/linux/net/core/dev.c),把接收到的數(shù)據(jù)包傳輸?shù)骄W(wǎng)絡協(xié)議的上層進行處理。 實現(xiàn)模式 實現(xiàn)Linux網(wǎng)絡設備驅動功能主要有兩種形式:一是通過內核來進行加載,當內核啟動的時候,就開始加載網(wǎng)絡設備驅動程序,內核啟動完成之后,網(wǎng)絡驅動功能也隨即實現(xiàn)了;再就是通過模塊加載的形式。比較兩者,第二種形式更加靈活。在此著重對模塊加載形式進行討論。 模塊設計是Linux中特有的技術,它使Linux內核功能更容易擴展。采用模塊來設計Linux網(wǎng)絡設備驅動程序會很輕松,并且能夠形成固定的模式。任何人只要依照這個模式去設計,都能設計出優(yōu)良的網(wǎng)絡驅動程序。先簡要介紹一下基于模塊加載網(wǎng)絡驅動程序的設計步驟,后面還結合具體實例來講解。首先通過模塊加載命令insmod來把網(wǎng)絡設備驅動程序插入到內核之中。然后,insmod將調用init_module()函數(shù)首先對網(wǎng)絡設備的init函數(shù)指針初始化,再通過調用register_netdev()函數(shù)在Linux系統(tǒng)中注冊該網(wǎng)絡設備。如果成功,再調用init函數(shù)指針所指的網(wǎng)絡設備初始化函數(shù)來對設備初始化,將設備的device數(shù)據(jù)結構插入到dev_base鏈表的末尾。最后可以通過執(zhí)行模塊卸載命令rmmod,來調用網(wǎng)絡驅動程序中的cleanup_module()函數(shù),對網(wǎng)絡驅動程序模塊進行卸載。具體實現(xiàn)過程見圖2所示。 通過模塊初始化網(wǎng)絡接口是在編譯內核時標記為編譯為模塊。系統(tǒng)在啟動時并不知道該接口的存在,需要用戶在/etc/rc.d/目錄中定義的初始啟動腳本中寫入命令或手動將模塊插入內核空間來激活網(wǎng)絡接口。這也給我們在何時加載網(wǎng)絡設備驅動程序提供了靈活性。 應用實例 我們以NE2000兼容網(wǎng)卡為例,來具體介紹基于模塊的網(wǎng)絡驅動程序的設計過程。可以參考文件linux/drivers/net/ne.c和linux/drivers/net/8390.c。 1.模塊加載和卸載 NE2000網(wǎng)卡的模塊加載功能由init_module()函數(shù)完成。具體過程及解釋如下: int init_module(void) { int this_dev, found = 0; //循環(huán)檢測ne2000類型的網(wǎng)絡設備接口 for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++) { //獲得網(wǎng)絡接口對應的net-device結構指針 struct net_device *dev = &dev_ne[this_dev]; dev->irq = irq[this_dev]; //初始化該接口的中斷請求號 dev->mem_end = bad[this_dev]; //初始化接收緩沖區(qū)的終點位置 dev->base_addr = io[this_dev]; //初始化網(wǎng)絡接口的I/O基地址 dev->init = ne_probe; //初始化init為ne_probe,后面介紹此函數(shù) //調用registre_netdevice()向系統(tǒng)登記網(wǎng)絡接口,在這個函數(shù)中將分配給網(wǎng)絡接口在系統(tǒng)中惟一 的名稱。并且將該網(wǎng)絡接口設備添加到系統(tǒng)管理的鏈表dev-base中進行管理。 if (register_netdev(dev) == 0) { found++; continue; } … //省略 } return 0;} 模塊卸載功能由cleanup_module()函數(shù)來實現(xiàn)。如下所示: void cleanup_module(void) { int this_dev; //遍歷整個dev-ne數(shù)組 for (this_dev = 0; this_dev < MAX_NE_CARDS; this_dev++) { //獲得net-device結構指針 struct net_device *dev = &dev_ne[this_dev]; if (dev->priv != NULL) { void *priv = dev->priv; struct pci_dev *idev = (struct pci_dev *)ei_status.priv; //調用函數(shù)指針 idev->deactive將已經(jīng)激活的網(wǎng)卡關閉使用 if (idev) idev->deactivate(idev); free_irq(dev->irq, dev); //調用函數(shù)release_region()釋放該網(wǎng)卡占用的I/O地址空間 release_region(dev->base_addr, NE_IO_EXTENT); //調用unregister_netdev()注銷 這個net_device()結構 unregister_netdev(dev); kfree(priv); //釋放priv空間 } } } 2.網(wǎng)絡接口初始化 實現(xiàn)此功能是由ne_probe()函數(shù)來完成的。前面已經(jīng)提到過,在init_module()函數(shù)中用它來初始化init函數(shù)指針。它主要對網(wǎng)卡進行檢測,并且初始化系統(tǒng)中網(wǎng)絡設備信息,用于后面的網(wǎng)絡數(shù)據(jù)的發(fā)送和接收。具體過程及解釋如下: int __init ne_probe(struct net_device *dev) { unsigned int base_addr = dev->base_addr; //初始化dev-owner成員,因為使用模塊類型驅動,會將dev-owner指向對象modules結構指針。 SET_MODULE_OWNER(dev); //檢測dev->base_addr是否合法,是則執(zhí)行ne-probe1()函數(shù)檢測過程。不是,則需要自動檢測。 if (base_addr > 0x1ff) return ne_probe1(dev, base_addr); else if (base_addr != 0) return -ENXIO; //如果有ISAPnP設備,則調用ne_probe_isapnp()檢測這種類型的網(wǎng)卡。 if (isapnp_present() && (ne_probe_isapnp(dev) == 0)) return 0; …//省略 return -ENODEV; } 這其中兩個函數(shù)ne_probe_isapnp()和ne_probe19()的區(qū)別在于檢測中斷號上。PCI方式只需指定I/O基地址就可以自動獲得IRQ,是由BIOS自動分配的;而ISA方式需要獲得空閑的中斷資源才能分配。 3.網(wǎng)絡接口設備打開和關閉 網(wǎng)絡接口設備打開就是激活網(wǎng)絡接口,使它能接收來自網(wǎng)絡的數(shù)據(jù)并且傳遞到網(wǎng)絡協(xié)議棧的上面,也可以將數(shù)據(jù)發(fā)送到網(wǎng)絡上。設備關閉就是停止操作。 在NE2000網(wǎng)絡驅動程序中,網(wǎng)絡設備打開由dev_open()和ne_open()完成,設備關閉有dev_close()和ne_close()完成。它們相應調用底層函數(shù)ei_open()和ei_close()來完成。其實現(xiàn)過程相對簡單,不再贅述。 |