PCI是一種廣泛采用的總線標(biāo)準(zhǔn),它提供了許多優(yōu)于其它總線標(biāo)準(zhǔn)(如EISA)的新特性,目前已經(jīng)成為計(jì)算機(jī)系統(tǒng)中應(yīng)用最為廣泛,并且最為通用的總線標(biāo)準(zhǔn)。Linux的內(nèi)核能較好地支持PCI總線,本文以Intel 386體系結(jié)構(gòu)為主,探討了在Linux下開發(fā)PCI設(shè)備驅(qū)動(dòng)程序的基本框架。
一、PCI總線系統(tǒng)體系結(jié)構(gòu)
PCI是外圍設(shè)備互連(Peripheral Component Interconnect)的簡稱,作為一種通用的總線接口標(biāo)準(zhǔn),它在目前的計(jì)算機(jī)系統(tǒng)中得到了非常廣泛的應(yīng)用。PCI提供了一組完整的總線接口規(guī)范,其目的是描述如何將計(jì)算機(jī)系統(tǒng)中的外圍設(shè)備以一種結(jié)構(gòu)化和可控化的方式連接在一起,同時(shí)它還刻畫了外圍設(shè)備在連接時(shí)的電氣特性和行為規(guī)約,并且詳細(xì)定義了計(jì)算機(jī)系統(tǒng)中的各個(gè)不同部件之間應(yīng)該如何正確地進(jìn)行交互。
無論是在基于Intel芯片的PC機(jī)中,或是在基于Alpha芯片的工作站上,PCI毫無疑問都是目前使用最廣泛的一種總線接口標(biāo)準(zhǔn)。同舊式的ISA總線不同,PCI將計(jì)算機(jī)系統(tǒng)中的總線子系統(tǒng)與子系統(tǒng)完全地分開,CPU通過一塊稱為PCI橋(PCI-Bridge)的設(shè)備來完成同總線子系統(tǒng)的交互,如圖1所示。
圖1 PCI子系統(tǒng)的體系結(jié)構(gòu)
由于使用了更高的時(shí)鐘頻率,因此PCI總線能夠獲得比ISA總線更好的整體性能。PCI總線的時(shí)鐘頻率一般在25MHz到33MHz范圍內(nèi),有些甚至能夠達(dá)到66MHz或者133MHz,而在64位系統(tǒng)中則最高能達(dá)到266MHz。盡管目前PCI設(shè)備大多采用32位數(shù)據(jù)總線,但PCI規(guī)范中已經(jīng)給出了64位的擴(kuò)展實(shí)現(xiàn),從而使PCI總線能夠更好地實(shí)現(xiàn)平臺(tái)無關(guān)性,現(xiàn)在PCI總線已經(jīng)能夠用于IA-32、Alpha、PowerPC、SPARC64和IA-64等體系結(jié)構(gòu)中。
PCI總線具有三個(gè)非常顯著的優(yōu)點(diǎn),使得它能夠完成最終取代ISA總線這一歷史使命:
在計(jì)算機(jī)和外設(shè)間傳輸數(shù)據(jù)時(shí)具有更好的性能;
能夠盡量獨(dú)立于具體的平臺(tái);
可以很方便地實(shí)現(xiàn)即插即用。
圖2是一個(gè)典型的基于PCI總線的計(jì)算機(jī)系統(tǒng)邏輯示意圖,系統(tǒng)的各個(gè)部分通過PCI總線和PCI-PCI橋連接在一起。從圖中不難看出,CPU和RAM需要通過PCI橋連接到PCI總線0(即主PCI總線),而具有PCI接口的顯卡則可以直接連接到主PCI總線上。PCI-PCI橋是一個(gè)特殊的PCI設(shè)備,它負(fù)責(zé)將PCI總線0和PCI總線1(即從PCI主線)連接在一起,通常PCI總線1稱為PCI-PCI橋的下游(downstream),而PCI總線0則稱為PCI-PCI橋的上游(upstream)。圖中連接到從PCI總線上的是SCSI卡和以太網(wǎng)卡。為了兼容舊的ISA總線標(biāo)準(zhǔn),PCI總線還可以通過PCI-ISA橋來連接ISA總線,從而能夠支持以前的ISA設(shè)備。圖中ISA總線上連接著一個(gè)多功能I/O控制器,用于控制鍵盤、鼠標(biāo)和軟驅(qū)。
圖2 PCI系統(tǒng)示意圖
在此我只對(duì)PCI總線系統(tǒng)體系結(jié)構(gòu)作了概括性介紹,如果讀者想進(jìn)一步了解,David A Rusling在The Linux Kernel(http://tldp.org/LDP/tlk/dd/pci.html)中對(duì)Linux的PCI子系統(tǒng)有比較詳細(xì)的介紹。
二、Linux驅(qū)動(dòng)程序框架
Linux將所有外部設(shè)備看成是一類特殊文件,稱之為“設(shè)備文件”,如果說系統(tǒng)調(diào)用是Linux內(nèi)核和應(yīng)用程序之間的接口,那么設(shè)備驅(qū)動(dòng)程序則可以看成是Linux內(nèi)核與外部設(shè)備之間的接口。設(shè)備驅(qū)動(dòng)程序向應(yīng)用程序屏蔽了硬件在實(shí)現(xiàn)上的細(xì)節(jié),使得應(yīng)用程序可以像操作普通文件一樣來操作外部設(shè)備。
1. 字符設(shè)備和塊設(shè)備
Linux抽象了對(duì)硬件的處理,所有的硬件設(shè)備都可以像普通文件一樣來看待:它們可以使用和操作文件相同的、標(biāo)準(zhǔn)的系統(tǒng)調(diào)用接口來完成打開、關(guān)閉、讀寫和I/O控制操作,而驅(qū)動(dòng)程序的主要任務(wù)也就是要實(shí)現(xiàn)這些系統(tǒng)調(diào)用函數(shù)。Linux系統(tǒng)中的所有硬件設(shè)備都使用一個(gè)特殊的設(shè)備文件來表示,例如,系統(tǒng)中的第一個(gè)IDE硬盤使用/dev/hda表示。每個(gè)設(shè)備文件對(duì)應(yīng)有兩個(gè)設(shè)備號(hào):一個(gè)是主設(shè)備號(hào),標(biāo)識(shí)該設(shè)備的種類,也標(biāo)識(shí)了該設(shè)備所使用的驅(qū)動(dòng)程序;另一個(gè)是次設(shè)備號(hào),標(biāo)識(shí)使用同一設(shè)備驅(qū)動(dòng)程序的不同硬件設(shè)備。設(shè)備文件的主設(shè)備號(hào)必須與設(shè)備驅(qū)動(dòng)程序在登錄該設(shè)備時(shí)申請(qǐng)的主設(shè)備號(hào)一致,否則用戶進(jìn)程將無法訪問到設(shè)備驅(qū)動(dòng)程序。
在Linux操作系統(tǒng)下有兩類主要的設(shè)備文件:一類是字符設(shè)備,另一類則是塊設(shè)備。字符設(shè)備是以字節(jié)為單位逐個(gè)進(jìn)行I/O操作的設(shè)備,在對(duì)字符設(shè)備發(fā)出讀寫請(qǐng)求時(shí),實(shí)際的硬件I/O緊接著就發(fā)生了,一般來說字符設(shè)備中的緩存是可有可無的,而且也不支持隨機(jī)訪問。塊設(shè)備則是利用一塊系統(tǒng)內(nèi)存作為緩沖區(qū),當(dāng)用戶進(jìn)程對(duì)設(shè)備進(jìn)行讀寫請(qǐng)求時(shí),驅(qū)動(dòng)程序先查看緩沖區(qū)中的內(nèi)容,如果緩沖區(qū)中的數(shù)據(jù)能滿足用戶的要求就返回相應(yīng)的數(shù)據(jù),否則就調(diào)用相應(yīng)的請(qǐng)求函數(shù)來進(jìn)行實(shí)際的I/O操作。塊設(shè)備主要是針對(duì)磁盤等慢速設(shè)備設(shè)計(jì)的,其目的是避免耗費(fèi)過多的CPU時(shí)間來等待操作的完成。一般說來,PCI卡通常都屬于字符設(shè)備。
所有已經(jīng)注冊(cè)(即已經(jīng)加載了驅(qū)動(dòng)程序)的硬件設(shè)備的主設(shè)備號(hào)可以從/proc/devices文件中得到。使用mknod命令可以創(chuàng)建指定類型的設(shè)備文件,同時(shí)為其分配相應(yīng)的主設(shè)備號(hào)和次設(shè)備號(hào)。例如,下面的命令:
[root@gary root]# mknod /dev/lp0 c 6 0
將建立一個(gè)主設(shè)備號(hào)為6,次設(shè)備號(hào)為0的字符設(shè)備文件/dev/lp0。當(dāng)應(yīng)用程序?qū)δ硞(gè)設(shè)備文件進(jìn)行系統(tǒng)調(diào)用時(shí),Linux內(nèi)核會(huì)根據(jù)該設(shè)備文件的設(shè)備類型和主設(shè)備號(hào)調(diào)用相應(yīng)的驅(qū)動(dòng)程序,并從用戶態(tài)進(jìn)入到核心態(tài),再由驅(qū)動(dòng)程序判斷該設(shè)備的次設(shè)備號(hào),最終完成對(duì)相應(yīng)硬件的操作。
2. 設(shè)備驅(qū)動(dòng)程序接口
Linux中的I/O子系統(tǒng)向內(nèi)核中的其他部分提供了一個(gè)統(tǒng)一的標(biāo)準(zhǔn)設(shè)備接口,這是通過include//fs.h中的數(shù)據(jù)結(jié)構(gòu)file_operations來完成的:
struct file_operations {
struct module *owner;
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *, char *, size_t, loff_t *);
ssize_t (*write) (struct file *, const char *, size_t, loff_t *);
int (*readdir) (struct file *, void *, filldir_t);
unsigned int (*poll) (struct file *, struct poll_table_struct *);
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
int (*mmap) (struct file *, struct vm_area_struct *);
int (*open) (struct inode *, struct file *);
int (*flush) (struct file *);
int (*release) (struct inode *, struct file *);
int (*fsync) (struct file *, struct dentry *, int datasync);
int (*fasync) (int, struct file *, int);
int (*lock) (struct file *, int, struct file_lock *);
ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
};
當(dāng)應(yīng)用程序?qū)υO(shè)備文件進(jìn)行諸如open、close、read、write等操作時(shí),Linux內(nèi)核將通過file_operations結(jié)構(gòu)訪問驅(qū)動(dòng)程序提供的函數(shù)。例如,當(dāng)應(yīng)用程序?qū)υO(shè)備文件執(zhí)行讀操作時(shí),內(nèi)核將調(diào)用file_operations結(jié)構(gòu)中的read函數(shù)。
2. 設(shè)備驅(qū)動(dòng)程序模塊
Linux下的設(shè)備驅(qū)動(dòng)程序可以按照兩種方式進(jìn)行編譯,一種是直接靜態(tài)編譯成內(nèi)核的一部分,另一種則是編譯成可以動(dòng)態(tài)加載的模塊。如果編譯進(jìn)內(nèi)核的話,會(huì)增加內(nèi)核的大小,還要改動(dòng)內(nèi)核的源文件,而且不能動(dòng)態(tài)地卸載,不利于調(diào)試,所有推薦使用模塊方式。