摘要:在過去的幾年里,高速實時數(shù)字信號處理(DSP)技術(shù)取得了飛速的發(fā)展,目前單片DSP芯片的速度已經(jīng)可以達(dá)到每秒80億次定點運算(8 000 MIPS);其高速度、可編程、小型化的特點將使信息處理技術(shù)進(jìn)入一個新紀(jì)元。一個完整的高速實時數(shù)字信號處理系統(tǒng)包括多種功能模塊,如DSP、ADC、DAC、RAM、FPGA、總線接口等技術(shù)。本文的內(nèi)容主要是分析高速實時數(shù)字信號處理系統(tǒng)的特點、構(gòu)成、發(fā)展過程和系統(tǒng)設(shè)計中的一些問題,并對其中的主要功能模塊分別進(jìn)行了分析。最后文中介紹了一種采用自行開發(fā)的COTS產(chǎn)品快速構(gòu)建嵌入式并行實時信號處理系統(tǒng)的設(shè)計方法。
關(guān)鍵詞:高速數(shù)字信號處理;DSP;COTS;MIMP結(jié)構(gòu)
中圖分類號:TN919.5
文獻(xiàn)標(biāo)識碼:A
Abstract: In recent years, high speed real-time DSP technology has made rapid development. At present, the speed of single DSP chip has reached 8 000 MIPS, the characters of high speed, programmable and miniaturization, will make information processing technology into a new era. An integrated high speed real-time DSP system includes many kinds of function modules, such as DSP, ADC, DAC, RAM, FPGA, bus interface technology, etc. This paper is focus on analyzing the characters, constitutes and developing process of high speed real-time DSP system, also including some problems of system designs, especially introduces some mainly function modules. At last, the paper introduces a design method which adopts COTS production self-exploited to rapidly construct embedded parallel real-time DSP system.
Key words: high speed digital signal processing; DSP; COTS; MIMP
1 概述
信號處理的本質(zhì)是信息的變換和提取,是將信息從各種噪聲、干擾的環(huán)境中提取出來,并變換為一種便于為人或機(jī)器所使用的形式。從某種意義上說,信號處理類似于“沙里淘金”的過程:它并不能增加信息量(即不能增加金子的含量),但是可以把信息(即金子)從各種噪聲、干擾的環(huán)境中(即散落在沙子中)提取出來,變換成可以利用的形式(如金條等)。如果不進(jìn)行這樣的變換,信息雖然存在,但卻是無法利用的,這正如散落在沙中的金子無法直接利用一樣。
高速實時信號處理是信號處理中的一個特殊分支。它的主要特點是高速處理和實時處理, 被廣泛應(yīng)用在工業(yè)和軍事的關(guān)鍵領(lǐng)域,如對雷達(dá)信號的處理、對通信基站信號的處理等。高速實時信號處理技術(shù)除了核心的高速DSP技術(shù)外, 還包括很多外圍技術(shù),如ADC、DAC等外圍器件技術(shù)、系統(tǒng)總線技術(shù)等。
本文比較全面地介紹了各種關(guān)鍵技術(shù)的當(dāng)前狀態(tài)和發(fā)展趨勢,并介紹了目前高性能嵌入式并行實時信號處理的技術(shù)特點和發(fā)展趨勢,最后介紹了一種基于COTS產(chǎn)品快速構(gòu)建嵌入式并行實時信號處理系統(tǒng)的設(shè)計方法。
2 DSP技術(shù)
2.1 DSP的概念
DSP(digital signal processor),即數(shù)字信號處理器,是一種專用于數(shù)字信號處理的可編程芯片。它的主要特點是:
①高度的實時性,運行時間可以預(yù)測;
②Harvard體系結(jié)構(gòu),指令和數(shù)據(jù)總線分開(有別于馮·諾依曼結(jié)構(gòu));
③RISC指令集,指令時間可以預(yù)測;
④特殊的體系結(jié)構(gòu),適合于運算密集的應(yīng)用場合;
⑤內(nèi)部硬件乘法器,乘法運算時間短、速度快;
⑥高度的集成性,帶有多種存儲器接口和IO互聯(lián)接口;
⑦普遍帶有DMA通道控制器,保證數(shù)據(jù)傳輸和計算處理并行工作;
⑧低功耗,適合嵌入式系統(tǒng)應(yīng)用。
DSP有多種分類方式。其中按照數(shù)據(jù)類型分類,DSP被分為定點處理器(如ADI的ADSP218x/9x/BF5xx、TI的TMS320C62/C64)和浮點處理器(如ADI的SHARC/TigerSHARC系統(tǒng)、TI的TMS320C67)。
雷達(dá)信號處理系統(tǒng)對DSP的要求很高,通常是使用32 bit的高端DSP;而且浮點DSP更能滿足雷達(dá)信號大動態(tài)范圍的要求。
2.2 DSP和其他處理器的比較
目前在高性能嵌入系統(tǒng)/實時信號處理領(lǐng)域,占統(tǒng)治地位的處理器是DSP;而目前諸如MCU(微控制器)、GPP/RISC(通用處理器)、FPGA、ASIC等都在分享這一市場。它們在性能、價格、開發(fā)難度、功耗等等方面有著不同的特點,因此各自適合不同的市場領(lǐng)域。表1對它們的特點進(jìn)行比較。
其中,GPP和MCU和DSP一樣都可以通過高層語進(jìn)行編程;而FPGA則需要硬件描述語言進(jìn)行開發(fā)設(shè)計;ASIC則屬于功能定制產(chǎn)品。它們和DSP有著很大區(qū)別,主要在于GPP多用于通用計算機(jī),內(nèi)部采用馮?諾依曼結(jié)構(gòu),只有處理內(nèi)核沒有DMA控制器,沒有豐富的IO設(shè)備接口,不適合實時處理,而且功率很大,如Intel的CPU的功耗多在20~100 W左右,PowerPC的功耗最小也要5~10 W,而且DSP可以做到1~2 W。而MCU主要用于嵌入式系統(tǒng)的控制,沒有計算和處理能力。就信號處理能力而言,DSP最適合信號處理的前端,GPP/RISC處理器比較適合復(fù)雜算法或者混合信號處理與數(shù)據(jù)處理的場合。
2.3 DSP的發(fā)展和趨勢
1982年TI公司推出了世界上第一款成功商用的DSP-TMS320C10。在上世紀(jì)90年代,DSP技術(shù)有很大的發(fā)展,出現(xiàn)了幾款典型的DSP,主要有ADI公司的ADSP2106x/ADSP21160和TI公司的TMS320C62x/C67x。ADI的DSP具有出色的浮點處理能力,多用于雷達(dá)/聲納等信號處理;獨特的多DSP互聯(lián)能力(總線直接互聯(lián)和Link口互聯(lián)),使它們被稱為“多DSP系統(tǒng)的實現(xiàn)標(biāo)準(zhǔn)”。而TI公司的DSP則更注重單片的處理能力,在民用高端DSP市場占有很大份額。
進(jìn)入21世紀(jì),DSP在各方面性能都有了飛躍。ADI公司推出TigerSHARC系列,TS101主頻達(dá)到300 MHz,目前已經(jīng)得到大量的應(yīng)用;2003年推出最新的TS201,主頻達(dá)到600 MHz,處理能力為3.6 GFLOPs,是當(dāng)前處理能力最強(qiáng)的浮點DSP之一。TI公司則推出了C64系列,2004年初已經(jīng)公布了1 GHz的TMS320C6416的技術(shù)是目前少數(shù)突破1 GHz的DSP之一,定點處理能力達(dá)到8 000 MIPS。目前TS201和1 GHz C64都仍處于工程樣品階段,ADI公司預(yù)計在2004年8月正式量產(chǎn)TS201。
目前DSP的發(fā)展趨勢是向速度更快、集成度更高的方向發(fā)展。DSP將會在其內(nèi)部集成特殊的運算單元,以適合矩陣運算等運算密集的特殊算法。另外,光DSP(ODSP,Optical DSP)也將成為一個新的發(fā)展熱點。ODSP采用光調(diào)制矩陣進(jìn)行光速級的矢量和矩陣的運算。目前以色列的LENSLET公司公布的ODSP原型機(jī)Enlight256,處理能力相當(dāng)于1 GHz C64的1 000倍。
2.4 當(dāng)前DSP性能狀態(tài)和比較
下面表2中通過典型的技術(shù)指標(biāo),比較了目前多款主流DSP的技術(shù)性能。
表2中不僅給出了目前常見的4種DSP的主要指標(biāo)比較,還給出了IBM公司的PowerPC系列處理器的典型性能指標(biāo)。PowerPC系列雖然屬于MPU,但是由于它的出色處理性能,而且低功耗(相對于Intel的CPU)等特點,使得它非常適合嵌入式的實時信號處理系統(tǒng)中,目前PowerPC處理器在國際上軍用信號處理市場占有大部分市場。但由于PowerPC畢竟屬于MPU,在結(jié)構(gòu)上和DSP有些差異,例如它沒有內(nèi)部DMA控制器、IO處理器、存儲器外設(shè)接口,內(nèi)核在計算的同時,還需要負(fù)責(zé)讀取數(shù)據(jù),使得整個處理時間加長。因此雖然PowerPC系列有著標(biāo)稱值很高的指標(biāo),但是對于需要持續(xù)實時信號處理的系統(tǒng)并不一定都合適。下面簡單給出一個TS101、C64和MPC7410的比較結(jié)論:
①TigerSHARC適合于多DSP互聯(lián)、動態(tài)范圍大、帶寬處理量比較平均的持續(xù)實時信號處理系統(tǒng);
②TMS320C64適合于動態(tài)范圍不大、對DSP片間互聯(lián)要求不高的持續(xù)實時信號處理系統(tǒng);
③MPC7410適合于動態(tài)范圍大、對DSP片間互聯(lián)要求不高、帶寬處理量比較小的事后數(shù)據(jù)處理系統(tǒng)。
3 外圍器件技術(shù)
一個高速實時信號處理系統(tǒng)除了DSP技術(shù)外,還需要配合大量的外圍電路。圖1描述了一個典型的基于DSP的高速實時信號處理系統(tǒng)的主要功能框圖。
按照功能分類,外圍電路可以分成幾類:
①模擬信號數(shù)字信號的轉(zhuǎn)換電路,ADC、DAC、DDS等;
②用于數(shù)字信號下變頻和上變頻的DDC、DDU;
③緩沖和存儲電路,RAM、FIFO等;
④邏輯控制和協(xié)處理器,CPLD和FPGA;
⑤通信接口電路,光纖、LVDS等。
下面分別簡單介紹每類外圍器件的當(dāng)前技術(shù)狀態(tài)。
3.1 模擬信號數(shù)字信號的轉(zhuǎn)換電路
3.1.1 ADC器件技術(shù)狀態(tài)和趨勢
ADC器件對處理系統(tǒng)起到關(guān)鍵作用,影響到系統(tǒng)的可實現(xiàn)性和系統(tǒng)的性能。ADC器件由其內(nèi)部構(gòu)造不同,可以分成串并行和全并行。前者通過多級串行的逐次比較,可以很好地提供ADC量化精度,但缺點是速率較慢;目前500 MHz以下的ADC多是采用這種類型。后者是將輸入模擬信號同時和2N個比較器比較,并行產(chǎn)生量化值,因此也稱為Flash ADC;這種ADC器件可以實現(xiàn)很高頻率的模數(shù)轉(zhuǎn)換,但是缺點是精度較低,而且功耗很大。
串并行ADC以ADI公司的AD6645為例,可以實現(xiàn)最大采樣率105 MSPS,14 bit量化精度。全并行ADC以ATMEL公司的TS83102G0 為例,可以實現(xiàn)最大采樣率2 GSPS,10 bit量化精度,采用LVDS接口,功耗只有4.6 W。
目前ADC器件發(fā)展的趨勢是:
①高輸入帶寬、高采樣速率、高量化精度;
②對外接口電平發(fā)展為LVDS等高速電平;
③低功耗、多通道集成、多功能集成。
3.1.2 DAC器件技術(shù)狀態(tài)和趨勢
DAC器件在系統(tǒng)中的作用和ADC相反,所以其內(nèi)部結(jié)構(gòu)和ADC也相反的過程。目前DAC的指標(biāo)相對ADC要更高一些,例如ADI公司的AD736可以實現(xiàn)1.2 GSPS的轉(zhuǎn)換速率,精度為14 bit,對外接口采用DDR方式的LVDS電平;而其功耗卻只有0.55 W。
當(dāng)前DAC的發(fā)展趨勢是:
①高速、高精度、低功耗;
②多功能集成,如增加濾波器;
③接口電平采用高速協(xié)議:LVDS、DDR等技術(shù)。
3.1.3 DDS器件技術(shù)狀態(tài)和趨勢
DDS器件內(nèi)部結(jié)構(gòu)基本分為兩類:
①相位累加器(如圖2所示)。
②數(shù)據(jù)存儲型(如圖3所示)。
當(dāng)前DDS的典型指標(biāo)可以達(dá)到超過1 GSPS以上,相位累加器精度可以保證在32 bit; 300 MSPS的AD9854可以實現(xiàn)48 bit的相位累加器精度。
當(dāng)前DDS的發(fā)展趨勢:
①更高時鐘頻率:目前最高到達(dá)了1G左右;
②通過提高相位累加器的位數(shù)、查找表位數(shù)及DAC的位數(shù)以提高輸出的信噪比和SFDR;
③編程實現(xiàn)多種調(diào)制輸出方式:幅度、相位調(diào)制;
④實現(xiàn)任意波形輸出的能力。
3.2 RAM、FIFO技術(shù)
存儲器技術(shù)目前的技術(shù)狀態(tài)是同步技術(shù)、雙沿和多沿傳輸技術(shù)的廣泛應(yīng)用。
目前同步靜態(tài)存儲器成為高速、大容量SRAM中的主要力量,例如SBSRAM、ZBTSRAM等同步SRAM,時鐘頻率可以高達(dá)200 MHz以上。另外,新型DDRSRAM、甚至QDRSRAM,可以在一個時鐘周期內(nèi)傳輸2個或者4個數(shù)據(jù),這將大大提高SRAM的讀寫帶寬。
而動態(tài)RAM中,由于DDR技術(shù)的應(yīng)用,使得存儲速率可以達(dá)到每線400 Mb/s;而且由于新的芯片封裝技術(shù)和制造工藝的應(yīng)用,使得單片DRAM的容量越來越大,目前單片最大1Gbit的DDRSDRAM已經(jīng)大量應(yīng)用。
目前常用的FIFO器件仍然是高速同步FIFO,同步時鐘可以達(dá)到100 MHz以上。目前出現(xiàn)了DDR接口的FIFO器件,可以達(dá)到250 MHz以上,大大提高了帶寬。
目前存儲器發(fā)展的主要趨勢是:
①高速、大帶寬:采用DDR、QDR等技術(shù),甚至LVDS等接口電平邏輯;
②低功耗、高密度:采用更新的芯片封裝和制造工藝,提高單片容量、降低功耗。
3.3 CPLD、FPGA技術(shù)
CPLD和FPGA一直是數(shù)字電路中的重要成員。傳統(tǒng)的小規(guī)模的CPLD大多實現(xiàn)邏輯控制和邏輯轉(zhuǎn)換的功能;而目前大規(guī)模的FPGA則通常實現(xiàn)更加復(fù)雜的算法、信號處理等工作,它們的效率往往要高于DSP很多。
目前FPGA的技術(shù)已經(jīng)達(dá)到了千萬門級的水平,而且通常嵌入一些信號處理的功能模塊,如DSP模塊、存儲器模塊、Gbit串行收發(fā)模塊等等;另外目前FPGA的另一大技術(shù)特點是FPGA的IO管腳支持越來越多的電平協(xié)議。這些技術(shù)的出現(xiàn)使得目前SOPC的系統(tǒng)設(shè)計大大增加。
目前CPLD和FPGA的重要廠商仍然是Xilinx、Altera和Lattice。它們的典型高端器件如:Virtex II/ Virtex II Pro、Stratix/Stratix GX、ISPGDX等器件。它們共同的特征是:
①大規(guī)模、超大規(guī)模的門數(shù)設(shè)計;
②內(nèi)嵌大容量SRAM、DSP模塊、硬件乘加器等資源;
③具有高速串行通信的硬件模塊,如Xilinx的RocketIO可到10 Gb/s。
3.4 通信接口電路
傳統(tǒng)的通信接口大多采用低速的接口,如232、422等接口;隨著系統(tǒng)功能的提高、處理帶寬的增加,對通信接口的要求也大大提供。目前在通信接口電路中采用很多高速通信手段,實現(xiàn)大帶寬的數(shù)據(jù)傳輸。目前光纖接口和基于差分信號的串行傳輸技術(shù)被大量應(yīng)用。
3.4.1 光纖通信
光纖通信是利用光來傳輸信息的一種傳輸方式。由于光信號的特點,決定了光纖傳輸有很多天生的優(yōu)點:
①容許頻帶寬,傳輸容量大;
②單波長光纖傳輸系統(tǒng)的傳輸速率一般為2.5 Gb/s和10Gb/s,多模為1.062 5 Gb/s和1.25 Gb/s;
③損耗小,中繼距離很長且誤碼率很小,傳輸距離從幾百米到幾公里;
④抗電磁干擾性能好;
⑤無串音干擾,保密性好;
⑥光纖線徑細(xì)、重量輕、柔軟;
⑦光纖的原材料資源豐富,用光纖可節(jié)約金屬材料;
⑧耐腐蝕力強(qiáng)、抗核幅射、能源消耗小。
光纖傳輸在很早就被用于電信系統(tǒng)的中繼傳輸中,但直到最近幾年才被廣泛應(yīng)用在嵌入式系統(tǒng)的數(shù)據(jù)傳輸中,例如Fibre Channel、光纖以太網(wǎng)等技術(shù)。目前這些光纖傳輸技術(shù)的帶寬已經(jīng)可以到達(dá)10 Gb/s以上。
3.4.2 基于低壓差分電平的串行傳輸技術(shù)
低壓差分電平協(xié)議是目前比較流行的一種電平形式,它具有擺幅小、抗干擾強(qiáng)、輻射小等優(yōu)點,廣泛應(yīng)用于高速數(shù)字信號的傳輸協(xié)議中;例如LVDS協(xié)議就是滿足最流行的傳輸協(xié)議之一,它的共模電壓為1.2 V,差模電壓為350 mV,傳輸速率可以達(dá)到上Gb/s。目前很多第三代互聯(lián)技術(shù)都是以低壓差分電平一些為基礎(chǔ),例如RapidIO協(xié)議、InfiniBand協(xié)議等等。
而基于低壓差分電平的串行傳輸協(xié)議,更是將銅線傳輸帶寬提高到一個前所未有的水平。采用了時鐘打包和時鐘恢復(fù)技術(shù)的串行傳輸協(xié)議,不用再考慮數(shù)據(jù)線和時鐘線之間的Skew和Jitter等問題,更容易提高傳輸速率,而且減少線對數(shù)量,降低實現(xiàn)成本。通過對信號的預(yù)加重和均衡處理,目前串行RapidIO協(xié)議可以支持3.125 Gb/s,而Xilinx公司的RocketIO接口可以實現(xiàn)單線對10 Gb/s的串行傳輸速率。這種技術(shù)目前已經(jīng)逐步成熟,將會大量應(yīng)用于板內(nèi)、底板間、機(jī)箱間等大量高速數(shù)據(jù)傳輸?shù)膱龊稀?
4 基于標(biāo)準(zhǔn)總線的DSP系統(tǒng)設(shè)計
隨著處理系統(tǒng)規(guī)模的增大,系統(tǒng)設(shè)計時通常被分成多個較獨立的功能模塊。總線技術(shù)就是為了解決系統(tǒng)各模塊之間的管理、控制、通信等問題而產(chǎn)生的。早期的系統(tǒng)由于功能較簡單,故很多系統(tǒng)采用了自定義總線的方式,即用戶根據(jù)自己系統(tǒng)的要求設(shè)計一套滿足特定功能的總線。隨著信號處理技術(shù)的發(fā)展,自定義總線對系統(tǒng)的使用和擴(kuò)展帶來了很大的制約,而且每個新系統(tǒng)的開發(fā)時間和開發(fā)成本都難以降低。
隨后在DSP信號處理系統(tǒng)中使用標(biāo)準(zhǔn)總線系統(tǒng)的思路被提出,所謂標(biāo)準(zhǔn)總線系統(tǒng)就是滿足一定工業(yè)標(biāo)準(zhǔn)或國際標(biāo)準(zhǔn)的總線(如PCI總線)。這種方式可以提供很多優(yōu)點。
(1)提供DSP系統(tǒng)的通用、標(biāo)準(zhǔn)的擴(kuò)展和互聯(lián)能力。
①總線接口邏輯的統(tǒng)一標(biāo)準(zhǔn);
②板卡物理尺寸和結(jié)構(gòu)的統(tǒng)一標(biāo)準(zhǔn);
③使DSP系統(tǒng)便于擴(kuò)展、互聯(lián)和快速構(gòu)建平臺。
(2)提供DSP系統(tǒng)方便的控制界面和用戶界面。
標(biāo)準(zhǔn)總線系統(tǒng)的計算機(jī)平臺可以通過標(biāo)準(zhǔn)總線對DSP系統(tǒng)進(jìn)行控制、管理和設(shè)置。
(3)提供DSP板卡之間的通信、傳輸方式。
板卡之間通過標(biāo)準(zhǔn)總線互聯(lián),便于通信。
(4)節(jié)省開發(fā)時間、降低開發(fā)成本。
可以選擇很多商用的標(biāo)準(zhǔn)總線產(chǎn)品(COTS)來實現(xiàn)用戶系統(tǒng)。
4.1 標(biāo)準(zhǔn)總線的發(fā)展和當(dāng)前技術(shù)
目前工業(yè)中較為流行的標(biāo)準(zhǔn)總線有多種:ISA總線、PCI總線、cPCI總線、VME總線、PC104等。
ISA總線目前已經(jīng)基本被淘汰。PCI總線隨著PC市場的發(fā)展而迅速壯大起來,成為目前技術(shù)最先進(jìn)、應(yīng)用最廣、支持最多的總線之一。但由于PCI總線標(biāo)準(zhǔn)的物理結(jié)構(gòu),限制了它在環(huán)境惡劣的工業(yè)領(lǐng)域尤其是軍事領(lǐng)域中的應(yīng)用。而基于PCI總線邏輯協(xié)議的cPCI總線標(biāo)準(zhǔn),卻能很好的彌補(bǔ)這個問題。因為cPCI總線除了機(jī)械標(biāo)準(zhǔn)外,其他都是采用PCI的標(biāo)準(zhǔn);而機(jī)械標(biāo)準(zhǔn)是采用歐洲卡標(biāo)準(zhǔn),具有很強(qiáng)的加固能力;因此cPCI總線可應(yīng)用到任何惡劣環(huán)境的工業(yè)系統(tǒng)和軍用系統(tǒng)中。
VME總線則是最老牌的系統(tǒng)總線,它是Motorola等幾家大公司在80年代初提出的一種獨立于DSP的總線標(biāo)準(zhǔn),而且在機(jī)械結(jié)構(gòu)方面同樣也是采用了歐洲卡的標(biāo)準(zhǔn)。由于美國軍方在早期大量使用基于VME標(biāo)準(zhǔn)的產(chǎn)品,因此VME標(biāo)準(zhǔn)總線目前仍是世界范圍內(nèi)軍用系統(tǒng)的最大標(biāo)準(zhǔn)。
|