以文本方式查看主題 - 曙海教育集團論壇 (http://www.hufushizhe.com/bbs/index.asp) -- DSP系統和硬件開發討論區 (http://www.hufushizhe.com/bbs/list.asp?boardid=5) ---- 高速實時數字信號處理硬件技術發展概述 (http://www.hufushizhe.com/bbs/dispbbs.asp?boardid=5&id=1322) |
-- 作者:wangxinxin -- 發布時間:2010-11-13 13:37:43 -- 高速實時數字信號處理硬件技術發展概述 摘要:在過去的幾年里,高速實時數字信號處理(DSP)技術取得了飛速的發展,目前單片DSP芯片的速度已經可以達到每秒80億次定點運算(8 000 MIPS);其高速度、可編程、小型化的特點將使信息處理技術進入一個新紀元。一個完整的高速實時數字信號處理系統包括多種功能模塊,如DSP、ADC、DAC、RAM、FPGA、總線接口等技術。本文的內容主要是分析高速實時數字信號處理系統的特點、構成、發展過程和系統設計中的一些問題,并對其中的主要功能模塊分別進行了分析。最后文中介紹了一種采用自行開發的COTS產品快速構建嵌入式并行實時信號處理系統的設計方法。 關鍵詞:高速數字信號處理;DSP;COTS;MIMP結構 中圖分類號:TN919.5 文獻標識碼:A Abstract: In recent years, high speed real-time DSP technology has made rapid development. At present, the speed of single DSP chip has reached 8 000 MIPS, the characters of high speed, programmable and miniaturization, will make information processing technology into a new era. An integrated high speed real-time DSP system includes many kinds of function modules, such as DSP, ADC, DAC, RAM, FPGA, bus interface technology, etc. This paper is focus on analyzing the characters, constitutes and developing process of high speed real-time DSP system, also including some problems of system designs, especially introduces some mainly function modules. At last, the paper introduces a design method which adopts COTS production self-exploited to rapidly construct embedded parallel real-time DSP system. Key words: high speed digital signal processing; DSP; COTS; MIMP 1 概述 信號處理的本質是信息的變換和提取,是將信息從各種噪聲、干擾的環境中提取出來,并變換為一種便于為人或機器所使用的形式。從某種意義上說,信號處理類似于“沙里淘金”的過程:它并不能增加信息量(即不能增加金子的含量),但是可以把信息(即金子)從各種噪聲、干擾的環境中(即散落在沙子中)提取出來,變換成可以利用的形式(如金條等)。如果不進行這樣的變換,信息雖然存在,但卻是無法利用的,這正如散落在沙中的金子無法直接利用一樣。 高速實時信號處理是信號處理中的一個特殊分支。它的主要特點是高速處理和實時處理, 被廣泛應用在工業和軍事的關鍵領域,如對雷達信號的處理、對通信基站信號的處理等。高速實時信號處理技術除了核心的高速DSP技術外, 還包括很多外圍技術,如ADC、DAC等外圍器件技術、系統總線技術等。 本文比較全面地介紹了各種關鍵技術的當前狀態和發展趨勢,并介紹了目前高性能嵌入式并行實時信號處理的技術特點和發展趨勢,最后介紹了一種基于COTS產品快速構建嵌入式并行實時信號處理系統的設計方法。 2 DSP技術 2.1 DSP的概念 DSP(digital signal processor),即數字信號處理器,是一種專用于數字信號處理的可編程芯片。它的主要特點是: ①高度的實時性,運行時間可以預測; ②Harvard體系結構,指令和數據總線分開(有別于馮·諾依曼結構); ③RISC指令集,指令時間可以預測; ④特殊的體系結構,適合于運算密集的應用場合; ⑤內部硬件乘法器,乘法運算時間短、速度快; ⑥高度的集成性,帶有多種存儲器接口和IO互聯接口; ⑦普遍帶有DMA通道控制器,保證數據傳輸和計算處理并行工作; ⑧低功耗,適合嵌入式系統應用。 DSP有多種分類方式。其中按照數據類型分類,DSP被分為定點處理器(如ADI的ADSP218x/9x/BF5xx、TI的TMS320C62/C64)和浮點處理器(如ADI的SHARC/TigerSHARC系統、TI的TMS320C67)。 雷達信號處理系統對DSP的要求很高,通常是使用32 bit的高端DSP;而且浮點DSP更能滿足雷達信號大動態范圍的要求。 2.2 DSP和其他處理器的比較 目前在高性能嵌入系統/實時信號處理領域,占統治地位的處理器是DSP;而目前諸如MCU(微控制器)、GPP/RISC(通用處理器)、FPGA、ASIC等都在分享這一市場。它們在性能、價格、開發難度、功耗等等方面有著不同的特點,因此各自適合不同的市場領域。表1對它們的特點進行比較。 其中,GPP和MCU和DSP一樣都可以通過高層語進行編程;而FPGA則需要硬件描述語言進行開發設計;ASIC則屬于功能定制產品。它們和DSP有著很大區別,主要在于GPP多用于通用計算機,內部采用馮?諾依曼結構,只有處理內核沒有DMA控制器,沒有豐富的IO設備接口,不適合實時處理,而且功率很大,如Intel的CPU的功耗多在20~100 W左右,PowerPC的功耗最小也要5~10 W,而且DSP可以做到1~2 W。而MCU主要用于嵌入式系統的控制,沒有計算和處理能力。就信號處理能力而言,DSP最適合信號處理的前端,GPP/RISC處理器比較適合復雜算法或者混合信號處理與數據處理的場合。 2.3 DSP的發展和趨勢 1982年TI公司推出了世界上第一款成功商用的DSP-TMS320C10。在上世紀90年代,DSP技術有很大的發展,出現了幾款典型的DSP,主要有ADI公司的ADSP2106x/ADSP21160和TI公司的TMS320C62x/C67x。ADI的DSP具有出色的浮點處理能力,多用于雷達/聲納等信號處理;獨特的多DSP互聯能力(總線直接互聯和Link口互聯),使它們被稱為“多DSP系統的實現標準”。而TI公司的DSP則更注重單片的處理能力,在民用高端DSP市場占有很大份額。 進入21世紀,DSP在各方面性能都有了飛躍。ADI公司推出TigerSHARC系列,TS101主頻達到300 MHz,目前已經得到大量的應用;2003年推出最新的TS201,主頻達到600 MHz,處理能力為3.6 GFLOPs,是當前處理能力最強的浮點DSP之一。TI公司則推出了C64系列,2004年初已經公布了1 GHz的TMS320C6416的技術是目前少數突破1 GHz的DSP之一,定點處理能力達到8 000 MIPS。目前TS201和1 GHz C64都仍處于工程樣品階段,ADI公司預計在2004年8月正式量產TS201。 目前DSP的發展趨勢是向速度更快、集成度更高的方向發展。DSP將會在其內部集成特殊的運算單元,以適合矩陣運算等運算密集的特殊算法。另外,光DSP(ODSP,Optical DSP)也將成為一個新的發展熱點。ODSP采用光調制矩陣進行光速級的矢量和矩陣的運算。目前以色列的LENSLET公司公布的ODSP原型機Enlight256,處理能力相當于1 GHz C64的1 000倍。 2.4 當前DSP性能狀態和比較 下面表2中通過典型的技術指標,比較了目前多款主流DSP的技術性能。 表2中不僅給出了目前常見的4種DSP的主要指標比較,還給出了IBM公司的PowerPC系列處理器的典型性能指標。PowerPC系列雖然屬于MPU,但是由于它的出色處理性能,而且低功耗(相對于Intel的CPU)等特點,使得它非常適合嵌入式的實時信號處理系統中,目前PowerPC處理器在國際上軍用信號處理市場占有大部分市場。但由于PowerPC畢竟屬于MPU,在結構上和DSP有些差異,例如它沒有內部DMA控制器、IO處理器、存儲器外設接口,內核在計算的同時,還需要負責讀取數據,使得整個處理時間加長。因此雖然PowerPC系列有著標稱值很高的指標,但是對于需要持續實時信號處理的系統并不一定都合適。下面簡單給出一個TS101、C64和MPC7410的比較結論: ①TigerSHARC適合于多DSP互聯、動態范圍大、帶寬處理量比較平均的持續實時信號處理系統; ②TMS320C64適合于動態范圍不大、對DSP片間互聯要求不高的持續實時信號處理系統; ③MPC7410適合于動態范圍大、對DSP片間互聯要求不高、帶寬處理量比較小的事后數據處理系統。 3 外圍器件技術 一個高速實時信號處理系統除了DSP技術外,還需要配合大量的外圍電路。圖1描述了一個典型的基于DSP的高速實時信號處理系統的主要功能框圖。 按照功能分類,外圍電路可以分成幾類: ①模擬信號數字信號的轉換電路,ADC、DAC、DDS等; ②用于數字信號下變頻和上變頻的DDC、DDU; ③緩沖和存儲電路,RAM、FIFO等; ④邏輯控制和協處理器,CPLD和FPGA; ⑤通信接口電路,光纖、LVDS等。 下面分別簡單介紹每類外圍器件的當前技術狀態。 3.1 模擬信號數字信號的轉換電路 3.1.1 ADC器件技術狀態和趨勢 ADC器件對處理系統起到關鍵作用,影響到系統的可實現性和系統的性能。ADC器件由其內部構造不同,可以分成串并行和全并行。前者通過多級串行的逐次比較,可以很好地提供ADC量化精度,但缺點是速率較慢;目前500 MHz以下的ADC多是采用這種類型。后者是將輸入模擬信號同時和2N個比較器比較,并行產生量化值,因此也稱為Flash ADC;這種ADC器件可以實現很高頻率的模數轉換,但是缺點是精度較低,而且功耗很大。 串并行ADC以ADI公司的AD6645為例,可以實現最大采樣率105 MSPS,14 bit量化精度。全并行ADC以ATMEL公司的TS83102G0 為例,可以實現最大采樣率2 GSPS,10 bit量化精度,采用LVDS接口,功耗只有4.6 W。 目前ADC器件發展的趨勢是: ①高輸入帶寬、高采樣速率、高量化精度; ②對外接口電平發展為LVDS等高速電平; ③低功耗、多通道集成、多功能集成。 3.1.2 DAC器件技術狀態和趨勢 DAC器件在系統中的作用和ADC相反,所以其內部結構和ADC也相反的過程。目前DAC的指標相對ADC要更高一些,例如ADI公司的AD736可以實現1.2 GSPS的轉換速率,精度為14 bit,對外接口采用DDR方式的LVDS電平;而其功耗卻只有0.55 W。 當前DAC的發展趨勢是: ①高速、高精度、低功耗; ②多功能集成,如增加濾波器; ③接口電平采用高速協議:LVDS、DDR等技術。 3.1.3 DDS器件技術狀態和趨勢 DDS器件內部結構基本分為兩類: ①相位累加器(如圖2所示)。 ②數據存儲型(如圖3所示)。 當前DDS的典型指標可以達到超過1 GSPS以上,相位累加器精度可以保證在32 bit; 300 MSPS的AD9854可以實現48 bit的相位累加器精度。 當前DDS的發展趨勢: ①更高時鐘頻率:目前最高到達了1G左右; ②通過提高相位累加器的位數、查找表位數及DAC的位數以提高輸出的信噪比和SFDR; ③編程實現多種調制輸出方式:幅度、相位調制; ④實現任意波形輸出的能力。 3.2 RAM、FIFO技術 存儲器技術目前的技術狀態是同步技術、雙沿和多沿傳輸技術的廣泛應用。 目前同步靜態存儲器成為高速、大容量SRAM中的主要力量,例如SBSRAM、ZBTSRAM等同步SRAM,時鐘頻率可以高達200 MHz以上。另外,新型DDRSRAM、甚至QDRSRAM,可以在一個時鐘周期內傳輸2個或者4個數據,這將大大提高SRAM的讀寫帶寬。 而動態RAM中,由于DDR技術的應用,使得存儲速率可以達到每線400 Mb/s;而且由于新的芯片封裝技術和制造工藝的應用,使得單片DRAM的容量越來越大,目前單片最大1Gbit的DDRSDRAM已經大量應用。 目前常用的FIFO器件仍然是高速同步FIFO,同步時鐘可以達到100 MHz以上。目前出現了DDR接口的FIFO器件,可以達到250 MHz以上,大大提高了帶寬。 目前存儲器發展的主要趨勢是: ①高速、大帶寬:采用DDR、QDR等技術,甚至LVDS等接口電平邏輯; ②低功耗、高密度:采用更新的芯片封裝和制造工藝,提高單片容量、降低功耗。 3.3 CPLD、FPGA技術 CPLD和FPGA一直是數字電路中的重要成員。傳統的小規模的CPLD大多實現邏輯控制和邏輯轉換的功能;而目前大規模的FPGA則通常實現更加復雜的算法、信號處理等工作,它們的效率往往要高于DSP很多。 目前FPGA的技術已經達到了千萬門級的水平,而且通常嵌入一些信號處理的功能模塊,如DSP模塊、存儲器模塊、Gbit串行收發模塊等等;另外目前FPGA的另一大技術特點是FPGA的IO管腳支持越來越多的電平協議。這些技術的出現使得目前SOPC的系統設計大大增加。 目前CPLD和FPGA的重要廠商仍然是Xilinx、Altera和Lattice。它們的典型高端器件如:Virtex II/ Virtex II Pro、Stratix/Stratix GX、ISPGDX等器件。它們共同的特征是: ①大規模、超大規模的門數設計; ②內嵌大容量SRAM、DSP模塊、硬件乘加器等資源; ③具有高速串行通信的硬件模塊,如Xilinx的RocketIO可到10 Gb/s。 3.4 通信接口電路 傳統的通信接口大多采用低速的接口,如232、422等接口;隨著系統功能的提高、處理帶寬的增加,對通信接口的要求也大大提供。目前在通信接口電路中采用很多高速通信手段,實現大帶寬的數據傳輸。目前光纖接口和基于差分信號的串行傳輸技術被大量應用。 3.4.1 光纖通信 光纖通信是利用光來傳輸信息的一種傳輸方式。由于光信號的特點,決定了光纖傳輸有很多天生的優點: ①容許頻帶寬,傳輸容量大; ②單波長光纖傳輸系統的傳輸速率一般為2.5 Gb/s和10Gb/s,多模為1.062 5 Gb/s和1.25 Gb/s; ③損耗小,中繼距離很長且誤碼率很小,傳輸距離從幾百米到幾公里; ④抗電磁干擾性能好; ⑤無串音干擾,保密性好; ⑥光纖線徑細、重量輕、柔軟; ⑦光纖的原材料資源豐富,用光纖可節約金屬材料; ⑧耐腐蝕力強、抗核幅射、能源消耗小。 光纖傳輸在很早就被用于電信系統的中繼傳輸中,但直到最近幾年才被廣泛應用在嵌入式系統的數據傳輸中,例如Fibre Channel、光纖以太網等技術。目前這些光纖傳輸技術的帶寬已經可以到達10 Gb/s以上。 3.4.2 基于低壓差分電平的串行傳輸技術 低壓差分電平協議是目前比較流行的一種電平形式,它具有擺幅小、抗干擾強、輻射小等優點,廣泛應用于高速數字信號的傳輸協議中;例如LVDS協議就是滿足最流行的傳輸協議之一,它的共模電壓為1.2 V,差模電壓為350 mV,傳輸速率可以達到上Gb/s。目前很多第三代互聯技術都是以低壓差分電平一些為基礎,例如RapidIO協議、InfiniBand協議等等。 而基于低壓差分電平的串行傳輸協議,更是將銅線傳輸帶寬提高到一個前所未有的水平。采用了時鐘打包和時鐘恢復技術的串行傳輸協議,不用再考慮數據線和時鐘線之間的Skew和Jitter等問題,更容易提高傳輸速率,而且減少線對數量,降低實現成本。通過對信號的預加重和均衡處理,目前串行RapidIO協議可以支持3.125 Gb/s,而Xilinx公司的RocketIO接口可以實現單線對10 Gb/s的串行傳輸速率。這種技術目前已經逐步成熟,將會大量應用于板內、底板間、機箱間等大量高速數據傳輸的場合。 4 基于標準總線的DSP系統設計 隨著處理系統規模的增大,系統設計時通常被分成多個較獨立的功能模塊。總線技術就是為了解決系統各模塊之間的管理、控制、通信等問題而產生的。早期的系統由于功能較簡單,故很多系統采用了自定義總線的方式,即用戶根據自己系統的要求設計一套滿足特定功能的總線。隨著信號處理技術的發展,自定義總線對系統的使用和擴展帶來了很大的制約,而且每個新系統的開發時間和開發成本都難以降低。 隨后在DSP信號處理系統中使用標準總線系統的思路被提出,所謂標準總線系統就是滿足一定工業標準或國際標準的總線(如PCI總線)。這種方式可以提供很多優點。 (1)提供DSP系統的通用、標準的擴展和互聯能力。 ①總線接口邏輯的統一標準; ②板卡物理尺寸和結構的統一標準; ③使DSP系統便于擴展、互聯和快速構建平臺。 (2)提供DSP系統方便的控制界面和用戶界面。 標準總線系統的計算機平臺可以通過標準總線對DSP系統進行控制、管理和設置。 (3)提供DSP板卡之間的通信、傳輸方式。 板卡之間通過標準總線互聯,便于通信。 (4)節省開發時間、降低開發成本。 可以選擇很多商用的標準總線產品(COTS)來實現用戶系統。 4.1 標準總線的發展和當前技術 目前工業中較為流行的標準總線有多種:ISA總線、PCI總線、cPCI總線、VME總線、PC104等。 ISA總線目前已經基本被淘汰。PCI總線隨著PC市場的發展而迅速壯大起來,成為目前技術最先進、應用最廣、支持最多的總線之一。但由于PCI總線標準的物理結構,限制了它在環境惡劣的工業領域尤其是軍事領域中的應用。而基于PCI總線邏輯協議的cPCI總線標準,卻能很好的彌補這個問題。因為cPCI總線除了機械標準外,其他都是采用PCI的標準;而機械標準是采用歐洲卡標準,具有很強的加固能力;因此cPCI總線可應用到任何惡劣環境的工業系統和軍用系統中。 VME總線則是最老牌的系統總線,它是Motorola等幾家大公司在80年代初提出的一種獨立于DSP的總線標準,而且在機械結構方面同樣也是采用了歐洲卡的標準。由于美國軍方在早期大量使用基于VME標準的產品,因此VME標準總線目前仍是世界范圍內軍用系統的最大標準。 |