以文本方式查看主題 - 曙海教育集團論壇 (http://www.hufushizhe.com/bbs/index.asp) -- DSP2000技術討論 (http://www.hufushizhe.com/bbs/list.asp?boardid=27) ---- DSP—數字化音頻領域的未來 (http://www.hufushizhe.com/bbs/dispbbs.asp?boardid=27&id=1575) |
||
-- 作者:wangxinxin -- 發布時間:2010-11-20 13:38:45 -- DSP—數字化音頻領域的未來 隨著數字信號處理技術的日益推進, IT領域的科技成果越來越普遍的應用于視音頻領域并大大的推動了視音頻科技的進步,其中DSP(Digital Signal Processor即數字信號處理器)在音頻領域內的應用就是一個很好的例子。 DSP的優勢 要了解DSP的優勢,就必須明白DSP與傳統微處理器在硬件基本架構上的不同。 Von Neumann與Harvard基本架構 所有的微處理器都是由幾個基本的模塊所組成:運算器以完成數學運算、存儲器和解碼器以完成類比信號與數位信號間的轉換。在程序中,在每一周期必須告知微處理器要做些什么。因此微處理器必須從儲存程序的存儲體取得控制指令與一些數據而加以運算。但是對于所有的微處理器并不是使用相同的方法,一般來說可分成Von Neumann與Harvard二種基本架構,同時又有取其二者優點而衍生出多種的混合改良架構,在增加存儲器與周邊裝置后,就成為能作為數字信號處理應用的微處理控制器。 DSP的Modified Harvard架構 DSP是屬于Modified Harvard架構,即它具有兩條內部總線,一個是數據總線,一個是程序總線;而傳統的微處理器內部只有一條總線供數據傳輸與程序執行使用; 從上面我們已經看到Modified Harvard架構在大量數學運算方面有著強大的優勢,在DSP內部具有硬件乘法器,大量的寄存器,目前最快的可在一個指令周期內完成32bit乘32bit的指令,而傳統的微處理器運算系以微代碼來執行,遇到乘法運算指令時就得消耗掉好幾個指令周期,加上傳統的微處理器中的寄存器較少,不得不經常從外部儲存器傳輸數據來進行運算,而DSP指令具備重新執行功能,因此在數學運算速度超越一般傳統的微處理器。 DSP在音頻領域的應用 由于不存在線形放大電路非理想傳輸函數所造成的失真缺點,運算速度又比傳統微處理器快,DSP已普遍應用于視音頻領域的合成、辨識與編碼;由于對硬盤存儲容量的要求日益提高,使得對VCM(VOICE COIL MOTOR)的定位精度的要求也越來越嚴謹,DSP IC已成為高容量硬盤機的核心元件;DSP還廣泛應用在DAT、DLT等磁帶機上,用以控制轉速與磁頭讀寫位置;應用于全球定位系統(GPS)的接收機之相關器(CORRELATOR)上,提供計算衛星所發射的射頻信號至接收器距離的功能。圖象處理的離散余弦變換(DCT)應用;電視信號的抗多經干擾(Ghost Cancellation) 。至于對模糊失真控制(Fuzzy Control)的大量浮點運算,能達到即時要求,更是得心應手。
主動噪聲控制 傳統的被動式隔音方法,單純以隔音材料阻隔噪聲,對中、低頻噪音源產生的噪聲幾乎無阻隔能力,因此必須以厚重的隔音材料方能產生效果。主動噪聲控制是以電子閉回路控制的方法,產生和原始噪聲反相的聲音,以抵消原噪聲(如圖-1)。其優點在于它對于抑制低頻噪聲極為有效。其應用上的限制在于它無法控制中高頻段的噪聲(1.5K赫茲以上)
在通訊的各個環節,都可能產生惱人的噪聲,其綜合的影響,便是降低通訊效率、成功率。主動噪聲控制技術能在很多層面提高信噪比,且和傳統簡單的濾波器相比,它能動態地適應各種狀況,過去濾波器所無法處理的不確定噪聲也可相當程度地克服。 語音訊號處理 雖然目前許多資料已由數位編碼后,經原有的語音通訊通道收發。但語音仍然穩占所有通訊含量的第一位。對語音訊號的處理的需求,近年來呈現指數增長。語音技術可分為如下四項:語音增強(Speech Enhancement),語音辨識(Speech Recognition) ,語音編解碼(Speech Coding/Decoding),回聲抑制(Echo Suppression)。語音增強 圖-2
在信號處理上,針對應用場合、背景噪聲特性、語音清晰度對可允許的語音失真的相對要求等 ,我們可制定不同的方案,以滿足任務需求。例如,語音識別軟體對語音信號的要求,就有別于人耳對語音信號的要求,因此,在完成通訊時,和在完成語音識別任務時,需使用不同的程序。針對不同任務研發機構若不能對語音特性具備全面的了解與把握,是無法在這上面取得真正優化的結果。 語音辨識 語音識別系統的核心,應具有硬件要求少,自含時間矯正,和能量矯正的特點。目前已實際應用的為小辭匯量(200字)系統的獨立語音識別,中辭匯量(1800字)的核心亦完成。在自動語音識別的發展方向上,將集中於發展語音控制技術,而非語音輸入技術。重點在于首次識別的準確率,而非混合語意的輔助識別。 語音編、解碼 由于在DSP具有語音處理上的強大功能,因此才有可能在語音編碼的設計、使用上,偏重使用壓縮比較高的“編碼激勵線性預測”(CELP)型算法。目前使用的開放標準為ITU的G.723.1,這種算法廣泛使用于IP的編解碼上,具有6.3Kbps和5.3Kbps兩種傳輸率,語音品質高,抗噪聲能力和計算負荷適中?商峁┯脩羰褂渺陡鞣N平臺上。同時,專屬的2.4Kbps的語音編碼算法也在開發中,預計該算法將在語音品質、抗噪聲能力、語音壓縮比、計算負荷、計算延時上取得更好的平衡。因以硬體性能不斷的提升,會適配較大的計算量的編碼方式,根據信息論的原理,若在不降低確定的信號指標的條件下,如果采用高的壓縮比方式則必然相對的應用大運算量的編解碼方式,以在高壓縮比的情況下取得較好的音頻性能。 回聲抑制 在長距離通訊及活動通訊中,經常會被回聲所困擾。無論是線性回聲,或是音響回聲,當延時超過0.5秒 ,都會在接收端清晰的收到。針對這兩種現象,各有適用的回聲抑制算法;贒SP的算法穩定、簡潔,不但抑制響應速度快,而且對Double Talk、Near-End-Speech及靜音狀態,皆能保持降噪性能。同時因為線性回聲時間延遲可在1毫秒到900毫秒的大范圍內變動,同樣有基于DSP專屬的算法來克服這種變異性對系統帶來的額外負荷(在傳統的回聲抑制系統中,300毫秒的延時意味者系統性能價格比的急劇劣化)。而這些算法的源代碼亦能應用在各種通訊平臺上,解決長程通訊各環節所產生的問題。 音樂訊號處理 自從數字化的音樂規范開始流行后,因數字信號處理所附帶的彈性因素,已在影音訊號的儲存 、傳送、播放上,產生了許多開放規范和專屬規范。對使用者而言,它們帶來的效果,除了更耐久更廉價的儲存媒介、更多元化的接收管道外,也包括更絢麗的視聽效果。但在終端獲得和原始影音信號源相當的影音效果,到目前為止都仍然是昂貴且不見得有效的。為了實現所謂的“環場音效”,目前已有諸如Dolby Surround、Dolby ProLogic、AC-3 、THX等各式開放規范,也有商品化的解碼晶片。但整個環節中最弱的一環,是在由揚聲系統到人耳的這一段。這一段的傳遞函數因不同的聽音者,不同的聽音環境而隨機的改變,甚至差異極大。原始錄音工程師的心血,在這一段經常被糟蹋無遺。而且和傳統音響系統相同,這個性能最不容易把握的環節,往往也是投資昂貴的一個環節。 且以DSP動態的 補償聲場的變異,基本上可以做到使用一個低成本基于DSP技術的系統去替代昂貴的非DSP的高檔系統,完整還原原始錄音效果。(如圖-3) DSP以其強大的運算能力及優良的性能價格比已經成為越來越多的數字化視音頻設備的核心構件,隨著科技的進步,DSP技術的日益完善,相信DSP的未來就是數字化音頻領域的未來。 |