視頻信號數(shù)字化管理論文

時間:2022-07-29 05:39:00

導語:視頻信號數(shù)字化管理論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

視頻信號數(shù)字化管理論文

電視信號數(shù)字化處理需要三個步驟,即:取樣、量化和編碼,下面就各個步驟來分別介紹它們給視頻信號帶來的損傷。

一取樣過程產(chǎn)生的信號損傷

在取樣的過程中對信號造成的損傷主要有:孔闌效應、混疊效應、過沖和振鈴。為了說明這些損傷所產(chǎn)生的原因,我們在以下敘述中給出分析結果。

取樣是指用每隔一定時間的信號樣值序列來代替原來在時間上連續(xù)的信號,也就是在時間上將模擬信號離散化。根據(jù)奈奎斯特取樣定理:對于最大頻率為fm的信號f(t),當取樣頻率fs不低于2fm時,由截止頻率為fm矩形低通濾波器可以從取樣信號中完全恢復原信號。但實際的物理過程與數(shù)字模型有不同的工程結果。

1.孔闌效應

在數(shù)學模型的理想化狀態(tài)下理想的取樣脈沖寬度為無窮窄,取樣情況及其頻域情況如圖一所示,但在實際設備中取樣脈沖只能是有限寬度的脈沖,它的取樣情況及其頻域情況如圖一所示,很顯然具有不等于零的實際的有限寬度的取樣脈沖所引起的孔闌效應會產(chǎn)生高頻衰落。

由于信號的高頻部分反映的是視頻圖象的細節(jié),因此高頻衰落會導致視頻畫面的細節(jié)模糊。針對這種情況實際工程中一般采用在將數(shù)字信號恢復成模擬信號以后通過提升高頻的辦法對這種失真進行補償和校正。一般來講,由于取樣信號的頻率fs必須滿足fs>2fm,而為了減少孔闌效應要求取樣脈沖的寬度τ盡量小,因此要滿足τ遠遠小于取樣信號的周期T,即取樣信號的脈沖寬度要滿足1/τ>>2fm。

2.混疊效應

在實際應用中,為滿足奈奎斯特定理在取樣之前應使用截止頻率為取樣頻率一半的濾波器對原信號進行濾波,濾除可能產(chǎn)生頻譜混疊的高頻成分,以保證新處理的信號是一個有限帶寬的處理信號。理想低通濾波器特性如圖二所示,但實際的低通濾波器性能如圖三所示,因此為了盡量濾除大于1/2fc的頻率成分,就要選擇多階濾波器。如果濾波器的階數(shù)不足以達到濾除1/2fc以上的高頻分量,會引起恢復的信號中頻譜混疊效應。混疊效應在視頻圖象上表現(xiàn)為一種被稱為morie的漣漪狀的干擾。

3.過沖和振鈴

在保證有效的消除混疊效應時,在上述情況已建議采用多階濾波器以滿足濾波器的帶外特性,但是取樣前的低通濾波器如果階數(shù)太大,會引起過沖和振鈴從而造成恢復的視頻信號過渡的邊沿不清晰。

針對以上兩種信號損傷造成的矛盾,主觀上選用階數(shù)少的濾波器會有利一些,因為頻譜混疊效應只有在圖象有超過二分之一取樣頻率以上分量時,特別是有單頻分量時才會明顯感覺到,因此是偶發(fā)事件。但過沖和振鈴效應卻是只要有過渡邊沿就回出現(xiàn)的經(jīng)常性現(xiàn)象。因此就主觀感覺來說,減少過沖和振鈴留有一些混疊相對來講更有利一些。一般工程上出于平衡考慮取樣頻率選為fc=(2.2---2.5)fm。

另外為克服這一矛盾的方法是采用過抽樣方式,即在抽樣時用兩倍抽樣頻率抽樣,這時頻譜按兩倍抽樣頻率周期重復,重復頻譜中心頻率之間的間隔比正常情況大一倍,如圖四所示。這時抽樣前的濾波相對簡單,可以用階數(shù)少、頻率特性緩降的無振鈴濾波器,然后在數(shù)字域用線形相位濾波器進行二分之一抽取濾波器恢復到原抽樣頻率樣值。另外,在此過程中,取樣頻率增加了一倍,因此取樣脈沖的寬度只有原來的一半,從而也起到了減少孔闌效應的作用。

二量化誤差所帶來的信號損傷

取樣過程是把模擬信號變成了時間上離散的脈沖信號,量化的過程則是進行幅度上的離散化處理。因此在時間軸的任意一點上量化后的信號電平與原模擬信號電平之間在大多數(shù)情況下總是存在有一定的誤差,量化所引入的誤差是不可避免的同時也是不可逆的,由于信號的隨機性這種誤差大小也是隨機的,這種表現(xiàn)類似于隨機噪聲效果,具有相當寬度的頻譜,因此我們又把量化誤差稱為量化噪聲。但量化誤差與噪聲是有本質(zhì)的區(qū)別的,因為任一時刻量化誤差是可以從輸入信號求出的,而噪聲與信號之間則沒有這種關系。

降低量化誤差的方法最直接的就是增加量化級數(shù)減小最小量化間隔,但由此帶來碼率的增加從而要求更大的處理帶寬,一般現(xiàn)在的視頻信號均采用8比特、10比特,在信號質(zhì)量要求較高的情況下采用12比特量化。此外,我們在設計一套系統(tǒng)的時候,可以考慮在系統(tǒng)的不同環(huán)節(jié)采用不同的比特量化,使得在系統(tǒng)的各個環(huán)節(jié)的量化級相互錯開,從而避免量化噪聲累積效果所產(chǎn)生的臺階效應,這種均衡的效果可以改善整個系統(tǒng)的量化失真。一般量化比特高的環(huán)節(jié)應該放在系統(tǒng)的前端,這樣可以使系統(tǒng)的前端對信號造成的不可恢復損傷減小到最低限度。

為了減小量化誤差我們還要正確的選擇量化方式。量化有兩種量化方式,一種是取整時只舍不入,此時產(chǎn)生的量化誤差總是負的,最大量化誤差等于兩個相鄰量化級的間隔d;另一種是取整時有舍有入,此時量化誤差有正有負,量化誤差的絕對值最大為1/2d。因此為了減少量化誤差,應該采用有舍有入量化方式。

1.輪廓效應

如果信號兩個相鄰量化電平相差較大,若在圖象面積較大的范圍內(nèi),視頻信號緩變區(qū)(如漸變的藍天)能夠看出不連續(xù)的跳變,即會在圖象緩變區(qū)出現(xiàn)從一個量化電平到另一個量化電平之間的輪廓線,實際上就是圖象的等量化電平線。這種輪廓線是原圖象所沒有的,所以又稱為偽輪廓,即輪廓效應。

一種簡單而有效的消除輪廓效應的方法是利用隨機的高斯噪聲信號發(fā)生器產(chǎn)生顫動信號,疊加到被量化的信號當中,當顫動信號的均方根值大于1/3d時人們便覺察不到輪廓效應的存在。在數(shù)字電視中使用最多的顫動信號是重復頻率為取樣脈沖的一半,峰-峰幅度為1/2d的方波,具體步驟如圖五所示。

圖五高頻顫動的效果

由圖五比較可以看出,疊加顫動信號的效果等效于將量化間隔由d減小到1/2d,或者說將量化級數(shù)提高了一倍(比特數(shù)由n提高到n+1),從而改善了輪廓效應。順便指出,由于模/數(shù)轉換中的取樣、量化都屬于非線形過程,難以避免會出現(xiàn)差拍干擾,采用疊加顫動信號的方法對于消除圖象中的差拍干擾也同樣有效。同時由于顫動信號的幅度小,頻率高,并未對圖象細節(jié)造成顯而易見的損傷。

2.顆粒雜波

如果最小量化電平不夠小,則圖象較弱信號的緩變區(qū)可能會出現(xiàn)在鄰近的兩個量化電平之間產(chǎn)生由于四舍五入法則而造成的跳變,使得圖象在這個區(qū)域內(nèi)出現(xiàn)顆粒狀的雜波,而人的視覺對圖象弱信號緩變區(qū)的噪聲則是非常敏感的。

為了克服均勻量化時這種大信號時信噪比有余,而小信號時信噪比不足的特點,我們可以采用小信號時量化級間寬度小而大信號時量化級間寬度大些的非均勻量化,又叫非線形量化。值得說明一點,數(shù)字攝象機信號處理大多數(shù)采用非均勻量化方式,這是由于攝象機中的光-電轉換至電視機顯象管中的電-光轉換在內(nèi)的整個電視信道必須保持線形,但是實際的電視系統(tǒng)在沒有校正之前是非線形的,因此為了使最終顯示出來的光像保持良好的線形關系,在攝象機單元必須對它進行校正,即γ校正。而γ校正類似于非線形量化特性,因此我們可以在量化過程中采用非均勻量化方式,在提高小信號信噪比的同時也滿足了γ校正的要求。

另外,由于在實際的信號中,弱信號出現(xiàn)的概率是很大的,為了改善弱信號時的的量化信噪比,可以采用壓縮擴張的編解碼方法。在量化之前,先利用非線形器件將信號電平高的部分進行壓縮,然后對壓縮過的信號進行量化,解碼后復原出的模擬信號再通過非線形器件對大幅度信號進行擴張恢復沒壓縮之前的比例關系,這種方法相對擴大了小信號的動態(tài)范圍,等效于對小信號采用量化間隔小的細量化而大信號采用粗量化,從而改善了弱信號的量化信噪比。

三壓縮編碼所帶來的信號損傷

數(shù)字電視信號數(shù)碼率太高,數(shù)據(jù)量非常大。如果直接存儲和傳輸不但開銷很大,而且有時設備也承受不了如此大的負荷。壓縮編碼以壓縮信源數(shù)碼率為目的,盡量減少信源各符號的相關性,使信源的傳輸效率提高。當然,它是以犧牲圖像質(zhì)量為前提。必定會對信號造成一定的損傷。

下面針對幾種常用的圖像壓縮方式,來看一下他具體會對信號帶來什么樣的損傷呢?

(一)差值脈沖編碼(DPCM)

電視圖像基本上是由面積較大的像塊(如藍天,大地,服裝)組成。雖然每個像塊的幅值各不相同,但像塊內(nèi)各樣值的幅度是相近或相同的。換句話說,相鄰象素之間有很強的相關性。我們就可以利用這些相關性對當前的像素進行預測。再利用預測值得到差值。這樣在很大的程度上降低了信源的冗余度。這種壓縮方法對視頻信號會產(chǎn)生以下問題:

1由于在當前差值中包括當前的量化誤差,而輸出的前一樣值又包括前一樣值的量化誤差,這就造成了量化誤差的積累。而誤差會傳播,這就使信號抗通道誤碼能力減弱。

2邊緣清晰度臨界。根據(jù)DPCM編碼思想,當被預測值處于圖象突變邊緣時,往往會導致錯誤預測或產(chǎn)生較大的預測誤差。致使邊緣清晰度臨界。如:邊緣為黑白突變,被預測值為x,x1x2x3x4x5為已知值,由DPCM編碼可得

進行水平一維預測x=x1=0產(chǎn)生錯誤預測

進行二維預測x=x1+(x4-x5)/2=1/2產(chǎn)生較大的預測誤差

(二)變換編碼

變換編碼首先對圖象數(shù)據(jù)進行某種形式的正交變換,并對變換后的數(shù)據(jù)進行編碼,從而達到數(shù)據(jù)壓縮的目的。正交變換的種類很多,比如人們熟知的傅立葉變換,沃爾什哈達碼變換,哈爾變換,斜變換,余弦變換,正弦變換,K--L變換。

變換編碼中較常用的是離散余弦變換DCT,它首先將輸入圖象分成若干NXN的圖象塊,對每一小圖象塊進行正交變換,從空間域變換到頻域。為了達到壓縮的目的,對DCT系數(shù)需作量化處理。低頻分量采用較小的量化間隔,量化誤差小,精度高。頻率越高,量化間隔愈大,精度越低。這是因為高頻分量只影響圖象的細節(jié),對整塊圖象來講,沒有低頻分量重要。讀取時采用之字型。這樣的處理給信號帶來的損傷主要表現(xiàn)在:

由于高頻信息的丟失,恢復圖象中相鄰塊在邊界上產(chǎn)生較為規(guī)則的誤差分布,由于人眼對水平和垂直方向的規(guī)則誤差分布具有特殊的敏感性,使得在主觀感覺上認為具有規(guī)則誤差分布的圖象的質(zhì)量明顯降低,從而產(chǎn)生"塊效應"。在拍攝一幅綠草如茵的草地中,充斥畫面的草坪隨風搖擺時,一種細塊狀的閃爍效應是這一失真的直觀表現(xiàn)。

(三)運動補償預測

運動補償預測是一個有力的工具,以便減少幀間的時間冗余度,并作為用于DPCM編碼的預測技術。運動補償概念是以對視頻幀間運動的估計為基礎的。也就是說,若視頻鏡頭中所有物體均在空間上有一位移,那么用有限的運動參數(shù)來對幀間的運動加以描述。為了做到這一點,畫面一般劃分成一些不連續(xù)的象素塊,對每個這樣的象素塊,只對一個運動矢量進行估算、編碼和傳送。

在MPEG壓縮算法中,運動補償預測技術用來減少幀間的時間冗余度,只對預測誤差畫面(原始畫面與運動補償預測畫面之間的差別)加以編碼。運動補償去除時間方向的冗余度,最多只能利用前后兩幀圖象間的相關性,效率不高。而實際上,尤其是在運動緩慢的圖象序列中,在連續(xù)多幀圖象間都存在著很強的時間相關性。正是由于它固有的缺陷,使得在圖象活動劇烈或低碼率通訊時,編碼器只能通過迭用粗量化,降低幀頻或舍去更多的DCT變換系數(shù)來降低碼率,因而對信號損傷較大,丟失了許多有用的信息。在恢復圖象中將出現(xiàn)明顯的塊效應和運動物體邊緣的蚊音效應。

(四)混合編碼

以兩種或兩種以上的方法對圖象進行編碼稱為混合編碼。我們熟悉的JPEG和MPEG都屬于該種類型。

1JPEG

JPEG是處理彩色或單色靜止圖象的壓縮標準。利用它可以獲得較高的壓縮比,并保持較好的信噪比,從而大大節(jié)省圖象存儲空間,降低通訊帶寬。但是編碼過程會使物體在背景中的位置略有移動(即發(fā)生幾何畸變)。另外,高壓縮比場合,JPEG的重建圖象在水平和垂直方向可能有暈圈、幻影,產(chǎn)生"方塊"效應。

這不難理解.在JPEG系統(tǒng)中,首先把原始圖像劃分成大小相等的像素塊,然后對圖像塊進行離散余弦變換DCT(圖像塊的能量集中到少量的系數(shù)),再利用基于人眼特性的矩陣對變換后得到的系數(shù)矩陣進行量化,從而大幅度地壓縮了矩陣系數(shù),同時也造成了損失。最后對量化得到的矩陣系數(shù)進行無損熵編碼。圖像的重建過程是編碼過程的逆過程。在高壓縮比場合,JPEG的重建圖像在水平和垂直方向出現(xiàn)暈圈、幻影,產(chǎn)生"方塊"效應,就是因為對原始圖像進行了分塊的DCT變換和量化。如果不分塊或分塊很大而進行DCT變換與量化,那么圖像塊中像素能量集中到少量的系數(shù)效果將變的不明顯,即不利于對數(shù)據(jù)進行量化壓縮,同時還得使計算復雜度增加。這樣一種現(xiàn)象實際上是離散余弦變換DCT本身的特性所造成的(采用離散正弦變換DST或離散傅立葉變換DFT結果類似)。

2MPEG

MPEG壓縮算法中包含兩種基本技術:一種是基于16X16子塊的運動補償技術,用來減少幀序列的時域冗余;另一種是基于DCT的壓縮,用來減少幀序列的空間冗余。

較為成熟的MPEG技術是MPEG1和MPEG2。MPEG1是為適應在數(shù)字存儲媒體(如CD-ROM)上有效地存取電視圖像而制定的標準(最高速率達1.5Mb/s)。它的壓縮技術基礎為:宏模塊結構、運動補償及宏模塊的有條件再補給。MPEG2是MPEG1算法的擴展。是為MPEG1最初沒有包括在內(nèi)或未想到的應用提供的一種視頻編碼方法。特別是對MPEG2提出的一個要求,即它所提供的視頻質(zhì)量,不能低于NTSC/PAL,最高應可達到CCIR601質(zhì)量。MPEG2編碼算法的基礎為通用的混合DCT/DPCM編碼方案。

隨著MPEG1和MPEG2的廣泛應用,其缺陷也日漸顯露,主要表現(xiàn)在:

(1)現(xiàn)已制定的標準所采用的技術,當碼率很低時(低于64Kb/s)會產(chǎn)生嚴重的"方塊"效應、"蚊音噪聲"以及"動作失真"。而低碼率要求是移動通訊信道所必須的。

(2)編碼采用了預測編碼技術。例如采用基于塊的運動補償來去除時間相關性。但信號的糾錯能力主要依賴其相關性,特別在條件較差的信道中傳播時,干擾造成的錯誤會迅速沿視頻序列擴散。

(3)仍停留在"幀"水平上處理視頻,而無法對視頻比特流內(nèi)的各個對象(object)單獨進行編碼,解碼及操作。而這種能力正是許多交互式應用(如多媒體數(shù)據(jù)庫)所需要的。

雖然電視信號經(jīng)過數(shù)字化處理后會有不同程度的損傷,有些損傷可以修復,并不影響圖象的最終質(zhì)量,而有些損傷是永久性的,只能通過一些補償措施削弱它的影響,但這并不能影響電視領域向數(shù)字化的轉變。因為與電視信號數(shù)字化后所帶來的好處相比,這些經(jīng)過修復的損傷的影響往往會被人為的忽略。