無(wú)線(xiàn)網(wǎng)絡(luò)中的聲學(xué)回聲控制
一.引言
二.電氣(混合)回聲
2.1 電氣(混合)回聲基本上是線(xiàn)性的
2.2 電氣(混合)回聲是穩(wěn)定的
三.聲學(xué)回聲
3.1 無(wú)線(xiàn)通信中感覺(jué)到聲學(xué)回聲的原因
3.2 數(shù)字無(wú)線(xiàn)應(yīng)用中的聲學(xué)回聲是非線(xiàn)性的
3.3 數(shù)字無(wú)線(xiàn)應(yīng)用中的聲學(xué)回聲是不穩(wěn)定的
四.控制數(shù)字無(wú)線(xiàn)網(wǎng)絡(luò)中的聲學(xué)回聲
4.1 主要考慮因素
4.2 方法
五.信號(hào)分類(lèi)錯(cuò)誤
5.1 錯(cuò)誤類(lèi)型1
5.2 錯(cuò)誤類(lèi)型2
5.3 錯(cuò)誤類(lèi)型3
六.聲學(xué)回聲的恰當(dāng)處理
6.1 使用降噪功能減少錯(cuò)誤類(lèi)型1出現(xiàn)的可能性
6.2 使用智能語(yǔ)音檢測(cè)降低錯(cuò)誤類(lèi)型1出現(xiàn)的可能性
6.3 減少錯(cuò)誤類(lèi)型2出現(xiàn)的可能性
6.4 降低錯(cuò)誤類(lèi)型3出現(xiàn)的可能性
一.引言
在本文中,討論了無(wú)線(xiàn)通信領(lǐng)域中聲學(xué)回聲的特性,并給出了對(duì)其進(jìn)行恰當(dāng)控制的方法。我們分析了聲學(xué)回聲和電氣回聲(混合回聲)的性質(zhì),解釋了為什么需要采用不同的技術(shù)來(lái)控制并消除每種信號(hào)衰落。在本文中,還對(duì)幾家回聲消除器產(chǎn)品廠(chǎng)家實(shí)際采用的實(shí)施方法進(jìn)行了評(píng)述,推導(dǎo)出了為什么某些回聲消除器完全無(wú)法實(shí)現(xiàn)其目標(biāo),或缺乏恰當(dāng)解決方案所需關(guān)鍵組件的原因。在本文的結(jié)論中,介紹了在NMS通信公司的回聲消除器設(shè)計(jì)中采用的方法,并闡述了該方法所基于的理論基礎(chǔ)。
二.電氣(混合)回聲
回聲消除器首先是在為長(zhǎng)途應(yīng)用而設(shè)計(jì)的網(wǎng)絡(luò)中引入的。長(zhǎng)途應(yīng)用中包含過(guò)量的傳播延遲,這種現(xiàn)象突顯出了將雙線(xiàn)連接轉(zhuǎn)換為四線(xiàn)系統(tǒng)的混合線(xiàn)路的不完整性。這種混合線(xiàn)路的不完整性被描述為"信號(hào)泄漏"或因阻抗失配而導(dǎo)致的信號(hào)反射,稱(chēng)為網(wǎng)絡(luò)電氣回聲(也稱(chēng)為混合回聲)。在圖1中,描述了這種現(xiàn)象。
符合ITU G.168(2000)標(biāo)準(zhǔn)的回聲消除器能夠消除電氣(混合)回聲。這類(lèi)設(shè)備在其運(yùn)行當(dāng)中采用了"兩段式"方法。在第1階段,使用線(xiàn)性卷積處理消除了大部分回聲。在第2階段,采用了非線(xiàn)性處理器(NLP)以消除殘存的回聲,這一部分相對(duì)較小。對(duì)殘存回聲信號(hào)的辨識(shí)是一件很簡(jiǎn)單的任務(wù),這是因?yàn)樗墓β孰娖矫黠@低于原始的語(yǔ)音信號(hào)。
2.1 電氣(混合)回聲基本上是線(xiàn)性的
線(xiàn)性意味著,可以構(gòu)建一個(gè)簡(jiǎn)單的數(shù)學(xué)模型(基于最小二乘法)來(lái)描述特定的回聲信號(hào)。首先對(duì)描述回聲信號(hào)的數(shù)學(xué)表示取反,然后將其加到實(shí)際返回的回聲信號(hào)上。結(jié)果為兩個(gè)完全相反(幾乎)信號(hào)之和,從而將回聲消除。由于技術(shù)方面的限制,數(shù)學(xué)模型存在缺陷。這種不完整性根植于源信號(hào)的來(lái)回轉(zhuǎn)換或"A"法則格式,而不是數(shù)學(xué)模型。使用非線(xiàn)性處理器(NLP),可以將源自這種不完整性的殘余回聲消除掉,NLP能像開(kāi)關(guān)一樣有效地工作,形成一個(gè)單向連接,阻斷任何信號(hào)(包括殘余的回聲信號(hào))正向通過(guò)該連接,如圖2所示。
圖2 電氣(混合)回聲的處理
2.2 電氣(混合)回聲是穩(wěn)定的
穩(wěn)定意味著,與語(yǔ)音信號(hào)相關(guān)的脈沖響應(yīng)是不變的,在一個(gè)特定呼叫的全過(guò)程中,在回聲消除器內(nèi)創(chuàng)建的數(shù)學(xué)模型只會(huì)出現(xiàn)很微小的漂移。這種行為要求回聲消除器存在一種自我訓(xùn)練機(jī)制,能根據(jù)特定的頻率作出響應(yīng)。訓(xùn)練是一項(xiàng)耗時(shí)的進(jìn)程,對(duì)于每一個(gè)呼叫,短可以少于100毫秒,長(zhǎng)會(huì)超過(guò)1秒。訓(xùn)練時(shí)間通常稱(chēng)為呼叫啟動(dòng)過(guò)程中的會(huì)聚時(shí)間。
源自接收器(耳機(jī))的聲波,通過(guò)位于聲音路徑上的固體物體反射進(jìn)入手機(jī)的麥克風(fēng)(話(huà)筒)中,或揚(yáng)聲器電話(huà)中,這就形成了聲學(xué)回聲。請(qǐng)參見(jiàn)圖3。
3.1 無(wú)線(xiàn)通信中感覺(jué)到聲學(xué)回聲的原因
在無(wú)線(xiàn)和有線(xiàn)應(yīng)用中都會(huì)出現(xiàn)聲學(xué)回聲。暴露在回聲狀況下的大多數(shù)有線(xiàn)配置均配備了電氣回聲消除器,因此,有線(xiàn)應(yīng)用中的聲學(xué)回聲是通過(guò)標(biāo)準(zhǔn)的回波消除算法和相關(guān)的NLP技術(shù)來(lái)控制的。直到最近才在數(shù)字無(wú)線(xiàn)應(yīng)用中采用了回聲消除器來(lái)消除在PSTN(公共交換電話(huà)網(wǎng)絡(luò))端生成的回聲(即電氣回聲)。在數(shù)字無(wú)線(xiàn)情形下,PSTN用戶(hù)不會(huì)經(jīng)歷聲學(xué)回聲或電氣回聲。該假設(shè)基于如下根本原因:
。1) 無(wú)線(xiàn)電話(huà)標(biāo)準(zhǔn)要求設(shè)備制造商在聲學(xué)回聲路徑上設(shè)計(jì)足夠大的衰減;
。2) 在數(shù)字無(wú)線(xiàn)環(huán)境中不存在PSTN網(wǎng)絡(luò)中的"二-四線(xiàn)"混合,因此,數(shù)字
無(wú)線(xiàn)設(shè)備不會(huì)產(chǎn)生電氣(混合)回聲。
不幸的是,很多無(wú)線(xiàn)電話(huà)廠(chǎng)商未能遵從正式標(biāo)準(zhǔn)的規(guī)定:在數(shù)字移動(dòng)電話(huà)接收器(耳機(jī))和麥克風(fēng)(話(huà)筒)之間應(yīng)具有恰當(dāng)?shù)母綦x措施。作為其結(jié)果,聲學(xué)回聲成為了無(wú)線(xiàn)服務(wù)提供商需關(guān)心的一項(xiàng)事宜。此外,因語(yǔ)音壓縮技術(shù)以及語(yǔ)音壓縮算法的非線(xiàn)性而引入的較長(zhǎng)的處理延遲時(shí)間(往返延遲大于200毫秒),使得在數(shù)字無(wú)線(xiàn)應(yīng)用中,聲學(xué)回聲問(wèn)題更加明顯。
3.2 數(shù)字無(wú)線(xiàn)應(yīng)用中的聲學(xué)回聲是非線(xiàn)性的
在無(wú)線(xiàn)電話(huà)話(huà)筒處進(jìn)入的聲學(xué)回聲隨后將被送至聲碼器(語(yǔ)音編碼器),聲碼器將按照處理有效語(yǔ)音信號(hào)的相同方式處理聲學(xué)回聲信號(hào)。也就是說(shuō),聲學(xué)回聲信號(hào)將被語(yǔ)音壓縮技術(shù)處理,該技術(shù)改變了信號(hào)的特征,與此同時(shí),還在源信號(hào)和聲學(xué)回聲的處理結(jié)果之間創(chuàng)建了一種非線(xiàn)性關(guān)聯(lián)。
非線(xiàn)性意味著,在數(shù)字無(wú)線(xiàn)環(huán)境中實(shí)施相對(duì)簡(jiǎn)單的數(shù)學(xué)模型(基于最小二乘法估算,就像在線(xiàn)性電氣回聲消除中所采用的那樣),將其作為消除或減少聲學(xué)回聲的手段完全不適合。這是一種錯(cuò)誤的方法,它會(huì)引入額外的、不希望出現(xiàn)的副作用(以信號(hào)失真,回聲增加,和噪音形式出現(xiàn))。這就是在處理聲學(xué)回聲時(shí)需要面對(duì)的情形。因此,試圖使用采用了標(biāo)準(zhǔn)線(xiàn)性卷積算法的回聲消除器來(lái)控制無(wú)線(xiàn)聲學(xué)回聲既昂貴且效率低下①。
3.3 數(shù)字無(wú)線(xiàn)應(yīng)用中的聲學(xué)回聲是不穩(wěn)定的
由于聲學(xué)回聲是聲波自固態(tài)物體反彈而導(dǎo)致的結(jié)果,改變這些固態(tài)物體與無(wú)線(xiàn)電話(huà)耳機(jī)的相對(duì)位置會(huì)改變聲學(xué)回聲的特性。例如,頭部或手部的移動(dòng),邊走邊講話(huà),以及在會(huì)話(huà)過(guò)程中公共場(chǎng)所內(nèi)人員或物體的移動(dòng),都會(huì)產(chǎn)生不同的,不穩(wěn)定的聲學(xué)回聲效應(yīng)。
不穩(wěn)定性意味著,與語(yǔ)音信號(hào)相關(guān)的脈沖響應(yīng)(即回聲)從本質(zhì)上講是一種"移動(dòng)的對(duì)象"。因此,在呼叫全過(guò)程中,標(biāo)準(zhǔn)電氣回聲消除器中采用的數(shù)學(xué)模型會(huì)不斷改變回聲的特征。因而,針對(duì)特定頻率響應(yīng)的訓(xùn)練技術(shù)即無(wú)效率且毫無(wú)用處。此外,訓(xùn)練是一項(xiàng)耗時(shí)的進(jìn)程,對(duì)于每一次呼叫,其時(shí)間從少于100毫秒到超過(guò)1秒。在這種情況下,截止回聲消除器完成訓(xùn)練時(shí)(即收斂時(shí)),它可能還停留在某一信號(hào)上,無(wú)法對(duì)當(dāng)前的聲學(xué)回聲作出響應(yīng)。其結(jié)果是,該方法可能會(huì)弊大于利(即,引入討厭的信號(hào)失真,降低語(yǔ)音質(zhì)量,帶來(lái)噪音等)。
總之,試圖使用采用了標(biāo)準(zhǔn)線(xiàn)性技術(shù)的回聲消除器來(lái)控制無(wú)線(xiàn)聲學(xué)回聲既昂貴且效率低下。
四.控制數(shù)字無(wú)線(xiàn)網(wǎng)絡(luò)中的聲學(xué)回聲
4.1 主要考慮因素
控制非線(xiàn)性、非穩(wěn)態(tài)聲學(xué)回聲的首選是采用非線(xiàn)性方法。然而,非線(xiàn)性方法--如在通常的回聲消除器中采用的傳統(tǒng)非線(xiàn)性處理器(NLP)--會(huì)帶來(lái)信號(hào)失真的副作用,形式為語(yǔ)音消波②,并會(huì)因噪音脈動(dòng)③干擾導(dǎo)致背景音頻發(fā)生變化。因此,對(duì)于有效的非線(xiàn)性方法來(lái)說(shuō),必須采取進(jìn)一步的措施,將這些副作用降低到最小程度,與此同時(shí),它還應(yīng)能識(shí)別出聲學(xué)回聲信號(hào)并將其從語(yǔ)音信號(hào)(或任何其他有效信號(hào))上分離,允許后者通過(guò)連接線(xiàn)路。
控制聲學(xué)回聲的另一個(gè)重要參數(shù)是定時(shí)。傳統(tǒng)的非線(xiàn)性處理器(NLP)采用了相對(duì)較短的回聲路徑時(shí)延,平均值介于10~64毫秒。通過(guò)回聲消除器中標(biāo)準(zhǔn)線(xiàn)性處理器的卷積操作,能夠簡(jiǎn)化電氣(混合)回聲消除器內(nèi)的NLP定時(shí)操作。在沒(méi)有卷積處理器,而且在時(shí)延的可能范圍內(nèi)存在明顯變化的情況下,有效的聲學(xué)回聲控制必須能夠在削弱返回信號(hào)前估算出聲學(xué)回聲路徑時(shí)延。因此,定時(shí)錯(cuò)誤會(huì)導(dǎo)致棘手的信號(hào)消波效應(yīng),后者會(huì)降低語(yǔ)音質(zhì)量。
4.2 方法
在無(wú)線(xiàn)網(wǎng)絡(luò)中減少聲學(xué)回聲而不導(dǎo)致副作用的方法取決于:聲學(xué)回聲控制器辨別有效語(yǔ)音和聲學(xué)回聲信號(hào)特征的能力(即,能夠阻斷聲學(xué)回聲信號(hào),并允許有效語(yǔ)音信號(hào)通過(guò))。準(zhǔn)確的信號(hào)識(shí)別是正確操作的關(guān)鍵所在,不正確的信號(hào)分類(lèi)(稱(chēng)為錯(cuò)誤類(lèi)型1,錯(cuò)誤類(lèi)型2,和錯(cuò)誤類(lèi)型3)會(huì)對(duì)通信質(zhì)量造成不利影響。
聲學(xué)回聲的一般頻譜特征類(lèi)似于語(yǔ)音的頻譜特征。類(lèi)似地,聲學(xué)回聲路徑中的非線(xiàn)性特征會(huì)引起回聲和原始語(yǔ)音音節(jié)之間的不一致。因此,有效語(yǔ)音和對(duì)應(yīng)的聲學(xué)回聲之間的電平差異(振幅差異)提供了相應(yīng)的信息,使用該類(lèi)信息,可將聲學(xué)回聲從主流語(yǔ)音中分離出來(lái)。在圖4中,給出了識(shí)別某一信號(hào)是有效信號(hào)還是聲學(xué)回聲信號(hào)所采用的邏輯方法的概念視圖。
圖4 確定聲學(xué)回聲
對(duì)于將聲學(xué)回聲信號(hào)從有效的語(yǔ)音信號(hào)中識(shí)別出來(lái)的邏輯方法來(lái)說(shuō),有兩種主要的相關(guān)事宜。下面,我們以問(wèn)題的形式介紹了這兩種事宜:
1.為了將錯(cuò)誤判斷的概率降至最低程度,所應(yīng)采用的恰當(dāng)?shù)拈撝倒β孰娖绞鞘裁矗?br>
2.怎樣才能測(cè)量出語(yǔ)音和聲學(xué)回聲的功率電平,而不引入測(cè)量缺陷?④
為了解決上述事宜,標(biāo)準(zhǔn)方法(業(yè)內(nèi))是采用相對(duì)較低的功率電平閾值設(shè)置,以便將回聲從語(yǔ)音中分離出來(lái),與此同時(shí),忽略引入測(cè)量本身的失真信號(hào)(由背景噪音電平導(dǎo)致)。這是一種脆弱的方法,無(wú)法令人接受。該方法的主要缺點(diǎn)在于其較高的錯(cuò)誤率,其導(dǎo)因在于對(duì)信號(hào)的錯(cuò)誤分類(lèi)(即,錯(cuò)誤地將聲學(xué)回聲信號(hào)解釋為語(yǔ)音信號(hào),反之亦然)。下面,詳細(xì)介紹了支持該觀(guān)點(diǎn)的基本原理。
一家主要的回波消除器廠(chǎng)家采用了該方法,其方式是在單一線(xiàn)路上采用了全雙向回波消除器。(引"三-3.2") | |
在不存在標(biāo)準(zhǔn)線(xiàn)性回聲的場(chǎng)合下使用NLP時(shí),它會(huì)變?yōu)槠胀ǖ幕芈曇种破。在下一?jié),討論了與這類(lèi)信號(hào)處理相關(guān)的性能事宜。(引"四-4.1") | |
當(dāng)標(biāo)準(zhǔn)NLP(作為對(duì)線(xiàn)性回波消除器的補(bǔ)充)打開(kāi)語(yǔ)音通道以截?cái)鄽堄嗟幕芈曅盘?hào)時(shí),它會(huì)"插入"(或"泵入")匹配、舒適的噪音,以便使特定呼叫的背景噪音保持連貫。一家主要的回波消除器廠(chǎng)商采用了噪音泵入方法來(lái)遮蔽聲回聲。這種聲回聲控制并不能令人滿(mǎn)意,這是因?yàn)樗鼤?huì)導(dǎo)致背景噪音的明顯變化,使聽(tīng)者(即用戶(hù))分心并導(dǎo)致不適。(引"四-4.1") | |
測(cè)量缺陷是因背景噪音而導(dǎo)致的,它傾向于放大所探測(cè)到的信號(hào)水平(功率)。(引"四-4.2") |