DAV数字音视工程网_会议系统、指挥调度、演艺科技、智能楼宇等音视频工程信息行业门户

DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

麥克風陣列的語音信號處理技術

來源:數字音視工程網        編輯:胡燕    2017-07-20 09:24:50     加入收藏    咨詢

咨詢
所在單位:*
姓名:*
手機:*
職位:
郵箱:*
其他聯系方式:
咨詢內容:
驗證碼:
不能為空 驗證碼錯誤
確定

麥克風陣列技術相對于單麥克風系統有很多優點,已成為語音增強及語音信號處理的重要部分。語音增強和聲源定位已經成為陣列技術中不可缺少的部分,在視頻會議,智能機器人,助聽器,智能家電,通信,智能玩具,車載領域都需要聲源定位和語音增強。

  隨著人工智能與人們的生活越來越近,語音技術的發展也備受關注。傳統的近場語音已經無法滿足人們的需求,人們希望可以在更遠的距離,更復雜的環境中語音控制智能設備。因此,陣列技術成為遠場語音技術的核心。

  陣列麥克風對人工智能的意義:

  空間選擇性:通過電掃陣列等空間定位技術可以獲取聲源的有效位置,智能設備在獲取精準的聲源位置信息,讓我們的語音更加智能,通過算法獲取高品質的語音信號質量。

  麥克風陣列可以自動檢測聲源位置,跟蹤說話人,同時可以獲取多聲源和跟蹤移動聲源的優勢,無論你走到任何位置,智能設備都會對你的位置方向進行語音增強。

  陣列麥克風增加了空域處理,對多信號空時頻三維的處理彌補單信號在噪聲抑制,回聲抑制,混響抑制,聲源定位,語音分離方面的不足,讓我們的智能設備在復雜的環境中都可以獲取高質量的語音信號,提供更好的智能語音體驗。

  麥克風陣列技術的技術難點:

  傳統的陣列信號處理技術直接應用到麥克風陣列處理系統中往往效果不理想,其原因在于麥克風陣列處理有不同的處理特點:

  陣列模型的建立

  麥克風主要應用處理語音信號,拾音范圍有限,且多用于近場模型,使得常規的陣列處理方法如雷達,聲吶等平面波遠場模型不再適用,在近場模型中,需要更加精準的球面波,需要考慮傳播路徑不同引起的幅度衰減不同。

  寬帶信號處理

  通常的陣列信號處理多為窄帶,即不同陣元在接受時延與相位差主要體現在載波頻率,而語音信號未經過調制也沒有載波,且高低頻之比較大,不同陣元的相位延時與聲源本身的特性關系很大—頻率密切相關,使得傳統的陣列信號處理方法不再完全適用。

  非平穩信號處理

  傳統陣列處理中,多為平穩信號,而麥克風陣列的處理信號多是非平穩信號,或者短時平穩信號,因此麥克風陣列一般對信號做短時頻域處理,每個頻域均對應一個相位差,將寬帶信號在頻域上分成多個子帶,每個子帶做窄帶處理,再合并成寬帶譜。

  混響

  聲音傳播受空間影響較大,由于空間反射,衍射,麥克風收到的信號除了直達信號以外,還有多徑信號疊加,使得信號被干擾,即為混響。在室內環境中,受房間邊界或者障礙物衍射,反射導致聲音延續,極大程度的影響語音的可懂度。

  聲源定位

  聲源定位技術在人工智能領域應用廣泛,利用麥克風陣列來形成空間笛卡爾坐標系,根據不同的線性陣列,平面陣列和空間陣列,來確定聲源在空間中的位置。智能設備首先可以對聲源的位置做進一步的語音增強,當智能設備獲取你的位置信息可以結合其他的傳感器進行進一步的智能體驗,比如機器人會聽到你的呼喚走到你的身邊,視頻設備會聚焦鎖定說話人等等。了解聲源定位技術之前,我們需要了解近場模型和遠場模型。

  近場模型和遠場模型

  通常麥克風陣列的距離為1~3m,陣列處于近場模型,麥克風陣列接受的是球面波而不是平面波,聲波在傳播的過程中會發生衰減,而衰減因子與傳播的距離成正比,因此聲波從聲源到達陣元時候的幅度也各不相同。而遠場模型中,聲源到陣元的距離差相對較小,可以忽略。通常,我們定義2L²/λ為遠近場臨界值,L為陣列孔徑,λ為聲波波長,因此陣元接受信號不僅有相位延時還有幅度衰減。

  聲源定位技術

  聲源定位的方法包括波束形成,超分辨譜估計和TDOA,分別將聲源和陣列之間的關系轉變為空間波束,空間譜和到達時間差,并通過相應的信息進行定位。

  電掃陣列

  通過陣列形成的波束在空間掃描,根據不同角度的抑制不同來判斷方向。通過控制各個陣元的加權系數來控制陣列的輸出指向,進行掃描。當系統掃描到輸出信號功率最大時所對應的波束方向就是認為是聲源的DOA方向,從而可以聲源定位。電掃陣列的方式存在一定的局限,僅僅適用于單一聲源。若多聲源在陣列方向圖的同一主波束內,則無法區分。而這種定位精度和陣列寬度有關—在指定頻率下,波束寬度和陣列孔徑成反比,所以大孔徑的麥克風陣列在很多場合的硬件上很難實現。

  超分辨譜估計

  如MUSIC,ESPRIT等,對其協方差矩陣(相關矩陣)進行特征分解,構造空間譜,關于方向的頻譜,譜峰對應的方向即為聲源方向。適合多個聲源的情況,且聲源的分辨率與陣列尺寸無關,突破了物理限制,因此成為超分辨譜方案。這類方法可以拓展到寬帶處理,但是對誤差十分敏感,如麥克風單體誤差,通道誤差,適合遠場模型,矩陣運算量巨大。

  TDOA

  TDOA是先后估計聲源到達不同麥克風的時延差,通過時延來計算距離差,再利用距離差和麥克風陣列的空間幾何位置來確定聲源的位置。分為TDOA估計和TDOA定位兩步:

  1. TDOA估計

  常用的有廣義互相關GCC,Generalized Cross Correlation和LMS自適應濾波

  廣義互相關

  基于TDOA的聲源定位方法中,主要用GCC來進行延時估計。GCC計算方法簡單,延時小,跟蹤能力好,適用于實時的應用中,在中等嘈雜強度和低混響噪聲情況下性能較好,在嘈雜非穩態噪聲環境下定位精度會下降。

  LMS自適應濾波

  在收斂的狀態下給出TDOA的估值,不需要噪聲和信號的先驗信息,但是對混響較為敏感。該方法將兩個麥克風信號作為目標信號和輸入信號,用輸入信號去逼近目標信號,通過調整濾波器系數得到TDOA。

  2. TDOA定位

  TDOA估值進行聲源定位,三顆麥克風陣列可以確定空間聲源位置,增加麥克風會增高數據精度。定位的方法有MLE最大似然估計,最小方差,球形差值和線性相交等。TDOA相對來講應用廣泛,定位精度高,且計算量最小,實時性好,可用于實時跟蹤,在目前大部分的智能定位產品中均采用TDOA技術做為定位技術。

  波束形成:

  波束形成可分為常規的波束形成CBF,Conventional Beam Forming和自適應波束形成ABF,Adaptive Beam Forming。CBF是最簡單的非自適應波束形成,對各個麥克風的輸出進行加權求和得到波束,在CBF中,各個通道的權值是固定的,作用是抑制陣列方向圖的旁瓣電平,以濾除旁瓣區域的干擾和噪聲。ABF在CBF的基礎之上,對干擾和噪聲進行空域自適應濾波。ABF中,采用不同的濾波器得到不同的算法,即不同通道的幅度加權值是根據某種最優準則進行調整和優化。如LMS,LS,最大SNR,LCMV(線性約束最小方差,linearly constrained Minimum Variance)。采用LCMV準則得到的是MVDR波束形成器(最小方差無畸變響應,Minimum Variance Distortionless Response)。LCMV的準則是在保證方向圖主瓣增益保持不變的情況下,使陣列的輸出功率最小,表明陣列輸出的干擾加噪聲功率最小,也可以理解為是最大SINR準則,從而能最大可能的接收信號和抑制噪聲和干擾。

  CBF-傳統的波束形成

  延時求和的波束形成方法用于語音增強,對麥克風的接收信號進行延時,補償聲源到每個麥克風的時間差,使得各路輸出信號在某一個方向同相,使得該方向的入射信號得到最大的增益,使得主波束內有最大輸出功率的方向。形成了空域濾波,使得陣列具有方向選擇性。

  CBF + Adaptive Filter 增強型波束形成

  結合Weiner濾波來改善語音增強的效果,帶噪語音經過Weiner濾波得到基于LMS準則的純凈語音信號。而濾波器系數可以不斷更新迭代,與傳統的CBF相比,可以更有效的去除非穩態噪聲。

  ABF-自適應波束形成

  GSLC是一種基于ANC主動噪聲對消的方法,帶噪信號同時通過主通道和輔助通道,而輔助通道的阻塞矩陣將語音信號濾除,得到僅包含多通道噪聲的參考信號、各通道根據噪聲信號得到一個最優信號估計,得到純凈語音信號估計。

  陣列技術的未來發展

  麥克風陣列技術相對于單麥克風系統有很多優點,已成為語音增強及語音信號處理的重要部分。語音增強和聲源定位已經成為陣列技術中不可缺少的部分,在視頻會議,智能機器人,助聽器,智能家電,通信,智能玩具,車載領域都需要聲源定位和語音增強。各種信號處理技術,陣列信號處理技術都陸續結合到麥克風陣列的語音處理系統當中,并逐漸得到算法改進和進一步的廣泛應用。在復雜的噪聲環境,混響環境,聲學環境下,強大的硬件處理能力也使得復雜算法實時處理語音增強成為了可能。在未來,語音和圖像的緊密結合會成為人工智能領域的新的突破口,在人工智能的風口浪尖,是誰能將語音識別,語音理解,陣列信號處理,遠場語音,圖像識別,人臉識別,虹膜識別,聲紋識別的技術巧妙并有機的結合在一起,并將技術的本質和與人為本的宗旨完美的結合,讓我們拭目以待。

免責聲明:本文來源于網絡收集,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
掃一掃關注數字音視工程網公眾號

相關閱讀related

評論comment

 
驗證碼:
您還能輸入500
    主站蜘蛛池模板: 上海钧尚电器有限公司 - Faulhaber电机 AMETEK pittman电机 AMETEK ROTRON军用航空风机 Exlar电动缸 MAE电机 MCG电机 CP电动工具 马头工具 AMCI驱动器 直流电机 减速箱 直流伺服电机,无刷电机,直线电机 直流防爆电机 防爆电机 汽车助力转向电机 EPS电机 faulhaber motor faulhaber gearbox NANOTEC电机 ELWOOD电机 PHYTRON电机 EXLAR伺服电动缸 高力矩、高性能直流电机,音圈电机,风机,直流风机,航空风机 | 亿企商贸-亿万企业的商务贸易平台-B2B企业产品发布供求信息平台,一带一路中国企业及产品展示平台,免费企业智能自助建站网络营销推广平台,打造B2B企业黄页产品信息发布推广专业综合电子商务平台! | 厦门海为科技有限公司 - 工业物联网|国产PLC|HMI|SCADA | 石家庄团建公司|石家庄拓展训练|石家庄拓展培训|石家庄公司团建|石家庄拓展公司-石家庄启聚团建公司 | 新硕考研_新硕寄宿考研-升学路上的规划师【官网】 | 西安外墙防水补漏-堵漏-防腐-保温工程公司-陕西宏图祥瑞实业有限公司 | 全降解塑料厂家_淋膜_秸秆_手机壳_气泡袋_牙刷牙线_GRS可回收包装材料-东莞全球环保科技有限公司 | 诸城市瑞特机械有限公司_洗筐机,周转箱,托盘清洗机,风淋室 | 烟台蓝天投资开发有限公司| 转炉烟道,转炉汽化冷却烟道,转炉汽化烟道,汽化冷却烟道系统生产厂家-宏发制造集团有限公司原河北宏发机械有限公司 | 吸污车|吸粪车|冷藏车|消防车|清障车|环卫垃圾车价格|湖北程力汽车集团厂家销售公司 | 山东货架,山东仓库货架,临沂仓库货架,临沂仓储货架-山东兴博物流设备有限公司 | 石家庄团建公司|石家庄拓展训练|石家庄拓展培训|石家庄公司团建|石家庄拓展公司-石家庄启聚团建公司 | 南通众诚数控机床有限公司-液压机,剪板机,折弯机,卷板机,液压冲床,路灯杆设备专业制造商 | 外墙涂料_真石漆_真石漆批发_河南宝润达真石漆厂家 | 正规网上赚钱网站「百赚网」专注在家赚钱的网络赚钱平台 | 抛丸机-通过式抛丸机-履带吊钩式抛丸机厂家-青岛泓霖智能设备公司 | 葡萄糖酸钠_食用葡萄糖_精萘-安徽鹏腾实业有限公司 | 拼装式电磁屏蔽室厂家,屏蔽机柜生产厂家,电波暗室制造商,屏蔽配件-常州麦思恩屏蔽机柜生产厂家 | 浙江创洁卫生消杀有限公司-浙江杀虫公司,温州消杀公司,温州灭鼠公司,灭蟑螂,灭蚊蝇,灭跳蚤,灭书虱,灭臭虫,灭螨虫,白蚁防治,房间消毒除味等专业服务 | 石家庄华龙鼎电动门,石家庄电动门电话,石家庄电动门配件,石家庄电动门维修电话,石家庄电动门安装电话,石家庄华龙电动门 | 上海森信实验仪器有限公司| 排污管道疏通_长沙消防管道/暗管网漏水检测维修_长沙雨水管道疏通就找湖南鸿磊环保工程有限公司 排水PVC管-PVC排污管-给水PVC管-电线PVC管-米阳建材pvc管厂 | 水电站泵站LCU控制屏_发电机保护_变压器保护_逆功率保护_防孤岛保护装置_ 电力微机保护网 | 上海专升本-上海统招专升本网 | 领先的木工机械生产厂家,原木加工流水线,立式带锯机,数控木工跑车-邢台亚士达机械制造有限公司 | 柯赛德斯-加美润滑油-专业做汽车工业润滑油品牌加盟代理 | 四方光电(武汉)仪器有限公司_四方仪器首页-烟气分析仪|尾气分析仪|煤气分析仪|沼气分析仪|天然气分析仪|超声波流量计|在线气体分析系统|红外气体传感器 | 气胀轴丨安全夹头丨电磁制动器丨纠偏系统丨磁粉离合器丨张力控制器厂家- 东莞天机通信科技有限公司 | 合金锤头_破碎机锤头_耐磨锤头_巩义市东辰实业有限公司 | 制沙机,反击式破碎机,重锤破碎机,泥石分离机,圆锥破碎机厂家-昆明德鑫机械 | 气体泄漏检测仪,COD水质分析仪,RD8200管线探测仪-成都恒通兴业科技有限责任公司 | 蒸汽流量计_涡轮流量计_涡街流量计_雷达液位计_污水流量计_分体式_大口径工业流量计-江苏长顺仪表 | 商标注册_商标转让交易_专利申请_版权登记_ISO认证服务咨询-世标知识产权 | 网站制作-网站制作公司-专业制作网站【做网站找企术】 | 气密仪-气密性检测仪-气密性测试仪-苏州莱和电子科技有限公司 | 衡水一体化污水处理设备|循环水旁滤器|加药装置|钢厂浊环净化装置|河北欧意科技集团有限公司 | 泊头市特种油泵阀制造有限公司 - 渣油泵,重油泵,沥青泵,高压齿轮泵,煤焦油泵,导热油泵,三螺杆泵,圆弧齿轮泵,不锈钢齿轮泵, | 激光切割机_激光切割机价格-山东大威激光科技有限公司 | 网站建设-百度SEO关键词优化与企业全网营销推广服务-启源信息 | 湖北聚力汽车技术股份有限公司 |