DAV数字音视工程网_会议系统、指挥调度、演艺科技、智能楼宇等音视频工程信息行业门户

DAV首頁
數字音視工程網

微信公眾號

數字音視工程網

手機DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

智能家居語音控制解決方案:能聽會說、自在交互

來源:數字音視工程網        編輯:航行150    2015-12-09 14:47:51     加入收藏    咨詢

咨詢
所在單位:*
姓名:*
手機:*
職位:
郵箱:*
其他聯系方式:
咨詢內容:
驗證碼:
不能為空 驗證碼錯誤
確定

 遠場語音識別、云端語義辨識、人工智能應用等等一個個技術節點得到新的突破,為智能家居提供了新的控制入口選擇。本文將從技術趨勢、解決方案、產品應用、項目實施等多角度為您呈現語音控制技術在智能家居產品和集成項目中的應用前景。

  在智能家居給人們帶來便捷生活的同時,人們的控制習慣逐漸發生改變。語音技術的發展也為控制入口做了一個補充,在拋去了傳統遙控器和手機APP之后,通過口令發送讓家居環境達到舒適狀態,讓生活更便捷智能,這是否會成為智能家居行業下一個階段的普遍應用?

  遠場語音識別、云端語義辨識、人工智能應用等等一個個技術節點得到新的突破,為智能家居提供了新的控制入口選擇。本文將從技術趨勢、解決方案、產品應用、項目實施等多角度為您呈現語音控制技術在智能家居產品和集成項目中的應用前景。

  所謂智能語音產業,主要指通過語音合成技術和語音識別技術,為用戶提供各種服務的產業。一般來說,用戶只需要用說話的方式給服務終端發布命令,就能得到相應的服務。這一產業從上世紀六十年代就已出現,但并不為普通消費者所熟知,消費者對其認知度也比較低。近年來,隨著蘋果、谷歌、微軟等公司先后推出Siri等智能語音服務,這一服務以及相關產業也開始被普通消費者和投資界所關注。

  語音控制技術

  與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的技術。

  語音識別是一門交叉學科,語音識別技術與語音合成技術結合使人們能夠甩掉鍵盤,通過語音命令進行操作,語音技術的應用已經成為一個具有競爭性的新興高技術產業。

  目前語音控制技術存在的問題

  目前,對于語音控制類的智能硬件產品在很多場景下因語音交互體驗不如人意而深受詬病,究其原因主要是受限于空間距離、背景噪音、其他人聲干擾、回聲、混響等多重復雜因素,進而導致的識別距離近、識別率低等明顯痛點。

  除此之外,單是中國語系、方言和口音就相當多,加上中文的多語義性,所以不同地區的人使用語音控制識別率差異較大。同時,在語義識別上,也存在上下文的關聯帶來識別的學習難、定位難和建立模型難等問題。

  語音識別的幾種控制技術

  “語音識別”技術相當于給計算機系統安裝上“耳朵”,使其具備“能聽”的功能。該技術經過語音信號處理、語音特征處理、模型訓練及解碼引擎等復雜步驟,使機器最終能夠將語音中的內容、說話人、語種等信息識別出來。語音控制功能的實現,與用戶的使用習慣高度關聯。目前的語音控制功能實現方式可分為近場語音識別和遠場語音識別二個大類。

  近場/遠場語音識別技術

  近場語音識別,需要用戶點擊啟動,并且用戶與終端設備的距離比較近,如手機或其他終端設備,可直接借助這些終端設備的實現控制功能。

  遠場語音識別,以麥克風陣列遠距離拾取的語音數據作為輸入數據,通過語音識別的算法將語音信號轉寫成文字的技術。雖然和近場語音識別技術在原理上是相同的,但是由于音源和麥克風之間的空間距離增大,在聲波傳播過程中會出現信號強度的衰減和各種噪音干擾,因此需要特殊的語音數據拾取和預處理技術。不同的拾取設備和預處理技術常常會使用于語音識別的聲波信號特征發生改變,因此針對不同的遠場語音拾取技術,需要對語音識別引擎進行定制化適配和優化。

  當語音信號在傳播過程中有所衰減,影響采集信號的強度和分辨率,使用的靈敏度非常高的指向性麥克風,同時將麥克風的參數調整到適合遠場語音數據的模式,可以最大限度采集清晰的遠場語音信號。語音指令聲波在傳輸過程中受到周圍噪音的污染,降低聲波信號的信噪比,使用定向波速成形技術,抑制方向外的噪音,從而減少噪音對語音信號的干擾。在一個房間里,麥克風拾取的聲波不僅僅直接來自于音源,還有音源發出后經過墻壁反射的遲到的聲波,形成聲音的殘留,造成混響。利用多個麥克風采集的數據,通過多通道回聲消除算法,將這些不同時間達到的聲音數據分離開來,從而消除了混響對聲音數據的影響。

  喚醒目標檢測技術

  在遠距離用語音進行操控的時候,聲音可能來自不同方向的不同人。因此首先要確定哪些是發指令的聲音,哪些不是。使用的麥克風陣列波速成形算法,將360度空間垂直劃分成若干區域,每個麥克風負責檢測一個指定的區域。當某個空間區域里面檢測到有喚醒詞出現時,對應于該空間區域的麥克風拾音功能就被增強,其他區域的麥克風拾音就被抑制。從而實現了對聲音進行有方向有角度的拾取,避免了周圍電視機里的說話聲音、其他人交談對語音指令的影響。

  播放狀態打斷技術

  在對音箱等設備進行語音控制時,往往該設備處于播放歌曲的狀態。由于麥克風安裝在音箱上,麥克風和說話人之間的距離要遠大于麥克風和揚聲器之間的距離,在這樣的情況下,采用內外兼顧的方法進行解決。內部使用特殊的回聲消除算法從內部減小噪音對麥克風的影響。另外對于震動帶來的非線性干擾,傳統的線性回聲消除方法失效了,因此可以使用非線性回聲消除算法提高內部噪聲消除的效果。在外部結構設計方面,使用精心設計的麥克風陣列減震結構,使多個麥克風和它所連接的電路板之間的震動減小到最小,從而最大程度的控制高聲強導致的音箱本體震動對拾音的干擾。

  成熟的語音控制應用解決方案

  科大訊飛作為中國最大的智能語音技術提供商,在智能語音技術領域有著長期的研究積累,并在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。對于智能家居語音控制的應用,必須解決好距離、效率、個性化、方言、喚醒等問題,科大訊飛在這些方面都有非常成熟的解決方案。

  距離:遠場識別技術打破距離瓶頸

  近場識別技術目前已經比較成熟,現在手機上使用的語音輸入功能就屬于近場識別技術,用戶必須在離手機比較近的距離內說話,但在智能家居環境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個必要條件就是在無論你在客廳哪個角落發出指令,設備都能準確的識別,語音識別技術必須突破距離的障礙。

  目前室內的語音交互受到背景噪音、其他人聲干擾、回聲、混響等多重復雜因素影響,導致識別率低甚至無法使用,只能在相對安靜、近距離的環境下使用。而遠場識別技術將能夠很好的解決這些問題。

  科大訊飛于2015年3月發布遠場識別技術,是目前唯一支持超過5米的語音識別技術,突破了語音交互距離瓶頸,大幅度改進了語音交互的自由度。該技術利用麥克風陣列的空域濾波特性——在目標說話人方向形成拾音波束(BeamForming),抑制波束之外的噪聲,結合獨特的去混響算法,最大程度的吸收反射聲,從而達到去除混響的目的,用戶在客廳的任意角落通過語音操控智能家電已成為現實。

  效率:快速反應實現秒懂

  近年來,隨著深度學習理論的爆發式發展及其在語音識別領域獲得的顯著效果,同時Kaldi等開源語音識別工具也在工業界和學術界逐漸普及,語音識別的門檻持續降低,許多公司都具備了語音識別的能力及相關產品,但是一些產品反應慢,說出一句話往往要等待很久才能顯示結果,另外,準確率也不高,存在識別不出來的情況。

  針對語音識別準確率和響應速度的問題,科大訊飛持續在核心技術和產品特性上做出創新,在把國際領先的深度神經網絡技術引入語音識別的基礎上,基于深度神經網絡的語音增強算法對輸入語音進行“識別關鍵信息無損”的降噪,通過海量訓練語料基礎上的高精度聲學模型和語言模型訓練,并結合極致的解碼引擎工程技術,實現了在很小延遲的情況下,做到將去除原始語音的噪聲干擾和識別幾乎同時,大大提高了語音輸入的響應速度和用戶體驗,在大詞匯連續語音識別率上可以達到95%以上,命令詞識別率達到99%以上,解碼引擎可以在用戶說完話40毫秒之內給出結果,真正實現“秒懂”。

  個性化:自動學習適應用戶使用習慣

  每個人在說話時,口音、語速、口頭禪都不一樣,那么家里的智能設備只會識別一些基本詞句顯然是遠遠不夠的,它們必須要更懂你。比如,懂你的口音、方言、口頭禪以及時不時蹦出的專業詞匯等。

  讓智能設備適應每個人的使用習慣可能嗎?答案是肯定的。這里要用的到就是語音識別的另外一項關鍵技術——個性化識別技術。個性化識別指的是語音識別系統具備自動學習并適應用戶使用習慣的能力,你用的越多,它越懂你。一般來說,個性化識別包括發音和語言兩方面。其中發音個性化主要是指系統對用戶語速、口音等發音習慣的學習,而語言個性化主要是指系統可以對用戶的特定詞匯,例如人名、地名、口頭禪、專業詞匯等,具備更好的辨識性。

  目前科大訊飛的個性化識別技術已能針對每個人的興趣點、知識背景等來進行個性化語言模型建模,從而準確識別出個性化的詞匯內容。以后你用的越多,語音識別系統就會越懂你。

  方言:無拘束隨心控制

  眾所周知,中國的語音及語言博大精深,雖然國家在推廣標準普通話方面不遺余力,但是中國真正掌握標準普通話的人群比例還是比較低的,而中國的口音現象則是紛繁復雜,同城市中不同口音的情況也很常見。因此,當這些帶有或輕或重口音的人群在使用語音輸入時,如果按通常的方法使用標準普通話數據進行模型的訓練,就會產生很嚴重的適配問題,從而影響語音輸入時的識別效果。

  “方言”現在也不再是語音識別的障礙,得益于各類方言豐富的音頻數據、特殊詞匯、發音現象等專業資源以及充分利用深度神經網絡的自學習特色,目前,訊飛輸入法已經陸續支持四川話、河南話、東北話、天津話等15種方言識別,這些方言識別能力同樣適用于智能家居環境中。以后,無論你使用普通話還是方言,無論你說話語速快還是慢,普通話標不標準,在家里都能自由地使用語音控制智能設備。

  語音喚醒:真正解放雙手

  由于功耗等方面的限制,智能設備很難24小時都保持在激活狀態。因此,要想在家里自由地控制智能家居設備,我們還需要能即時“喚醒”功能,也就是給智能設備加入“語音喚醒”技術。

  語音喚醒,是指通過含有特定喚醒詞的語音輸入來“觸發”語音識別系統以實現后續的語音交互。通過該技術,任何人在任何環境、任何時間,無論是近場還是遠場,面向設備直接說出預設的喚醒詞,就能激活產品的識別引擎,從而真正實現全程無觸控的語音交互。

  除了說單個喚醒詞實現喚醒外,更自然便捷、在技術上更具有挑戰性的交互方式是在連續語流中帶上喚醒詞,以實現喚醒產品并同時實現操控的效果。目前,語音喚醒方案已在部分產品中取得成功應用,比如在靈犀語音助手中,說出“靈犀靈犀,打電話給張三”就可以喚醒設備并自動完成人名識別與撥打電話。

  國內外語音控制的市場現狀

  隨著智能家居市場的發展,國外的IT巨頭們已先后以智能家居產品與語音相結合的方式進入智能家居領域:谷歌收購NEST布局智能家居,不斷強化Google Now的語音入口;蘋果HomeKit智能家居平臺與Siri也不斷加強融合;市場上流行的Echo智能音箱使用了亞馬遜的Alexa語音技術;微軟也發布語音助手Cortana,將它作為智能家庭領域擴展交互入口。從這些國外科技大佬們對語音產業的重視和投入,可以看出智能語音與智能家居的融合是大勢所趨,業內普遍認為語音作為人類信息最自然、最便捷的交互方式,必將成為未來智能家居設備中的重要組成部分。

  在國內,語音巨頭科大訊飛也在去年8月宣布進軍智能家居市場,并于今年3月攜手京東成立合資公司——北京靈隆科技,推出了其生產第一個產品——DingDong智能音箱,除了具備音箱的基本功能,還可以作為語音助手,更是智能硬件的控制中樞。除此之外,百度、騰訊等都在打造自己的語音團隊。

  隨著國內外巨頭們對語音交互領域投入的增加,語音核心技術正逐步成熟。智能家居作為 IT 產業和制造工業向個人家居領域滲透發展的必然結果,語音技術正不斷進入智能家居領域滲透,市場前景廣闊。

  小貼士

  Siri是iOS系統上的語音系統,與Siri對話,就和跟朋友對話一樣,可以幫您做很多事情,例如發短信、打電話、預定餐廳、問路等等。也能與Siri做一些很有趣的互動,例如讓它幫您拋硬幣或者占卜星座。Siri可以在免提模式下工作,可以通過Siri進行語音操作導航尋找最佳駕車路線。Siri也可以與HomeKit一起工作以實現通過語音來控制家里的智能產品。Siri還能對接維基百科、Yelp、爛番茄、Shazam等許多第三方在線服務平臺,幫助用戶更多地了解與關注世界。

  語音交互對于智能家居行業的意義

  科技讓生活更智能,語音讓交互更便捷。語音交互對于智能家居最直接的意義在于將“智能家居”變得真正的智能起來。無論是再技術先進的品牌,再友善的人機交互界面,都沒有語音交互控制來的簡便直接。所有品牌、所有產品以一個智能控制的概念進駐到人們息息相關的日常生活中的時候,少不了需要一個學習和適應的過程,而語音則不需要,我們所有的日常交流、行為習慣,語言和聲音已經成了人們思維中的一部分。所以,如果智能家居能與語音交互融于一體,那么智能家居產業也許會迎來一次劃時代的突破。

免責聲明:本文來源于網絡收集,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者聯系或有侵權行為聯系本站刪除。(原創稿件未經許可,不可轉載,轉載請注明來源)
掃一掃關注數字音視工程網公眾號

相關閱讀related

評論comment

 
驗證碼:
您還能輸入500
    主站蜘蛛池模板: 中国焊接协会网站—中国焊接信息网;焊接行业最权威访问量最大的专业网站:焊接信息、焊接材料,焊接机器,焊接设备,焊机,焊材,辅助设备,焊机配件,仪器仪表,电动工具,钎焊,送丝机,表面处理,自动化专机,焊锡丝,助焊剂 | 无石棉纤维增强水泥板厂家_水泥纤维装饰板_河北埃尔佳建材科技有限公司 | 拖链电缆-卷筒电缆-行车电缆-机器人电缆-上海甲朗制造 | 砂基透水砖滤水率,防滑性试验仪,砂基透水砖落球冲击,抗冲击试验机-献县中正试验仪器销售处 | 威海实木家具-威海定制家具-威海家具-威海至佳百隆家具有限公司 威海木箱,威海木托盘,威海免熏蒸包装箱-威海耀晟木制品有限公司 | 乌海市腐植酸盐加工,内蒙古腐植酸钠,内蒙古型煤粘合剂生产厂家|创联腐植酸盐加工有限公司 | 全自动视觉点胶机|在线式点胶机|精密点胶阀设备厂家-杭州迈伺特科技有限公司 | 明基太阳能玻璃钢污水处理公司-设计研发全自动加药装置设备 | 咪咕体育直播,咪咕直播,CCTV5直播,体育直播,高清直播,腾讯体育直播,篮球直播,足球直播 | 制砂机-合金-耐磨锤头-耐磨衬板-铸造件厂家-巩义市豫园宏宇铸造有限公司 | 种植槽系统,移动苗床,多层种植货架,潮汐苗床,物流苗床,潮汐面板,立体旋转育秧床,河北博超温室设备有限公司 | 绣花厂_电脑绣花厂_手工刺绣加工定制 - 北京丽绣坊工艺品有限公司 | 破碎机锤头-耐磨锤头-合金锤头-河南磐石耐磨材料有限公司 | 灭菌洗箱机_周转箱清洗机_隧道式洗箱机 - 环速科技有限公司 | 清扫器-聚氨酯清扫器-合金清扫器-四连杆自动纠偏-机械纠偏-锥辊纠偏-衡水涌泉机械科技有限公司 | 呼吸家官网|肺功能检测仪生产厂家|国产肺功能仪知名品牌|肺功能检测仪|肺功能测试仪|婴幼儿肺功能仪|弥散残气肺功能仪|肺功能测试系统|广州红象医疗科技有限公司|便携式肺功能仪|大肺功能仪|呼吸康复一体机|儿童肺功能仪|肺活量计|医用简易肺功能仪|呼吸康复系统|肺功能仪|弥散肺功能仪(大肺)|便携式肺功能检测仪|肺康复|呼吸肌力测定肺功能仪|肺功能测定仪|呼吸神经肌肉刺激仪|便携式肺功能 | 衡水物流网,衡水物流信息网,衡水物流公司,衡水货运专线,衡水专线运输车辆 | 乐云SEO | 品牌营销:抖音小红书关键词优化-ai搜索优化GEO推广 | 七台河市供排水有限责任公司 | 液压尾管悬挂器,机械式尾管悬挂器价格,石油套管扶正器厂家,连续油管悬挂器,高压双塞水泥头,免钻塞注水泥分级箍,单塞套管水泥头价格,弹性套管扶正器,铸铝钢性扶正器,钢性套管扶正器厂家 | 狠狠穞A片一區二區三區-免费网站在线观看人数更新时间-欧洲尺码日本尺码专线不卡顿,国产大尺度禁片未删减版,baomaav | 热电偶_电磁流量计_温度传感器_涡轮流量计_铠装PT100_压力变送器-中瑞能 | 徐州电动垃圾车|三轮快速保洁车|电动高压冲洗车|江苏大卫王环保科技有限公司 | 科衣洛定制衣柜,书柜,厨柜,衣帽间,电视柜,酒柜,餐厅柜,门厅柜,鞋柜——科衣洛全屋定制官网 | 美林基业集团官网——美林基业,一生挚诚| 意大利留学-意大利语培训-马来西亚留学【长青藤海外】 | 陕西锐锋建筑安装有限公司,锐锋建筑,总承包,专业分包,市政综合,劳务,水电钢构,铁路公路,房建,房屋建筑施工 | 金雷诺机柜,GLN机柜,户外机柜,电力机柜,服务器机柜 | 五金冲压厂家_五金冲压件加工_微细孔加工-深圳市浩鑫精密五金制品有限公司 | 西安防静电地板_防静电地板厂家_防静电地板价格_OA网络地板_写字楼架空地板_机房墙板安装-红梅防静电地板厂家直销 | 长兴嘉诚炉业有限公司【官网】| 郑州润滑油展-第16届中国润滑油、脂及汽车养护展览会-2025年5月27-28日-郑州国际会展中心 | 宁波允泰仪器有限公司-硬度计、拉力试验机、盐雾试验箱、影像测量仪、气动量仪 | 浙江健朗-舒华跑步机|公园运动器材|商用健身设备|户外健身器材厂家 | 微型电磁阀_隔膜泵_活塞泵_微型水泵_微型真空泵_微型气泵【东莞市宗旨电子科技有限公司】 | 荧光显微镜,倒置显微镜,显微镜相机,荧光光源——广州市明美光电技术有限公司 | 中山电子控制板|中山工业控制板|中山市云禾电子科技有限公司 | 宁波华路德|交通信号灯|交通信号机|太阳能信号灯|交通警示灯|交通信号灯厂家 | 台式氙灯老化箱-光伏组件-真空老化试验箱|中科万通仪器官网 | 山东胜王水处理设备有限公司,反渗透设备,纯净水设备,污水处理设备,SWS系列全自动钠离子交换器,纯净水设备报价,活性碳过滤器,多介质过滤器 | 河北高新技术企业认定,沧州商标注册,沧州9001质量管理体系认证,沧州高新技术企业认定,沧州体系认证,沧州商标续展,沧州版权登记,河北国瑞企业管理咨询有限公司 |