DAV数字音视工程网_会议系统、指挥调度、演艺科技、智能楼宇等音视频工程信息行业门户

DAV首頁
數(shù)字音視工程網(wǎng)

微信公眾號

數(shù)字音視工程網(wǎng)

手機(jī)DAV

null
null
null
卓華,
招商,
null
null
null
快捷,
null

我的位置:

share

語音識別技術(shù)分析

來源:數(shù)字音視工程網(wǎng)        編輯:數(shù)字音視工程    2013-01-06 10:17:10     加入收藏    咨詢

咨詢
所在單位:*
姓名:*
手機(jī):*
職位:
郵箱:*
其他聯(lián)系方式:
咨詢內(nèi)容:
驗(yàn)證碼:
不能為空 驗(yàn)證碼錯誤
確定

聲音識別系統(tǒng)的發(fā)展得益于便宜的硬件,大多數(shù)的計(jì)算機(jī)都有聲卡和麥克風(fēng)。

  聲音識別系統(tǒng)的發(fā)展得益于便宜的硬件,大多數(shù)的計(jì)算機(jī)都有聲卡和麥克風(fēng)。

  但是聲音識別系統(tǒng)比指紋識別系統(tǒng)有更高的誤識率,因?yàn)槿说穆曇舨幌裰讣y那樣具備唯一性。

  生物識別指從生理和行為特征上自動辨識人類的身份,包括面部、虹膜、靜脈、語音、簽名和指紋識別,以及掌形識別。要被辨識的人必須親自站在識別器前,這樣的辨識技術(shù)不需要記密碼或攜帶識別證和智能卡。

  隨著個人身份號碼和密碼使用的快速增長,有必要限制對這些敏感數(shù)據(jù)的訪問。替代了個人身份號碼和密碼,讓生物識別技術(shù)使用更方便,能夠阻止對ATM機(jī)、識別證和智能卡、移動電話、PC機(jī)、工作站和計(jì)算機(jī)網(wǎng)絡(luò)等未授權(quán)的訪問或是欺詐性地使用。個人身份號碼和密碼可能會被忘掉,識別證類的方法如護(hù)照、駕照和保險(xiǎn)卡也可能被遺忘、被偷竊或丟失。

  各種各樣的生物識別系統(tǒng)現(xiàn)在被用作實(shí)時識別。最常見的是面部識別和指紋識別,此外,還有其他運(yùn)用虹膜和視網(wǎng)膜掃描、語音、面部和掌形等的生物識別系統(tǒng)。

  語音識別

  語音信號表明了語言、語音生理上的呈現(xiàn)方式和類型,以及說話者的身體和情緒狀態(tài)。20世紀(jì)60年代早期,貝爾實(shí)驗(yàn)室的Lawrence Kersta在計(jì)算機(jī)語者驗(yàn)證技術(shù)上邁出了重要的第一步,他在由復(fù)雜的電動機(jī)械設(shè)備產(chǎn)生的聲譜圖中引入了聲波紋的概念,聲波紋同視覺比較的驗(yàn)證運(yùn)算法則相匹配。

  為了進(jìn)行語者辨識而記錄人們的聲音,這需要用語音來展現(xiàn)說話的行為和方式,語音識別是生物行為識別的一部分。語音信號是十分復(fù)雜的,它可以很容易地被普通的麥克風(fēng)捕捉。然而,同其他生物識別技術(shù)如指紋識別相比,聲音識別不是很穩(wěn)定。

  自動語者識別的先進(jìn)方法要求隨機(jī)的語者模型,模型具有不同的語音特點(diǎn),它可以區(qū)分高級和低級信息。高級信息包括方言、口音、談話風(fēng)格和主題樣式,這些特征現(xiàn)在只能被人辨識和分析。低級信息包括音高周期、節(jié)奏、音調(diào)、聲譜級和個人聲音的頻率和帶寬。

  雖然較高質(zhì)量的聲音采集設(shè)備可以提高辨識的性能,但通過麥克風(fēng)或普通電話也可進(jìn)行。硬件的價(jià)格現(xiàn)在非常低,幾乎每一臺PC都有麥克風(fēng),或是很容易連接麥克風(fēng)。

  聲音識別對沙啞或是模仿的聲音不是很有效。如果遇到這種情況,系統(tǒng)將不能辨認(rèn)使用者。此外如果麥克風(fēng)質(zhì)量很差或背景很嘈雜,辨識的準(zhǔn)確率會降低。聲音識別由于有較高的誤識率,所以它較少被單獨(dú)用到,往往會輔以更高辨識率的技術(shù),如指紋掃描。而且語音會隨著時間變化而改變,所以需要相應(yīng)的樣版和方法。

  不同語者的語音變化和同一語者的語音變化

  不同語者的語音變化是由個人不同的嗓音特征造成的,為區(qū)分不同的語者提供有用的信息。同一語者的語音變化是指語者不能以完全相同的方式重復(fù)同一詞匯或句子的發(fā)音。

  同一語者的語音變化包括不同說話速度、情緒狀態(tài)和說話環(huán)境,它會導(dǎo)致語音識別系統(tǒng)表現(xiàn)的下降。所以需要選擇可以顯示較少同一語者語音變化,而較多不同語者語音變化的參數(shù)。在許多語音識別的應(yīng)用中,通過要求使用者說出含有和訓(xùn)練語句相同文本和詞匯的測試語句,來減少同一語者的語音變化。

  語音識別系統(tǒng)被分為文本相關(guān)的和文本無關(guān)兩種。文本相關(guān)系統(tǒng)要求使用者重復(fù)指定的話語,通常包含與訓(xùn)練信息相同的文本,文本無關(guān)的系統(tǒng)則沒有這樣的限制。在文本相關(guān)的系統(tǒng)中,大家熟知的詞匯或詞組信息可以用來提高辨識的表現(xiàn)。

  語音識別系統(tǒng)提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統(tǒng)也不會被錄音欺騙。文本相關(guān)的聲音識別方法可以分為動態(tài)時間伸縮或隱馬爾可夫模型方法。文本無關(guān)聲音識別已經(jīng)被研究很長時間了,不一致環(huán)境造成的性能下降是應(yīng)用中的一個很大的障礙。

  工作原理

  動態(tài)時間伸縮方法使用瞬間的、變動倒頻。1963年Bogert et al出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用一個含義廣泛的詞匯定義了一個新的信號處理技術(shù),倒頻譜的計(jì)算通常使用快速傅立葉變換。

  從1975年起,隱馬爾可夫模型變得很流行。運(yùn)用隱馬爾可夫模型的方法,頻譜特征的統(tǒng)計(jì)變差得以測量。文本無關(guān)語音識別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。

  平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語者的一套短期訓(xùn)練的特征向量可以直接用來描繪語者的本質(zhì)特征。但是,當(dāng)訓(xùn)練向量的數(shù)量很大時,這種直接的描繪是不切實(shí)際的,因?yàn)榇鎯陀?jì)算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來壓縮訓(xùn)練數(shù)據(jù)。Montacie et al在倒頻向量的時序中應(yīng)用多變量自回歸模式來確定語者特征,取得了很好的效果。

  想騙過語音識別系統(tǒng)要有高質(zhì)量的錄音機(jī),那不是很容易買到的。一般的錄音機(jī)不能記錄聲音的完整頻譜,錄音系統(tǒng)的質(zhì)量損失也必須是非常低的。對于大多數(shù)的語音識別系統(tǒng),模仿的聲音都不會成功。用語音識別來辨認(rèn)身份是非常復(fù)雜的,所以語音識別系統(tǒng)會結(jié)合個人身份號碼識別或芯片卡。

  語音識別系統(tǒng)得益于廉價(jià)的硬件設(shè)備,大多數(shù)的計(jì)算機(jī)都有聲卡和麥克風(fēng),也很容易使用。但語音識別還是有一些缺點(diǎn)的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風(fēng)、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統(tǒng)比指紋識別系統(tǒng)有著較高的誤識率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。對快速傅立葉變換計(jì)算來說,系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。目前語音識別系統(tǒng)不適合移動應(yīng)用或以電池為電源的系統(tǒng)。

免責(zé)聲明:本文來源于網(wǎng)絡(luò)收集,本文僅代表作者個人觀點(diǎn),本站不作任何保證和承諾,若有任何疑問,請與本文作者聯(lián)系或有侵權(quán)行為聯(lián)系本站刪除。(原創(chuàng)稿件未經(jīng)許可,不可轉(zhuǎn)載,轉(zhuǎn)載請注明來源)
掃一掃關(guān)注數(shù)字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗(yàn)證碼:
您還能輸入500
    主站蜘蛛池模板: 西安外墙防水补漏-堵漏-防腐-保温工程公司-陕西宏图祥瑞实业有限公司 | 石家庄UPS_石家庄UPS电源_石家庄广亚电子科技有限公司 | 日本国际高中_上海日本国际高中学校排名_日本国际高中留学课程_上海日语国际高中学校学费-上海工程技术大学国际多语种特色高中课程【官网】 | 王者荣耀/和平精英扫码上号登录器_微信安卓苹果扫码上号登录软件 - 上号宝扫码登录器 | 明基太阳能玻璃钢污水处理公司-设计研发全自动加药装置设备 | 无负压供水设备-杭州勤铭机电有限公司| 郫都人才网_郫都招聘网_求职找工作平台 | 郑州试驾场地_双超专业汽车试驾场地_郑州双超文化传播有限公司官方网站 | 气体报警器,有毒气体报警器,可燃气体探测器,乙炔气体报警器,可燃气体检漏仪,便携式气体检测仪,气体报警控制器-山东如特安防设备有限公司 | 远东齿轮泵|高粘度齿轮泵|三螺杆油泵|沥青保温泵|高粘度稠油泵-远东泵业官网 | 皮带输送机(输送机械)-带式输送机-皮带输送机生产厂家-河南坤威机械 | 桥梁支座更换_桥梁检测车租赁_高空作业车出租_支座更换_伸缩缝安装_隧道防水_养护加固_维修_出租_衡水庆兴桥梁养护工程有限公司 桥梁养护|桥梁维修加固|隧道裂缝修补|支座更换|管道堵水气囊|衡水众拓路桥养护有限公司 | 合肥发斯特精密塑模有限公司专业精密磨具,注塑模具,精密注塑机械零件(加工制造|生产|销售|厂家) 浩通集团 国际货运 物贸一体化 中非经贸 | 桥梁支座更换_桥梁检测车租赁_高空作业车出租_支座更换_伸缩缝安装_隧道防水_养护加固_维修_出租_衡水庆兴桥梁养护工程有限公司 桥梁养护|桥梁维修加固|隧道裂缝修补|支座更换|管道堵水气囊|衡水众拓路桥养护有限公司 | 玉米加工机械_玉米深加工机械_玉米加工设备--河南工粮机械设备有限公司 | 智能化解决方案 智能家居 家庭影院 灯光音箱 会议室报告厅 剧场剧院 指挥中心 大数据中心_沈阳天哲科技有限公司 | 四川川亚电子科技有限公司| 喷雾式干燥机-真空桨叶干燥机-桨叶干燥器-常州力马干燥科技有限公司 | 专业网站建设_企业品牌营销 · 北京汇仁智杰科技有限公司 | 陕西筱润智能科技有限公司 干部人事智能档案柜 智能密集架 智能档案柜 部队选层文件智能柜 智能枪弹柜 财务智能档案柜 边防武警智能密集架 医院智能档案柜 部队选层文件智能柜智能枪弹柜 学校医院文件柜 企事业单位公检法智能文件柜 生产厂家-筱润智能科技有限公司 RFID射频智能密集架 全自动智能选层档案柜 智能密保柜 枪柜部队营房营具床桌椅办公家具 办公用品档案盒设备货架 全自动智能选层柜生产厂家-筱润智能科技有限公司 | 九江中澳钽铌有限公司| 家具板|橱柜衣柜家具板|木饰面定制|榉木胶合板|防水胶合板|胶合板厂家-佛山吉盛唐朝木业-大坂木业 | 压缩强度测定仪-纸管平压强度测定仪-电脑拉力仪-杭州纸邦自动化技术有限公司 | 水处理设备厂家_纯净水设备_超纯水设备价格找西安瑞泉水处理 | 锯骨机-砍排机-全自动锯骨机-商用砍排机-切丁机 - 广州市九盈机械设备有限公司 | 垃圾桶_垃圾桶厂家_临沂市旭宏塑料有限公司 | 万通汽车学校,汽车学校,汽修学校,汽修培训学校,汽车美容学校,汽车维修学校,学汽修-武汉万通汽车学校官方网站 | 铝合金百叶窗_西安百叶窗厂家-西安市未央区通达建材物资部 | 雷达液位计_耐磨热电偶_蒸汽_柴油,汽油_天然气流量计_巴歇尔槽_一体化温度变送器-江苏翔腾仪表有限公司 | 重庆教师资格网-重庆教师资格证考试网 | 四方光电(武汉)仪器有限公司_四方仪器首页-烟气分析仪|尾气分析仪|煤气分析仪|沼气分析仪|天然气分析仪|超声波流量计|在线气体分析系统|红外气体传感器 | 真石漆-防火涂料-氟碳漆-地坪漆-广田外墙涂料 | 面馆加盟_重庆小面加盟_特色面馆加盟首选老城街 | 新密耐火材料厂家价格-河南郑州荣盛窑炉耐火材料有限公司 | 河卵石制砂机|鹅卵石制砂机-移动制砂机-制砂设备-郑州秦星机械设备有限公司 | 网咖网址导航,网咖分类目录,网址目录,免费收录国内外、各行业优秀网站网站。 | 无锡亮鑫不锈钢有限公司-不锈钢炉胆,马弗炉胆,耐高温炉胆,310s炉胆,网带炉 | 提供技术支持-TXC晶振-晶振厂家-32.768K,石英晶体振荡器厂家销售-NDK振荡器正规代理商 | 配电箱自动生产线-配电箱生产线设备-山东炜桦智能 | 旋转补偿器-专注套筒三维球形补偿器定制生产厂家-伸缩接头价格_巩义市新华丰管道设备有限公司 | 青砖_仿古砖_仿古小青瓦-「肥西晓军仿古建材」 |