声纹鉴别及其应用 声纹鉴别及其应用

声纹鉴别及其应用

  • 期刊名字:武警学院学报
  • 文件大小:503kb
  • 论文作者:侯遵泽
  • 作者单位:武警学院
  • 更新时间:2020-06-12
  • 下载次数:
论文简介

2002年12月武警学院学报Dec.2002第18卷第6期JOURNAL OF THE CHINESE PEOPLE S ARMED POLICE FORCE ACADEMYVol 18 No 6声纹鉴别及其应用●侯遵泽(武警学院训练部,河北廊坊065000)【摘要】声纹是人说话声音的频谱图,由于人的个性,决定了不同人声纹的差异性,因此,声纹识别或声纹鉴定能够确定说话人的身份。声纹鉴别在很多领域有着广泛的应用价值和前景,这里,简单介绍声纹和声纹鉴定与识别的概念及其应用的历史与现状,探讨声纹鉴别的方法原理和步驟,讨论声纹鉴别在个人身份证明、刑事侦察、军事、通信、防伪等领域的应用,展望声纹鉴别的应用前景。【关键词】声纹;声纹鉴定;声紋识别;滤波;特征提取;模式匹配中图分类号:TN912.34文献标识码:A文章编号:1008-2077(2002)06-0087-031引言形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。它的基本原理是通过分析人的发声和听觉当一起刑事案件发生后,侦察人员极有可能利用从案发为每个人构造一个独一无二的数学模型,由计算机对模型和现场获得的一段录音得到有价值的破案证据;当空难发生后,实际输人的语音进行精确匹配,根据匹配结果辨认出说话人从找到的“黑匣子”里,可以通过声音的记录,解开事故原因是谁。首先是对鉴别对象的声音进行采样,即输入语音信号之谜;当一个要挟电话打来之后,经过对电话录音进行处理,再对采样数据进行滤波等处理,而在声纹鉴别过程中最主要就可以确定来电人是谁。这些都是声纹鉴定或声纹鉴别技术的两部分内容是特征提取和模式匹配。特征提取,就是从声的应用实例。音中选取唯一表现说话人身份的有效且稳定可靠的特征;模声纹( voIce pant)是指借助一定的仪器描绘出来的人说式匹配就是对训练和鉴别时的特征模式做相似性匹配。声纹话声音的图像,即人的声音的频谱图。虽然人的发音器官生鉴别过程示意于图1。理构造总的是相同的,但人的语言产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的器官——舌、牙齿、喉头、肺、鼻腔在尺寸和形态等方面,每两个信号处理特征」模式识别提取匹配结果人之间的差异会很大,所以任何两个人的声纹图谱都有差异,而对于每个人而言,从十几岁发育变声后直到五十多岁,其声纹基本保持不变。利用声纹的这些特点,就可以通过声纹鉴图1声纹鉴别过程示意图别进行个人身份识别,从而达到司法鉴定的目的。声纹鉴定,就是通过对所记录的语音与被鉴人声纹的比限于篇幅,这里仅简要讨论特征提取和模式匹配两部分较确定二者是否为同一人的一种技术手段。声纹鉴定技术内容,然后简要介绍声纹技术在刑事案件侦破过程中应用的适用于刑事侦察和司法鉴定领域,能起到提供线索和审判证方法步骤。据的作用。利用声纹鉴定技术可鉴别录音语声的真伪;可以2.1特征提取提供线索;可以提供证据。从20世纪60年代开始,声纹鉴别声纹鉴别系统中的特征检测即提取语音信号中表征人的技术被广泛地应用到了电话查询、电话交易、个人身份证明、基本特征,此特征应能有效地区分不同的说话人,且对同一说侦察技术、防伪技术等诸多领域话人的变化保持相对稳定。考虑到特征的可量化性、训练样2声纹鉴别方法本的数量依靠声纹识别属于生物识别技术的一种,是一项根据语音波(1)谱Vu#的评价问题,目前的声纹鉴别系统主要中国煤化工。声纹特征大体分为:CNMHG组输出,以合适的速率收稿日期:2002-09-12作者简介:侯遵泽(1956-),男,山东平度人,武警学院训练部科研所副所长,教授博士。《武警学院学报》2002年第6期(总第97期)基础科研对滤波器输出抽样,并将它们作为声纹鉴别特征;(2)基音轮纹鉴别的性能。廓、共振峰频率带宽及其轨迹,这类特征是基于发声器官如声2.3声纹刑事案件侦破方法步骤门、声道和鼻腔的生理结构而提取的参数;(3)线性预测系在刑侦方面,声纹鉴别技术可以在一段录音中查找出嫌数,即以线性预测导出的各种参数,如线性预测系数、自相关疑人。通过辨析、频谱分析、提取特征和进行模式匹配等方法系数、反射系数、对数面积比线性预测残差及其组合等参数,步骤,进行声纹鉴定,从而侦破案件作为鉴别特征,可以得到较好的效果。主要原因是线性预测首先辨析样本语音材料,对有关方言、语音速度、言语习与声道参数模型是相符合的(4)反映听觉特性的参数模拟惯鼻音轻重音高变音变调、节奏声源谱特性(声音的厚人耳对声音频率感知的特性而提出了多种参数,如美倒谱系薄,余音的强弱)、清晰度、流畅度、口头语赞语、虚词、言语数、感知线性预测等。此外,人们还通过对不同特征参量的组缺陷以及是否伪装等进行辨别。另外,还要听辨语义、词汇合来提高实际系统的性能,当各组合参量间相关性不大时,会语法及其表达方式的异同,最后得出相似或差异程度的评价。有较好的效果。在对样本语音材料辨析的基础上,进行频谱分析,求出多2.2模式匹配种声学特征图谱,这些图谱反映的是多种多样的声纹形态,它2.2.1概率统计方法们有带状(宽带、窄带)谱、曲线谱线状谱和连续谱等,声纹语音中说话人信息在短时内较为平稳,通过对稳态特征鉴定一般至少要进行观察和定量检测的图谱有:(1)波形图如基音、声门增益、低阶反射系数的统计分析,可以利用均值、即声波的图形,它表征振幅随时间的动态变化;(2)振幅曲方差等统计量和概率密度函数进行分类判决。线,是语音波的振幅包,是一条高低起伏的曲线,表示语音强2.2.2动态时间规整方法弱;(3)基频曲线,是表征声音的基础频率随时间变化的动态说话人信息不仅有稳定因素(发声器官的结构和发声习曲线,又称声调曲线;(4)三维声谱,表征声音的频率、强度和惯),而且有时变因素(语速、语调、重音和韵律)。将识别模时间的关系的曲线,它又包括两种形式:宽带语谱,其特点是板与参考模板进行时间对比,按照某种距离测定得出两模板时间分辨能力较强、但频率分辨能力较弱;窄带语谱,其特点间的相似程度。常用的方法是基于最近邻原则的动态时间规与前者相反;(5)过零率曲线,表征声音波形通过横坐标的比整DTW。率与时间的关系,用于分析某个音是嗓音还是噪音,或者是辅2.2.3矢量量化方法音的浊化现象;(6)二维声谱,是声音的振幅随时间变化形成矢量量化最早是基于聚类分析的数据压缩编码技术。的,包括瞬时频谱、光标间功率谱、长时平均功率谱三种频谱Helms首次将其用于声纹识别,把每个人的特定文本编成码在提取特征的基础上,对检材和样本的相同语音材料的本,识别时将测试文本按此码本进行编码,以量化产生的失真主要声学特征参量的数值,包括共振参量、振幅曲线参量、基度作为判决标准。Bel实验室的 rosenberg和 Soong用VQ进频曲线参量、音节时长、长时平均功率谱参量、长时平均声调行了孤立数字文本的声纹识别研究。这种方法的识别精度参量等进行匹配对比,得出是否同一的定量评价。高,判断速度快。224隐马尔可夫模型方法3声纹鉴别的应用隐马尔可夫模型是一种基于转移概率和传输概率的随机声纹鉴别技术有着十分广阔的应用前景,在世界范围内,模型,最早在CMU和IBM被用于语音识别。它把语音看成声纹鉴别技术正广泛应用于诸多领域。目前,我国市场尚属由可观察到的符号序列组成的随机过程,符号序列则是发声启动阶段,其发展空间更为广阔在金融、证券、社保公安、军系统状态序列的输出。在使用HMM识别时,为每个说话人队及其他民用安全认证等行业和部门有着广泛的需求。建立发声模型,通过训练得到状态转移概率矩阵和符号输出有资料介绍,世界上最早用声纹破案的是于1963年4月概率矩阵。识别时计算未知语音在状态转移过程中的最大概发生的东京下谷的“吉展幼儿拐卖案”。台湾华航“5·25”空率根据最大概率对应的模型进行判决。HMM不需要时间规难事件调查中,声纹也起到了一定的作用。声纹鉴别也曾有整,可节约判决时的计算时间和存储量,在目前被广泛应用。效地应用于海下探测。例如,一艘舰艇的声纳接收到了250m缺点是训练时计算量较大水下的一个奇怪的声音,似乎这是一艘潜艇。经过与计算机2.2.5人工神经网络方法资料中的各种舰艇声纹对比,得出了初步结论:“这可能是美人工神经网络在某种程度上模拟了生物的感知特性,它国派来的弗吉尼亚号核潜艇。”是一种分布式并行处理结构的网络模型,具有自组织和自学声纹鉴别在司法鉴定中也有成功的范例。有一起指使谋习能力、很强的复杂分类边界区分能力以及对不完全信息的杀案,侦察人员采用声纹技术,取得了成功。首先,侦察人员鲁棒性,其性能近似理想的分类器。其缺点是训练时间长,动通过磁带的语音是否连续,背景噪声是否连贯,还有一些信号态时间规整能力弱,网络规模随说话人数目增加时可能大到的波中国煤化工是否经过剪辑;接着侦察难以训练的程度。小波变换方法具有多分辨分析功能,可以人员CNMH低它的噪声,突出增强它有效地进行频谱分析,利用小波变换的方法,可以将声音信号语音y。察入贝付犯非现场留下的犯罪分子的声分解成各种不同音频频段的谱,从而得到高质量的声纹频谱音与在看守所提取的犯罪嫌疑人的声音转化为声纹后,比较它们的异同发现其声纹的很多地方的共同点,通过相同的方把以上各类方法与不同特征进行有机组合可显著提高声法,侦察人员又找到大量相同语句的声纹是一致的,说明磁带88·侯遵泽:声纹鉴别及其应用中嫌疑人的声音就是被鉴定人的,最终侦破了此案。大大地提高电话订购商品的效率推动电话商务的发展。在信息查询领域中,呼叫中心为了向用户提供个性化服在PC机及手持式设备上,也需要进行用户身份的识别,务,并提高坐席的工作效率,在坐席的电脑端采用了“ Screen从而允许或拒绝用户登陆电脑或者使用某些资源,或者进入Pop”技术。电话拨打进入呼叫中心后,系统通过识别拨打者特定用户的使用界面。同样采用传统的用户名加密码的保护的电话号码来进行用户识别,并从数据库里调出该用户的个机制存在着用户名和密码泄密、被窃取、容易遗忘等问题人及历史交易信息从而能够提高人工坐席的工作效率并向声纹鉴别技术应用到PC机以及手持式设备上面,可以无须用户提供更具针对性的信息服务。但通过电话号码来进行用记忆密码,保护个人信息安全,大大提高系统的安全性,方便户身份识别的缺陷是显而易见的。而声纹鉴别技术就可以很用户使用。好的解决这些缺陷。基于每个人的声音特征都是唯一而且几在保安系统以及证件防伪的应用中,声纹鉴别系统可用乎很少会发生变化的特性可以很好地通过声纹鉴别技术进于信用卡银行自动取款机、门车的钥匙卡、授权使用的电行用户身份鉴别从而提高呼叫中心的工作有效性,尤其在更脑、声纹锁以及特殊通道口的身份卡等。在卡上事先存储了加需要人性化服务的医疗、教育投资、票务、旅游等方面,声持卡者的声音特征码需要时持卡者只要将卡插入专用机的纹鉴别显得尤其重要插口上,通过一个传声器读出事先已储存的暗码,同时仪器接在通过电话进行交易的系统中,如电话银行系统商品电收持卡者发出的声音,然后进行分析比较,从而完成身份确话交易系统证券交易电话委托系统交易系统的安全性是最认。同样可以把含有某人声纹特征的芯片嵌入到证件之中,重要的,也是系统设计者所要重点考虑的内容。传统的电话通过上面所述的过程完成证件防伪交易系统采取“用户名+密码”的控制机制,以确认用户的身与二维条码技术相结合的防伪应用。PDF417二维条码份并确保交易的安全性,然而这种控制机制缺点明显。若在是一种高密度高信息含量的便携式数据文件,PDF417二维电话交易系统内采用声纹鉴别技术来进行交易者身份识别与条码及其系统的开发应用范围极广,在国外已广泛应用在国确认,不仅提高了交易的安全性,大大降低了用户名和密码被防、公安交通运输、医疗保健、工业、商业、金融、海关及政府猜中或者窃取的可能性而且对交易系统的用户来说,交易过管理等领域。其典型优点为:可容纳约1000个汉字信息,比程更加简单和人性化。若与电话自动语音识别技术相结合,普通条码信息容量高几十倍,可将照片、指纹、掌纹、声音、签通过语音下达交易指令,则更能提高交易的快捷性,缩短拨打字、文字等凡可数字化的信息进行编码,纠错能力强,可靠性用户的拨打时间降低电话交易难度。准确的用户身份识别,高容易制作且成本低廉。利用现有的点阵激光、喷墨、热可通过用户信息数据库和历史交易数据库,为提供真正的敏/热转印制卡机等打印技术,可在纸张、PVC、甚至金属表One-to-One个性服务打下基础,降低交易系统费用,提高面上印出PDF417二维条码,采用声纹鉴别的方法对重要的效率。由于缩短了拨打用户的拨打时间,从而会减少IVR硬证件、文件、单据进行防伪。在需要进行证件确认时,通过件系统的通道需求数量,降低欺诈的可能性。商家可以根据维条码识别出用户的声纹特征并输入到声纹确认仪器中,同有关的声纹鉴别技术,判断这些信息的可信度,并据此决定是时与持证人的声音进行对比,从而完成证件和身份确认。否送货等,并可从数据库内查看拨打者的信用状况,由此可以Voice discrimination and its applicationHoU Zun-zeStaff office, The Academy, Lang Fang 065000, China)Abstract] Voice print is a frequency map of a mans voice. Because of the character of person, the discrepancyof any two mens voice and the speaker can be determined with their voice print. Voice discrimination has widely ap-plications in many domains. In this paper, the concept, history and actuality of voice print and its application wereintroduced and the methods, principle, discriminating steps and application to person identification, penal recon-naissance, military affairs, communications, defending false, etc are studiedI Key words] voice print; identifying the voice; speaker recognition; filter; pick up the character; matching the中国煤化工(本栏责任编辑、校对CNMHG89

论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。