新闻详情

声纹识别进入落地阶段
仍有发展空间

发表时间:2021-02-25 15:48

  2020年受疫情影响,顾客需求向线上倾斜,智能客服需求量也随之增加。因而,尽管疫情影响下中国经济下行,但人工智能特别智能语音作业商场整体利好。激增的商场顾客团体,一方面带来了多元化的商场需求,另一方面,促进技术服务商不断根究新的产品功用和运用场景。近年来,许多智能语音技术服务商开始布局声纹辨认领域。跟着技术老到与商业化落地,声纹辨认逐渐进入大众视界。

  一、声纹辨认技术

  声纹辨认是生物辨认技术的一种,也是语音技术的分支,也被称为说话人辨认,包含声纹注册和声纹认证两道程序。所谓声纹辨认就是把声信号转换成电信号,提取特征、建立模型,根据匹配度进行辨认判别。

  声纹辨认VS语音辨认

  声纹辨认比较于语音辨认,近年来才逐渐进入大众视界,两者同为语音前端信号处理,经常被放在一同比较。而谈及两者的共性及差异时,快商通联合创始人李稀敏博士在承受亿欧智库采访时标明:“声纹的载体是语音,而所谓语音就是指人说的话。在人类正常的语音交互中,我们可以辨认语音主体的意图、心情、性别、身份以及内容等信息。而使用人工智能技术结束这一辨认,则需求依托语音及声纹的提取与处理。语音辨认和声纹辨认尽管在智能语音技术流程中都归于对语音信号的处理,但实践的技术方向及运用却截然相反。”

  “语音辨认寻求的是声音的共性”,李稀敏博士标明。也就是针对不同单个关于同一句话的不同声音、口音、语速表达,可以翻译成相同的文字。比如在运用智能音箱时,关于相同的指令,不管宣告这个指令的单个是男是女,南边抑或是北方口音,智能音箱都需求可以对语音输入提取共性,并作出准确的一同的应对。

  与之比较,“声纹辨认则寻求声音的特性”,即针对同一单个在不同情境下的不同表达,可以认证声源来自同一单个。比如微信的语音登陆体系,有时因外部环境,身体状况等要素,说话人的语音输入会呈现语速,音高级改动,而一个完善的声纹辨认体系,则需求可以提取不同情境下语音输入信号的特性,并准供认证说话人的身份以结束登陆。

  声纹辨认VS声纹供认

333091.jpg (600×400)

  声纹辨认首要有两大运用场景,声纹辨认和声纹供认,其间:

  声纹辨认,也被称作1:N辨认,首要运用于在语音库范围内的语音筛查,即在海量声纹数据库中找到说话人的进程。比如,金融语音出售场景下,可以灵敏根据来访者声纹信息与自身声纹数据库对比,判别客户是否为初次购买,抑或是否在征信黑名单中,然后调整出售战略。

  声纹供认,也称1:1验证,首要运用于安全访问验证及身份认证等场景,体系对说话人进行语音认证,结束”你是不是你”的身份判别。比较起声纹辨认,声纹供认关于语音输入信息的质量要求更为苛刻,比如微信的语音登录功用会要求运用者在无喧闹环境中对固定文本进行语音输入。

  声纹辨认进入落地阶段,技术仍有翻开空间

  谈及声纹辨认技术老到度,李稀敏博士标明:“声纹辨认具有数十年的研讨前史,但因为技术的束缚,近年来才逐渐进入运用落地阶段,技术老到度相当于3年前的语音辨认。”

  因而语音辨认所面对的绝大部分技术痛点,也相同影响着声纹的翻开。因声源采样率、信噪比、信道、语音时长、文本内容等要素改动而构成的准确率改动显着。因而进步声纹辨认体系的鲁棒性是声纹辨认大规划落地运用的前提条件。

  深化金融安防领域,多元语音技术融合助力场景落地

  因为声纹辨认体系的特殊性,在进行辨认前,需求进行声纹注册,因而声纹辨认的运用关于数据库有着较强的依托。另一方面,前文说到的声纹辨认技术的不老到,也导致其运用领会无法抵达预期效果。因而数据的缺少以及技术的痛点导致声纹辨认与作业融合程度较浅,也成为声纹辨认落地传统作业的首要妨碍。

  李稀敏博士标明,现阶段声纹辨认首要运用在公安、司法以及金融领域。首要是因为声纹辨认直接的处理了这些作业的痛点,运用价值大,因而在作业的本钱投入下,声纹辨认的作业落地取得了快速翻开。

  除金融安防领域外,现阶段声纹辨认在民生场景中的运用还处于初期试水阶段,如家居车载中声纹判定体系,硬件中的声纹门禁等等。

  智能语音技术的全面翻开,以及智能设备的爆发式增加,为声纹辨认供应了更多的运用端口,而与多元语音技术的融合也成为声纹辨认落地更多作业场景供应了技术保证。在未来声纹辨认将向着声纹+智能,以及多模态辨认的方向翻开。

  二、声纹辨认商场

  运用前景广大

  比较为人所熟知的指纹辨认、人脸辨认,声纹辨认作为生物辨认的另一个首要的分支,尽管刚刚从实验室走出进入大众视界,但却具有较强的适用性和较大的运用空间。根据快商通供应的信息收拾,首要,声纹辨认具有更高的收集方便性,用户承受度更高,被收集者无需触摸传感器或面对镜头,即可结束辨认。在疫情所带来的新需求下,声纹辨认具有极大的落地空间。

  与此同时,声纹辨认在1:1验证运用下的准确率高,并因声纹的稳定性,造假难度较高,是志向的生物辨认办法。此外声纹传感器相对低价的造价及安置本钱也使得声纹辨认具有可被广泛运用的优势。

0cc1-hzxsvnn6055872.jpg (550×334)

  三、声纹辨认商场参与者

  企业不断入局声纹赛道,原因为何?

  近年来参与声纹赛道的企业越来越多,包含腾讯、百度、字节跳动、安全科技等,创业者也不断入局,究其原因,我们可以从以下几个视角进行考虑。

  1.技术视角

  李稀敏博士标明:“2011年前后神经网络技术在人脸辨认和语音辨认领域的广泛运用,带动了神经网络技术在声纹技术领域的根究,直至2018年前后抵达了一个高潮,各种算法层出不穷。所以,这个阶段参与声纹赛道,有其技术方面的要素。”在另一方面,李智勇也指出,在原创技术的推动下,声纹辨认所带来的技术盈余也是企业入局的促进要素。

  2.商场视角

  在语音研发的道路上,服务商们逐渐发现了声纹的重要性,以及潜在的商场需求,因而逐渐向声纹技术翻开。而跟着声纹技术在金融、安全领域的根究运用,身份认证及声纹反诈骗运用不断老到,并引发了作业的广泛重视。以金融、安全为引,声纹商场逐渐向其他作业落地拓宽,商场规划增加的状况下,企业缤纷入局声纹赛道。

  3.政策视角

  生物辨认政策频出,2018年,央行正式发布《移动金融根据声纹辨认的安全运用技术规范》,加深了声纹辨认在金融作业的运用落地,大批声纹服务商呈现。

  四、声纹辨认服务商分类及布局

  受商场、战略以及技术的影响,声纹辨认技术服务商呈现出了多元化的趋势,业务办法、产品形状以及用户团体都展现出了较大的差异化。现阶段声纹辨认的商场参与者首要有四类,别离为概括语音技术服务商、人工智能草创公司、深耕声纹的技术服务商以及互联网巨子。

  1.概括语音技术服务商

  多为传统语音服务商,遍及成立于2000年左右,具有较为老到的技术支撑及产品体系。整体业务以融合了多元语音技术的通用处理方案为主,客户团体以大型客户为主。声纹辨认作为语音的技术分支,更多作为定制化选项调配语音方案进行输出。企业战略自身就是途径+赛道,也就是将其自身的AI途径,落地到各种赛道。典型的概括语音技术服务商为科大讯飞,捷通华声等。

  2.深耕声纹的技术服务商

  在传统语音技术服务商进入商场后,一部分专注与语音细分赛道的企业相继呈现,以满足音通、远鉴科技为代表的深耕声纹辨认的服务商进入商场。整体业务以声纹辨认产品及方案为主,比较起概括语音技术服务商,更加调集作业的特定需求,并专注于声纹技术的落地,根究各类潜在的运用场景。

  3.人工智能草创公司

  2010年头步,专注于特定作业的人工智能草创公司连续进入商场。因调集作业,因而在作业图谱及数据库建立上具有更大的优势。整体业务以特定作业的SaaS服务及落地方案为主,在作业的基础上运用声纹技术,更加深化作业需求,首要面向中小企业。典型的代表企业为快商通,声智科技等。

  4.互联网巨子公司

  近年来互联网巨子公司缤纷开始布局声纹赛道,依托自身云服务优势及巨大C端客户流量进入商场。业务布局较广,具有较大的潜在用户团体。典型的互联网巨子为阿里云、腾讯云、百度智能云及华为云。更多技术动态关注安徽安防资质网!


X 打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮
评论

客服

留言