注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

城宇 网易博客

互联网专栏作家,IT评论人城宇。合作请私信:@城宇词典

 
 
 

日志

 
 

不知道麦克风阵列是何方神圣?这篇文章告诉你!  

2016-05-22 11:49:04|  分类: 互联网评论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

  上个世纪七八十年代,麦克风阵列技术已经开始应用到语音技术的研究中,2000年左右,业界开始慢慢深入,进行基于麦克风阵列相关算法的专题研究。到了物联网时代,市场的刺激和产品的需求,极大的推动了相关的技术进展,尤其是2014年亚马逊echo的正式发布,这一领先性的语音技术迅速进入到民用级产品的应用范畴中。

  一般来说,人耳能听到的声音频率在20~20000赫兹之间,而很有意思的是,听觉其实是一种预警机制,除了听到声音,更重要的是具备分辨声源方向的能力,屏蔽主赫兹以外的声音更是为了对人体起到一定的保护作用,为有效交流提供保证(否则整个世界就真的太吵了)。那么,相似地,麦克风阵列,其实就相当于机器之耳,不仅只是为了采集音频,识别信号,传输信息,还为了更好的声源定位和噪音降解,杂音屏蔽等。

  思必驰于2015年年底推出了环形6+1远场麦克风阵列,也是目前国内唯一一款6+1环麦,亚马逊echo核心功能的“中国版”技术。目前被广泛运用在机器人和音箱等智能家居产品中。那么这款环麦具体有什么样的功能和优势?

不知道麦克风阵列是何方神圣?这篇文章告诉你! - kosmos2046 - 城宇 网易博客


  图1 思必驰环形6+1远场麦克风阵列

  麦克风阵列能解决的问题

  【语音增强】解决噪声环境下的识别

  噪声环境是影响语音识别的一个重要因素,普通家居环境下的噪音有混响、回声、背景噪音、人声干扰等多种类型。不同步的语音相互叠加产生音素的交叠掩蔽效应,严重影响语音识别的效果。解决该问题需要从抑制噪声和语音增强两方面入手。思必驰环形6+1远场麦克风阵列利用拾音波束成形,采用独特算法,有效抑制波束之外的噪声,同时融合语音信号的空时信息,从含噪声的语音信号中提取出纯净语音,有效地增强说话人语音。

  【声源定位】辅助多功能联动

  对麦克风拾音来讲,声源的位置的不确定性为语音交互带来了阻碍。思必驰环形6+1远场麦克风阵列实现360°环形拾音,多麦克定向,准确计算目标说话人的角度和距离,实现对目标说话人的跟踪以及后续的语音定向拾取,精准度控制在±10°以内,成为智能语音交互中捕捉说话人语音的重要方式。声源定位功能不限制说话人运动,不需要移位操作,这增强了产品设计的灵活性和功能的多样性,可有效地实现对产品的多功能辅助作用。

  【远场交互】打破远距离沟通障碍

  语音会随着传播距离衰减,传播距离越远,背景噪声和干扰所占比例就越大,同时混响也越严重,这对语音的远场识别及交互提出了较高要求。思必驰环形6+1远场麦克风阵列在前端充分利用其空域滤波特性,抑制拾音波束外的回声、混响等噪声,进行语音增强处理,辅之以语音识别引擎的二次处理,实现优质的远场识别交互。思必驰已实现了国内领先的5米远场交互,5米识别率达92%,3米识别率达94%,1米识别率达96%以上,远场识别媲美近讲。

  【打断纠错】针对错误识别的解决办法

  语音系统的认知能力是智能语音不容回避的问题,用户需求决定了要识别错误、纠正打断,认知型语音技术成为语音交互的必然趋势。思必驰环形6+1远场麦克风阵列融入了自适应、理解纠错、智能反馈等认知技术,重新提取大数据因素,并进行二次计算,实现智能纠正打断,能够适应更多的应用环境,具有进化调整功能,从而在人机交互的过程中,使机器更“听话”。

  【多轮对话】应对用户的复杂需求指令

  复杂任务的处理要求人机能够进行多轮对话,要求机器能够基于上下文的任务关系,进行任务切换和指代消减。就此,思必驰推出了“对话管理” 技术,并成功应用于环形6+1远场麦克风阵列。基于对话逻辑,允许人机进行多轮语音互动,让机器理解用户的深层意图并提供反馈。而机器可以通过深度学习,可以根据上下文语境准确追踪用户意图,并随着数据的积累而越发灵活精准。深谙语音交互之道的多轮对话,使人机交互更自然流畅。

  【后端服务】实际场景下的功能需求

  语音技术的应用场景、功能设计千差万别,保证用户体验的首要标准是满足用户的功能需求。当前智能硬件更多的是在生活场景中的应用,需要提供周边、资讯、音乐、订餐、订票、导航等生活服务,自然语言仅是人机交互的入口,而后端的内容和服务才是真正的交互对象。目前思必驰“环形6+1远场麦克风阵列”解决方案整合了高德地图、酷我音乐、虾米音乐、喜马拉雅电台、考拉电台、大众点评等生活服务方面的诸多关键资源,致力将智能语音服务整合成一体化产品,打造体验闭环,形成完整的生态链。

不知道麦克风阵列是何方神圣?这篇文章告诉你! - kosmos2046 - 城宇 网易博客

 

  图2 思必驰环麦阵列特性

  思必驰麦克风阵列的应用领域

  当前思必驰“环形6+1远场麦克风阵列”解决方案主要应用于以下几个领域:

  1. 机器人

  思必驰针对智能机器人业务提供“环形6+1远场麦克风阵列”软硬一体化解决方案,使机器人反应灵敏,能说会道,闻声识路。在一般家居环境下,能够随时随地捕捉用户声音倩影,自由对话。你无聊,我陪你闲聊;你搜索,我提供资源;你呼唤我,我闻声而来;我做错了,由你纠正打断。思必驰智能语音实现更人性化的人机交互。

  2. WiFi音箱

  “环形6+1远场麦克风阵列”使音箱不仅只属于音乐,也属于生活。想听歌,随时语音操控;想安静,任你打断关闭;生活周边,吃喝玩乐,你问我答,贴心的乐活专家;行程安排,路线订票,你下令,我执行,专业的资讯助手…..小小音箱不再仅仅是音乐播放器,思必驰交互语音让它成为了生活工作的小能手。

  3. 智能中控系统

  传统家居中控采用按键或触控的方式,但思必驰“环形6+1远场麦克风阵列”使智能中控系统更便捷精准。比如支持智能语音系统的路由器,可通过智能语音操控帮助用户管理家中的各个联网设备。联网设备的分散性及位置的不确定性强调了拾音角度和拾音范围的随意性,思必驰“环形6+1远场麦克风阵列”可有效解决这一问题,使中控更加精准有效。

  4. 智能电视(“4麦线性麦克风阵列”解决方案)

  就电视类的家居产品而言,“4麦线性麦克风阵列”解决方案更为适宜。此类家居具有位置相对固定的特点,环形360°麦克风解决方案稍显不合理,而线性180°麦克风解决方案完全可满足用户需求,性价比更高。“4麦线性麦克风阵列”解决方案亦可实现5米远场识别,识别率达92%以上,同时为用户提供云端丰富的第三方内容。在电视行业向智能家居转型的过程中,智能语音大亮鲜招,思必驰“4麦线性麦克风阵列”解决方案实现更快的语音控制,更自由的语音搜索,更高效的语音交互及更丰富的内容服务,扔掉遥控器,抛弃终端APP,一语控制,随心所欲,家居操控更便捷。

不知道麦克风阵列是何方神圣?这篇文章告诉你! - kosmos2046 - 城宇 网易博客

 

  图3 思必驰麦克风阵列使用场景

  Echo与环形6+1麦克风阵列

  谈到环形麦克风技术的市场应用,亚马逊Echo音箱无疑成为国际市场典范,以消费级电子产品来衡量,Echo表现出色,能迅速360°全方位识别语音并做出反应,准确进行声源定位,结合丰富的后端资源,支持多样功能。

不知道麦克风阵列是何方神圣?这篇文章告诉你! - kosmos2046 - 城宇 网易博客

 

  图4 亚马逊echo

  该产品技术理念与思必驰“环形6+1远场麦克风阵列”解决方案可谓是不谋而合,极为相近但却又不尽相同。Echo是成熟的市场产品,主要采用英文进行语音交互;思必驰“环形6+1远场麦克风阵列”是智能语音解决方案,专注国内中文市场。前者对后者的市场应用有较大的借鉴意义,思必驰环麦技术专注智能硬件领域,不仅仅局限于音箱,还包括机器人、家居中控等等,环麦技术的应用领域将进一步拓宽。

  打造中国版的Echo

  如今,人工智能技术日新月异,智能产品应用领域飞速拓展,优质智能家居产品终将突破Echo类的音箱型产品,电视、机器人、个人网关等高频使用的产品形态均具备较大市场潜力。思必驰“环形6+1远场麦克风阵列”解决方案将先进的语音交互技术与丰富的后端资源相结合,突破音箱类产品形态,为更多优秀的智能硬件产品提供语音操作及交互服务。在可以预见的未来,智能语音将作为有效媒介传递价值,思必驰将借助“环形6+1远场麦克风阵列”解决方案,致力于打造中国版Echo。

不知道麦克风阵列是何方神圣?这篇文章告诉你! - kosmos2046 - 城宇 网易博客

 

  图5 语音交互具有丰富的应用可能

  ----------------------------------------------------------

  城宇自媒体:百度百家、今日头条、腾讯新闻、搜狐新闻等20多家

  【微信公号:ksms2046】最接地气的手机体验自媒体

  分享互联网、智能硬件、电商等业内动态,顺手点评房产、影视和娱乐

  评论这张
 
阅读(53)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017