本发明涉及定位技术领域,具体地,涉及一种基于空间音效的定位系统、方法及介质。
背景技术:
现有的声源定位装置大都只能够在没有背景噪声的理想环境下对声源目标进行定位,而且其在结构上冗余复杂。由于声波非常敏感,被测量的声场很容易受到测量装置本身的干扰,从而影响测量的精度。若麦克风阵列中传感器的数量较多、结构较复杂,不仅需要较高的制作成本,而且会直接影响到声波的自由扩散,严重时会导致测量结果的错误。另外,在三维空间中由于受到俯仰角和距离等因素的影响,对声源目标的定位精度会产生较大误差。
专利文献cn101957442a(申请号:201010191634.1)公开了一种声源定位装置,涉及应用声波通过确定多个方向的配合来定位的装置,是三维空间声源目标定位装置,由听觉传感器、声源信号微处理器和上位机系统三部分构成。所述听觉传感器是四元正四面体结构的麦克风阵列,四个麦克风分别位于该正四面体结构的四个顶点;所述声源信号微处理器由声音信号放大模块、分析锁存模块和通信传输模块构成;所述上位机系统由定位计算方法和外围设备构成。各个部分和各个模块之间的硬件部分均用导线相互连接。该专利定位距离的精度不够高。
专利文献cn201166703y(申请号:200720191645.3)公开了一种可用于检测和定位公路上撞车、急刹车等突发事件的声源定位系统,包括传声器阵列,其特征在于:所述传声器阵列为五元五面体阵,由平面四元十字阵和位于十字阵中心上方的一个阵元组成,该阵列克服了平面四元十字阵在实用中的一大缺陷,更利于系统对目标的捕获和定位,系统还包括声源微处理器,云台和摄像机,通过传声器阵列拾取声音信号,声源微处理器将其作进一步处理,经过处理后的信号转换成命令传送给云台,云台带动摄像机转向声源位置,从而快速定位声源,第一时间得到突发事件现场的图像,全程自动操作,定位方便快捷,具有很强的实用性,此外,为了避免设备遭雷击而被破坏,系统设置了避雷针,安全性能得以提高。
技术实现要素:
针对现有技术中的缺陷,本发明的目的是提供一种基于空间音效的定位系统、方法及介质。
根据本发明提供的一种基于空间音效的定位系统,包括:
模块m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
模块m2:利用时延差算出声源达到各麦克风的距离差;
模块m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
优选地,所述模块m1包括:
模块m1.1:采集多个麦克风接收到的信号;
模块m1.2:对接收到的信号进行降噪处理;
模块m1.3:对降噪处理后的信号进行互相关;
模块m1.4:搜索互相关信号的最大值,得到信号之间的时延。
优选地,模块m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差。
优选地,模块m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
优选地,还包括:
异常声音检测模块:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位模块:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处。
根据本发明提供的一种基于空间音效的定位方法,包括:
步骤m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
步骤m2:利用时延差算出声源达到各麦克风的距离差;
步骤m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
优选地,所述步骤m1包括:
步骤m1.1:采集多个麦克风接收到的信号;
步骤m1.2:对接收到的信号进行降噪处理;
步骤m1.3:对降噪处理后的信号进行互相关;
步骤m1.4:搜索互相关信号的最大值,得到信号之间的时延。
优选地,步骤m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差。
优选地,步骤m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
优选地,还包括:
异常声音检测步骤:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位步骤:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处。
本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
1、本发明通过采用麦克风阵列定位方案,提高了定位精准度,能够确认声源的准确位置;
2、本发明通过使用麦克风阵列,在设备的使用过程中能够有效抑制背景噪声、干扰等问题;
3、本发明通过采用si-lms算法计算声源位置,实现了声源位置的精确定位且计算量小、简单易行。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为基于空间音效的定位系统示意图;
图2为基于空间音效的定位方法流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
根据本发明提供的一种基于空间音效的定位系统,包括:如图1至2所示,
模块m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
具体地,所述模块m1包括:
模块m1.1:采集多个麦克风接收到的信号;
模块m1.2:对接收到的信号进行降噪处理;
模块m1.3:对降噪处理后的信号进行互相关;
模块m1.4:搜索互相关信号的最大值,得到信号之间的时延。
模块m2:利用时延差算出声源达到各麦克风的距离差;
具体地,模块m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差。
模块m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
具体地,模块m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
具体地,还包括:
异常声音检测模块:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位模块:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处;
所述设定声响条件集合包括预先录入的门铃声、开水烧开的声音、电话铃声、真实环境中物体倾倒的声音等;
识别到真实环境中异常声音后,定位声音来源,并将该来源所在区域的真实影像添加到虚拟影像中,从而可以及时发现真实环境中物体倾倒、开水烧开、门铃等情况。
根据本发明提供的一种基于空间音效的定位方法,包括:
步骤m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
具体地,所述步骤m1包括:
步骤m1.1:采集多个麦克风接收到的信号;
步骤m1.2:对接收到的信号进行降噪处理;
步骤m1.3:对降噪处理后的信号进行互相关;
步骤m1.4:搜索互相关信号的最大值,得到信号之间的时延。
步骤m2:利用时延差算出声源达到各麦克风的距离差;
具体地,步骤m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差。
步骤m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
具体地,步骤m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
具体地,还包括:
异常声音检测步骤:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位步骤:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处。
所述设定声响条件集合包括预先录入的门铃声、开水烧开的声音、电话铃声、真实环境中物体倾倒的声音等;
识别到真实环境中异常声音后,定位声音来源,并将该来源所在区域的真实影像添加到虚拟影像中,从而可以及时发现真实环境中物体倾倒、开水烧开、门铃等情况。
本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
实施例2
实施例2是实施例1的变化例
本发明通过采集麦克风接收到的信号,得到麦克风对之间的时延差,再利用时延算出声源到达各麦克风的距离差,最后利用几何算法推算并确定声源位置,实现对目标声源的跟踪。
具体实现流程如下:
1.固定好麦克风1、麦克风2和声源1的位置;
2.对麦克风采集到的信号进行降噪处理;
3.将降噪处理后的信号进行互相关,寻找互相关信号的最大值,得到两信号之间的时延δt。具体步骤为:
在给定声源的前提下,麦克风阵列接受的信号为:
xi(t)=hi(t)*s(t) ni(t)=αis(t-ti) ni(t)(3-1)
s(t)为声源信号,i是麦克风序号,hi(t)为声源到第i个麦克风的信道传输函数,ti为声源到第i个麦克风的传输时间,αi为直达通道的衰减因子。ni(t)为第i个麦克风接收的噪声和。
考虑两个麦克风的互相关函数
rx1x2(τ)=e[x1(t)x2(t-τ)]=α1α2*r(τ-δt) n(τ)(3-2)
δt为声源信号到达两个麦克风的时间差;n(τ)为麦克风接收到的噪声和。将互相关函数进行时频域转换,可以通过互功率谱函数得到麦克风对接收到信号的时间差。
4.通过声音传播公式计算得出声源到麦克风对的距离差di;
5.在球形插值(si)算法的基础上,引入最小均方(lms)的算法,以si的解析解为初始值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。在球形插值算法的基础上,引入最小均方的算法是为了解决si算法在迭代过程中无法收敛的问题;
使用n个麦克风共可以形成(n(n-1))/2个不同的麦克风对si插值描述如下:
取第一个麦克风为三维坐标系的原点,则有如下算式成立
由勾股定理和式5-1,5-2,得到
(rs dij)2=(xi2-2xitxs rs2)(5-2)
展开得到:
ri2-dij2-2rsdij-2xitxs=0(5-3)
上式为理想情况下,由于时间差估计误差的存在,引入方程误差
εi=ri2-dij2-2rsdij-2xitxsi=2,…,n(5-4)
εi是第i个麦克风对的方程误差;联立n-1个方程,用矩阵可表示为:
ε=δ-2rsd-2sxs
其中,
在给定rs后,最小化εtε可以直接的到最小二乘解;
xs=1/2*swφ(δ-2rsd),其中swφ=(sts)-1*st;
在此基础上初始化权矩阵w为单位矩阵,得到声源的初始估计值xs。基于此解析解,利用得到的xs(n)更新权矩阵w(n)和步长u,通过公式(5-5)可以迭代计算得到声源xs位置。
其中
diag
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
1.一种基于空间音效的定位系统,其特征在于,包括:
模块m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
模块m2:利用时延差算出声源达到各麦克风的距离差;
模块m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
2.根据权利要求1所述的基于空间音效的定位系统,其特征在于,所述模块m1包括:
模块m1.1:采集多个麦克风接收到的信号;
模块m1.2:对接收到的信号进行降噪处理;
模块m1.3:对降噪处理后的信号进行互相关;
模块m1.4:搜索互相关信号的最大值,得到信号之间的时延。
3.根据权利要求1所述的基于空间音效的定位系统,其特征在于,所述模块m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差;
所述模块m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
4.根据权利要求1所述的基于空间音效的定位系统,其特征在于,还包括:
异常声音检测模块:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位模块:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示模块:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处。
5.一种基于空间音效的定位方法,其特征在于,包括:
步骤m1:通过采集多个麦克风接收到的信号,得到麦克风之间的时延差;
步骤m2:利用时延差算出声源达到各麦克风的距离差;
步骤m3:利用距离差通过几何算法确定声源位置,实现对目标声源的跟踪。
6.根据权利要求5所述的基于空间音效的定位方法,其特征在于,所述步骤m1包括:
步骤m1.1:采集多个麦克风接收到的信号;
步骤m1.2:对接收到的信号进行降噪处理;
步骤m1.3:对降噪处理后的信号进行互相关;
步骤m1.4:搜索互相关信号的最大值,得到信号之间的时延。
7.根据权利要求5所述的基于空间音效的定位方法,其特征在于,所述步骤m2包括:利用信号之间的时延,通过声音传播公式计算得到声源到各麦克风的距离差。
8.根据权利要求5所述的基于空间音效的定位方法,其特征在于,所述步骤m3包括:基于计算得到的声源到各麦克风的距离差,在球形插值si算法的基础上,引入最小均方lms算法,以球形差值si算法的解析值为声源的初始估计值,利用最大似然的误差准则,通过迭代过程更新定位,从而确定声源位置。
9.根据权利要求5所述的基于空间音效的定位方法,其特征在于,还包括:
异常声音检测步骤:设定声响条件集合,检测得到符合所述声响条件集合的外部声响,记为异常声响;
异常声响定位步骤:利用分布在vr眼镜上相互之间具有间距的三个以上的传感器,分别对同一声源的异常声响进行采集,得到发出异常声响的声源的空间位置;
异常声源显示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界覆盖到所述异常声源时,将摄像头获取的异常声源的空间位置处的真实图像,在vr眼镜的虚拟画面中与所述空间位置对应位置处进行叠加或者替换显示;
异常声源指示步骤:在异常声响持续期间以及异常声响结束后的一段设定时长内,当vr眼镜的摄像头采集图像的视界没有覆盖到所述异常声源时,在vr眼镜的虚拟画面中显示指示性图形,以指示vr眼镜的虚拟画面中与所述空间位置对应位置处。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求5至9中任一项所述的方法的步骤。
技术总结