声源方向估计装置以及方法-山东科威数控机床有限公司

专利名称：声源方向估计装置以及方法
技术领域：
本发明涉及声源方向估计装置以及方法，例如可应用于对声源相对于头部等身体部位的方向进行估计的情况下的声源方向估计装置以及方法。
背景技术：
人类根据左右耳听到的声音的差异来识别声源的方向、距离。左右耳听到的声音的差异起因于从声源到左右耳的距离的差异即声音在空间中传播时被赋予的特性(频率特性、相位特性、音量等)的差异。通过针对来自某个声源的信号，有意地附加该特性的差异，由此可识别为任意的方向、距离。作为表示声源到达耳朵时被附加的特性的函数，公知有被称为HRTF(头部传递函数)的函数。预先测定从声源到耳朵的HRTF，将其附加在声源信号中，由此可识别为从声源听到声音。并且，检测头部的动作，当头部向右旋转时使声源位置向左移动，当头部向左旋转时使声源位置向右移动，由此可识别为宛如声源位于固定的位置。
一直以来，作为检测头部相对于声源的方向和动作的方法，存在使用GPS(全球定位系统)的方法(参照专利文献1)、使用加速度传感器的方法(参照专利文献2、、使用地磁传感器的方法(参照专利文献幻等。
专利文献1 日本特开2002-267737
专利文献2 日本特开2003-139536
专利文献3 日本特开2003-167039
上述专利文献1 专利文献3所述的方法均存在需要专用的硬件、装置规模和成本增大的课题。发明内容
本发明鉴于上述的课题而提出，提供硬件规模小且估计精度高的声源方向估计装置以及方法。
第1发明的声源方向估计装置的特征在于，该声源方向估计装置具有(1)采集声音的多个声音采集单元；( 逆特性保持单元，其针对多个不同的位置，预先对空间传递函数的逆特性进行保持，该空间传递函数是在声源位于某个位置的情况下，来自该声源的声音传递到各个所述声音采集单元的位置时的空间传递函数；C3)声源位置声音信号估计单元，其对各个所述声音采集单元采集的声音信号应用针对该声音采集单元所保持的多个位置的空间传递函数的逆特性，来估计所采集的声音信号的声源位置处的声音信号；(4)判定用函数生成单元，其得到判定用函数，该判定用函数针对每个位置示出利用不同的采集声音信号而估计的多个声源位置处的声音信号的一致性；( 方向信息取得单元，其根据所生成的判定用函数，得到连接多个所述声音采集单元和与所采集的声音相关的声源的方向的信息。
第2发明的声源方向估计方法的特征在于，该声源方向估计方法包括声音采集步骤，使多个声音采集单元采集声音信号；逆特性保持步骤，针对多个不同的位置，预先对空间传递函数的逆特性进行保持，该空间传递函数是在声源位于某个位置的情况下，来自该声源的声音传递到各个所述声音采集单元的位置时的空间传递函数；声源位置声音信号估计步骤，对各个所述声音采集单元采集的声音信号应用针对该声音采集单元所保持的多个位置的空间传递函数的逆特性，来估计所采集的声音信号的声源位置处的声音信号；判定用函数生成步骤，得到判定用函数，该判定用函数针对每个位置示出利用不同的采集声音信号而估计的多个声源位置处的声音信号的一致性；以及方向信息取得步骤，根据所生成的判定用函数，得到连接多个所述声音采集单元和与所采集的声音相关的声源的方向的 fn息ο
根据本发明，可提供硬件规模小且估计精度高的声源方向估计装置以及方法。

图1是为了说明第1实施方式的估计原理而示出一对麦克风的安装状态的说明图。
图2是为了说明第1实施方式的估计原理而示出声源与空间传递函数的路径之间的关系的说明图。
图3是示出第1实施方式的声源方向估计装置的结构的框图。
图4是示出第1实施方式的声场函数c(m)的一例的说明图。
图5是第2实施方式的估计原理的说明图。
图6是示出第2实施方式的声源方向估计装置的结构的框图。
图7是示出第1实施方式的声源方向估计装置的用途例的框图。
标号说明
100U00A声源方向估计装置；IOlR右耳用麦克风；IOlL左耳用麦克风；102R 右耳用声源估计电路；102L左耳用声源估计电路；103声场生成电路；104声源方向估计电路；105头部方位估计电路。
具体实施方式
(A)第1实施方式
下面，参照附图，详细叙述将本发明的声源方向估计装置以及程序应用于估计从头部观察的声源的相对方向的第1实施方式。
(A-I)第1实施方式的估计原理
首先，对第1实施方式的声源方向估计装置所应用的从头部观察的声源方向的估计原理进行说明。并且，声源不仅可以是发出声音或音响的声源，还可以是发出噪音的声源。
现在，假设如图1所示在左右耳的位置处设置有麦克风(以下称为麦克风)101R 以及101L，右耳用麦克风IOlR采集的信号设为yr (η)，左耳用麦克风IOlL采集的信号设为 yl(n)。另外，如图2所示，将位于正面(0度)的声源的信号定义为χΟ(η)、从位于正面的声源到右耳的空间传递函数(头部传递函数)定义为HOR(Z)、从位于正面的声源到左耳的空间传递函数定义为HOL(Z)。
此时，(1)式以及⑵式所示的关系成立。其中，(1)式以及⑵式中，YR(Z)是对 yr(n)进行ζ变换而得到的，YL(ζ)是对yl (η)进行ζ变换而得到的。并且，各参数中的数字“0”与角度0 (正面)对应，如以下这样，在该数字部分中也存在包含表示其它角度的数字的参数。
YR(z) =HOR(Z) · χ0 (ζ)... (1)
YL(z) = HOL(z) · χΟ (ζ)... (2)
(1)式以及⑵式分别变形为(3)式以及(4)式。
xO(z) = HOR (ζΓ1 · YR(Z) ... (3)
xO(z) = HOUzr1 *YL(z) ... (4)
其中，上标-1表示空间传递函数的倒数(逆特性)，(5)式以及(6)式的关系成立。
HOR(z) · HOR (ζΓ1 = 1... (5)
HOL (ζ) · HOL (ζΓ1 = 1... (6)
由(3)式以及(4)式可知，如果知道声源的方向(角度)，则对采集的信号实施与该角度对应的空间函数的逆特性，由此可估计声源处的信号(以下，称为声源信号)，并且可知根据右采集信号估计的声源信号与根据左采集信号估计的声源信号一致。从相关性来看，2个声源信号一致的情况示出非常高的相关性。
另一方面，当应用了与声源之间的角度不同的空间传递函数的逆特性时，根据右采集信号估计的声源信号与根据左采集信号估计的声源信号不一致(即，示出低相关性)。例如，在声源位于正面(0度)的情况下，当应用了角度为45度的空间传递函数的逆特性时，根据右采集信号估计的声源信号与根据左采集信号估计的声源信号不一致。(7)式 (9)式示出这种情况。在(7)式 (9)式中。ΜδΙ^ζΓ1是从位于正面的左45度的声源到右耳的空间传递函数的逆特性，H45L(z)-1是从位于正面的左45度的声源到左耳的空间传递函数的逆特性，x45R(z)是根据右采集声音估计为角度45度的声源信号，x45L(z)是根据左采集声音估计为角度45度的声源信号。H45R(z)-1 · HOR(ζ)和H45L(z)-1 · HOL(ζ)不会成为1。
x45R(z) = H45R(z)_1 · YR (ζ)
= H45R(z)_1 · HOR (ζ) · χΟ (ζ)... (7)
x45L(z) = H45L(z)_1 · YL (ζ)
= H45L(z)_1 · HOL (ζ) · χΟ (ζ)... (8)
x45R(z) Φ x45L(z). . . (9)
现在假设存在在与声源之间的角度未知的状态下采集的右采集信号和左采集信号。对于这些信号，得到全部角度的(0度 359度)的估计声源信号，用c(m)表示右估计声源信号与左估计声源信号的相关性(其中，m = 0 359)。当把该c(m)定义为声场函数时，显示出与实际声源之间的角度(角度=M度)附近的角度对应的声场函数(c(M)以及 c(M)附近)的值增大，除此之外的声场函数的值减小的特性。即，声场函数的值增大的角度是与实际声源之间的角度，可根据声场函数估计与实际声源之间的角度。
(A-2)第1实施方式的结构
图3是示出遵循上述原理的第1实施方式的声源方向估计装置的功能性结构的框5图。
第1实施方式的声源方向估计装置100具有右耳用麦克风101R、左耳用麦克风 101L、右耳用声源估计电路102R、左耳用声源估计电路102L、声场生成电路103以及声源方向估计电路104。这里，右耳用麦克风IOlR以及左耳用麦克风IOlL之外的部分可由CPU或 DSP (包括安装在计算机中的单元)、以及该CPU或DSP执行的声源方向估计程序来实现。
如上所述，右耳用麦克风IOlR以及左耳用麦克风IOlL分别采集(捕获)来自声源的信号。
右耳用声源估计电路102R根据右耳用麦克风IOlR采集的信号yr (η)和内部存储的右耳用的各角度的空间传递函数的逆特性，执行C3)式所示的运算，得到针对全部角度的右耳估计声源信号xOr (η) x359r(n)。
左耳用声源估计电路102L根据左耳用麦克风IOlL采集的信号yl (η)和内部存储的左耳用的各角度的空间传递函数的逆特性，执行(4)式所示的运算，得到针对全部角度的左耳估计声源信号xOl (η) χ3591 (η)。
声场生成电路103根据右耳估计声源信号xmr (η)和左耳估计声源信号xml (η)，生成上述声场函数c (m)。
声源方向估计电路104根据声场函数c (m)的值，估计声源方向。如果是以1个声源为估计对象的情况，则声源方向估计电路104例如选出使得声场函数c (m)的值最大的角度θ，将其估计为声源方向。如果是以多个声源作为估计对象的情况，则声源方向估计电路 104例如取出所有的在图4所示的声场函数c (m)的曲线上得到极大值(其中，需要大于等于规定阈值)的角度，将各角度估计为不同的声源的方向。
(A-3)第1实施方式的动作
接着，对第1实施方式的声源方向估计装置100的动作进行说明。
分别由右耳用麦克风IOlR以及左耳用麦克风IOlL采集(捕获)来自声源的信号 (声音或音响)。
由右耳用声源估计电路102R将右耳用麦克风IOlR的采集信号yr (η)与右耳用声源估计电路102R内部存储的右耳用的各角度的空间传递函数的逆特性相乘，得到针对全部角度的右耳估计声源信号xOr (η) X359r(n)。另外，由左耳用声源估计电路102L将左耳用麦克风IOlL的采集信号yl (η)与左耳用声源估计电路102L内部存储的左耳用的各角度的空间传递函数的逆特性相乘，得到针对全部角度的左耳估计声源信号xOl (η) χ3591 (η)。
然后，由声场生成电路103根据右耳估计声源信号xmHn)与左耳估计声源信号 xml (η)，生成声场函数c (m)。
由声源方向估计电路104检测声场函数c(m)的最大值或极大值，将与最大值或极大值有关的角度估计为表示声源方向的角度。
(A-4)第1实施方式的效果
根据第1实施方式，通过只使用左右麦克风采集的声音信号或音响信号的运算处理来估计声源方向，因此未必需要专用或复杂的硬件，即使装置规模、成本较小，也可使得高精度的估计成为可能。
(A-5)第1实施方式的变形实施方式
第1实施方式的前提为，声源与右耳用麦克风IOlR以及左耳用麦克风IOlL之间的距离大致恒定。
在声源与右耳用麦克风IOlR以及左耳用麦克风IOlL之间的距离未知的情况下，按照以下这样进行即可。即，预先准备多个距离(例如，依次相差50cm)的逆特性作为左右耳用的各角度的空间传递函数的逆特性，针对每个距离，进行声源方向的估计动作。在通过该估计动作检测出最大值或极大值的情况下，在超过规定阈值时才估计为声源存在于该距离的该方向上。
(B)第2实施方式
接着，参照附图，详细叙述将本发明的声源方向估计装置以及程序应用于估计头部方位(头部方向)的第2实施方式。
(B-I)第2实施方式的估计原理
首先，对第2实施方式的声源方向估计装置所应用的头部方位(头部方向)的估计原理进行说明。并且，在第2实施方式的情况下，声源被固定或被大致固定。这样的固定也可以是短时间的。
图5是用于说明第2实施方式的估计原理的图。在时刻n，声源位置为正面(角度0)时的声场函数Cn(Hl)显示出Cn(O)附近的值增大的特性。声场函数Cn(Hl)的标记中的 “η”表示时刻η。假设在时刻η+1头部相比于时刻η向右旋转了 45度。此时，其声场函数 cn+1(m)显示出Cn+J45)附近的值增大的特性。
此时，在时刻η的声场函数cn(m)与时刻η+1的声场函数cn+1 (m)之间，(10)式所示的关系成立。
cn+1(0) = cn (315)
·
·
cn+1(44) = cn (359)
cn+1(45) = Cn(O)
·
·
cn+1(359) = cn (314). . . (10)
S卩，时刻n+1的声场函数cn+1(m)看上去似乎是使时刻η的声场函数cn(m)向左旋转了 45度而得到的。因此，可知如果观测声场函数的时间变化，则可估计为头部向与其相反的方向运动。
(B-2)第2实施方式的结构以及动作
图6是示出遵循上述原理的第2实施方式的声源方向估计装置的功能性结构的框图，对与第1实施方式的图3相同、相对应的部分标注相同、相对应的标号进行表示。
图6中，第2实施方式的声源方向估计装置100A设有头部方位估计电路105，来替代第1实施方式的声源方向估计电路104。
头部方位估计电路105存储前一时刻n-1的声场函数Clri (m)，当从声场生成电路 103提供了新时刻η的声场函数cn(m)时，求出使得上述(10)式所示的关系成立的角度差 D，将该角度差D估计为从前一时刻n-1起的头部方位变化。
例如，按照以下方式执行使得(10)式所示的关系成立的角度差D的搜索即可。分别针对声场函数(V1Oll)以及Cn(Hl)，求出多个极大值(包括最大值)，并且求出前后的极大值间的角度差。参照前后的极大值间的角度差，并且将一方的声场函数(V1OiI)中的各个极大值与另一方的声场函数Cn(m)中的各个极大值相关联。求出相关联的极大值间的角度差的平均，并且确认即使是极大值之外的角度也可用该角度差来对应，得到使得(10)式所示的关系成立的角度差D。
(B-3)第2实施方式的效果
根据第2实施方式，通过只使用左右麦克风采集的声音信号或音响信号的运算处理来求出声场函数，并且观测其时间变化，可估计头部的方位变化，因此未必需要专用或复杂的硬件，即使装置规模、成本较小，也能使得高精度的估计成为可能。
(B-4)第2实施方式的变形实施方式
在上述第2实施方式中，示出了声源固定而头部转动的情况，但在相反情况即在对头部方位固定而声源以头部为中心转动时的转动角进行估计的情况下，也可应用第2实施方式的技术思想。
(C)其他实施方式
上面提及了变形实施方式，可进一步举出以下所示的变形实施方式。
上面示出了一对0个)麦克风位于左右耳附近的情况，但麦克风的位置不限于此。例如，也可以将麦克风安装在左右肩上，来估计与胸部有关的方向和方位。
上面示出了利用一对O个)麦克风在包含2个麦克风和声源位置的平面上捕获期望的方向和方位的情况，但也可以利用大于等于3个的麦克风捕获期望的方向和方位。例如，也可以是，将3个麦克风配置在三角形的顶点位置，根据第1以及第2麦克风的采集信号，在包含第1以及第2麦克风和声源位置的第1平面上捕获期望的方向和方位，根据第 2以及第3麦克风的采集信号，在包含第2以及第3麦克风和声源位置的第2平面上捕获期望的方向和方位，根据第3以及第1麦克风的采集信号，在包含第3以及第1麦克风和声源位置的第3平面上捕获期望的方向和方位，对得到的3种方向和方位进行整理，最终估计三维的方向和方位。
在上述各实施方式中未提及声源方向估计装置的用途，本发明的用途不受限定。
图7是示出第1实施方式的声源方向估计装置100的用途的一例的框图。
图7中，标注了标号200R以及标号200L的部件表示头戴式耳机的右耳用以及左耳用的耳垫，如对右耳用的耳垫200R详细示出的那样，耳机内部具有扬声器201R和201L、麦克风202R和202L、混合电路203R和203L、以及放大/衰减电路204R、204L。便携电话电路210将表示是否是通话中的状态信号V提供给放大/衰减电路204R及204L，并且将通话中的受话声音信号提供给立体音响电路211。立体音响电路211对受话声音信号应用头部传递函数，形成来自相对于左右耳处于正面规定距离的虚拟声源位置的左右耳用的受话声音信号sr以及sl，提供给对应的混合电路203R及203L。各麦克风202R、202L所采集的采集信号被提供给声源方向估计装置100。声源方向估计装置100如上述那样估计声源方向，并且通过(3)式以及(4)式所示的运算，也得到该声源信号。
在不是通话中的情况下，各放大/衰减电路204R、204L将对应的麦克风202R、202L 所采集的信号保持原样或稍微放大，经由混合电路203R、203L提供给对应的扬声器201R、201L，使其输出声音。因此，在佩戴头戴式耳机的状态下，用户也能听到周围声音。
在通话中的情况下，各放大/衰减电路204R、204L根据声源方向估计装置100提供的周围声音声源的方向和其声源位置处的声源信号，从相对于左右耳的正面，使来自位于规定角度范围内的周围声音声源的声源信号大幅度地衰减或将其去除，而不使来自超过规定角度范围的方向的周围声音声源的声源信号衰减过多而是经由混合电路203R、203L 提供给对应的扬声器201R、201L，使其输出声音。因此，通话中听不到以与受话声音信号的虚拟声源接近的位置为声源位置的周围声音，但通话中可听到声源方向与受话声音信号的虚拟声源有很大不同的周围声音。
权利要求
1.一种声源方向估计装置，其特征在于，该声源方向估计装置具有采集声音的多个声音采集单元；逆特性保持单元，其针对多个不同的位置，预先对空间传递函数的逆特性进行保持，该空间传递函数是在声源位于某个位置的情况下，来自该声源的声音传递到各个所述声音采集单元的位置时的空间传递函数；声源位置声音信号估计单元，其对各个所述声音采集单元采集的声音信号应用针对该声音采集单元所保持的多个位置的空间传递函数的逆特性，来估计所采集的声音信号的声源位置处的声音信号；判定用函数生成单元，其得到判定用函数，该判定用函数针对每个位置示出利用不同的采集声音信号而估计的多个声源位置处声音信号的一致性；以及方向信息取得单元，其根据所生成的判定用函数，得到连结多个所述声音采集单元和与所采集的声音相关的声源的方向的信息。
2.根据权利要求1所述的声源方向估计装置，其特征在于，所述方向信息取得单元通过搜索在所生成的判定用函数中一致性大的位置，来取得以多个所述声音采集单元的配置作为基准的未知声源的方向。
3.根据权利要求1所述的声源方向估计装置，其特征在于，所述方向信息取得单元根据所生成的判定用函数的时间变化，取得安装有多个所述声音采集单元的安装体相对于所采集的声音信号的声源的方向变化。
4.一种声源方向估计方法，其特征在于，该声源方向估计方法包括声音采集步骤，使多个声音采集单元采集声音信号；逆特性保持步骤，针对多个不同的位置，预先对空间传递函数的逆特性进行保持，该空间传递函数是在声源位于某个位置的情况下，来自该声源的声音传递到各个所述声音采集单元的位置时的空间传递函数；声源位置声音信号估计步骤，对各个所述声音采集单元采集的声音信号应用针对该声音采集单元所保持的多个位置的空间传递函数的逆特性，来估计所采集的声音信号的声源位置处的声音信号；判定用函数生成步骤，得到判定用函数，该判定用函数针对每个位置示出利用不同的采集声音信号而估计的多个声源位置处声音信号的一致性；以及方向信息取得步骤，根据所生成的判定用函数，得到连结多个所述声音采集单元和与所采集的声音相关的声源的方向的信息。
全文摘要
本发明提供硬件规模小且估计精度高的声源方向估计装置以及方法。作为解决手段，该声源方向估计装置具有采集声音的多个麦克风。另外，针对不同的多个位置，预先对在声源位于某个位置的情况下来自该声源的声音传递到各个麦克风的位置时的空间传递函数的逆特性进行保持。然后，对各个麦克风采集的声音信号应用针对该麦克风保持的多个位置的空间传递函数的逆特性，来估计所采集的声音信号的声源位置(未知)处的声音信号。然后，针对不同的麦克风，搜索所估计的声源位置处的声音信号一致(声音信号的相关性高)的位置，至少得到未知声源的方向信息。
文档编号G01S5/18GK102033221SQ201010193030
公开日2011年4月27日申请日期2010年5月28日优先权日2009年9月29日
发明者青柳弘美申请人:冲电气工业株式会社