バイアス付きmmse-stsa推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張...
DESCRIPTION
古典的な雑音抑圧手法であるMMSE短時間振幅スペクトル推定法では,人工的な音の歪み(ミュージカルノイズ)が発生しユーザに不快感を与えるという問題がありました. 今回の学会発表では,MMSE短時間振幅スペクトル推定法に改良を加えることで, ミュージカルノイズを発生させない「ミュージカルノイズフリー雑音抑圧」を達成できることを数学的な解析により明らかにしました.TRANSCRIPT
バイアス付き MMSE-STSA 推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張
☆中井駿介,宮崎亮一,猿渡洋,中村哲(奈良先端大・情報)
近藤多伸(ヤマハ)
研究背景
�近年,音声通信に関するアプリケーションが増加している
�テレビ会議システム,携帯電話 etc.�周囲の雑音の影響により音声品質が劣化
� 1ch 非線形音声強調法– Spectral subtraction (SS) [Boll, 1979]– Wiener filter (WF) [Wiener, 1949]– Minimum mean-square error short-time spectral amplitude estimator
(MMSE-STSA 推定器) [Ephraim, 1984]�雑音抑圧性能が高いが,ミュージカルノイズが発生して利用者に
不快感を与える.
� ミュージカルノイズフリー音声強調 [Miyazaki, 2012]�SS の内部パラメータを高次統計量に基づいて導出�ミュージカルノイズを全く発生させずに雑音抑圧が可能
2
ミュージカルノイズフリー音声強調
� ミュージカルノイズフリー状態
�カートシス不動条件:信号処理によりミュージカルノイズが発生し
ていないことを示す
�NRR 増加条件:信号処理により SNR が改善することを示す
ミュージカルノイズフリー状態ミュージカルノイズフリー状態ミュージカルノイズフリー状態ミュージカルノイズフリー状態
Kurtosis ratioKurtosis ratioKurtosis ratioKurtosis ratio・値が大きいほどミュージカルノイ
ズ発生量が多い
・値が 1.0 のときはミュージカルノイズは発生しない
Noise reduction rate (NRR)Noise reduction rate (NRR)Noise reduction rate (NRR)Noise reduction rate (NRR)・SNR の改善量を表す評価尺度・値が正のとき SNR が改善されていることを示す
3
従来の音声強調
ミュージカルノイズフリー音声強調
雑音抑圧量の増加するが
ミュージカルノイズが発生
研究目的
�これまで SS および WF におけるミュージカルノイズフリー状態が確認されている.
�しかし,MMSE-STSA 推定器におけるミュージカルノイズフリー音声強調については検討がなされていない.
�また,MMSE-STSA 推定器は SS と比較して音声品質が高いことが知られている.
�より高品質なミュージカルノイズフリー音声強調を目的とし
て,MMSE-STSA 推定器においてミュージカルノイズフリー状態が存在することを明らかにする.
4
MMSE-STSA 推定器 [Ephraim, 1984]
5
( ) ( )( )
( ) ( )( ) ( ) ( ) ( ) ( ) ττυ
τυτυ
τυτυ
τγτυπ
τ ,2
,,
2
,,1
2
,exp
,ˆ
,
2, 10 fX
fIf
fIf
f
f
ffY ⋅
+
+
−=
( ) ( ) ( ) ( )( )τξτγτξτυ ,1,,, ffff += :0次と1次の変形ベッセル関数( ) ( )xIxI 10 ,
:推定音声( )τ,fY :観測信号( ) ( ) ( )τττ ,,, fNfSfX +=
:真の音声成分と雑音成分( ) ( )ττ ,,, fNfS
MMSEMMSEMMSEMMSE----STSA STSA STSA STSA 推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル
( ) ( )[ ] ( )[ ]22 , , , τττξ fNEfSEf = : 事前 SNR ( ) ( ) ( )[ ]22
, ,, τττγ fNEfXf = : 事後 SNR
�音声の振幅スペクトルの誤差を最小とする音声強調法
真の音声成分は得ることができない
MMSE-STSA 推定器 [Ephraim, 1984]� Decision directed法による事前 SNR の推定を行う.
� MMSE-STSA 推定器の性能は,忘却係数 αに関係している.
6
( ) ( ) ( ) ( ) ( )τξαττγατξ ,11,1,ˆ,ˆml
2 ffGff −+−−=
Decision directed Decision directed Decision directed Decision directed 法による事前法による事前法による事前法による事前 SNR SNR SNR SNR 推定推定推定推定
10 <<α : 忘却係数 ( ) ( )[ ]1,ˆ,0max,ml −= τγτξ ff
MMSE-STSA 推定器 [Ephraim, 1984]
7
�忘却係数と MMSE-STSA 推定器の性能
HarmfulHarmfulHarmfulHarmful
NaturalNaturalNaturalNatural
BadBadBadBad GoodGoodGoodGood忘却係数忘却係数忘却係数忘却係数 ααααの値を変化させてもの値を変化させてもの値を変化させてもの値を変化させても
ミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならない
1≈α
( ) ( ) ( ) ( ) ( )τξαττγατξ ,11,1,ˆ,ˆbias
2 ffGff −+−−=
バイアス付き MMSE-STSA推定器�本研究では,バイアス付き事前 SNR 推定を導入する.
�バイアス付き事前 SNR 推定を導入した MMSE-STSA 推定器をバイアス付き MMSE-STSA 推定器とする.
�バイアス値 ε とミュージカルノイズ発生量,雑音抑圧性能
の関係を理論解析により明らかにする.
バイアス付き事前バイアス付き事前バイアス付き事前バイアス付き事前 SNR SNR SNR SNR 推定推定推定推定
( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
8
� ミュージカルノイズ発生量の評価尺度
�雑音抑圧性能の評価尺度
客観評価値
9
カートシス比カートシス比カートシス比カートシス比
org
proc
kurt
kurtratio kurtosis =
prockurt : 信号処理後のカートシス orgkurt : 信号処理前のカートシス
2
4kurtµµ
=
雑音抑圧量雑音抑圧量雑音抑圧量雑音抑圧量
1
110inout log10SNRSNRNRRµµ′
≈−=
11,µµ ′:信号処理前後の雑音パワースペクトルの1次モーメント
mµ :雑音パワースペクトルの m次モーメント
理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の
パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要
バイアス付き MMSE-STSA 推定器の解析�事前 SNR 推定において無限の再帰処理を含む.
�信号処理後のモーメントを解析的に表すことは困難
�近似 [Breithaupt, 2010] を用いたモーメント計算法を導入する.
�モーメント計算の準備
1.雑音パワースペクトルのモデリング
2.バイアス付き MMSE-STSA 推定器への近似の適用3.キュムラントの導入
10
1.雑音パワースペクトルのモデリング
�雑音パワースペクトルがガンマ分布に従うと仮定する.
�形状母数は雑音の種類を表しており,値が1.0のとき白色ガウス雑音に相当する.
11
:形状母数 :尺度母数
ガンマ分布ガンマ分布ガンマ分布ガンマ分布
( ) ( )( )ηθ
θη
η
Γ−
=− xx
xpexp1
η θ
2.バイアス付き MMSE-STSA推定器の近似� 2つの近似を適用する.
�非音声区間を仮定したゲイン関数の近似
�事前 SNR を畳みこみ演算を用いて近似 (再帰処理を含まない)
– 本研究では実データとの整合をとるため ρ = 2.0 とした
バイアス付きバイアス付きバイアス付きバイアス付き MMSE-STSA 推定器の近似推定器の近似推定器の近似推定器の近似
( ) ( )[ ]ετγτξ ,1,max,bias −= ff
( ) ( ) ( )τξττξ ξ ,,ˆbias fhf ∗≈
( ) ( ) ( )τλατ ξξ −−= exp1h
⋅=πα
ρλξ
4ln
ρ : スムージングパラメータ
( ) ( )ηθτξπ
τ ,ˆ4
,2
bias ffY ≈
12
3.キュムラントの導入 [1/2]�近似式を用いてモーメント計算を行う.
�モーメントには加法性がないため,近似式にある畳みこみ演算
(積和演算) を扱うことが困難
キュムラントを導入
�キュムラントには加法性があるため,積和演算を含む処理
でも容易に計算できる.
�モーメントとキュムラントは一意に変換可能
13
キュムラントの加法性キュムラントの加法性キュムラントの加法性キュムラントの加法性
: 確率信号 Xの m次キュムラント[ ]Xmκ : 独立な確率変数YX , : 定数ba,
[ ] [ ] [ ]Ymm
Xm
m
bYaXm ba κκκ +=+
�バイアス付き MMSE-STSA 推定器のキュムラントを求めてから,モーメントへの変換を行う.
� のキュムラントを直接求めることはできない
�モーメントを求めてからキュムラントへ変換
�モーメントは確率密度関数 (PDF) から導出可能
3.キュムラントの導入 [2/2]
14
][ biasξκm : のキュムラント( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
( ) ( ) [ ]bias2
bias
14]|[| ξκαηθπ
κ m
m
YmmZ
−=
バイアス付きバイアス付きバイアス付きバイアス付きMMSE-STSA推定器のキュムラント推定器のキュムラント推定器のキュムラント推定器のキュムラント
]|[| 2biasYm
κ : バイアス付きMMSE-STSA 推定器のキュムラント( ) ( )
( )ξξ
λ
λ
m
mmZ
−−
−=
exp1
exp
( )τξ ,bias f
バイアス付き MMSE-STSA 推定器のモーメント計算
�モーメント計算の手順
1. の PDF を求める.2. のモーメント を計算する.
3. をキュムラントへ変換する.
4. バイアス付き MMSE-STSA 推定器の出力パワースペクトルのキュムラント を求める.
5. をモーメントへ変換する.
15
( )τξ ,bias f
[ ]biasξµm
]|[| 2biasYm
κ
( )τξ ,bias f
[ ]biasξµm
]|[| 2biasYm
κ
カートシス比,NRR
1. PDF 2. モーメント 3.キュムラント
4.キュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. モーメント
� の PDF 変形
�非音声区間を仮定しているため,事後 SNR は正規
化された雑音パワースペクトルとなる.
�雑音パワースペクトルはガンマ分布を仮定
1. のPDFの導出 [1/3]
( )τγ ,ˆ f
[ ]( )( )
( ) ( )ηηη
η
η
γΓ
−=
−
1
exp1
ˆ
xxxp
( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
( )τξ ,bias f
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
1. のPDFの導出 [2/3]
� の PDF 変形
�減算により p.d.f. は負の方向へ平行移動する.
17
[ ]( )( ) ( )( )
( ) ( )ηηη
η
η
γΓ
+−+=
−
−1
1exp11
1ˆ
xxxp
( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
( )τξ ,bias f
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
1. のPDFの導出 [3/3]
� の PDF 変形
� max 演算ではバイアス値 ε より小さい成分が全て εの位
置に積み上げられる.
[ ]( )( )
[ ]( ) ( )[ ]( ) ( )
>
=
<
=
−
− −∫εε
ε
γ
ε
γξ
xxp
xdxxp
x
xp
1ˆ
11ˆ
bias
0
( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
( )τξ ,bias f
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
� のモーメントを計算する.
� 求めた PDF の式をモーメントの定義式へ代入
2. のモーメント計算
19
[ ] [ ]( )
[ ]( ) [ ]( )
( )( ) ( )
( ) ( )( )( )
( )( )( )1,
1
1,11
11
1
0
2
11ˆ1ˆ
biasbias
+ΓΓ
+
+−+Γ⋅+−Γ+Γ
+Γ−
Γ=
+=
=
∑
∫∫
∫
=
− −
∞
−
∞
∞−
εηηη
ε
εηηηηη
ε
µε
γε γ
ξξ
m
m
l
l
m
mm
m
m
lmlml
m
dxxpdxxpx
dxxpx
( )ba,1Γ : 第一種不完全ガンマ関数 ( )ba,2Γ : 第二種不完全ガンマ関数
( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff
( )τξ ,bias f
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
3. モーメント-キュムラント変換
�モーメント-キュムラント変換により のキュムラン
ト が得られる.
20
( )τξ ,bias f
[ ]biasξκm
−+
−−=
+−=
−=
=
4
][1
2
][1][2
2
][2][1][3][4][4
3
][1][1][2][3][3
2
][1][2][2
][1][1
biasbiasbias
biasbiasbiasbiasbias
biasbiasbiasbiasbias
biasbiasbias
biasbias
612
34
23
ξξξ
ξξξξξ
ξξξξξ
ξξξ
ξξ
µµµµµµµκµµµµκ
µµκµκ
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
4. バイアス付き MMSE-STSA推定器のモーメント
� のキュムラントを用いて,バイアス付き MMSE-STSA 推定器のキュムラントを求める.
21
( ) ( ) [ ]bias2
bias 41
]|[| ξκηθπ
ακ m
m
YmmZ
−=
バイアス付きバイアス付きバイアス付きバイアス付きMMSE-STSA推定器のキュムラント推定器のキュムラント推定器のキュムラント推定器のキュムラント ((((再掲再掲再掲再掲) ) ) )
( )τξ ,bias f
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
騀 ֩◌
5. キュムラント-モーメント変換
� をモーメントへ変換すると,バイアス付き MMSE-STSA 推定器による信号処理後のモーメントが得られる.
�カートシス比および NRR の理論値が計算できる.
22
++
++=
+=
=
4
]|[|1
2
]|[|1]|[|2
2
]|[|2]|[|1]|[|3]|[|44
2
]|[|1]|[|22
]|[|11
2bias
2bias
2bias
2bias
2bias
2bias
2bias
2bias
2bias
2bias
46
34
YYY
YYYY
YY
Y
κκκ
κκκκµ
κκµ
κµ
]|[| 2biasYm
κ
モーメント計算の流れ
1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント
4.4.4.4.キュムラントキュムラントキュムラントキュムラント
( )τξ ,bias f
( ) 2
bias , τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント
評価実験
�先に導出した式を用いてカートシス比および NRR の理論値を求め,ミュージカルノイズフリー状態が存在するか検
証を行う.
�また実音源を用いた信号処理実験を行い,実際にミュー
ジカルノイズフリー状態が存在しているか確認する.
�実験条件
�DD 法の忘却係数 α = 0.98�雑音パワースペクトルの形状母数 η = 1.0 (白色ガウス雑音)�推定雑音 : 非音声区間の雑音パワースペクトルの平均
23
◌֝
理論解析結果
24
Conventional MMSE-STSA estimator
Musical-noise-free condition
カートシス不動条件および NRR 増加条件を満たす点が存在している
HarmfulHarmfulHarmfulHarmful
NaturalNaturalNaturalNatural
実音源を用いた信号処理実験結果
25
Conventional MMSE-STSA estimator
Musical-noise-free condition
ミュージカルノイズフリー状態を達成している
HarmfulHarmfulHarmfulHarmful
NaturalNaturalNaturalNatural
薰 ◌֜
まとめ
� MMSE-STSA 推定器におけるミュージカルノイズフリー雑音抑圧を目的として,バイアス付き MMSE-STSA 推定器を提案した.
�理論解析および実音源を用いた評価実験の結果,バイア
ス付き MMSE-STSA 推定器においてミュージカルノイズフリー状態が存在することが確認できた.
26