最近はプリエンファシスばっかやってる。

昨日の議論の一般化をしようとして、まず2次フィルタを使って1次の相関を消す場合を考えて導いたが、以下の難点があるのでスルー。

  • 解が複雑になる
  • 今のプリエンファシスを置き換えられない

代わりに \(k\) 次相関を消す1次のフィルタはまとまった。フィルタ係数を \(a\) と書き、分散で正規化した \(k\) 次相関を \(\rho_{k}\) と書く(\(\rho_{0} = 1, \rho_{-k} = \rho_{k}\)

\begin{align*} E[(x_{n} - ax_{n-1})(x_{n-k} - ax_{n-k-1})] &= E[x_{n}x_{n-k} - ax_{n}x_{n-k-1} - ax_{n-1}x_{n-k} + a^{2}x_{n-1}x_{n-k-1}] \\ &= \sigma^{2} (\rho_{k} - a \rho_{k+1} - a \rho_{k-1} + a^{2} \rho_{k}) \\ &= \sigma^{2} \left\{ a^{2} \rho_{k} - (\rho_{k+1} + \rho_{k-1}) a + \rho_{k} \right\} \\ &= \sigma^{2} \left[ \rho_{k} \left\{ a^{2} - \frac{\rho_{k+1} + \rho_{k-1}}{\rho_{k}} a \right\} + \rho_{k} \right\} \\ &= \sigma^{2} \left[ \rho_{k} \left( a - \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right)^{2} + \rho_{k} - \frac{(\rho_{k+1} + \rho_{k-1})^{2}}{4\rho_{k}} \right] \end{align*}

よって、 \(\rho_{k} > 0 (< 0)\) のとき最小(大)値は \(\rho_{k} - \frac{(\rho_{k+1} + \rho_{k-1})^{2}}{4\rho_{k}}\ (a = \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}})\) となる。解(\(k\) 次相関が0になる点)は、

\begin{align*} a &= \frac{(\rho_{k+1} + \rho_{k-1}) \pm \sqrt{(\rho_{k+1} + \rho_{k-1})^{2} - 4\rho_{k}^{2}}}{2\rho_{k}} \\ &= \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \pm \sqrt{\left( \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right)^{2} - 1} \end{align*}

で、 \(\left| \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right| > 1\) ならば解あり。

一般化ができたので2次相関を消してみたが、分散が上昇したり、2回連続で適用すると発散してしまう。やっぱり1次相関除去に命かけた方が良いか。

改めて、今のボーダーラインは

  • MS変換 + 最適プリエンファシス(1)x2 + LPC(4), サブブロックでLPC(4) + CDF42を1段 + 低域でSS(4), 高域でSS(4): 54.9%

プリエンファシス次の右シフト量を落とすと性能改善の傾向あり。あんまり精度がいらないということ? 1次相関除去が他の音源でも有効なのか検証必要あり。→うーん、ワン・ツー・スゥイーツとSPARKLEで1次相関より分散減らしのほうが良かった。。