最近はプリエンファシスばっかやってる。
昨日の議論の一般化をしようとして、まず2次フィルタを使って1次の相関を消す場合を考えて導いたが、以下の難点があるのでスルー。
- 解が複雑になる
- 今のプリエンファシスを置き換えられない
代わりに \(k\) 次相関を消す1次のフィルタはまとまった。フィルタ係数を \(a\) と書き、分散で正規化した \(k\) 次相関を \(\rho_{k}\) と書く(\(\rho_{0} = 1, \rho_{-k} = \rho_{k}\) )
\begin{align*}
E[(x_{n} - ax_{n-1})(x_{n-k} - ax_{n-k-1})] &= E[x_{n}x_{n-k} - ax_{n}x_{n-k-1} - ax_{n-1}x_{n-k} + a^{2}x_{n-1}x_{n-k-1}] \\
&= \sigma^{2} (\rho_{k} - a \rho_{k+1} - a \rho_{k-1} + a^{2} \rho_{k}) \\
&= \sigma^{2} \left\{ a^{2} \rho_{k} - (\rho_{k+1} + \rho_{k-1}) a + \rho_{k} \right\} \\
&= \sigma^{2} \left[ \rho_{k} \left\{ a^{2} - \frac{\rho_{k+1} + \rho_{k-1}}{\rho_{k}} a \right\} + \rho_{k} \right\} \\
&= \sigma^{2} \left[ \rho_{k} \left( a - \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right)^{2} + \rho_{k} - \frac{(\rho_{k+1} + \rho_{k-1})^{2}}{4\rho_{k}} \right]
\end{align*}
よって、 \(\rho_{k} > 0 (< 0)\) のとき最小(大)値は \(\rho_{k} - \frac{(\rho_{k+1} + \rho_{k-1})^{2}}{4\rho_{k}}\ (a = \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}})\) となる。解(\(k\) 次相関が0になる点)は、
\begin{align*}
a &= \frac{(\rho_{k+1} + \rho_{k-1}) \pm \sqrt{(\rho_{k+1} + \rho_{k-1})^{2} - 4\rho_{k}^{2}}}{2\rho_{k}} \\
&= \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \pm \sqrt{\left( \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right)^{2} - 1}
\end{align*}
で、 \(\left| \frac{\rho_{k+1} + \rho_{k-1}}{2\rho_{k}} \right| > 1\) ならば解あり。
一般化ができたので2次相関を消してみたが、分散が上昇したり、2回連続で適用すると発散してしまう。やっぱり1次相関除去に命かけた方が良いか。
改めて、今のボーダーラインは
- MS変換 + 最適プリエンファシス(1)x2 + LPC(4), サブブロックでLPC(4) + CDF42を1段 + 低域でSS(4), 高域でSS(4): 54.9%
プリエンファシス次の右シフト量を落とすと性能改善の傾向あり。あんまり精度がいらないということ? 1次相関除去が他の音源でも有効なのか検証必要あり。→うーん、ワン・ツー・スゥイーツとSPARKLEで1次相関より分散減らしのほうが良かった。。