昨日の(プリエンファシス後の最小分散)/(プリエンファシス前の最小分散)の尺度で再度解析してみたところ、以下の結果。
- 悪化する場合もあり。高域チャープとジャズ音源。
- 安易には高周波が入ってるとダメそう、という予測ができる
- 1次のフィルタ一発を入れるところでほぼ決まる
- 多層(残差に対して予測する構成)にしてもあまり減らない
- 4層/1層あたり6パラメータくらいまで試したけどほぼ同じ傾向(0.1dBほど下がるが、全体から見るとごくわずかな変化)。
- 正則化を入れても同じ傾向。
ここで、 \(G=(\text{プリエンファシス後の最小分散})/(\text{プリエンファシス前の最小分散})\) の式はいじってみても良さそう。プリエンファシス後の信号は伝達関数を使ってかける。
\begin{align*}
G &= \frac{\frac{1}{2\pi} \int_{0}^{2\pi} \log S^{\prime}(\omega) d\omega}{\frac{1}{2\pi} \int_{0}^{2\pi} \log S(\omega) d\omega} = \frac{\int_{0}^{2\pi} \log S^{\prime}(\omega) d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega} = \frac{\int_{0}^{2\pi} \log |H(\omega)|^{2} S(\omega) d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega} \\
&= 1 + \frac{\int_{0}^{2\pi} \log |H(\omega)|^{2} d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega}
\end{align*}
第二項が負になればプリエンファシスが有効になる…と思ったら、『The Theory of Linear Prediction』の6.2節に、ARモデルのフィルタ(厳密に言うと、発散しないフィルタ係数)に対して
\begin{equation*}
\int_{0}^{2\pi} \log |H(\omega)|^{2} d\omega = 0
\end{equation*}
が成り立つと書いてある。つまり理論的には \(G=1\) となる。これは、フィルタを連結させようとあるフィルタを用いて \(H^{\ast}(\omega) = \prod_{i=1}^{N} H_{i}(\omega)\) と書けてしまうから、結局最小残差で抑えられてしまうことからうなずける。
しかし、実験結果はそうなっていない。。。演算誤差にしては無視できないくらい大きい。特に低域チャープでは \(G=1/2\) 、つまり分散が半減している。
もしかして、定常ではない場合が効いてくるのか??定常に近づけるため時間分解能を高める。フレームサイズを8192でやっていたけど4096に変え、更に窓適用して再度実験してみる。