昨日の(プリエンファシス後の最小分散)/(プリエンファシス前の最小分散)の尺度で再度解析してみたところ、以下の結果。

  • 悪化する場合もあり。高域チャープとジャズ音源。
    • 安易には高周波が入ってるとダメそう、という予測ができる
  • 1次のフィルタ一発を入れるところでほぼ決まる
    • 多層(残差に対して予測する構成)にしてもあまり減らない
    • 4層/1層あたり6パラメータくらいまで試したけどほぼ同じ傾向(0.1dBほど下がるが、全体から見るとごくわずかな変化)。
    • 正則化を入れても同じ傾向。

ここで、 \(G=(\text{プリエンファシス後の最小分散})/(\text{プリエンファシス前の最小分散})\) の式はいじってみても良さそう。プリエンファシス後の信号は伝達関数を使ってかける。

\begin{align*} G &= \frac{\frac{1}{2\pi} \int_{0}^{2\pi} \log S^{\prime}(\omega) d\omega}{\frac{1}{2\pi} \int_{0}^{2\pi} \log S(\omega) d\omega} = \frac{\int_{0}^{2\pi} \log S^{\prime}(\omega) d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega} = \frac{\int_{0}^{2\pi} \log |H(\omega)|^{2} S(\omega) d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega} \\ &= 1 + \frac{\int_{0}^{2\pi} \log |H(\omega)|^{2} d\omega}{\int_{0}^{2\pi} \log S(\omega) d\omega} \end{align*}

第二項が負になればプリエンファシスが有効になる…と思ったら、『The Theory of Linear Prediction』の6.2節に、ARモデルのフィルタ(厳密に言うと、発散しないフィルタ係数)に対して

\begin{equation*} \int_{0}^{2\pi} \log |H(\omega)|^{2} d\omega = 0 \end{equation*}

が成り立つと書いてある。つまり理論的には \(G=1\) となる。これは、フィルタを連結させようとあるフィルタを用いて \(H^{\ast}(\omega) = \prod_{i=1}^{N} H_{i}(\omega)\) と書けてしまうから、結局最小残差で抑えられてしまうことからうなずける。

しかし、実験結果はそうなっていない。。。演算誤差にしては無視できないくらい大きい。特に低域チャープでは \(G=1/2\) 、つまり分散が半減している。

もしかして、定常ではない場合が効いてくるのか??定常に近づけるため時間分解能を高める。フレームサイズを8192でやっていたけど4096に変え、更に窓適用して再度実験してみる。