より次数を上げたCDFを実装して様子(統計量)を見る。

CDF(5,1), (5,3), (6,2), (6,4)まで実装してみた。

  • 4以上になると低域成分の分散の減少も顕著
  • しかし5,6では高域の分散は上昇傾向

全体的にいえることとしては、

  • 相関は減少している。高域は勿論だが、低域も。
  • 高周波(10000以上)に対して自己相関がほぼ同じになる。(低域の振幅は減少しているが)
  • ナイキスト周波数での振動に対して高域が大きな定数値をとる(分散はほぼ0)
  • スイープも高周波数帯域で高域が大きな定数値をとりがち。
    • 高域の予測は外れがちのよう。低域の分離はできているようだ。

プリエンファシスと比較している。前どっかで見たけど、周波数特性も低域が完全に消えていないし、高域は強調されてる。 相関はリフティングとどっこいどっこい。合計のエントロピーもどっこい?いや、リフティングの方が高域がかなり小さい。 低域にプリエンファシスを適用することもできるし。

また、純音(440Hz)に対してプリエンファシスをかけると自己相関はほぼ変わらないが、リフティングの場合は高域にて相関が減少(高次になるにつれてすぐに0に収斂)し、低域も相関の減少が見られた。

所感

音声圧縮に適したリフティングウェーブレットの設計は、テーマとしてありだと思う。

  • 消失モーメント多め(CDF(2,2)よりもCDF(4,2)の方が良いことを受け)
  • シフトと加算で実装可能
  • L1ノルムの意味スパース or エントロピー最小化

どうやればいいかつかみどころがないけど、確かお家で自分だけのウェーブレットを作る論文あったと思うので、そこからアプローチしてみるか。