Adaptive Polyphase Subband Decomposition Structures for Image Compression を引用している音声関連の文献を漁る。もしくは適応的リフティング、整数ウェーブレット変換の音声圧縮への適用を探る。

  • Lossless Sound Compression using the Discrete Wavelet Transform 離散ウェーブレット変換を使って圧縮を試みる。算術符号を使用。Shortenよりも高い圧縮率。しかし当然遅い。
    • 試してみたという感じの文体だが、ウェーブレットでロスレス圧縮するときの示唆にはなっている。
    • まとめにおいて Ultimately, our experiences suggest that wavelets may not be the right paradigm for lossless sound compression. と言った。LPCの方が少ないパラメータで信号を表現できているとも指摘している。
    • SZIP というRice符号の変種を比較対象としていた。強いかも。よく見るべし。下記所感に詳しく。
  • IMPROVED INTEGER TRANSFORMS FOR LOSSLESS AUDIO CODING 整数DCTベースの手法。LTACでダメだったということがわかっている。
  • A review of lossless audio compression standards and algorithms ロスレス音声符号化のまとめ2017年度版。
    • IEEE 1857.2が整数ウェーブレット変換したのをLPC予測にかけている。つまり変換域適応している。
    • なるほど正しい流れっぽいな。IEEE 1857.2にもっと探り入れるか。
    • Investigation of Lossless Audio Compression using IEEE 1857.2 Advanced Audio Coding 固定係数Liftingの後にLPCが刺さっている。
      • 固定係数なのがうーんという感じ。
      • 符号は算術符号。これもうーん。
      • 論文での比較によると圧縮率はMonkey's Audioより高いけど圧縮速度は遅い。

EZW(符号化手法)について

所感

  • 適応リフティング(適応フィルタ)試してみるか。そんなんで良くなるとはどうも思えないが見てみよう。間引き(受容野拡大)で何か魔法が起こるかもしれない。間引いてLPCは常套手段だったりしない?(フィルタバンクの適応みたいな話になりそう)
  • 間引きLPC(適応的フィルタバンク)が次世代標準だったりしないかとちょっと思う。
  • なんかタンペレ大でロスレス音声の研究をやってた残骸があるな。
  • SZIP 気になる。ライス符号ベースというのがいい印象だし、再帰的Golomb-Riceを見切ってもよさそう。 - 奥村先生 によるとBurrows-Wheeler 変換(ブロック整列法)を使った手法のようだ。つまりブロック整列+Rice符号か。