RWCデータセットに対して性能が壊滅的に悪い。発表を戸惑うレベル。しかし発表申し込みはしてしまった。。。 手元のアニソン数種類でWavPack(-hh)を越えていた(4, 8, 8)の構成で、RWCデータセットに対してはFLAC(-8)と同等の圧縮率。
11/3から、焦りも感じながらパラメータ調整に着手。以下を試したがいずれも悪化の傾向
- 補助関数法に切り替え
- この結果がかなりショック。手元では良くなったのに、何かのバグを疑っている。。。冷静にクラシック音源で確かめるとたしかに悪化している。
- パラメータ数を2倍((8, 16, 16))にして係数ビット数を半分の4に
- 学習率を0.001かつ学習イプシロンを1e-8に
- 手元のクラシックでは改善したが、RWCでの全体平均がだめ。
- フレームサイズを増やす
- 16384を選んだ。これ以上はエンコード遅延がキツイか。。
- クラシック音源では良いが、平均的な挙動が悪い。
以下は改善の傾向
- LPC予測/合成を先頭部分でも行う
- これは手抜きだった。処理追加で改善確認。無条件で取り込む予定。
残差波形を見ていると、ブロック周期で大きな残差が出ているのが気になる。先頭は予測できないから仕方ないのだが。