係数を静的ハフマンで圧縮した。狙い通り、ほぼエントロピーレート(6.5bit)に圧縮できて0.1%ほどの改善。あと、ねんがんの32bitビット入出力を実装できた。僅かに速度改善。

明日から投稿準備に入るので他に改善案はないか考えていた。補助関数法は負荷が重すぎるのがネック。もっと低い負荷でL1ロス最小化できないか考えていたら、NGSAの応用が思い浮かんだ。SAでも僅かに減少することは見ているので、ほぼ同様の負荷でより高い圧縮率が達成できるかもしれない。期待しつつやってみる。

うまくいかない。今、AR次数と係数次数が一致している状況になっている。それだと、どうしても更新式で全体更新ができない。。。

詰まったので、AVXでどれくらい早くなるか見ることにする。

最適化で粘っていたら、予測/合成のときのユニット方向の並列化が有効に思えた。2,4並列で計算するようにしてみたら、4/5くらいの高速化に見えた。その代わりとして、前ユニットを見ることをやめる必要がある。それによって圧縮率がどれくらい悪化するか見たら、手元の5分音源で0.01%未満の悪化であった(何故か圧縮率が上がる音源もあった。謎)。

ユニット方向の並列化は有効だからやってしまうか。