ワーク配置をする。

  • LPC計算ハンドル: 済
  • コーダー: 済(まよったけど、今後別用途ありうる)
  • プロセッサ: やめる。内部モジュールであって構造体公開してるし。
  • エンコーダ: 済
  • デコーダ: 済

の順に。かるくデコーダのワークサイズみた。8ch, 最大32次とすると9kくらい。プロセッサがほとんどを占めてる。まだメモリを削る要望はないけど、やるとしたらここかな。コンフィグの最大次数に合わせて動的確保する実装に変えるべき。

Windowsで軽く動かしてたら、NLZは _BitScanReverse を使えば早くできそうな印象で、やっつけたらたしかに早くなった。630ms->550msとか。全部NLZ(CLZ)使ってんのもよくなくて、CTZも使ったほうがいいんじゃないか。