ワーク配置をする。
- LPC計算ハンドル: 済
- コーダー: 済(まよったけど、今後別用途ありうる)
- プロセッサ: やめる。内部モジュールであって構造体公開してるし。
- エンコーダ: 済
- デコーダ: 済
の順に。かるくデコーダのワークサイズみた。8ch, 最大32次とすると9kくらい。プロセッサがほとんどを占めてる。まだメモリを削る要望はないけど、やるとしたらここかな。コンフィグの最大次数に合わせて動的確保する実装に変えるべき。
Windowsで軽く動かしてたら、NLZは _BitScanReverse を使えば早くできそうな印象で、やっつけたらたしかに早くなった。630ms->550msとか。全部NLZ(CLZ)使ってんのもよくなくて、CTZも使ったほうがいいんじゃないか。