パラメータ(層数+層ごとの係数次数)調節を進めた。なんとかFLAC(-8)を超える圧縮率が出たところ。しかしやっぱりWavPack(-hh)は越えておきたい…

パラメータ調節でのメモ:

  • フレームサイズは大きく取る。フレームサイズを4096から8192, 2048*5に増やしたところ、パラメータ増加に対して性能悪化しなくなった。
    • フレームサイズが小さいとパラメータを増やしたときにすぐに頭打ちになる。プリエンファシスの精度低下も効いてきていると思う。
    • しかしレイテンシが気になってくる。TAKはたしか250msのブロックと言っていたので、おそらく2048*5だろう。
  • パラメータ個数は、先頭は少なく(4とか)、次に最大(32など)、その後は少しずつ減らしていくといい感じの圧縮率だった。
    • これは経験的なのであんまり信憑性がない。。
  • 学習を切るとAFはなかなか良い性能を出す。(つまり学習が逆効果になっている?)
    • AF単体で負荷がかなり大きい。ボトルネックは何かをちゃんと見るべき。繰り返し回数を見直すなど。
      • たとえば構造決定のときは2回くらいの繰り返しにして、本チャンのパラメータ設定では10回程度繰り返す。
      • これは試してみたい。繰り返し回数を指定できるようにAPIを変える。
    • AFのみ(学習しない)場合の結果も見たい。
    • もしかしてと思ってAFの行列の平均操作をやめたら性能が向上した。とくに音量の小さい音源で。ラグ込みで正しい平均を取れていないから平均はむしろ悪影響になっていた。これは直す。
    • いよいよ学習抜きで試すときがきたかも。
  • ユニット数の記録bit幅が3(=2の7乗=128)になっていて大きいのでは…
    • bit幅を2(=2の3乗=8)にした。効果は微妙なので取り下げる。