LPCの多段構成検証(6)

これまでの結果をまとめることを試みる。いい加減グダグダ実験するのはやめ。

パラメータ（LPC係数）は多いほうが低いロスを達成する
- ロスの減少は頭打ちになるが、実用的な範囲（8192サンプルフレームに256パラメータまで）は下がり続ける
2層構成が最も低いロスを達成することが多かった
- ただし、パラメータを各層に等しく振り分けた場合。
- パラメータを各層で変えた場合は、3層でよりよい構成が見つかる場合が多数あった。
1層目は分割しないほうがロスが小さい
- はっきりとした傾向として出ている。
- これが何故良いのかはっきりと説明できない。以下に仮説を述べる。
  1. プリエンファシスで見たように相関を消せるから。またその相関を消すには長い区間で分析すべきだから。（正確な統計量を計算すべきだから）
  2. マルチスケールで分析できているから。分割しないで計算すると長区間の傾向を捉えることができる
2層目以降の分割は法則が見えない
- 分割時に見る波形に依存してパフォーマンスがブレるから
- これは適応的に定めるべきかと。分割数を変えて最も低いロスを出す構成を探すのが良い
学習はいつでも有効。学習率を上げすぎると発散する
- Momentumで加速する。プラトーにもあんまりはまらない。単調に減っていく。
- 初期値をLebinson-Durbin法で設定すると良い。ランダム初期値/ゼロ初期値よりも低いロスを達成していた。

で、コーデックにどう還元していくか。

2層をベースに、2層目の適応分割をおこなって性能を見る。
学習実装
- 学習による改善は少ないように思える。絶対値にして2~3の改善はどれくらい圧縮に効いてくるか不明…
- しかしLebinson-Durbin法によって設定するより確実によい係数が見つかっている。

Related Posts: