TOKUNAGA Hiroyuki[B!]新着記事・評価 - はてなブックマーク

『TOKUNAGA Hiroyuki』

最近のOptimizerの研究について
3 users
tkng.org

Optimizerはロマンである。Optimizerを変えると学習が速くなったりlossがこれまでより下がったりする。すばらしい！本記事では今年出てきた新しいOptimizerやその関連研究を眺めてみたい。 Cautious Optimizers: Improving Training with One Line of Codegradientと更新方向の符号が一致している場合にのみ、そのパラメーターを更新する。なんのこっちゃと思われるかもしれないが、momentumの概念が入ると、gradientと実際の更新方向の食い違いは容易に起こりえる。更新するパラメーターの数に応じて、更新量をスケールする。更新するパラメーターの数が少ない場合は、更新するパラメーターに対してはアグレッシブに更新を行う。AdamWとLionに適用しているが、Momentum SGDにも適用できそう。LLaMA-60
- テクノロジー
- 2024/12/12 23:56

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx