■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 901- 最新50  
レス数が1000を超えています。残念ながら全部は表示しません。

ぷにぷにNVA部★14

688 :転載禁止 (プッチョイ g5eQ-ElT7):2025/02/07(金) 06:10:48.37 ID:2VuIulbM
あいかわらず意味わからんでLoRA学習やっとるワイやけど
GUIの「LRウォームアップ」て何やろと調べたら
https://hoshikat.hatenablog.com/entry/2023/05/26/223229
>スケジューラーがconstant_with_warmupでないならここは無視して構いません。
せやったんか……(意味もなく250〜100にしとった)

あとCAME(青)とAdamW(黒)のTensorBoard
restart=2でできたわ、なんでか全く解らん
やっぱCAMEは速いンゴね

https://files.catbox.moe/ta98b9.png


けどepochの序盤で終わるときピーキーなんよね、epoch3.5が欲しいとき多い
そんとき繰り返し数を減らして様子みるより
スケジューラPolynomialで「LR power = 2」のほうが緩やかになりそう……かな?

https://cdn-ak.f.st-hatena.com/images/fotolife/h/hoshikat/20230525/20230525001355.png


次はPolynomialためしてみるで
LR power = 2を3にしたらグラフがどう動くかは想像でけんけども
完成度上がるならepoch数多くても構わんニキ向けやろうか?

304KB
READ.CGI - 0ch+ BBS 0.7.5 20220323 (Tuned by イーブイワイ★)
ぷにぷに板は「ぜろちゃんねるプラス」で作られていますぶい!🐕