shirwu
/

content

Generated from Trainer

Model card Files Files and versions

69.5 MB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

shirwu's picture

shirwu/dpo-personal-preference-llama3.2-1b-trainer

e0257e3 verified over 1 year ago