Sean13
/

llama-8b-instruct-rdpo-full-multipref-init-eta-0.80

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

llama-8b-instruct-rdpo-full-multipref-init-eta-0.80

14.5 GB

1 contributor

History: 3 commits

Sean13's picture

Model save

f3837f0 verified 3 months ago