inference-optimization
/

Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-down_proj-all

compressed-tensors

Model card Files Files and versions

README.md exists but content is empty.

Downloads last month: 1

Safetensors

Model size

6B params

Tensor type

F32

·

BF16

·

F8_E4M3

·

U8

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support