Nanbeige
/

Nanbeige4-3B-Thinking-2511

Text Generation

text-generation-inference

Model card Files Files and versions

leran1995 commited on 15 days ago

Commit

89cabf6

·

verified ·

1 Parent(s): 4367424

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -24,9 +24,11 @@ tags:
 Nanbeige4-3B-Thinking-2511 is an enhanced iteration over our previous Nanbeige4-3B-Thinking-2510.
 Through advanced distillation techniques and reinforcement learning (RL) optimization, we have effectively scaled the model’s reasoning capacity, resulting in superior performance across a broad range of benchmarks.
 On math and science reasoning benchmarks, Nanbeige4-3B-Thinking-2511 outperforms Qwen3-4B-Thinking-2507, Qwen3-8B-Thinking-2504, and Qwen3-14B-Thinking-2504 with a significant margin.
-Besides, Nanbeige4-3B-Thinking-2511 achieves state-of-the-art (SOTA) results among models smaller than 32B parameters on Arena-Hard-V2 and BFCL-V4.
 This marks a major milestone in delivering powerful, efficient reasoning performance at a compact scale.
 <div align="center">
 <img src="figures/performance_reasoning.png">

 Nanbeige4-3B-Thinking-2511 is an enhanced iteration over our previous Nanbeige4-3B-Thinking-2510.
 Through advanced distillation techniques and reinforcement learning (RL) optimization, we have effectively scaled the model’s reasoning capacity, resulting in superior performance across a broad range of benchmarks.
 On math and science reasoning benchmarks, Nanbeige4-3B-Thinking-2511 outperforms Qwen3-4B-Thinking-2507, Qwen3-8B-Thinking-2504, and Qwen3-14B-Thinking-2504 with a significant margin.
+Besides, Nanbeige4-3B-Thinking-2511 achieves state-of-the-art (SOTA) results among models smaller than 32B parameters on general tasks like Arena-Hard-V2 and BFCL-V4.
 This marks a major milestone in delivering powerful, efficient reasoning performance at a compact scale.
+* Technical Report - Comming Soon.
 <div align="center">
 <img src="figures/performance_reasoning.png">