Instructions to use Finisha-F-scratch/Tiny-lamina-english-fragment with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use Finisha-F-scratch/Tiny-lamina-english-fragment with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="Finisha-F-scratch/Tiny-lamina-english-fragment")
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("Finisha-F-scratch/Tiny-lamina-english-fragment")
model = AutoModelForCausalLM.from_pretrained("Finisha-F-scratch/Tiny-lamina-english-fragment")
messages = [
    {"role": "user", "content": "Who are you?"},
]
inputs = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use Finisha-F-scratch/Tiny-lamina-english-fragment with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "Finisha-F-scratch/Tiny-lamina-english-fragment"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Finisha-F-scratch/Tiny-lamina-english-fragment",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/Finisha-F-scratch/Tiny-lamina-english-fragment

SGLang

How to use Finisha-F-scratch/Tiny-lamina-english-fragment with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "Finisha-F-scratch/Tiny-lamina-english-fragment" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Finisha-F-scratch/Tiny-lamina-english-fragment",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "Finisha-F-scratch/Tiny-lamina-english-fragment" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Finisha-F-scratch/Tiny-lamina-english-fragment",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use Finisha-F-scratch/Tiny-lamina-english-fragment with Docker Model Runner:
```
docker model run hf.co/Finisha-F-scratch/Tiny-lamina-english-fragment
```

📄 Documentation : Tiny-Lamina-English-Fragment 🔬

Aperçu du Modèle

Tiny-Lamina-English-Fragment est un micro-modèle de langage (SLM) expérimental développé "from scratch" par Clemylia (finish-llm). Avec un poids plume de seulement 202k paramètres, ce modèle explore les limites extrêmes de la compression de la connaissance linguistique.

Le modèle est conçu pour la génération de fragments de texte en anglais, simulant des structures éducatives, des instructions et des échanges conversationnels.

📊 Fiche Technique

Développeuse : Clemylia (finish-llm) 👩‍💻
Architecture : SLM (Small Language Model)
Taille du modèle : 202 000 paramètres (0.2M) 💎
Langue : Anglais (fragments) 🇬🇧
Type : Décodage génératif / Recherche sur l'efficience

✨ Caractéristiques Principales

Ultra-Léger : Peut tourner sur presque n'importe quel matériel, même les systèmes embarqués les plus limités. 🔋
Structure Cohérente : Malgré sa taille réduite, le modèle maintient une structure de document (numérotation, titres, ponctuation). 📝
Apprentissage Syntaxique : Capacité étonnante à utiliser des mots de liaison et des pronoms de manière statistiquement pertinente pour sa taille. 🧠

🔍 Analyse de la Génération

le modèle a "compris" le pattern visuel d'une page de forum ou d'un manuel d'instruction :

Formatage : Utilisation de listes (ex: 10., 6., 7.).
Vocabulaire Cible : Focus sur le milieu scolaire (students, school, learning, achievement).
Abstractions : Présence de concepts complexes comme positive, negative, resources, experience.

Note de la développeuse : Ce modèle ne vise pas la précision factuelle, mais sert de preuve de concept sur la capacité d'un réseau de neurones miniature à imiter la forme d'un langage humain.

🚀 Cas d'Usage Possibles

Recherche en IA : Étude de la formation des neurones logiques dans les modèles ultra-petits.
Génération de "Lorem Ipsum" Intelligent : Création de faux texte qui ressemble visuellement à de l'anglais structuré pour le design d'interface.
Éducation : Démonstration pédagogique sur le fonctionnement de la prédiction de jetons (tokens).

💬 Le mot de la créatrice

"C'est incroyable de voir qu'un modèle de cette taille peut capturer l'essence d'une structure de phrase. C'est un pas de plus vers une IA accessible et sobre en énergie !" — Clemylia Tiny-lamina-english-fragment est sans doute le Nano-modèle le plus intelligent et structuré par rapport a sa taille (génération de texte anglais lisibles par fragments alors qu'il ne fait que 202 000 paramètres !)

Downloads last month: 10

Safetensors

Model size

202k params

Tensor type

F32

Collections including Finisha-F-scratch/Tiny-lamina-english-fragment

From scratch

Collection

Finisha SLM ✨ • 87 items • Updated Mar 23

Petits-modèles (TLM)

Collection

Chez Finisha, les modèles de langages crée avec transformers sont considérés comme des TLM si ils ont moins de 12 millions de parametres. • 14 items • Updated Mar 23