Instructions to use Finisha-F-scratch/Tiny-lamina-english-fragment with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Finisha-F-scratch/Tiny-lamina-english-fragment with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="Finisha-F-scratch/Tiny-lamina-english-fragment") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("Finisha-F-scratch/Tiny-lamina-english-fragment") model = AutoModelForCausalLM.from_pretrained("Finisha-F-scratch/Tiny-lamina-english-fragment") messages = [ {"role": "user", "content": "Who are you?"}, ] inputs = tokenizer.apply_chat_template( messages, add_generation_prompt=True, tokenize=True, return_dict=True, return_tensors="pt", ).to(model.device) outputs = model.generate(**inputs, max_new_tokens=40) print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:])) - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use Finisha-F-scratch/Tiny-lamina-english-fragment with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "Finisha-F-scratch/Tiny-lamina-english-fragment" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Tiny-lamina-english-fragment", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/Finisha-F-scratch/Tiny-lamina-english-fragment
- SGLang
How to use Finisha-F-scratch/Tiny-lamina-english-fragment with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "Finisha-F-scratch/Tiny-lamina-english-fragment" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Tiny-lamina-english-fragment", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "Finisha-F-scratch/Tiny-lamina-english-fragment" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Tiny-lamina-english-fragment", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use Finisha-F-scratch/Tiny-lamina-english-fragment with Docker Model Runner:
docker model run hf.co/Finisha-F-scratch/Tiny-lamina-english-fragment
📄 Documentation : Tiny-Lamina-English-Fragment 🔬
Aperçu du Modèle
Tiny-Lamina-English-Fragment est un micro-modèle de langage (SLM) expérimental développé "from scratch" par Clemylia (finish-llm). Avec un poids plume de seulement 202k paramètres, ce modèle explore les limites extrêmes de la compression de la connaissance linguistique.
Le modèle est conçu pour la génération de fragments de texte en anglais, simulant des structures éducatives, des instructions et des échanges conversationnels.
📊 Fiche Technique
- Développeuse : Clemylia (finish-llm) 👩💻
- Architecture : SLM (Small Language Model)
- Taille du modèle : 202 000 paramètres (0.2M) 💎
- Langue : Anglais (fragments) 🇬🇧
- Type : Décodage génératif / Recherche sur l'efficience
✨ Caractéristiques Principales
- Ultra-Léger : Peut tourner sur presque n'importe quel matériel, même les systèmes embarqués les plus limités. 🔋
- Structure Cohérente : Malgré sa taille réduite, le modèle maintient une structure de document (numérotation, titres, ponctuation). 📝
- Apprentissage Syntaxique : Capacité étonnante à utiliser des mots de liaison et des pronoms de manière statistiquement pertinente pour sa taille. 🧠
🔍 Analyse de la Génération
le modèle a "compris" le pattern visuel d'une page de forum ou d'un manuel d'instruction :
- Formatage : Utilisation de listes (ex:
10.,6.,7.). - Vocabulaire Cible : Focus sur le milieu scolaire (students, school, learning, achievement).
- Abstractions : Présence de concepts complexes comme positive, negative, resources, experience.
Note de la développeuse : Ce modèle ne vise pas la précision factuelle, mais sert de preuve de concept sur la capacité d'un réseau de neurones miniature à imiter la forme d'un langage humain.
🚀 Cas d'Usage Possibles
- Recherche en IA : Étude de la formation des neurones logiques dans les modèles ultra-petits.
- Génération de "Lorem Ipsum" Intelligent : Création de faux texte qui ressemble visuellement à de l'anglais structuré pour le design d'interface.
- Éducation : Démonstration pédagogique sur le fonctionnement de la prédiction de jetons (tokens).
💬 Le mot de la créatrice
"C'est incroyable de voir qu'un modèle de cette taille peut capturer l'essence d'une structure de phrase. C'est un pas de plus vers une IA accessible et sobre en énergie !" — Clemylia Tiny-lamina-english-fragment est sans doute le Nano-modèle le plus intelligent et structuré par rapport a sa taille (génération de texte anglais lisibles par fragments alors qu'il ne fait que 202 000 paramètres !)
- Downloads last month
- 10
