← Retour aux cours
Fiche référence
📄 Fiche LLM — Les essentiels
Les concepts clés des grands modèles de langage à retenir pour un Product Owner.
🔤 Token
Unité de base traitée par un LLM. Un token n'est ni un mot ni un caractère.
- • 1 token ≈ ¾ mot en anglais
- • 1 token ≈ 1,2 mot en français
- • Une page A4 standard ≈ 500 tokens
- • Les prix API sont facturés au nombre de tokens (input + output)
🧠 Contexte (fenêtre)
La mémoire du modèle : nombre max de tokens qu'il peut prendre en entrée.
- • 4K tokens — GPT-3.5, Mistral 7B (ancienne génération)
- • 32K-128K tokens — GPT-4, Mistral Large, Claude 3
- • 200K tokens — Claude 4, Gemini 2.5 Pro (modèles 2026)
- 💡 200K tokens ~ 500 pages de document. Un roman entier tient dans le contexte.
🌡️ Température
Contrôle la créativité / déterminisme du modèle.
- • 0.0 — 0.3 : Déterministe, reproductible. Usage métier, extraction, classification
- • 0.4 — 0.7 : Équilibré. Rédaction, synthèse
- • 0.8 — 1.0 : Créatif. Brainstorming, génération d'idées
- 💡 Pour un PO : utiliser 0.1 — 0.3 pour du travail de production
🤥 Hallucination
Le modèle génère des informations fausses ou inventées avec assurance.
- • Phénomène inhérent aux LLMs (ce ne sont pas des bases de données)
- • Mitigation 1 : RAG — ancrer la réponse dans des sources vérifiées
- • Mitigation 2 : Prompt contraignant — «Réponds UNIQUEMENT à partir du contexte fourni»
- • Mitigation 3 : Validation humaine — ne jamais déléguer sans supervision
⚙️ System Prompt
Instruction de base qui définit le rôle, les règles et le format de réponse du modèle.
- • Rôle : «Tu es un Product Owner expert en IA...»
- • Règles : «Réponds en français. Cite tes sources. Utilise des listes à puces.»
- • Format : «Structure ta réponse en 3 parties : constat, analyse, recommandation.»
- 💡 Essentiel en contexte professionnel. Le system prompt est votre «cadre de travail» avec l'IA.
📐 Embedding
Représentation vectorielle du sens d'un texte. Permet la recherche sémantique.
- • Vecteur numérique : 768 dimensions (petits modèles) → 3072 dimensions (haut de gamme)
- • Similarité cosinus : mesure de proximité entre deux embeddings
- • Utilisé dans le RAG pour retrouver les documents pertinents
💰 Prix API 2026 (par million de tokens)
| Modèle | Contexte | Prix input | Open Source | OnPrem |
|---|---|---|---|---|
| GPT-4o | 128K | $2,50 | ❌ | ❌ |
| Claude 4 | 200K | $3,00 | ❌ | ❌ |
| Mistral Large | 128K | $2,00 | ✅ | ✅ |
| DeepSeek-V3 | 128K | $0,50 | ✅ | ✅ |
| Llama 4 | 128K | $0,25 | ✅ | ✅ |
Prix indicatifs en dollars US par million de tokens en entrée (avril 2026).
Le PDF conservera la mise en page complète.