Fiche référence

📄 Fiche LLM — Les essentiels

Les concepts clés des grands modèles de langage à retenir pour un Product Owner.

🔤 Token

Unité de base traitée par un LLM. Un token n'est ni un mot ni un caractère.

La mémoire du modèle : nombre max de tokens qu'il peut prendre en entrée.

Contrôle la créativité / déterminisme du modèle.

• 0.0 — 0.3 : Déterministe, reproductible. Usage métier, extraction, classification
• 0.4 — 0.7 : Équilibré. Rédaction, synthèse
• 0.8 — 1.0 : Créatif. Brainstorming, génération d'idées
💡 Pour un PO : utiliser 0.1 — 0.3 pour du travail de production

Le modèle génère des informations fausses ou inventées avec assurance.

• Phénomène inhérent aux LLMs (ce ne sont pas des bases de données)
• Mitigation 1 : RAG — ancrer la réponse dans des sources vérifiées
• Mitigation 2 : Prompt contraignant — «Réponds UNIQUEMENT à partir du contexte fourni»
• Mitigation 3 : Validation humaine — ne jamais déléguer sans supervision

Instruction de base qui définit le rôle, les règles et le format de réponse du modèle.

• Rôle : «Tu es un Product Owner expert en IA...»
• Règles : «Réponds en français. Cite tes sources. Utilise des listes à puces.»
• Format : «Structure ta réponse en 3 parties : constat, analyse, recommandation.»
💡 Essentiel en contexte professionnel. Le system prompt est votre «cadre de travail» avec l'IA.

Représentation vectorielle du sens d'un texte. Permet la recherche sémantique.

• Vecteur numérique : 768 dimensions (petits modèles) → 3072 dimensions (haut de gamme)
• Similarité cosinus : mesure de proximité entre deux embeddings
• Utilisé dans le RAG pour retrouver les documents pertinents

Modèle	Contexte	Prix input	Open Source	OnPrem
GPT-4o	128K	$2,50	❌	❌
Claude 4	200K	$3,00	❌	❌
Mistral Large	128K	$2,00	✅	✅
DeepSeek-V3	128K	$0,50	✅	✅
Llama 4	128K	$0,25	✅	✅

Prix indicatifs en dollars US par million de tokens en entrée (avril 2026).

Le PDF conservera la mise en page complète.