Glossaire IA

Le vocabulaire de l'IA agentique, sans jargon.

Les termes qu'on entend partout, expliqués en deux phrases pour les dirigeants et leurs équipes.

LLM

Concepts fondamentaux

Grand modèle de langage

Modèle d'IA entraîné sur d'immenses corpus de texte pour comprendre et générer du langage. C'est le moteur derrière des outils comme ChatGPT ou Claude.

Contexte

Concepts fondamentaux

Context

L'ensemble des informations dont dispose le modèle à un instant donné pour produire sa réponse : instructions, documents fournis et historique de la conversation.

Token

Concepts fondamentaux

Jeton

Unité de base que le modèle lit et génère : un mot court ou un fragment de mot. La taille du contexte et le coût d'usage se mesurent en tokens.

Prompt système

Concepts fondamentaux

System prompt

Instruction de fond qui fixe le rôle, le ton et les règles de l'IA. Définie par le concepteur, elle reste invisible pour l'utilisateur final.

Prompt utilisateur

Concepts fondamentaux

User prompt

La demande formulée par l'utilisateur à chaque échange, à laquelle le modèle répond en s'appuyant sur le prompt système et le contexte.

Fenêtre de contexte

Concepts fondamentaux

Context window

Quantité maximale d'information (en tokens) que le modèle peut prendre en compte d'un seul coup. Au-delà, il faut résumer ou sélectionner ce qui compte vraiment.

Hallucination

Concepts fondamentaux

Hallucination

Réponse plausible mais fausse, produite avec assurance par le modèle. C'est le principal risque à encadrer avant toute mise en production.

Température

Concepts fondamentaux

Temperature

Réglage qui dose le côté créatif ou déterministe des réponses : basse pour des résultats stables et factuels, haute pour des sorties plus variées.

Transformer

Architectures & modèles

Transformer

Architecture de réseau de neurones derrière la quasi-totalité des LLM. Son mécanisme d'attention traite tous les mots d'un texte en parallèle plutôt qu'un par un.

Diffusion

Architectures & modèles

Diffusion

Architecture qui génère une image ou une vidéo en partant d'un bruit aléatoire qu'elle débruite progressivement. C'est le moteur de générateurs comme Midjourney ou Stable Diffusion.

Modèle de fondation

Architectures & modèles

Foundation model

Grand modèle pré-entraîné et généraliste, réutilisable comme socle pour de multiples usages sans tout réapprendre à chaque fois.

Raisonnement

Architectures & modèles

Reasoning model

Modèle qui « réfléchit » par étapes avant de répondre, ce qui améliore nettement sa fiabilité sur les tâches complexes.

RAG

Mémoire & données

Retrieval-Augmented Generation

Technique qui va chercher les documents pertinents et les injecte dans le contexte, pour ancrer la réponse sur vos données plutôt que sur la seule mémoire du modèle.

Embedding

Mémoire & données

Plongement vectoriel

Représentation numérique d'un texte qui capture son sens, permettant de retrouver des contenus proches par similarité.

Base vectorielle

Mémoire & données

Vector database

Stockage optimisé pour retrouver très vite les embeddings les plus proches d'une requête. C'est le socle technique d'un système RAG.

Chunking

Mémoire & données

Découpage

Segmentation des documents en morceaux digestes avant indexation, pour que la recherche renvoie des passages précis et utiles.

Agent

Agents

IA capable d'enchaîner des actions de façon autonome (réfléchir, utiliser des outils, vérifier le résultat) pour accomplir une tâche, et pas seulement répondre.

Sous-agent

Agents

Sub-agent

Agent secondaire qu'un agent principal délègue pour une sous-tâche précise, afin de garder son propre raisonnement clair et focalisé.

Harnais

Agents

Harness

L'infrastructure qui entoure le modèle et le transforme en agent opérationnel : boucle d'exécution, accès aux outils, gestion de la mémoire et du contexte.

Routines

Agents

Routines

Séquences d'étapes prédéfinies qu'un agent suit pour traiter des situations récurrentes de façon fiable et reproductible.

Second cerveau

Agents

Second-brain

Base de connaissances personnelle ou d'entreprise, structurée pour qu'un agent puisse la consulter et s'appuyer dessus à la demande.

Boucle agentique

Agents

ReAct

Schéma où l'agent alterne raisonnement et action (il réfléchit, agit, observe le résultat, recommence) jusqu'à résoudre la tâche.

Orchestration

Agents

Orchestration

Coordination de plusieurs agents, outils et étapes vers un objectif commun, avec gestion de l'ordre et des dépendances.

Outil

Outils & intégrations

Tool

Fonction externe qu'un agent peut appeler (recherche web, requête base de données, envoi d'email) pour agir au-delà du simple texte.

Appel d'outil

Outils & intégrations

Tool call

Moment où l'agent décide d'utiliser un outil, fournit les paramètres nécessaires et récupère le résultat pour poursuivre sa tâche.

MCP

Outils & intégrations

Model Context Protocol

Standard ouvert qui connecte un agent à des données et des outils externes de façon uniforme : l'équivalent d'un port universel pour l'IA.

Connecteurs

Outils & intégrations

Connectors

Intégrations prêtes à l'emploi qui relient l'agent à vos applications (Slack, Gmail, CRM, Drive…), souvent via un protocole comme MCP.

Skills

Outils & intégrations

Skill.md

Compétences modulaires ajoutées à un agent sous forme de fichiers d'instructions (souvent un fichier Skill.md) qu'il charge au moment où il en a besoin.

Hooks

Outils & intégrations

Points d'accroche

Déclencheurs qui lancent une action automatique à un moment précis du cycle de l'agent (avant ou après un outil) pour valider, journaliser ou bloquer.

Computer use

Outils & intégrations

Usage de l'ordinateur

Capacité d'un agent à piloter directement un ordinateur (déplacer la souris, cliquer, taper) comme le ferait un humain devant l'écran.

Markdown

Fichiers & instructions agent

Markdown

Format texte léger à balises simples (titres, listes, gras). C'est le langage par défaut des instructions et de la documentation d'agents.

CLAUDE.md

Fichiers & instructions agent

Instructions projet

Fichier d'instructions persistant que l'agent lit au démarrage : conventions, préférences et contexte propres au projet.

MEMORY.md

Fichiers & instructions agent

Mémoire de l'agent

Fichier où l'agent consigne ce qu'il doit retenir d'une session à l'autre : décisions, leçons et état d'avancement.

KV Cache

Performance & coût

Cache clé-valeur

Mémoire des calculs intermédiaires réutilisée pendant la génération, qui accélère nettement la production token après token.

GPU

Performance & coût

Processeur graphique

Matériel spécialisé qui entraîne les modèles et les fait tourner. Sa disponibilité conditionne directement le coût et la vitesse d'un projet IA.

Inférence

Performance & coût

Inference

Exécution du modèle pour produire une réponse, par opposition à la phase d'entraînement. C'est ce qui consomme des ressources à chaque requête.

Quantisation

Performance & coût

quantization

Compression d'un modèle pour le rendre plus léger et plus rapide, au prix d'une légère baisse de précision.

Evals

Entraînement & qualité

Évaluations

Tests systématiques qui mesurent la qualité et la fiabilité d'un système IA, avant et après mise en production. Indispensables pour décider en confiance.

Pré-entraînement

Entraînement & qualité

Pre-training

Phase initiale d'apprentissage généraliste sur d'immenses corpus, avant toute spécialisation par fine-tuning.

Fine-tuning

Entraînement & qualité

Affinage

Ré-entraînement d'un modèle existant sur vos propres données pour le spécialiser sur votre métier, votre ton ou vos cas particuliers.

Reinforcement learning

Entraînement & qualité

Apprentissage par renforcement

Entraîner un modèle par récompenses et pénalités selon la qualité de ses actions. C'est le socle du RLHF.

Jeu de données

Entraînement & qualité

Dataset

Ensemble de données servant à entraîner ou à évaluer un modèle. Sa qualité détermine largement celle du résultat.

RLHF

Entraînement & qualité

Renforcement par retour humain

Méthode d'alignement où des retours humains guident le modèle vers des réponses plus utiles, sûres et conformes aux attentes.

Guardrails

Entraînement & qualité

Garde-fous

Règles et filtres qui empêchent l'agent de sortir du cadre : sujets interdits, actions sensibles, formats imposés.

Benchmark

Entraînement & qualité

Banc d'essai

Jeu de tests standardisé servant à comparer objectivement les performances de plusieurs modèles.

Distillation

Entraînement & qualité

Distillation

Transfert du savoir d'un gros modèle vers un plus petit, qui devient presque aussi performant tout en étant bien plus rapide et économique.

Prompt engineering

Ingénierie & pratiques

Ingénierie du prompt

Art de formuler les instructions pour obtenir des réponses fiables, précises et reproductibles d'un modèle.

Few-shot

Ingénierie & pratiques

Apprentissage par l'exemple

Glisser quelques exemples dans le prompt pour montrer au modèle le format et le ton attendus, sans aucun ré-entraînement.

Sortie structurée

Ingénierie & pratiques

Structured output

Forcer la réponse du modèle dans un format précis (souvent JSON) pour qu'une application puisse l'exploiter directement.

Context engineering

Ingénierie & pratiques

Ingénierie du contexte

Discipline consistant à fournir au modèle la bonne information au bon moment, sans le surcharger d'éléments inutiles.

Harness engineering

Ingénierie & pratiques

Ingénierie du harnais

Conception de l'infrastructure agentique (outils, boucles d'exécution, garde-fous) qui rend un agent robuste et fiable en production.

Vibe-coding

Ingénierie & pratiques

Programmation par intention

Façon de programmer en décrivant l'intention en langage naturel et en laissant l'IA produire le code, par itérations rapides.

Le vocabulaire de l'IA agentique, sans jargon.

LLM

Contexte

Token

Prompt système

Prompt utilisateur

Fenêtre de contexte

Hallucination

Température

Transformer

Diffusion

Modèle de fondation

Raisonnement

RAG

Embedding

Base vectorielle

Chunking

Agent

Sous-agent

Harnais

Routines

Second cerveau

Boucle agentique

Orchestration

Outil

Appel d'outil

MCP

Connecteurs

Skills

Hooks

Computer use

Markdown

CLAUDE.md

MEMORY.md

KV Cache

GPU

Inférence

Quantisation

Evals

Pré-entraînement

Fine-tuning

Reinforcement learning

Jeu de données

RLHF

Guardrails

Benchmark

Distillation

Prompt engineering

Few-shot

Sortie structurée

Context engineering

Harness engineering

Vibe-coding

Prêt à découvrir ce qui fonctionne vraiment ?