Le vocabulaire de l'IA agentique, sans jargon.
Les termes qu'on entend partout, expliqués en deux phrases pour les dirigeants et leurs équipes.
LLM
Concepts fondamentauxModèle d'IA entraîné sur d'immenses corpus de texte pour comprendre et générer du langage. C'est le moteur derrière des outils comme ChatGPT ou Claude.
Contexte
Concepts fondamentauxL'ensemble des informations dont dispose le modèle à un instant donné pour produire sa réponse : instructions, documents fournis et historique de la conversation.
Token
Concepts fondamentauxUnité de base que le modèle lit et génère : un mot court ou un fragment de mot. La taille du contexte et le coût d'usage se mesurent en tokens.
Prompt système
Concepts fondamentauxInstruction de fond qui fixe le rôle, le ton et les règles de l'IA. Définie par le concepteur, elle reste invisible pour l'utilisateur final.
Prompt utilisateur
Concepts fondamentauxLa demande formulée par l'utilisateur à chaque échange, à laquelle le modèle répond en s'appuyant sur le prompt système et le contexte.
Fenêtre de contexte
Concepts fondamentauxQuantité maximale d'information (en tokens) que le modèle peut prendre en compte d'un seul coup. Au-delà, il faut résumer ou sélectionner ce qui compte vraiment.
Hallucination
Concepts fondamentauxRéponse plausible mais fausse, produite avec assurance par le modèle. C'est le principal risque à encadrer avant toute mise en production.
Température
Concepts fondamentauxRéglage qui dose le côté créatif ou déterministe des réponses : basse pour des résultats stables et factuels, haute pour des sorties plus variées.
Transformer
Architectures & modèlesArchitecture de réseau de neurones derrière la quasi-totalité des LLM. Son mécanisme d'attention traite tous les mots d'un texte en parallèle plutôt qu'un par un.
Diffusion
Architectures & modèlesArchitecture qui génère une image ou une vidéo en partant d'un bruit aléatoire qu'elle débruite progressivement. C'est le moteur de générateurs comme Midjourney ou Stable Diffusion.
Modèle de fondation
Architectures & modèlesGrand modèle pré-entraîné et généraliste, réutilisable comme socle pour de multiples usages sans tout réapprendre à chaque fois.
Raisonnement
Architectures & modèlesModèle qui « réfléchit » par étapes avant de répondre, ce qui améliore nettement sa fiabilité sur les tâches complexes.
RAG
Mémoire & donnéesTechnique qui va chercher les documents pertinents et les injecte dans le contexte, pour ancrer la réponse sur vos données plutôt que sur la seule mémoire du modèle.
Embedding
Mémoire & donnéesReprésentation numérique d'un texte qui capture son sens, permettant de retrouver des contenus proches par similarité.
Base vectorielle
Mémoire & donnéesStockage optimisé pour retrouver très vite les embeddings les plus proches d'une requête. C'est le socle technique d'un système RAG.
Chunking
Mémoire & donnéesSegmentation des documents en morceaux digestes avant indexation, pour que la recherche renvoie des passages précis et utiles.
Agent
AgentsIA capable d'enchaîner des actions de façon autonome (réfléchir, utiliser des outils, vérifier le résultat) pour accomplir une tâche, et pas seulement répondre.
Sous-agent
AgentsAgent secondaire qu'un agent principal délègue pour une sous-tâche précise, afin de garder son propre raisonnement clair et focalisé.
Harnais
AgentsL'infrastructure qui entoure le modèle et le transforme en agent opérationnel : boucle d'exécution, accès aux outils, gestion de la mémoire et du contexte.
Routines
AgentsSéquences d'étapes prédéfinies qu'un agent suit pour traiter des situations récurrentes de façon fiable et reproductible.
Second cerveau
AgentsBase de connaissances personnelle ou d'entreprise, structurée pour qu'un agent puisse la consulter et s'appuyer dessus à la demande.
Boucle agentique
AgentsSchéma où l'agent alterne raisonnement et action (il réfléchit, agit, observe le résultat, recommence) jusqu'à résoudre la tâche.
Orchestration
AgentsCoordination de plusieurs agents, outils et étapes vers un objectif commun, avec gestion de l'ordre et des dépendances.
Outil
Outils & intégrationsFonction externe qu'un agent peut appeler (recherche web, requête base de données, envoi d'email) pour agir au-delà du simple texte.
Appel d'outil
Outils & intégrationsMoment où l'agent décide d'utiliser un outil, fournit les paramètres nécessaires et récupère le résultat pour poursuivre sa tâche.
MCP
Outils & intégrationsStandard ouvert qui connecte un agent à des données et des outils externes de façon uniforme : l'équivalent d'un port universel pour l'IA.
Connecteurs
Outils & intégrationsIntégrations prêtes à l'emploi qui relient l'agent à vos applications (Slack, Gmail, CRM, Drive…), souvent via un protocole comme MCP.
Skills
Outils & intégrationsCompétences modulaires ajoutées à un agent sous forme de fichiers d'instructions (souvent un fichier Skill.md) qu'il charge au moment où il en a besoin.
Hooks
Outils & intégrationsDéclencheurs qui lancent une action automatique à un moment précis du cycle de l'agent (avant ou après un outil) pour valider, journaliser ou bloquer.
Computer use
Outils & intégrationsCapacité d'un agent à piloter directement un ordinateur (déplacer la souris, cliquer, taper) comme le ferait un humain devant l'écran.
Markdown
Fichiers & instructions agentFormat texte léger à balises simples (titres, listes, gras). C'est le langage par défaut des instructions et de la documentation d'agents.
CLAUDE.md
Fichiers & instructions agentFichier d'instructions persistant que l'agent lit au démarrage : conventions, préférences et contexte propres au projet.
MEMORY.md
Fichiers & instructions agentFichier où l'agent consigne ce qu'il doit retenir d'une session à l'autre : décisions, leçons et état d'avancement.
KV Cache
Performance & coûtMémoire des calculs intermédiaires réutilisée pendant la génération, qui accélère nettement la production token après token.
GPU
Performance & coûtMatériel spécialisé qui entraîne les modèles et les fait tourner. Sa disponibilité conditionne directement le coût et la vitesse d'un projet IA.
Inférence
Performance & coûtExécution du modèle pour produire une réponse, par opposition à la phase d'entraînement. C'est ce qui consomme des ressources à chaque requête.
Quantization
Performance & coûtCompression d'un modèle pour le rendre plus léger et plus rapide, au prix d'une légère baisse de précision.
Evals
Entraînement & qualitéTests systématiques qui mesurent la qualité et la fiabilité d'un système IA, avant et après mise en production. Indispensables pour décider en confiance.
Pré-entraînement
Entraînement & qualitéPhase initiale d'apprentissage généraliste sur d'immenses corpus, avant toute spécialisation par fine-tuning.
Fine-tuning
Entraînement & qualitéRé-entraînement d'un modèle existant sur vos propres données pour le spécialiser sur votre métier, votre ton ou vos cas particuliers.
Reinforcement learning
Entraînement & qualitéEntraîner un modèle par récompenses et pénalités selon la qualité de ses actions. C'est le socle du RLHF.
Jeu de données
Entraînement & qualitéEnsemble de données servant à entraîner ou à évaluer un modèle. Sa qualité détermine largement celle du résultat.
RLHF
Entraînement & qualitéMéthode d'alignement où des retours humains guident le modèle vers des réponses plus utiles, sûres et conformes aux attentes.
Guardrails
Entraînement & qualitéRègles et filtres qui empêchent l'agent de sortir du cadre : sujets interdits, actions sensibles, formats imposés.
Benchmark
Entraînement & qualitéJeu de tests standardisé servant à comparer objectivement les performances de plusieurs modèles.
Distillation
Entraînement & qualitéTransfert du savoir d'un gros modèle vers un plus petit, qui devient presque aussi performant tout en étant bien plus rapide et économique.
Prompt engineering
Ingénierie & pratiquesArt de formuler les instructions pour obtenir des réponses fiables, précises et reproductibles d'un modèle.
Few-shot
Ingénierie & pratiquesGlisser quelques exemples dans le prompt pour montrer au modèle le format et le ton attendus, sans aucun ré-entraînement.
Sortie structurée
Ingénierie & pratiquesForcer la réponse du modèle dans un format précis (souvent JSON) pour qu'une application puisse l'exploiter directement.
Context engineering
Ingénierie & pratiquesDiscipline consistant à fournir au modèle la bonne information au bon moment, sans le surcharger d'éléments inutiles.
Harness engineering
Ingénierie & pratiquesConception de l'infrastructure agentique (outils, boucles d'exécution, garde-fous) qui rend un agent robuste et fiable en production.
Vibe-coding
Ingénierie & pratiquesFaçon de programmer en décrivant l'intention en langage naturel et en laissant l'IA produire le code, par itérations rapides.