Glossaire

Le vocabulaire de cette révolution.

Un lexique de 50 termes pour comprendre le langage de l'IA générative — depuis token jusqu'à scaling laws, sans jargon inutile. Écrit pour celles et ceux qui veulent suivre les débats sans se sentir exclus.

A

AGI

Intelligence artificielle générale
Sécurité & éthique

Une IA aussi polyvalente qu'un humain compétent.

L'Artificial General Intelligence désigne un système hypothétique capable d'égaler ou de dépasser l'humain sur la plupart des tâches cognitives, pas seulement quelques-unes. Le terme est débattu — sa définition n'est pas universellement partagée, et l'industrie l'utilise de plus en plus comme objectif marketing.

API

Application Programming Interface
Économie & stratégie

L'interface technique qui permet à un logiciel d'appeler un modèle.

Une API expose les capacités d'un modèle aux développeurs. C'est la voie principale par laquelle les laboratoires d'IA monétisent leurs modèles auprès des entreprises — facturation au token, contrats, quotas.

ARR

Annual Recurring Revenue · Revenu récurrent annualisé
Économie & stratégie

Mesure standardisée du revenu d'une entreprise SaaS, projeté sur 12 mois.

Indicateur central pour comparer la traction commerciale des laboratoires d'IA. L'ARR d'OpenAI et d'Anthropic est régulièrement rapporté dans la presse financière comme baromètre de la course.

ASI

Superintelligence
Sécurité & éthique

Une IA qui dépasserait nettement l'humain dans tous les domaines.

Niveau hypothétique au-delà de l'AGI, où un système surpasse les meilleurs experts humains dans tous les domaines. Concept central dans les débats sur les risques existentiels et la gouvernance de l'IA.

Agent

Agent IA · AI agent
Capacités

Un modèle qui peut agir — pas seulement répondre.

Un agent est un modèle d'IA qui ne se contente pas de discuter : il peut exécuter du code, lire des fichiers, naviguer le web, appeler d'autres outils, et enchaîner des actions pour atteindre un objectif. Claude Code, Cursor ou Aider sont des exemples d'agents qui codent.

Alignement

Alignment
Sécurité & éthique

Faire en sorte qu'un modèle agisse conformément aux intentions humaines.

Discipline qui regroupe les techniques visant à s'assurer qu'un modèle reste utile, honnête et inoffensif. Inclut l'apprentissage par renforcement, les chartes de valeurs (Constitutional AI), les évaluations adversariales et les politiques d'usage.

Apprentissage automatique

Machine learning · ML
Fondamentaux

Discipline où les machines apprennent à partir de données plutôt que de règles écrites.

Plutôt que d'écrire des instructions à la main, on montre à la machine de nombreux exemples ; elle ajuste ses paramètres internes pour reproduire le comportement observé. C'est le socle de toute l'IA moderne.

Apprentissage profond

Deep learning
Fondamentaux

Apprentissage automatique avec des réseaux de neurones à plusieurs couches.

Sous-domaine de l'apprentissage automatique fondé sur des réseaux de neurones profonds (plusieurs dizaines à milliers de couches). C'est le paradigme qui domine l'IA depuis 2012 et qui a rendu possibles les LLM, la vision par ordinateur moderne et la génération d'images.

Attention

Mécanisme d'attention · Self-attention
Architectures

Mécanisme qui permet à un modèle de pondérer l'importance des différents éléments d'une entrée.

Quand un modèle lit une phrase, l'attention lui permet de relier chaque mot à tous les autres et de décider lesquels comptent pour la suite. C'est l'innovation clé de l'article *Attention Is All You Need* (2017), à l'origine de toute la révolution actuelle.

B

Benchmark

Évaluation
Pratiques

Test standardisé pour mesurer les performances d'un modèle.

Suite d'épreuves (MMLU, HumanEval, GPQA, SWE-bench…) sur lesquelles les laboratoires comparent leurs modèles. Les benchmarks sont essentiels pour le marketing, mais souvent critiqués pour leur saturation, leur fuite dans les corpus d'entraînement, ou leur faible lien avec l'utilité réelle.

Biais

Bias
Sécurité & éthique

Distorsion systématique qu'un modèle hérite de ses données d'entraînement.

Les modèles reproduisent et amplifient parfois les biais présents dans leurs corpus : représentations stéréotypées, lacunes culturelles, surreprésentation de certaines langues. La mesure et la mitigation des biais est un chantier permanent.

C

Capex IA

Dépenses d'infrastructure IA
Économie & stratégie

Les dépenses en équipement (GPU, datacenters) consenties pour l'IA.

Microsoft, Google, Amazon et Meta ont collectivement dépensé plus de 300 milliards de dollars par an fin 2025 en infrastructure IA. Le débat actuel : ce capex se justifie-t-il par les revenus actuels ou repose-t-il sur une promesse ?

Chain of Thought

CoT · Chaîne de pensée
Capacités

Technique où le modèle explicite son raisonnement étape par étape.

En invitant le modèle à "penser à voix haute" avant de répondre, on améliore drastiquement ses performances sur les tâches de raisonnement (math, logique, code). Les modèles dits *reasoning* (o1, o3, Claude avec extended thinking) industrialisent cette approche.

Constitutional AI

IA constitutionnelle
Pratiques

Méthode d'alignement par chartes de principes, développée par Anthropic.

Au lieu d'apprendre uniquement par retours humains, le modèle est entraîné à se critiquer lui-même à partir d'une charte écrite (la "constitution"). C'est l'approche signature d'Anthropic pour aligner Claude.

Context window

Fenêtre de contexte
Capacités

Le nombre maximal de tokens qu'un modèle peut lire en une fois.

Mesure combien d'information le modèle peut traiter simultanément : un prompt, un document, l'historique d'une conversation. Les modèles modernes vont de 8 000 à 2 millions de tokens. Au-delà, le modèle "oublie" le début.

Corpus

Données d'entraînement · Dataset
Fondamentaux

L'ensemble des textes (ou images, audio…) utilisés pour entraîner un modèle.

Les LLM frontière sont entraînés sur des corpus dépassant le pétaoctet : Common Crawl du web, livres, code, papiers scientifiques, conversations. La qualité et la composition du corpus déterminent largement ce que le modèle sait — et ses biais.

D

Distillation

Knowledge distillation
Pratiques

Compresser un gros modèle en un plus petit qui en copie les sorties.

On entraîne un "élève" plus petit à imiter un "maître" plus grand. Le résultat : un modèle moins coûteux à exécuter, qui conserve l'essentiel des capacités. Beaucoup de modèles "compacts" (Haiku, GPT-4o-mini) sont des distillations.

E

Embedding

Vecteur sémantique · Plongement
Fondamentaux

Une représentation numérique du sens d'un mot, d'une phrase ou d'un document.

Le modèle convertit "chat" et "chien" en vecteurs proches dans un espace à plusieurs centaines de dimensions, parce qu'ils partagent du sens. Les embeddings sont le socle de la recherche sémantique et de la RAG.

Émergence

Emergent capabilities
Architectures

Capacité qui apparaît brusquement au-delà d'une certaine échelle.

Certaines compétences (raisonnement multi-étapes, traduction zero-shot) ne s'observent pas dans les petits modèles puis surgissent quand on dépasse un seuil de taille ou d'entraînement. Le phénomène est partiellement remis en question — il dépend des métriques utilisées.

Entraînement

Training · Pré-entraînement
Fondamentaux

La phase d'apprentissage du modèle, où ses paramètres s'ajustent.

On présente au modèle d'énormes quantités de données et on ajuste progressivement ses milliards de paramètres pour qu'il produise les sorties attendues. C'est l'étape la plus coûteuse — plusieurs millions à plusieurs centaines de millions de dollars pour les modèles frontière.

F

FLOPS

Floating-Point Operations Per Second
Économie & stratégie

Unité de mesure de la puissance de calcul, en opérations par seconde.

Les modèles frontière demandent aujourd'hui de l'ordre de 10²⁵ FLOPS pour leur entraînement. Le *AI Act* européen et certains régimes d'export américains posent des seuils en FLOPS au-delà desquels un modèle est considéré comme "à risque systémique".

Few-shot

In-context learning
Pratiques

Apprendre une tâche en quelques exemples insérés dans le prompt.

Au lieu de fine-tuner un modèle pour une nouvelle tâche, on lui donne deux ou trois exemples dans le prompt — il généralise à partir de ces démonstrations. Un atout majeur des LLM par rapport aux modèles plus anciens.

Fine-tuning

Affinage
Pratiques

Continuer l'entraînement d'un modèle existant sur des données spécifiques.

Prendre un modèle pré-entraîné et le spécialiser sur un domaine (juridique, médical, vocabulaire interne…) avec un corpus dédié, beaucoup plus petit. Moins coûteux qu'un entraînement complet, plus efficace qu'un simple prompt.

Foundation model

Modèle de fondation
Architectures

Un modèle pré-entraîné qui sert de base à de nombreuses applications.

Terme popularisé par Stanford en 2021 pour désigner les très gros modèles polyvalents (GPT-4, Claude, Gemini, Llama) qui servent de socle à des milliers d'applications spécialisées par fine-tuning ou par prompt.

Frontier model

Modèle frontière
Économie & stratégie

Les modèles les plus capables à un instant donné — la "pointe".

Sous-ensemble des foundation models situés à la pointe des capacités, généralement détenu par 4-5 acteurs (OpenAI, Anthropic, Google, Meta, xAI, DeepSeek). Catégorie ciblée par les régulations émergentes en raison de son impact potentiel.

G

GPU

Graphics Processing Unit
Économie & stratégie

Processeur conçu pour le calcul parallèle massif — la machine de l'IA.

Les GPU de Nvidia (H100, H200, B200) sont la matière première de l'IA générative. Leur disponibilité conditionne qui peut entraîner quoi. L'allocation entre laboratoires est devenue un sujet géopolitique.

H

Hallucination

Confabulation
Sécurité & éthique

Quand un modèle invente une information avec assurance.

Les LLM, par construction, prédisent le mot le plus probable — pas le mot vrai. Quand ils manquent d'information, ils inventent plausiblement. Citations fictives, dates inventées, fonctions inexistantes : le risque est réel et doit être pris au sérieux.

I

IA générative

Generative AI · GenAI
Fondamentaux

Famille de modèles qui produisent du contenu nouveau plutôt que classer.

Désigne les modèles qui créent — texte, image, audio, vidéo, code — en opposition aux modèles purement "discriminatifs" qui classent. C'est l'IA générative qui a déclenché la vague médiatique depuis 2022.

Inférence

Inference
Fondamentaux

L'exécution d'un modèle déjà entraîné pour produire une réponse.

Pendant qu'un modèle est entraîné une fois, il est utilisé des milliards de fois. Le coût d'inférence (par requête) détermine la rentabilité d'un service IA. La compétition se joue de plus en plus sur l'efficacité d'inférence.

J

Jailbreak

Sécurité & éthique

Technique pour contourner les garde-fous d'un modèle.

Prompt malicieux ou exploit qui amène un modèle à enfreindre ses propres règles (générer du contenu interdit, divulguer son prompt système, etc.). Les laboratoires y consacrent des équipes dédiées (red team) en mode adversarial permanent.

L

LLM

Large Language Model · Modèle de langage large
Fondamentaux

Modèle d'IA entraîné à prédire du texte à très grande échelle.

Un *Large Language Model* est un réseau de neurones (généralement un Transformer) entraîné sur d'énormes corpus textuels à prédire le mot suivant. Claude, ChatGPT, Gemini, Mistral sont tous des LLM. Leur taille se mesure en paramètres (de quelques milliards à plusieurs milliers de milliards).

M

MCP

Model Context Protocol
Capacités

Protocole ouvert pour connecter les modèles aux outils et données.

Standard introduit par Anthropic fin 2024 pour normaliser la manière dont un agent IA accède à des fichiers, des API, des bases de données. Largement adopté par l'écosystème — Cursor, Continue, et la plupart des éditeurs IA le supportent.

MoE

Mixture of Experts
Architectures

Architecture où seuls quelques "experts" du modèle s'activent par requête.

Au lieu d'activer tous les paramètres pour chaque token, un MoE route la requête vers quelques sous-réseaux spécialisés. Permet d'entraîner d'énormes modèles (plusieurs trillions de paramètres) tout en gardant un coût d'inférence raisonnable. GPT-4, Mixtral, DeepSeek-V3 utilisent cette technique.

Multimodal

Capacités

Modèle qui traite plusieurs types d'entrées : texte, image, audio, vidéo.

Les modèles modernes (GPT-4o, Claude 4, Gemini) ne se limitent plus au texte : ils peuvent lire des images, écouter de l'audio, parfois générer images ou vidéos. La multimodalité élargit considérablement le champ des usages.

O

Open source

Économie & stratégie

Code source ET poids accessibles, avec licence permissive d'usage et modification.

Au sens strict, un modèle open source publie son code, ses poids, ses données et ses méthodes d'entraînement sous licence libre. À distinguer d'"open weights", plus restrictif. Vrais exemples : OLMo, Pythia. Souvent confondu avec open weights dans la presse.

Open weights

Poids ouverts
Économie & stratégie

Les poids du modèle sont téléchargeables, mais les données et l'entraînement restent fermés.

Llama, Mistral, Qwen, DeepSeek publient leurs poids — n'importe qui peut télécharger et exécuter le modèle. Mais ils ne publient pas leurs corpus ni la totalité de leurs méthodes. C'est la définition la plus courante d'"ouverture" en IA aujourd'hui.

Outil

Tool use · Function calling
Capacités

Capacité d'un modèle à appeler des fonctions externes pour agir.

Un modèle équipé d'outils peut décider d'exécuter du code, lire un fichier, faire une recherche web, appeler une API météo. C'est la couche qui transforme un chatbot en agent autonome.

P

Paramètre

Parameter · Poids
Fondamentaux

Les nombres internes du modèle qui s'ajustent pendant l'entraînement.

Un LLM moderne contient de quelques milliards à plusieurs milliers de milliards de paramètres — chacun étant un nombre réel ajusté lors de l'entraînement. Plus de paramètres = plus de capacité, mais aussi plus de coût d'entraînement et d'inférence.

Prompt

Invite
Pratiques

Le texte d'entrée qu'on donne à un modèle pour obtenir une réponse.

Tout ce qu'un modèle reçoit avant de répondre : votre question, le contexte, les instructions système, l'historique. La qualité du prompt influence directement la qualité de la sortie — d'où l'émergence du "prompt engineering" comme compétence.

Prompt engineering

Ingénierie de prompt
Pratiques

L'art de formuler des prompts efficaces pour exploiter au mieux un modèle.

Ensemble de techniques empiriques : décomposition des tâches, exemples insérés (few-shot), chaînes de pensée, rôles assignés. Une compétence à part entière, plus proche du métier d'éditeur que de celui d'ingénieur classique.

Q

Quantization

Quantification
Pratiques

Réduire la précision numérique des paramètres pour accélérer l'inférence.

Au lieu de stocker chaque paramètre en 32 ou 16 bits, on les ramène à 8, 4 ou même 2 bits. Le modèle perd un peu de qualité mais devient bien plus rapide et léger — utile pour faire tourner des LLM sur un laptop ou un téléphone.

R

RAG

Retrieval-Augmented Generation
Capacités

Combiner un LLM avec une recherche documentaire pour ancrer ses réponses.

Avant de répondre, le système cherche dans une base documentaire les passages pertinents et les injecte dans le prompt. Le modèle s'appuie alors sur des sources vérifiables — réduit les hallucinations, permet d'interroger des documents internes.

RLHF

Reinforcement Learning from Human Feedback
Pratiques

Affinage d'un modèle à partir de préférences humaines.

Des humains comparent deux réponses du modèle et indiquent laquelle est meilleure. Le modèle apprend à produire des réponses jugées meilleures. Technique standard depuis ChatGPT pour aligner les LLM aux attentes humaines.

Raisonnement

Reasoning
Capacités

Capacité d'un modèle à enchaîner plusieurs étapes logiques avant de répondre.

Une nouvelle génération de modèles (o1, o3, Claude *thinking*, Gemini 2.5) prend du temps à "réfléchir" avant de produire la réponse — décomposition, vérification, retour en arrière. Performance accrue sur math, code, planification.

Red team

Sécurité & éthique

Équipe interne dont la mission est d'attaquer le modèle pour trouver ses failles.

Pratique empruntée à la cybersécurité : avant chaque sortie majeure, une équipe simule des usages malicieux (jailbreaks, biais exploitables, fuites de données) pour identifier et corriger les vulnérabilités.

S

Scaling laws

Lois d'échelle
Économie & stratégie

Relation empirique entre la taille d'un modèle, ses données, son calcul, et ses performances.

Découvertes par OpenAI puis DeepMind (Chinchilla, 2022) : doubler les paramètres ou les données améliore le modèle de façon prévisible. Cette régularité a justifié les investissements massifs des cinq dernières années — et son éventuel plafonnement est l'enjeu actuel.

T

Token

Fondamentaux

L'unité de base que manipule un LLM — un mot, un fragment, un signe.

Un LLM ne voit pas des mots mais des tokens, généralement des fragments de 3 à 5 caractères. "Bonjour" peut être 1 token, "anticonstitutionnellement" en demande 6 ou 7. C'est aussi l'unité de facturation des API.

Transformer

Architectures

L'architecture de réseau de neurones qui sous-tend tous les grands modèles modernes.

Introduit en 2017 dans *Attention Is All You Need* par Google, le Transformer remplace les architectures récurrentes par le mécanisme d'attention. Toute la révolution LLM (GPT, BERT, Claude, Gemini) en découle.

V

Vision par ordinateur

Computer vision · CV
Capacités

Domaine de l'IA qui traite l'image et la vidéo.

De la reconnaissance d'objets à la génération d'images en passant par l'analyse de scènes médicales, la vision par ordinateur est aujourd'hui intégrée aux LLM multimodaux les plus avancés.

Z

Zero-shot

Pratiques

Réaliser une tâche sans aucun exemple préalable, juste à partir de l'instruction.

Capacité emblématique des LLM : on leur demande directement de traduire, résumer, classer — sans jamais avoir vu d'exemple de la tâche dans le prompt. Le revers du few-shot.

Un terme vous échappe encore ?

Suggérez-le-nous, ou demandez une clarification — nous étoffons le lexique au fur et à mesure des questions reçues.
contact@ryuzakilabs.com

Pour les développeurs : lexicon.json à la racine du dépôt.