Glossary
Médiane
La valeur centrale d’un ensemble trié
By Buğra SözeriPublished Updated
Médiane est la valeur centrale d’un ensemble trié. Pour [3, 4, 5, 6, 7, 8] (six valeurs), la médiane est 5,5 (la moyenne des deux valeurs centrales). Pour [3, 4, 5, 6, 7] (cinq valeurs), la médiane est 5. La moitié des données est en dessous, l’autre moitié au-dessus.
La médiane est fameusement robuste : une seule valeur aberrante extrême ne peut pas l’attirer. La médiane de [1, 2, 3, 4, 5] est 3. La médiane de [1, 2, 3, 4, 1000] est toujours 3. Cela fait de la médiane le bon résumé pour les distributions asymétriques — revenus, prix immobiliers, temps de réponse, tailles de fichiers — où une ou deux valeurs extrêmes domineraient la moyenne arithmétique.
C’est la même chose que le 50e percentile. La calculer directement (trier, prendre le milieu) est O(n log n) ; pour de très grands ensembles de données, un algorithme quickselect trouve la médiane en O(n) attendu.
Utilisez le calculateur statistique pour la médiane, la moyenne, le mode et les quartiles en une seule passe.
Pourquoi le « revenu médian des ménages » est le chiffre que les économistes citent réellement : le US Census Bureau rapporte le revenu médian des ménages parce qu’il s’agit du résumé honnête en un chiffre d’une distribution fortement asymétrique à droite. D’après l’ACS 2023, le revenu médian des ménages américains était d’environ 80 000 $ tandis que la moyenne était d’environ 112 000 $ — l’écart est l’influence du haut de la distribution sur la moyenne arithmétique. Le même écart apparaît dans les prix immobiliers (la NAR rapporte des médianes, pas des moyennes), les enquêtes salariales, et la surveillance des temps de réponse en logiciel (chaque tableau de bord d’observabilité cite le p50 = médiane, pas la latence moyenne). Quand un nombre est « moyen » sans qualification sur des données asymétriques, demandez quelle moyenne — la différence entre les deux est souvent l’histoire.
La médiane est un estimateur robuste de localisation — mais avec un coût : la médiane a un point de rupture de 50 % (il faudrait corrompre plus de la moitié des données pour déplacer la médiane arbitrairement loin), alors que la moyenne a un point de rupture de 0 % (un seul infini déplace la moyenne à l’infini). Le compromis est l’efficacité statistique : sous une distribution normale propre, l’intervalle de confiance de la médiane est environ 25 % plus large que celui de la moyenne pour le même taille d’échantillon. Donc pour des données propres et symétriques, la moyenne est plus informative ; pour des données du monde réel imparfaites, la médiane est plus sûre. Les moyennes tronquées (supprimer le haut et le bas à 5 %) et l’estimateur de Hodges-Lehmann se situent sur le spectre entre les deux. Connexe : moyenne, percentile, IQR.
Exemple concret
Onze prix de vente immobilière dans un quartier (en milliers de dollars) : [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Triez la liste (déjà triée). Avec n = 11, la médiane est la 6e valeur : 355 000 $. La moyenne est somme/11 = 5900/11 ≈ 536 000 $. La seule maison de bord de mer à 2,4 M$ a poussé la moyenne d’environ 180 000 $ au-dessus de n’importe lequel des dix comparables réalistes — un acheteur utilisant le « prix moyen » pour évaluer le quartier surestimerait de 50 %. La médiane ignore complètement cet outlier. Ajoutez une 12e vente à 370 000 $ : maintenant n = 12, la médiane est la moyenne des 6e et 7e valeurs, (355 + 360)/2 = 357 500 $. La technique se généralise : toute observation extrême unique dans un grand échantillon déplace la médiane d’au plus une position dans la liste triée.
Quand et pourquoi ça compte
La médiane est la bonne métrique chaque fois que la distribution a une longue queue et que vous voulez un chiffre qui représente « le cas typique ». Cela couvre la plupart des métriques opérationnelles qui intéressent les humains — revenu des ménages, prix immobiliers, temps de résolution des tickets de support, temps de chargement des pages, tailles de fichiers dans un dépôt, mots par phrase dans un corpus de documents. Lors de la surveillance de la latence logicielle, la pratique standard est de présenter p50 (médiane) et p99 ensemble : la médiane vous indique si l’utilisateur typique est satisfait ; p99 vous indique si la queue est acceptable. Rapporter simplement une moyenne peut masquer une distribution bimodale (deux groupes d’utilisateurs avec des expériences très différentes) que la médiane plus quelques percentiles révèle immédiatement. Référence : US Census Bureau — Revenus aux États-Unis : 2023.
Frequently asked questions
- Qu’est-ce que la médiane ?
- La médiane est la valeur centrale d’un ensemble de données trié. Pour un nombre impair de valeurs, c’est la valeur centrale ; pour un nombre pair, c’est la moyenne des deux valeurs centrales.
- Quand utiliser la médiane plutôt que la moyenne ?
- Utilisez la médiane pour les distributions asymétriques ou les données avec des valeurs aberrantes — revenus, prix immobiliers, temps de réponse. Une seule valeur extrême ne peut pas déplacer la médiane de plus d’un rang, alors qu’elle peut déplacer la moyenne de manière dramatique.
- Quelle est la différence entre la médiane et le percentile ?
- La médiane est le 50e percentile — le point où la moitié des données tombe en dessous et l’autre moitié au-dessus. Tout percentile divise les données de façon similaire : le 90e percentile est la valeur en dessous de laquelle tombent 90 % des observations.
- Comment trouver la médiane d’un ensemble de taille paire ?
- Triez les valeurs, prenez les deux éléments centraux, et faites leur moyenne. Pour [3, 7, 10, 14], les deux valeurs centrales sont 7 et 10, donc la médiane est (7+10)/2 = 8,5.
Related
Published May 16, 2026 · Last reviewed May 31, 2026