Skip to content

Glossary

Moyenne

La moyenne arithmétique

By Published Updated

Moyenne (plus précisément la moyenne arithmétique) est la somme d’un ensemble de valeurs divisée par leur nombre. Pour l’ensemble [4, 8, 6, 5, 3, 7] : somme 33, nombre 6, moyenne 5,5. C’est la forme la plus courante d’« average » dans le langage courant et la valeur renvoyée par AVG(), numpy.mean, statistics.mean, et toutes les autres fonctions appelées « mean ».

Propriétés importantes : elle est sensible aux valeurs aberrantes (une valeur extrême l’attire fortement), elle a les mêmes unités que les données sous-jacentes, et c’est une propriété d’un ensemble — pas d’un élément individuel. La moyenne de [1, 1, 1, 100] est 25,75 ; une seule des quatre valeurs en est proche.

D’autres « moyennes » existent pour des contextes spécifiques : la moyenne géométrique (racine n-ième du produit, utilisée pour les taux de composition), la moyenne harmonique (réciproque de la moyenne des réciproques, utilisée pour moyenner les taux), la moyenne pondérée (certaines valeurs comptent davantage que d’autres). Quand on dit « moyenne » sans qualification, on entend la moyenne arithmétique.

Utilisez le calculateur statistique pour l’une d’elles ou pour la médiane, le mode, la variance et l’écart-type en une seule passe.

Quand la moyenne est le mauvais résumé : pour les revenus, la richesse, les temps de réponse et toute distribution fortement asymétrique à droite, la moyenne se situe bien au-dessus de la médiane et donne une image inexacte de l’observation « typique ». L’exemple classique des salles de presse est le revenu national — le revenu moyen des ménages américains est tiré vers le haut par les 1 % les plus riches, de sorte que la moyenne est un mauvais indicateur de ce que la plupart des ménages gagnent réellement. La médiane est le résumé honnête en un chiffre pour les données asymétriques ; la moyenne est honnête pour les données symétriques. Rapporter les deux, ou rapporter l’image complète des quartiles, est généralement la bonne approche. La médiane, l’IQR, et un histogramme donnent ensemble une lecture fidèle dans presque tous les cas.

Le piège de la moyenne géométrique vs arithmétique en finance : moyenner les rendements annuels en additionnant et divisant (moyenne arithmétique) surestime la croissance composée — un portefeuille qui rapporte +50 % puis −50 % a une moyenne arithmétique de 0 % mais se retrouve 25 % plus pauvre qu’au départ. La moyenne géométrique (moyenne multiplicative) donne −13,4 % par an, ce qui est le chiffre qui compose effectivement vers le résultat observé. Le « rendement annuel moyen » cité dans les prospectus de fonds est presque toujours la moyenne géométrique (TCAC) pour cette raison ; le « rendement attendu » cité en finance académique est généralement la moyenne arithmétique. Ce ne sont pas les mêmes chiffres et la différence compte pour tout horizon supérieur à un an. Connexe : moyenne harmonique, moyenne pondérée.

Exemple concret

Vous mesurez les temps de réponse d’une API en millisecondes sur dix requêtes : [42, 48, 51, 39, 55, 47, 44, 50, 46, 980]. Somme = 1 402, nombre = 10, moyenne = 140,2 ms. La médiane est 47,5 ms. La moyenne est « vraie » arithmétiquement mais totalement trompeuse pour décrire la performance typique — neuf des dix requêtes étaient sous 56 ms, et un seul temps de 980 ms (une requête lente à la base de données) a triplé la moyenne. Afficher « temps de réponse moyen 140 ms » sur un tableau de bord résumerait correctement la somme de travail effectué, mais mal l’expérience utilisateur. Le bon rapport est quelque chose comme « p50 = 47 ms, p95 = 980 ms » — ce qui préserve à la fois le cas typique et la queue. Ce résumé en deux chiffres explique pourquoi chaque produit d’observabilité moderne (Datadog, Honeycomb, Grafana) privilégie les vues en percentiles plutôt que les moyennes pour la latence.

Quand et pourquoi ça compte

Choisir la bonne statistique de résumé prévient les mauvaises décisions. Les analyses de tests A/B sur les taux de conversion utilisent correctement la moyenne (les proportions sont bornées et à peu près symétriques) ; les SLO d’ingénierie sur la latence ne devraient jamais utiliser la moyenne (distributions à longue queue). Les enquêtes salariales, les prix immobiliers et les distributions de valeur vie client sont fortement asymétriques à droite — la médiane est le centre honnête. Les résultats de tests et les mesures physiques (taille, tension artérielle) sont à peu près symétriques — la moyenne convient. La question diagnostique à se poser : si je doublais ma plus grande observation, mon résumé changerait-il de manière significative ? Si oui, vous avez une distribution asymétrique et la moyenne vous induit en erreur. Référence : NIST/SEMATECH e-Handbook of Statistical Methods.

Frequently asked questions

Qu’est-ce que la moyenne ?
La moyenne (arithmétique) est la somme de toutes les valeurs d’un ensemble divisée par leur nombre. Pour l’ensemble [2, 4, 6, 8], la moyenne est (2+4+6+8)/4 = 5.
Quand la moyenne n’est-elle pas une bonne mesure de tendance centrale ?
La moyenne est attirée vers les valeurs aberrantes. Un ensemble de salaires comme [30 k€, 35 k€, 40 k€, 2 M€] a une moyenne proche de 526 k€, ce qui ne représente pas le salaire typique. La médiane (point milieu) est plus informative pour les distributions asymétriques.
Quelle est la différence entre la moyenne, la médiane et le mode ?
La moyenne est la moyenne arithmétique ; la médiane est la valeur centrale triée ; le mode est la valeur la plus fréquente. Pour des distributions symétriques en cloche, elles sont presque égales ; pour des données asymétriques, elles divergent significativement.
Quelle est la différence entre la moyenne de population et la moyenne d’échantillon ?
La moyenne de population (μ) est calculée sur tous les membres du groupe ; la moyenne d’échantillon (x̄) est calculée sur un sous-ensemble. La moyenne d’échantillon sert d’estimateur de la moyenne de population quand la population complète est inaccessible.

Related

Published May 16, 2026 · Last reviewed May 31, 2026