Guide
Media, mediana, moda: quando ciascuna è la media giusta
Stesso dataset, tre ‘medie’. Scegliere quella giusta è la differenza tra informare e fuorviare.
By Buğra SözeriPublished
“Media” nel linguaggio quotidiano di solito significa la mediaaritmetica. In statistica è una parola più vaga che copre almeno tre metriche diverse: media, mediana e moda. Ognuna misura “il valore tipico” in un dataset, ma risponde a domande diverse e differisce drammaticamente sui dati asimmetrici. Questa guida spiega quando ognuna è lo strumento giusto.
Le tre definizioni, veloci
- Media — somma di tutti i valori divisa per il conteggio. Il default. Stesse unità dei dati.
- Mediana — il valore centrale del dataset ordinato. Metà sopra, metà sotto.
- Moda — il valore che si verifica più frequentemente. L’unica che funziona sui dati non numerici.
La classica divergenza: il reddito
Reddito familiare statunitense, 2023 (American Community Survey):
- Media: $111.000
- Mediana: $80.610
- Moda: circa $40.000-50.000 (la fascia più popolosa)
Tre numeri che rispondono tutti a “quanto guadagna una famiglia tipica statunitense?” — e differiscono fino a un fattore tre. La media è tirata su dai percettori dell’1%; la mediana si trova al punto centrale effettivo della distribuzione; la moda riflette dove si trova la fascia più grande.
Per le discussioni politiche e i titoli delle notizie, la mediana è quasi sempre il numero giusto — è robusta contro gli outlier e rappresenta una famiglia effettivamente raggiungibile. La media fuorvia tranne che per il budgeting aritmetico (tasse raccolte = famiglie × reddito medio).
Quando usare ciascuna
Usa la MEDIA quando
- La distribuzione è approssimativamente simmetrica. Altezze, punteggi IQ, errore di misura. Media e mediana concordano strettamente; la media va bene da riportare.
- Hai bisogno di calcolare i totali dalle medie. La media (× conteggio) ti dà la somma esattamente. La mediana no.
- La alimenterai in ulteriori statistiche. Varianza, deviazione standard, intervalli di confidenza si basano tutti sulla media.
Usa la MEDIANA quando
- La distribuzione è asimmetrica. Reddito, prezzi delle case, tempi di risposta, dimensioni dei file, degenze ospedaliere, costi dei progetti.
- Gli outlier sono probabili e non controllati. Dati dei sensori con glitch occasionali, numeri inseriti manualmente con errori di battitura, web analytics con traffico bot.
- Vuoi l’“esperienza tipica”. Tempo di attesa mediano, pendolarismo mediano, tempo di risposta mediano nel servizio clienti.
Usa la MODA quando
- I dati sono categorici. Colore preferito, browser usato, paese di origine. Media e mediana non sono definite per questi; la moda è l’unico riassunto.
- Vuoi il caso più comune. Prodotto più popolare, tipo di errore più comune, taglia scatola UPS più spedita.
- Sospetti una distribuzione bimodale. Altezze maschi+femmine combinate, dati meteorologici caldo-freddo, traffico di rete in picco/fuori picco.
La trappola della distribuzione asimmetrica
Gli articoli di notizie riportano regolarmente il reddito medio, il prezzo medio delle case, il tempo di risposta medio. Tutte e tre sono distribuzioni asimmetriche verso destra; in tutte e tre la media è costantemente più alta della mediana; riportare la media sopravvaluta sistematicamente il “tipico”.
Test rapido: se il dataset ha un pavimento rigido (zero) e nessun soffitto rigido, è probabilmente asimmetrico verso destra. Usa la mediana.
| Dataset | Forma | Usa |
|---|---|---|
| Altezza degli adulti | Approssimativamente normale | Media OK |
| Reddito | Asimmetrico verso destra | Mediana |
| Patrimonio netto | Fortemente asimmetrico verso destra | Mediana (la media fuorvia drammaticamente) |
| Tempo di risposta API | Asimmetrico verso destra | Mediana + percentili |
| Durata degenza ospedaliera | Asimmetrico verso destra | Mediana |
| Dimensioni dei file in una cartella | Asimmetrico verso destra | Mediana |
| Punteggi del test (test ben progettato) | Approssimativamente normale | Media OK |
| Temperatura giornaliera | Approssimativamente normale | Media OK |
Quando riportare tutte e tre
La presentazione onesta dei dati di solito mostra media, mediana e una misura di dispersione (deviazione standard o range interquartile). La differenza tra media e mediana dice immediatamente al lettore quanto è asimmetrica la distribuzione. Una media di $111k e una mediana di $81k ti dice più di entrambi i numeri da soli — ovvero, la distribuzione ha una coda destra lunga.
Calcola tutte e tre (più percentili, deviazione standard e un istogramma) in un solo passaggio con il nostro calcolatore statistico.
Procedura dettagliata: monitoraggio del tempo di risposta
Sei richieste API questa mattina misurate in millisecondi: [42, 51, 48, 55, 47, 2.800]. L’ultima è un outlier da cold-start. Tre riassunti:
- Media: (42+51+48+55+47+2800)/6 = 507 ms.
- Mediana: ordina a [42, 47, 48, 51, 55, 2800], prendi la media dei due valori centrali = 49,5 ms.
- Moda: tutti i valori compaiono una volta, quindi la moda non è definita per questo campione.
Riportare solo la media (“tempo di risposta medio: 507 ms”) convincerebbe uno stakeholder che l’API è rotta. Riportare solo la mediana (“risposta tipica: 49,5 ms”) nasconde il problema del cold-start. Il riassunto onesto è entrambi i numeri più il p99: “mediana 50 ms, p99 ~2,8 s — veloce nel caso comune, picchi di cold-start occasionali.” Questo è azionabile; nessuno dei due numeri da solo lo è.
Errori comuni
- Calcolare la “media delle medie”. La media delle medie di tre gruppi non è la media dei dati combinati a meno che i gruppi non siano della stessa dimensione. Ricalcola sempre dai dati grezzi, o usa una media ponderata con le dimensioni dei gruppi come pesi.
- Riportare la mediana senza una metrica di dispersione. Due dataset con mediane identiche possono avere forme completamente diverse. Aggiungi il range interquartile (Q3 − Q1).
- Chiamare una distribuzione bimodale “la media”. Una distribuzione combinata di altezze maschi+femmine ha due picchi a ~168 cm e ~178 cm. La media (~173 cm) non descrive nessuno. Disaggrega per gruppo.
- Usare la moda per dati continui. Per misurazioni veramente continue ogni valore è tecnicamente unico; la moda è indefinita. Usa un istogramma e identifica il bin più denso.
Per la domanda correlata sulla dispersione, continua con la nostra guida sulla deviazione standard. Per il quadro della variazione percentuale che spesso segue le statistiche di riassunto, vedi percentuale vs punto percentuale.
Frequently asked questions
- Qual è la differenza tra media, mediana e moda?
- La media è la somma divisa per il conteggio. La mediana è il valore centrale quando i dati sono ordinati — metà dei valori è sopra, metà sotto. La moda è il valore che si verifica più frequentemente. Tutte e tre sono ‘medie’ ma differiscono significativamente sui dati asimmetrici.
- Perché il Census Bureau statunitense usa il reddito familiare mediano invece di quello medio?
- Il reddito è asimmetrico verso destra — un piccolo numero di percettori molto alti tira la media ben al di sopra di ciò che la maggior parte delle famiglie guadagna effettivamente. Nel 2023, il reddito familiare medio statunitense era di circa $111.000 mentre la mediana era di $80.610. La mediana rappresenta meglio l’esperienza della famiglia tipica.
- Quando dovrei usare la mediana invece della media?
- Usa la mediana quando i dati hanno un pavimento rigido a zero e nessun soffitto (reddito, prezzi delle case, tempi di risposta, dimensioni dei file), contengono outlier non controllati, o quando vuoi rappresentare l’esperienza tipica del singolo individuo. Se media e mediana differiscono sostanzialmente, i dati sono asimmetrici e la mediana è di solito più informativa.
- Quando è più utile la moda rispetto a media o mediana?
- La moda è l’unica misura di tendenza centrale che funziona sui dati categorici (non numerici) — colore preferito, tipo di browser, paese di origine. È anche la scelta giusta quando la domanda è ‘qual è il valore più comune’ — la taglia del prodotto più popolare, il codice di errore più frequente.
- Un dataset può avere più di una moda?
- Sì. Una distribuzione bimodale ha due mode — ad esempio, i dati combinati sull’altezza maschile e femminile hanno picchi a circa 168 cm e 178 cm. Riportare una singola media di ~173 cm non descrive nessuno nel dataset; riportare due mode rivela la struttura.
Related
Published May 16, 2026