Skip to content

Glossary

Mediana

Il valore centrale di un dataset ordinato

By Published Updated

Mediana è il valore centrale di un dataset ordinato. Per [3, 4, 5, 6, 7, 8] (sei valori), la mediana è 5,5 (la media dei due valori centrali). Per [3, 4, 5, 6, 7] (cinque valori), la mediana è 5. Metà dei dati è al di sotto, metà al di sopra.

La mediana è famosamente robusta: un singolo outlier estremo non può spostarla. La mediana di [1, 2, 3, 4, 5] è 3. La mediana di [1, 2, 3, 4, 1000] è ancora 3. Questo rende la mediana il riassunto corretto per distribuzioni asimmetriche — reddito, prezzi delle case, tempi di risposta, dimensioni dei file — dove uno o due valori estremi dominerebbero la media aritmetica.

È uguale al 50° percentile. Calcolarla direttamente (ordinare, prendere il centrale) è O(n log n); per dataset molto grandi un algoritmo quickselect trova la mediana in O(n) atteso.

Usa il calcolatore statistico per la mediana, la media, la moda e i quartili in un unico calcolo.

Perché il «reddito familiare mediano» è il dato che gli economisti citano davvero: il Census Bureau degli Stati Uniti riporta il reddito familiare mediano perché è il riassunto onesto in un solo numero di una distribuzione fortemente asimmetrica verso destra. Secondo l’ACS 2023, il reddito familiare mediano statunitense era intorno a $80.000 mentre la media era intorno a $112.000 — il divario è l’influenza della parte alta della distribuzione sulla media aritmetica. Lo stesso divario emerge nei prezzi delle case (il NAR riporta mediane, non medie), nei sondaggi sui salari e nel monitoraggio dei tempi di risposta nel software (ogni dashboard di osservabilità cita p50 = mediana, non latenza media). Quando un numero è «medio» senza qualifica su dati asimmetrici, chiedi quale media — la differenza tra le due è spesso la notizia.

La mediana è uno stimatore robusto della posizione — ma con un costo: la mediana ha un breakdown point del 50% (dovresti corrompere più della metà dei dati per spostare la mediana arbitrariamente lontano), mentre la media ha un breakdown point dello 0% (un singolo infinito sposta la media all’infinito). Il compromesso è l’efficienza statistica: sotto una distribuzione normale pulita, l’intervallo di confidenza della mediana è circa il 25% più ampio di quello della media per la stessa dimensione campionaria. Quindi per dati puliti e simmetrici la media è più informativa; per dati reali disordinati la mediana è più sicura. Le medie troncate (elimina il 5% superiore e inferiore) e lo stimatore di Hodges-Lehmann si collocano nel mezzo tra i due. Correlato: media, percentile, IQR.

Esempio pratico

Undici prezzi di vendita di abitazioni in un quartiere (in migliaia di dollari): [280, 295, 310, 320, 340, 355, 360, 380, 410, 450, 2400]. Ordina l’elenco (già ordinato). Con n = 11, la mediana è il 6° valore: $355.000. La media è somma/11 = 5900/11 ≈ $536.000. La singola villa sul lungofiume da $2,4M ha spinto la media ~$180.000 al di sopra di qualsiasi comparabile realistico tra i dieci — un acquirente che usa il «prezzo medio» per valutare il quartiere sovrastimarebbe del 50%. La mediana ignora completamente quell’outlier. Aggiungi una 12ª vendita a $370.000: ora n = 12, la mediana è la media del 6° e 7° valore, (355 + 360)/2 = $357.500. La tecnica si generalizza: qualsiasi singola osservazione estrema in un campione grande sposta la mediana di al più una posizione nell’elenco ordinato.

Quando e perché è importante

La mediana è la metrica corretta ogni volta che la distribuzione ha una coda lunga e vuoi un numero che rappresenti «il caso tipico». Ciò copre la maggior parte delle metriche operative che interessano agli esseri umani — reddito familiare, prezzi delle case, tempo di risoluzione dei ticket di supporto, tempi di caricamento delle pagine, dimensioni dei file in un repository, parole per frase in un corpus di documenti. Quando si monitorano le latenze del software, la pratica standard è visualizzare p50 (mediana) e p99 insieme: la mediana ti dice se l’utente tipico è soddisfatto; p99 ti dice se la coda è accettabile. Riportare solo una media può nascondere una distribuzione bimodale (due gruppi di utenti con esperienze molto diverse) che la mediana più alcuni percentili rivela immediatamente. Riferimento: US Census Bureau — Income in the United States: 2023.

Frequently asked questions

Che cos'è la mediana?
La mediana è il valore centrale di un dataset quando è ordinato. Per un numero dispari di valori è il valore centrale; per un numero pari è la media dei due valori centrali.
Quando dovrei usare la mediana invece della media?
Usa la mediana per distribuzioni asimmetriche o dati con outlier — reddito, prezzi delle case, tempi di risposta. Un singolo valore estremo non può spostare la mediana di più di una posizione, mentre può spostare la media drasticamente.
Qual è la differenza tra mediana e percentile?
La mediana è il 50° percentile — il punto in cui metà dei dati cade al di sotto e metà al di sopra. Qualsiasi percentile divide i dati in modo simile: il 90° percentile è il valore al di sotto del quale cade il 90% delle osservazioni.
Come trovo la mediana di un dataset con un numero pari di elementi?
Ordina i valori, prendi i due elementi centrali e fai la media. Per [3, 7, 10, 14], i due valori centrali sono 7 e 10, quindi la mediana è (7+10)/2 = 8,5.

Related

Published May 16, 2026 · Last reviewed May 31, 2026