Skip to content

Glossary

Correlación

Cuán estrechamente se mueven juntas dos variables

By Published Updated

Correlación mide el grado en que dos variables se mueven juntas. La medida estándar es la r de Pearson: un único número de −1 a +1 donde +1 significa una relación lineal positiva perfecta, 0 significa ninguna relación lineal, y −1 significa una relación lineal negativa perfecta.

Interpretación práctica:

  • |r| < 0,3 — débil
  • 0,3 ≤ |r| < 0,7 — moderada
  • |r| ≥ 0,7 — fuerte

Tres cosas que todo lector de números de correlación debe saber:

  1. La r de Pearson solo captura relaciones lineales. Dos variables relacionadas por una cuadrática perfecta (y = x²) pueden tener r ≈ 0 si x abarca valores positivos y negativos. Para relaciones no lineales, la rho de Spearman es la alternativa más robusta.
  2. Correlación no es causalidad. Dos variables pueden correlacionar fuertemente porque A causa B, B causa A, ambas son causadas por una tercera variable, o pura coincidencia (especialmente en muestras pequeñas o al comparar muchos pares).
  3. Los valores atípicos distorsionan r dramáticamente. Un único valor atípico en un conjunto de datos pequeño puede cambiar el signo de la correlación. Siempre visualice los datos antes de confiar en el número.

Para datos categóricos o de orden de rango, use la correlación de rango de Spearman en lugar de Pearson. Para resultados binarios, consulte el coeficiente phi. Para datos categóricos nominales con más de dos niveles, la V de Cramér.

El cuarteto de Anscombe — la ilustración famosa: en 1973, el estadístico Francis Anscombe construyó cuatro conjuntos de datos pequeños que comparten la misma media, varianza, coeficiente de correlación (0,816) y línea de regresión lineal — pero se ven completamente diferentes cuando se grafican. Uno es una tendencia lineal limpia; uno es una curva perfecta; uno es una línea con un único valor atípico; uno es una línea vertical con un punto desviado. El cuarteto sigue siendo citado como el caso canónico de “siempre grafique los datos primero.” La Docena de Datasaurus (Matejka y Fitzmaurice, 2017) extiende la misma idea a doce conjuntos de datos que comparten estadísticas resumidas — incluyendo uno con forma de dinosaurio. Ambos demuestran lo mismo: un único número de correlación es necesario pero nunca suficiente. Referencia: NIST/SEMATECH e-Handbook — Correlación Lineal.

Ejemplo práctico

Cinco puntos de datos (1,2), (2,4), (3,5), (4,4), (5,5). Medias x̄ = 3, ȳ = 4. Desviaciones x − x̄: −2, −1, 0, 1, 2. Desviaciones y − ȳ: −2, 0, 1, 0, 1. Suma de productos cruzados Σ(xᵢ − x̄)(yᵢ − ȳ) = 4 + 0 + 0 + 0 + 2 = 6. Suma de desviaciones al cuadrado de x: 10; de y: 6. Pearson r = 6 / √(10 × 6) = 6 / 7,746 ≈ 0,775 — una relación lineal positiva fuerte. Un diagrama de dispersión mostraría que esa interpretación se sostiene; si el tercer punto fuera (3, 50) en lugar de (3, 5), r seguiría pareciendo bien definido pero el modelo lineal estaría dominado por un único valor atípico.

Cuando la correlación impulsa decisiones

Diversificación de carteras: los activos con baja correlación entre pares reducen la varianza general incluso cuando sus volatilidades individuales son altas. La crisis financiera de 2008 mostró el contraejemplo catastrófico — acciones, bonos corporativos, REITs e incluso el oro se movieron juntos cuando se secó la liquidez, y las matrices de correlación estimadas en mercados tranquilos subestimaron el riesgo de cola. En ingeniería de características de ML, dos características con r > 0,95 son efectivamente redundantes; eliminar una raramente degrada la precisión del modelo y acelera el entrenamiento. Para la experimentación, tratar métricas correlacionadas como independientes infla la tasa de falsos positivos — aplique correcciones de Bonferroni o Benjamini-Hochberg. Relacionado: regresión, varianza. Referencia: Coeficiente de correlación de Pearson (Wikipedia).

Frequently asked questions

¿Qué es la correlación?
La correlación (r de Pearson) mide la relación lineal entre dos variables en una escala de −1 a +1. Un valor de +1 indica una relación lineal positiva perfecta, −1 una relación lineal negativa perfecta, y 0 ninguna relación lineal.
¿Cómo se usa la correlación en la práctica?
Un analista financiero descubre que dos acciones tienen una correlación de r = 0,85 — se mueven juntas con fuerza. Añadir la segunda acción a una cartera que contiene la primera ofrece muy poca diversificación; una acción con r = −0,3 proporcionaría mucho más.
¿Cuál es la diferencia entre correlación y causalidad?
La correlación solo mide el comovimiento estadístico, no la causa y efecto. Las ventas de helados y las tasas de ahogamiento están fuertemente correlacionadas porque ambas aumentan en verano; el helado no causa ahogamientos. Establecer causalidad requiere experimentos controlados o métodos de inferencia causal.
¿Cuál es la diferencia entre la correlación de Pearson y la de Spearman?
La r de Pearson mide relaciones lineales y requiere datos continuos aproximadamente normales. La ρ (rho) de Spearman primero clasifica los datos y mide relaciones monótonas, lo que la hace robusta a valores atípicos y adecuada para datos ordinales como calificaciones de encuestas.

Related

Published May 16, 2026 · Last reviewed May 31, 2026