Correlación y Regresión Lineal: Conceptos Clave y Coeficiente de Pearson
Clasificado en Matemáticas
Escrito el en español con un tamaño de 3,45 KB
Dependencia Funcional y Tipos de Distribuciones
La dependencia funcional se basa en la correlación, que es la relación existente entre dos variables de una distribución bidimensional. Existe una correlación funcional cuando una fórmula matemática o física permite relacionar todos los valores de una distribución. Cuanto más se aproxime esta relación a una línea recta, mejor.
Tipos de Distribuciones
- Relación lineal positiva: Cuando los puntos coinciden exactamente con la recta formada y, a medida que una variable crece, la otra también lo hace.
- Relación lineal negativa: Cuando los puntos coinciden exactamente con la recta y, a medida que una variable crece, la otra decrece.
- Relaciones curvilíneas positivas y negativas: La ecuación de la línea viene dada por y = a + bx + cx2.
Independencia entre Variables
Existen variables para las que no se puede hallar una ecuación y, por tanto, no se puede crear una recta de regresión. Además, si todos los puntos de una variable presentan el mismo valor en su distribución marginal, tampoco existe relación de dependencia.
Covarianza: Medida de Variabilidad Conjunta
La covarianza es una medida que indica la variabilidad conjunta de dos variables cuantitativas. Si se trasladan los ejes *x* e *y* hasta las medias de ambas variables en una recta, se observa lo siguiente:
- Si la recta queda en los cuadrantes 1 y 3, la covarianza será mayor que 0. Esto significa que los valores de *x* e *y* se alejan en el mismo sentido de sus medias (ambas variables crecen o decrecen a la vez).
- Si los valores están en los cuadrantes 2 y 4, la covarianza es menor que 0 y se alejan en sentido contrario (cuando una variable crece, la otra decrece).
- Si están distribuidos uniformemente por todos los cuadrantes, la covarianza es 0, y puede existir o no dependencia funcional (no se puede establecer una relación lineal).
Coeficiente de Correlación Lineal de Pearson
La covarianza, al ser una medida de variabilidad, se ve afectada por las unidades de medida. Para evitar esto, se utiliza el coeficiente de correlación lineal de Pearson, que es una medida de relación entre dos variables que no se ve afectada por el cambio de unidades.
Propiedades del Coeficiente de Pearson
- Adimensional: Carece de unidades de medida.
- Invariante: No se ve afectado por transformaciones lineales si se cambia el origen y la escala de las variables.
- Valores entre -1 y 1: Toma valores entre -1 y 1. Cuanto más se acerca a estos valores, más fuerte es la relación lineal.
- r = 0: No existe relación lineal entre las variables (variables incorrelacionadas o aleatoriamente independientes).
- 0 < r < 1: Correlación positiva y dependencia aleatoria. Cuantos más puntos estén fuera de la línea y más lejos de esta, más se acercará *r* a 0.
- -1 < r < 0: Correlación negativa y más fuerte cuanto más se acerque a -1. Las variables están en dependencia aleatoria.
Regresión Lineal
Las técnicas de regresión son herramientas para modelar y analizar la relación entre variables.