Comprendiendo la Regresión y Tablas de Contingencia en Estadística

Clasificado en Matemáticas

Escrito el en español con un tamaño de 2,88 KB

Recta de Regresión

La recta de regresión es aquella a la que más se aproximan los puntos de un diagrama de dispersión.

Recta de Regresión de Y sobre X

Esta recta se define como aquella que minimiza la suma de los cuadrados de las distancias verticales (coordenadas 'Y') de los puntos a la recta.

Estimación de Valores

En ocasiones, es necesario estimar valores que no se encuentran explícitamente en una tabla de datos. Si se requiere predecir un valor de 'Y' basándose en un valor de 'X', se utiliza la recta de regresión de Y sobre X. La precisión de esta estimación mejora significativamente con una correlación más fuerte entre las variables y cuando los puntos a estimar se encuentran dentro del rango de los datos observados.

Recta de Regresión de X sobre Y

Por otro lado, la recta de regresión de X sobre Y se obtiene al minimizar la suma de los cuadrados de las distancias horizontales (coordenadas 'X') de los puntos a la recta.

Relación entre las Dos Rectas de Regresión

  • Si las variables son incorreladas, el ángulo entre ambas rectas de regresión tenderá a ser cercano a 90 grados.
  • En el caso de una relación funcional perfecta entre las variables, ambas rectas de regresión coincidirían.
  • Cuando la correlación es fuerte, las dos rectas de regresión presentarán un ángulo pequeño entre ellas, aunque seguirán siendo distintas.

Tablas de Contingencia

Una tabla de contingencia es una herramienta utilizada para relacionar dos variables cuando su frecuencia absoluta es mayor que 1.

Distribución Marginal

La distribución marginal de una variable se obtiene al considerarla de forma independiente, sumando todas las frecuencias de una misma fila o columna. Esto nos da la distribución de esa variable por sí sola.

Distribución Condicional

La distribución condicionada de una variable, en relación con un valor específico de la otra variable, se observa al aislar la fila o columna correspondiente a dicho valor. Si la condición se aplica a varios valores de la otra variable, se suman las frecuencias de las filas o columnas correspondientes.

Variables Independientes en Tablas de Contingencia

Dos variables se consideran independientes si los valores de una no dependen de los valores de la otra. Matemáticamente, esto ocurre cuando la frecuencia relativa de la distribución condicionada de una variable es igual a su frecuencia relativa marginal.

Correlación en Tablas de Contingencia

Las fórmulas para calcular la correlación en tablas de contingencia son similares a las utilizadas en distribuciones normales, con la adición de la frecuencia absoluta (fi) en los cálculos.

Entradas relacionadas: