Análisis de Regresión Múltiple: Diseño y Consideraciones
Clasificado en Otras materias
Escrito el en español con un tamaño de 3,4 KB
Análisis de Regresión Múltiple
I. Objetivos
Como de costumbre, la primera fase consiste en determinar con la mayor precisión cuáles son los objetivos específicos que se persiguen en el estudio.
En el ejemplo, un estudio sobre la difusión de los medios de comunicación está interesado en descubrir qué conjunto de variables puede explicar la difusión de la prensa diaria en las diferentes provincias. En concreto, se trata de alcanzar dos objetivos:
- Establecer qué conjunto de variables puede ofrecer una explicación suficiente del índice de difusión de la prensa diaria.
- Determinar con qué precisión se puede predecir el índice de difusión de la prensa diaria a partir de las puntuaciones en el conjunto de variables.
Para ello, es preciso realizar un análisis de regresión múltiple que utilice como variables pronosticadoras un conjunto de variables socioeconómicas.
II. Diseño
La fase de diseño en el análisis de regresión múltiple incluye algunas tareas particulares:
- Asegurar la potencia estadística y la generalización del análisis de regresión mediante el adecuado tamaño de la muestra.
- Determinar cuál será la variable criterio y las variables pronosticadoras que se utilizarán.
- Realizar las transformaciones oportunas en las variables.
Tamaño de la muestra
El tamaño de la muestra afecta en particular a la potencia estadística de las pruebas de significación y a la generalización de los resultados. Con muestras muy pequeñas (20 o menos casos) solo las correlaciones muy fuertes presentarán un adecuado nivel de significación (<0,05).
Muestras muy grandes (más de 1000 casos) convierten en muy sensibles las pruebas de significación, con lo que casi cualquier relación sería significativa.
Una regla general es que la razón nunca debe estar por debajo de 5; esto es, debería haber como mínimo 5 casos para cada variable pronosticadora en la varianza. Si se alcanza una razón de entre 15 y 20 casos por cada variable pronosticadora, los resultados deberían ser generalizables si la muestra es representativa.
Selección de Variables
En la regresión, tanto la variable criterio como las pronosticadoras deben ser métricas.
El mayor problema es el error de especificación: la inclusión de variables pronosticadoras irrelevantes o la omisión de variables relevantes.
La inclusión de variables irrelevantes no sesga los resultados, pero tiene algún impacto sobre ellos.
Transformación de las variables
La relación básica que se representa en la regresión múltiple es la asociación lineal entre la variable criterio y las variables pronosticadoras.
Si las relaciones entre las variables no son lineales o se quieren incluir variables pronosticadoras no métricas, el análisis de regresión no es la técnica adecuada.
En estas situaciones, deben crearse nuevas variables mediante transformaciones, para sustituirlas por otras métricas que representen relaciones lineales.
Cuando las variables pronosticadoras no son métricas, se usa un conjunto de variables dicotómicas, conocidas como variables ficticias, que actúan como variables pronosticadoras de reemplazo.
Una variable ficticia es una variable dicotómica que representa una categoría de una variable pronosticadora que no sea métrica.