Fundamentos de Modelos de Regresión Lineal Múltiple y Técnicas de Agrupamiento

Clasificado en Matemáticas

Escrito el en español con un tamaño de 4,09 KB

Revisión de Conceptos Estadísticos Fundamentales

Regresión Lineal Múltiple (RLM)

Requisitos Iniciales

  • Las variables dependientes y las variables independientes deben ser **métricas**.

Pasos para la Interpretación del Modelo RLM

Paso 1) Bondad de Ajuste
  • Se evalúa mediante el **R cuadrado** ($R^2$).
  • El valor debe estar en el rango $0 \le R^2 \le 1$.
  • Cuanto más se acerque a **1**, mejor será el ajuste del modelo a los datos.
Paso 2) Interpretación de los Coeficientes
  • Se examinan los **coeficientes no estandarizados** en la tabla de coeficientes.
  • Se debe comentar la suma de cada número de la columna correspondiente (interpretación del efecto unitario de cada variable independiente sobre la dependiente, manteniendo las otras constantes).
Paso 3) Peso de las Variables en la Ecuación
  • El peso se determina por los coeficientes **beta estandarizados** (tabla de coeficientes beta).
  • Las variables con coeficientes más alejados de cero (tanto positivos como negativos) tienen el **mayor peso** en la formación de la ecuación.
Paso 4) Significancia de los Coeficientes Individuales
  • Se utiliza la tabla de coeficientes en la columna **Sig.** (significación).
  • Para que un coeficiente sea estadísticamente significativo, su valor **debe ser menor que 0,05** ($p < 0,05$).
  • Si $Sig. < 0,05$, las variables $x$ y $u$ son válidas a nivel explicativo. Si $Sig. \ge 0,05$ para una variable (ej. $Z$), esta **podría eliminarse** de la ecuación.
Paso 5) Validez Global del Modelo
  • Se utiliza la prueba **ANOVA** para estudiar la validez global del modelo.
  • ANOVA permite valorar si el modelo calculado es **válido y puede usarse para generalizar** a otros casos a nivel poblacional, independientemente de la significancia de coeficientes individuales.
  • En la tabla ANOVA, el valor de **Sig. (o $p$-valor)** asociado al estadístico $F$ **debe ser menor que 0,05** ($p < 0,05$) para aceptar el modelo como globalmente válido.

Técnicas de Agrupamiento (Cluster)

Objetivo

Agrupar individuos u objetos formando **conglomerados (clusters)** en función de su semejanza, con la condición de que sean **homogéneos internamente** y **heterogéneos entre sí**.

Tipos de Clustering

  • Jerárquicos: Se forman grupos en sucesivas etapas; **no se fija el número de clúster a priori**.
  • No Jerárquicos: **Requieren fijar el número de clúster a priori**, lo que a menudo necesita experiencia previa.

Requisitos para Clusterización

  • Las variables deben ser **métricas**.
  • El número de variables no debe ser muy elevado. Si el número de variables es grande, es conveniente realizar primero un **Análisis de Componentes Principales (ACP)**.

Técnicas Relacionadas

  • **AMN (Análisis de Múltiples Correspondencias)**: Entran dentro de las técnicas de **MDS (Escalamiento Multidimensional)** y permiten posicionar objetos en un espacio reducido.

Análisis Conjunto (AC)

Se utiliza para determinar las preferencias de los consumidores.

  • Los niveles más preferidos son aquellos que tienen **utilidades positivas y mayores**.
  • La información clave se encuentra en la tabla de **utilidades o puntuaciones**.

Modelo Logit (Regresión Logística)

Definición y Finalidad

Es un método multivariable de dependencia que permite construir un modelo explicativo a partir de un conjunto de variables independientes (categóricas o métricas) y una **variable dependiente dicotómica o binaria** (que solo define dos opciones).

  • Su finalidad principal es **pronosticar en términos de probabilidad** la pertenencia de un individuo a uno de los dos grupos definidos por la variable dependiente.
  • Se emplea específicamente cuando la variable dependiente es **cualitativa con dos posibilidades de respuesta**.

Entradas relacionadas: