Formulario Completo de Estadística Descriptiva y Modelos de Regresión

Clasificado en Matemáticas

Escrito el en español con un tamaño de 6,05 KB

Estadística Descriptiva Unidimensional: Frecuencias y Medidas

Frecuencias

  • Frecuencia Relativa (fi): $f_i = n_i / n$
  • Frecuencia Absoluta Acumulada (Ni): $N_i = \sum n_i$
  • Frecuencia Relativa Acumulada (Fi): $F_i = N_i / n = \sum f_i$

Medidas de Tendencia Central y Posición

Media Aritmética (x̄)

$$ \bar{x} = \sum x_i f_i = \frac{1}{n} \sum x_i n_i $$

Moda (Mo)

Datos no agrupados: Valor con la mayor frecuencia absoluta (ni).

Distribuciones agrupadas (Intervalos de igual amplitud ai): Se elige el intervalo con mayor ni.

$$ M_o = L_{i-1} + a_i \cdot \frac{n_i - n_{i-1}}{(n_i - n_{i-1}) + (n_i - n_{i+1})} $$

Distribuciones agrupadas (Intervalos de distinta amplitud): Se elige el intervalo con mayor densidad (di).

$$ M_o = L_{i-1} + a_i \cdot \frac{d_i - d_{i-1}}{(d_i - d_{i-1}) + (d_i - d_{i+1})} \quad \text{donde} \quad d_i = n_i / a_i $$

Mediana (Me)

Datos no agrupados:

  • Si n es impar: Valor cuya Ni es inmediatamente superior a n/2.
  • Si n es par: $M_e = (x_i + x_{i+1}) / 2$, donde xi y xi+1 son los valores centrales.

Distribuciones agrupadas: Intervalo cuya Ni es inmediatamente superior a n/2.

$$ M_e = L_{i-1} + a_i \cdot \frac{(n/2 - N_{i-1})}{n_i} $$

Percentiles (Pα)

Se define el intervalo al que corresponde la frecuencia acumulada mayor o igual a $\alpha/100 \cdot n$.

$$ P_{\alpha} = L_{i-1} + a_i \cdot \frac{(\alpha/100 \cdot n - N_{i-1})}{n_i} $$

Cuartiles (Ck)

  • C1 (Primer Cuartil): Posición $n/4$.
  • C2 (Segundo Cuartil / Mediana): Posición $n/2$.
  • C3 (Tercer Cuartil): Posición $3n/4$.

Medidas de Dispersión

Rango o Recorrido (Re)

$$ R_e = \text{Max } x_i - \text{Min } x_i $$

Nota: Si son intervalos, se toman los extremos.

Rango Intercuartílico (ReI)

$$ R_{eI} = C_3 - C_1 $$

Varianza Poblacional (σ2x)

$$ \sigma_x^2 = \sum (x_i - \bar{x})^2 f_i = \frac{1}{n} \sum (x_i^2 n_i) - \bar{x}^2 $$

Desviación Típica (σx)

Cuantifica la representatividad de la media.

$$ \sigma_x = +\sqrt{\sigma_x^2} $$

Coeficiente de Variación (CV)

$$ CV = \frac{\sigma_x}{\bar{x}} $$

Varianza Muestral Corregida (Cuasivarianza Sx2)

$$ S_x^2 = \frac{\sum x_i^2}{n-1} - \frac{(\sum x_i)^2}{n(n-1)} $$

Relación con la varianza poblacional: $S_x^2 = \sigma_x^2 \cdot \frac{n}{n-1}$

Estadística Bivariante: Relación y Dependencia

Independencia Estadística

Las variables son estadísticamente independientes si la frecuencia conjunta es igual al producto de las frecuencias marginales dividido por el total:

$$ n_{ij} = \frac{n_i \cdot n_j}{n} $$

Si son independientes, su covarianza es cero ($\sigma_{xy} = 0$).

Covarianza (σxy)

$$ \sigma_{xy} = \frac{1}{n} (\sum\sum x_i y_j n_{ij}) - \bar{x} \bar{y} $$

Medias Condicionadas

  • Media de X condicionada a Y: $$ \bar{x}|y=y_j = \frac{1}{n_j} \sum x_i n_{ij} $$
  • Media de Y condicionada a X: $$ \bar{y}|x=x_i = \frac{1}{n_i} \sum y_j n_{ij} $$

Modelos de Regresión y Correlación

Medidas de Correlación

Coeficiente de Correlación Lineal (r)

$$ r = \frac{\sigma_{xy}}{\sigma_x \sigma_y} = \sqrt{a a'} $$

Coeficiente de Determinación (r2)

Mide la bondad del ajuste.

$$ r^2 = \frac{\sigma_{xy}^2}{\sigma_x^2 \sigma_y^2} = a a' $$

Regresión Lineal

Recta de Regresión Y sobre X (y = a x + b)

  • Pendiente (a): $$ a = \frac{\sigma_{xy}}{\sigma_x^2} $$
  • Ordenada en el origen (b): $$ b = \bar{y} - a \bar{x} $$

Recta de Regresión X sobre Y (x = a' y + b')

  • Pendiente (a'): $$ a' = \frac{\sigma_{xy}}{\sigma_y^2} $$
  • Ordenada en el origen (b'): $$ b' = \bar{x} - a' \bar{y} $$

Modelos de Regresión No Lineal (Linealización)

Regresión Hiperbólica

Modelo: $y = a/x + b$

Transformación: Se define $z = 1/x$. El modelo linealizado es $y = a z + b$.

Parámetro a: $$ a = \frac{\sigma_{zy}}{\sigma_z^2} $$

Regresión Exponencial

Modelo: $y = b \cdot a^x$

Transformación: $\log y = \log b + x \cdot \log a$. Sea $Y' = \log y$, $A = \log a$, $B = \log b$.

Modelo Linealizado: $Y' = A x + B$

  • Pendiente (A): $$ A = \frac{\sigma_{x Y'}}{\sigma_x^2} $$
  • Ordenada (B): $$ B = \bar{Y}' - A \bar{x} $$
  • Correlación (r): $$ r = \frac{\sigma_{x Y'}}{\sigma_x \sigma_{Y'}} $$
  • Parámetros originales: $a = \text{antilog}(A)$; $b = \text{antilog}(B)$

Regresión Potencial

Modelo: $y = b \cdot x^a$

Transformación: $\log y = \log b + a \cdot \log x$. Sea $Y' = \log y$, $X' = \log x$, $B = \log b$.

Modelo Linealizado: $Y' = a X' + B$

  • Pendiente (a): $$ a = \frac{\sigma_{X' Y'}}{\sigma_{X'}^2} $$
  • Ordenada (B): $$ B = \bar{Y}' - a \bar{X}' $$
  • Correlación (r): $$ r = \frac{\sigma_{X' Y'}}{\sigma_{X'} \sigma_{Y'}} $$
  • Parámetro original: $b = \text{antilog}(B)$

Entradas relacionadas: