Formulario Completo de Estadística Descriptiva y Modelos de Regresión
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 6,05 KB
Estadística Descriptiva Unidimensional: Frecuencias y Medidas
Frecuencias
- Frecuencia Relativa (fi): $f_i = n_i / n$
- Frecuencia Absoluta Acumulada (Ni): $N_i = \sum n_i$
- Frecuencia Relativa Acumulada (Fi): $F_i = N_i / n = \sum f_i$
Medidas de Tendencia Central y Posición
Media Aritmética (x̄)
$$ \bar{x} = \sum x_i f_i = \frac{1}{n} \sum x_i n_i $$
Moda (Mo)
Datos no agrupados: Valor con la mayor frecuencia absoluta (ni).
Distribuciones agrupadas (Intervalos de igual amplitud ai): Se elige el intervalo con mayor ni.
$$ M_o = L_{i-1} + a_i \cdot \frac{n_i - n_{i-1}}{(n_i - n_{i-1}) + (n_i - n_{i+1})} $$
Distribuciones agrupadas (Intervalos de distinta amplitud): Se elige el intervalo con mayor densidad (di).
$$ M_o = L_{i-1} + a_i \cdot \frac{d_i - d_{i-1}}{(d_i - d_{i-1}) + (d_i - d_{i+1})} \quad \text{donde} \quad d_i = n_i / a_i $$
Mediana (Me)
Datos no agrupados:
- Si n es impar: Valor cuya Ni es inmediatamente superior a n/2.
- Si n es par: $M_e = (x_i + x_{i+1}) / 2$, donde xi y xi+1 son los valores centrales.
Distribuciones agrupadas: Intervalo cuya Ni es inmediatamente superior a n/2.
$$ M_e = L_{i-1} + a_i \cdot \frac{(n/2 - N_{i-1})}{n_i} $$
Percentiles (Pα)
Se define el intervalo al que corresponde la frecuencia acumulada mayor o igual a $\alpha/100 \cdot n$.
$$ P_{\alpha} = L_{i-1} + a_i \cdot \frac{(\alpha/100 \cdot n - N_{i-1})}{n_i} $$
Cuartiles (Ck)
- C1 (Primer Cuartil): Posición $n/4$.
- C2 (Segundo Cuartil / Mediana): Posición $n/2$.
- C3 (Tercer Cuartil): Posición $3n/4$.
Medidas de Dispersión
Rango o Recorrido (Re)
$$ R_e = \text{Max } x_i - \text{Min } x_i $$
Nota: Si son intervalos, se toman los extremos.
Rango Intercuartílico (ReI)
$$ R_{eI} = C_3 - C_1 $$
Varianza Poblacional (σ2x)
$$ \sigma_x^2 = \sum (x_i - \bar{x})^2 f_i = \frac{1}{n} \sum (x_i^2 n_i) - \bar{x}^2 $$
Desviación Típica (σx)
Cuantifica la representatividad de la media.
$$ \sigma_x = +\sqrt{\sigma_x^2} $$
Coeficiente de Variación (CV)
$$ CV = \frac{\sigma_x}{\bar{x}} $$
Varianza Muestral Corregida (Cuasivarianza Sx2)
$$ S_x^2 = \frac{\sum x_i^2}{n-1} - \frac{(\sum x_i)^2}{n(n-1)} $$
Relación con la varianza poblacional: $S_x^2 = \sigma_x^2 \cdot \frac{n}{n-1}$
Estadística Bivariante: Relación y Dependencia
Independencia Estadística
Las variables son estadísticamente independientes si la frecuencia conjunta es igual al producto de las frecuencias marginales dividido por el total:
$$ n_{ij} = \frac{n_i \cdot n_j}{n} $$
Si son independientes, su covarianza es cero ($\sigma_{xy} = 0$).
Covarianza (σxy)
$$ \sigma_{xy} = \frac{1}{n} (\sum\sum x_i y_j n_{ij}) - \bar{x} \bar{y} $$
Medias Condicionadas
- Media de X condicionada a Y: $$ \bar{x}|y=y_j = \frac{1}{n_j} \sum x_i n_{ij} $$
- Media de Y condicionada a X: $$ \bar{y}|x=x_i = \frac{1}{n_i} \sum y_j n_{ij} $$
Modelos de Regresión y Correlación
Medidas de Correlación
Coeficiente de Correlación Lineal (r)
$$ r = \frac{\sigma_{xy}}{\sigma_x \sigma_y} = \sqrt{a a'} $$
Coeficiente de Determinación (r2)
Mide la bondad del ajuste.
$$ r^2 = \frac{\sigma_{xy}^2}{\sigma_x^2 \sigma_y^2} = a a' $$
Regresión Lineal
Recta de Regresión Y sobre X (y = a x + b)
- Pendiente (a): $$ a = \frac{\sigma_{xy}}{\sigma_x^2} $$
- Ordenada en el origen (b): $$ b = \bar{y} - a \bar{x} $$
Recta de Regresión X sobre Y (x = a' y + b')
- Pendiente (a'): $$ a' = \frac{\sigma_{xy}}{\sigma_y^2} $$
- Ordenada en el origen (b'): $$ b' = \bar{x} - a' \bar{y} $$
Modelos de Regresión No Lineal (Linealización)
Regresión Hiperbólica
Modelo: $y = a/x + b$
Transformación: Se define $z = 1/x$. El modelo linealizado es $y = a z + b$.
Parámetro a: $$ a = \frac{\sigma_{zy}}{\sigma_z^2} $$
Regresión Exponencial
Modelo: $y = b \cdot a^x$
Transformación: $\log y = \log b + x \cdot \log a$. Sea $Y' = \log y$, $A = \log a$, $B = \log b$.
Modelo Linealizado: $Y' = A x + B$
- Pendiente (A): $$ A = \frac{\sigma_{x Y'}}{\sigma_x^2} $$
- Ordenada (B): $$ B = \bar{Y}' - A \bar{x} $$
- Correlación (r): $$ r = \frac{\sigma_{x Y'}}{\sigma_x \sigma_{Y'}} $$
- Parámetros originales: $a = \text{antilog}(A)$; $b = \text{antilog}(B)$
Regresión Potencial
Modelo: $y = b \cdot x^a$
Transformación: $\log y = \log b + a \cdot \log x$. Sea $Y' = \log y$, $X' = \log x$, $B = \log b$.
Modelo Linealizado: $Y' = a X' + B$
- Pendiente (a): $$ a = \frac{\sigma_{X' Y'}}{\sigma_{X'}^2} $$
- Ordenada (B): $$ B = \bar{Y}' - a \bar{X}' $$
- Correlación (r): $$ r = \frac{\sigma_{X' Y'}}{\sigma_{X'} \sigma_{Y'}} $$
- Parámetro original: $b = \text{antilog}(B)$