Probabilidad y Estadística: Conceptos Clave

Clasificado en Matemáticas

Escrito el en español con un tamaño de 5,19 KB

Sucesos Independientes

Se puede decir que dos sucesos pertenecientes al mismo espacio de probabilidad son independientes si la ocurrencia de uno no afecta a la probabilidad de ocurrencia del otro. Sea (Ω, A, P) el espacio de probabilidad asociado a un experimento aleatorio, siendo A y B dos sucesos de A.

  • Si P(B) > 0 se dice que A es independiente de B si P(A/B) = P(A).
  • Si P(A) > 0 se dice que B es independiente de A si P(B/A) = P(B).

Caracterización

Este teorema caracteriza la noción de independencia, ya que no interviene la probabilidad condicionada (en su formalización), permitiendo definir el concepto para sucesos de probabilidad nula. Sea (Ω, A, P) el espacio de probabilidad asociado a un experimento aleatorio y sean A y B dos sucesos de A. Entonces:

A es independiente de B <-> P(A ∩ B) = P(A) * P(B)

En efecto, si P(B) > 0 y A es independiente de B entonces P(A ∩ B) = P(A/B) * P(B) = P(A) * P(B).

Recíprocamente, supuesto que P(B) > 0, entonces P(A/B) = P(A ∩ B) / P(B) = P(A) * P(B) / P(B) = P(A).

Coeficiente de Determinación

Se nota por R², y se define como la proporción de variabilidad de la variable dependiente que es explicada por la regresión en el ajuste de modelos donde se verifique la descomposición de la varianza, [varianza total (v. variable dependiente) = varianza explicada por la regresión (v. valores ajustados) + varianza residual].

R² = 1 - varianza residual / varianza total

Interpretación

0 ≤ R² ≤ 1:

  • R² = 1 -> correlación perfecta según la función de regresión ajustada (dependencia funcional).
  • R² = 0 -> incorrelación según la función de regresión ajustada.
  • 0 ≤ R² ≤ 1 -> cierto grado de correlación según la función de regresión ajustada (mayor cuanto más se aproxime a 1).

Coeficiente de Determinación Lineal

Se nota por r², y cuantifica la bondad del ajuste, es decir, mide el grado de correlación entre las variables según la recta ajustada en un modelo lineal.

r² = (∑xy)² / (∑x² * ∑y²) = aa'

Interpretación

  • r² = 1 -> correlación lineal perfecta (dependencia funcional lineal).
  • r² = 0 -> incorrelación lineal.
  • 0 < r² < 1 -> cierto grado de correlación lineal tanto más intensa cuanto más cercano a 1.

Coeficiente de Correlación Lineal

Se nota por r, y cuantifica la interdependencia lineal entre las variables, es decir, el grado de asociación lineal junto con el sentido positivo o negativo de variación conjunta de las variables.

r = ∑xy / (√∑x²√∑y²) = √(aa')

Interpretación

-1 ≤ r ≤ 1

  • r = 1: asociación lineal perfecta positiva.
  • r = -1: asociación lineal perfecta negativa.
  • r = 0: asociación nula.
  • 0 < r < 1: cierto grado de asociación lineal positiva.
  • -1 < r < 0: cierto grado de asociación lineal negativa.

Estimación por Intervalos de Confianza

El objetivo es suministrar un intervalo que pueda contener al verdadero valor del parámetro θ con una cierta garantía probabilística (nivel de confianza).

Intervalo de Confianza

El intervalo aleatorio I = [θ₁(X₁,X₂,...Xₙ), θ₂(X₁,X₂,..Xₙ)] es un intervalo de confianza de θ al nivel de confianza (1-α), (0 < α < 1), si la probabilidad de que las variables en el muestreo X₁, X₂, ..., Xₙ tomen valores tales que θ esté comprendido entre ellos es 1-α:

P[θ₁(X₁,X₂,...Xₙ) < θ < θ₂(X₁,X₂,..Xₙ)] = 1-α

Interpretación

Si para todas las posibles muestras de tamaño n se obtienen los intervalos θ, el 100(1-α)% de éstos contendrían a θ y el 100α% no. Por tanto, el nivel de confianza (1-α) representa la proporción de intervalos θ que contendrían al verdadero valor del parámetro θ y sería entonces correcto afirmar que θ se encontraría entre sus límites. El valor α se denomina nivel de error o de significación y representa el riesgo de que el parámetro no esté entre los límites del intervalo.

La precisión de los estimadores depende de (1-α) y la amplitud de los intervalos. Para la disminución de la amplitud del intervalo de confianza:

  • Aumento del tamaño muestral n.
  • Disminuyendo el nivel de confianza (1-α) y por tanto aumentando el nivel de error o de significación (α).

Estimación Puntual

El objetivo es suministrar valores aproximados concretos al parámetro desconocido θ.

Contraste de Hipótesis

Se define como el procedimiento inferencial que debe conducir a determinar una regla para decidir si se rechaza o no H₀ frente a H₁ en base a la información muestral y midiendo el riesgo de la decisión en términos de probabilidad. La decisión de rechazar H₀ o no, se basa en un estadístico de contraste o prueba, cuyos valores para las muestras se llaman valores experimentales. Por tanto, para ciertos valores experimentales la decisión será rechazar H₀ y para otros no.

Entradas relacionadas: