Conceptos Fundamentales de Estadística: Medidas y Probabilidad

Clasificado en Matemáticas

Escrito el en español con un tamaño de 4,85 KB

Conceptos Fundamentales de Estadística Descriptiva y Probabilidad

Este documento explora los conceptos esenciales de la estadística descriptiva y las nociones básicas de probabilidad, fundamentales para el análisis y la interpretación de datos.

Medidas de Tendencia Central

Las medidas de tendencia central son valores que representan el centro de un conjunto de datos. Son útiles para resumir la información de una distribución.

La Media

Es una medida de posición central que se calcula para una variable (discreta o continua). Cuando las distribuciones están agrupadas en intervalos, la media se calcula utilizando la marca de clase.

  • Ventajas: Utiliza todos los valores de la distribución, es fácil de calcular y representa el centro de gravedad de la distribución.
  • Inconvenientes: Es sensible a los valores extremos (outliers).

Media Ponderada

Se tienen N observaciones de una variable X, y a cada una se le asigna un peso. Al valor xᵢ se le asigna un peso wᵢ (i=1, ..., N). La media ponderada se calcula considerando que wᵢ ≥ 0.

La Mediana

Es el valor de la variable que divide la distribución en dos partes iguales: la mitad de los valores están por debajo y la otra mitad por encima. Por tanto, requiere que los datos sean ordenables. Las variables cuantitativas tienen mediana; los atributos (variables cualitativas) solo en algunos casos específicos.

  • Ventajas: Es una medida robusta, ya que no le afectan los valores extremos.

La Moda

Es el valor más repetido en la distribución de frecuencias, es decir, el de mayor frecuencia absoluta (nᵢ) o mayor densidad de frecuencia. Es la única medida de tendencia central que se puede utilizar para atributos (variables cualitativas).

Medidas de Posición No Central

Son aquellos valores de la variable que, una vez ordenados de menor a mayor, dividen la distribución en partes, de manera que cada una contiene el mismo número de frecuencias u observaciones. Son una generalización de la mediana. Por ejemplo:

  • Cuartiles: Son valores que dividen la distribución en 4 partes con igual número de frecuencias u observaciones.
  • Percentiles: Son valores que dividen la distribución en 100 partes con igual número de frecuencias u observaciones.

Medidas de Dispersión

Miden la representatividad de las medidas de posición central. Esto equivale a cuantificar la separación de los valores de la distribución respecto a la medida de posición considerada. A esta separación se la denomina dispersión o variabilidad.

Existen dos tipos principales:

  • Absolutas: Están expresadas en las unidades originales o en transformaciones de las unidades en las que vienen expresadas las distribuciones de frecuencias.
  • Relativas: No vienen expresadas en unidades (son adimensionales). Por tanto, permiten comparar la dispersión de distribuciones de frecuencias expresadas en distintas unidades de medida.

Recorrido (Rango)

La unidad de medida del recorrido (R) es la misma que la de la variable. El recorrido mide el grado de variabilidad de los datos de la muestra: cuanto más grande sea el resultado del recorrido, más dispersos estarán los datos.

Recorrido Intercuartílico (RIQ)

De la fórmula se deduce que la unidad de medida del RIQ es la misma que la de la variable. Cuanto más pequeño sea el resultado del recorrido intercuartílico, menor será la dispersión respecto de la mediana; es decir, los datos estarán menos alejados de la mediana y, por tanto, la mediana será más representativa.

Probabilidad

Es la medida del grado de certeza de que un suceso aleatorio ocurra. Dado un suceso aleatorio, tenemos asociado un espacio muestral (E). Para cualquier suceso A, su probabilidad se define de alguna manera y se expresa como P(A).

Definición Clásica (o de Laplace)

Supone que el espacio muestral (E) es finito y que todos los resultados elementales son equiprobables (tienen la misma probabilidad de ocurrir). Sea n el número de resultados elementales en E. La probabilidad de cualquier suceso A se define como el cociente entre el número de elementos de A y el número total de elementos en E: P(A) = (Número de casos favorables a A) / (Número total de casos posibles).

Definición Frecuentista (o Empírica)

Sea A un suceso de un experimento aleatorio asociado a un espacio muestral E (no necesariamente finito). Se supone que el experimento aleatorio se realiza N veces, y se define n(A) como el número de veces que ocurre el suceso A. La probabilidad de A se aproxima por la frecuencia relativa: P(A) ≈ n(A) / N, cuando N tiende a infinito.

Entradas relacionadas: