Fundamentos de Estadística Descriptiva: Conceptos Esenciales y Medidas Clave

Clasificado en Matemáticas

Escrito el en español con un tamaño de 6,81 KB

La Estadística es la ciencia que estudia los métodos de recogida, organización, resumen e interpretación de datos. Se clasifica en diferentes tipos para abordar distintos aspectos del estudio de fenómenos:

  • Estadística Descriptiva: Se centra en la recopilación, organización y presentación de datos para describir sus características principales.
  • Teoría de la Probabilidad: Aborda la modelización y el estudio de fenómenos aleatorios, cuantificando la incertidumbre.
  • Estadística Inferencial: Permite realizar previsiones, tomar decisiones y obtener conclusiones sobre una población a partir de una muestra de datos, utilizando deducciones y modelos probabilísticos.

Etapas del Proceso Estadístico

El estudio estadístico de un fenómeno sigue una serie de fases bien definidas:

  1. Recogida de Datos: Obtención de la información necesaria.
  2. Organización y Presentación de Datos: Estructuración y visualización de los datos para facilitar su comprensión.
  3. Análisis de Datos: Aplicación de métodos estadísticos para extraer patrones y relaciones.
  4. Interpretación de Datos: Extracción de conclusiones significativas a partir de los resultados del análisis.

Distribución de Frecuencias de una Variable

La distribución de frecuencia de una variable (xi) es el conjunto de sus valores junto con sus correspondientes frecuencias (ni, Ni, fi, Fi).

Tipos de Frecuencias

  • Frecuencia Absoluta (ni): Es el número de veces que se repite un valor o conjunto de valores de la variable en el conjunto de datos.
  • Frecuencia Absoluta Acumulada (Ni): Es el número de veces que se repite un valor o conjunto de valores de la variable y cualquier valor menor a este, una vez que los datos han sido ordenados.
  • Frecuencia Relativa (fi): Es la proporción del valor o valores de la variable con respecto al total de observaciones. Se calcula como fi = ni / N (donde N es el total de observaciones).
  • Frecuencia Relativa Acumulada (Fi): Es la proporción acumulada del valor o valores de la variable con respecto al total de observaciones. Se calcula como Fi = Ni / N.

Conceptos Relacionados con Intervalos

  • Amplitud de un Intervalo: Es la distancia existente entre los extremos superior e inferior de un intervalo.
  • Marca de Clase de un Intervalo: Es el punto medio de un intervalo, calculado como la semisuma de sus extremos.
  • Densidad de un Intervalo: Representa la frecuencia correspondiente a cada unidad de la variable dentro de dicho intervalo.

Medidas de Dispersión

Las medidas de dispersión cuantifican la variabilidad de los datos, es decir, cuán extendidos están los valores en una distribución.

Medidas de Dispersión Absolutas

  • Rango o Recorrido: Es la diferencia entre el valor máximo y el valor mínimo de la variable.
  • Recorrido Intercuartílico: Es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), indicando la dispersión del 50% central de los datos.
  • Varianza (s2 o σ2): Es la media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a su media. Una mayor varianza indica una mayor dispersión y, consecuentemente, una menor representatividad de la media.
  • Desviación Típica (s o σ): Es la raíz cuadrada positiva de la varianza.

    Propiedades de la Desviación Típica:

    • Nunca toma valores negativos.
    • No le afectan los cambios de origen (suma o resta de una constante a todos los valores), pero sí los cambios de escala (multiplicación o división por una constante).

Medidas de Dispersión Relativas

Estas medidas permiten comparar la dispersión entre distribuciones con diferentes unidades o magnitudes.

  • Coeficiente de Disparidad: Es el cociente entre el valor máximo y el valor mínimo de la variable.
  • Coeficiente de Variación de Pearson (CV): Es el cociente entre la desviación típica y la media aritmética.

    Propiedades del Coeficiente de Variación de Pearson:

    • Es una medida adimensional, lo que permite comparar la variabilidad de diferentes conjuntos de datos.
    • Es útil para determinar la representatividad de la media.

Medidas de Forma

Las medidas de forma describen la configuración de la distribución de frecuencias, centrándose en dos aspectos principales: la asimetría y la curtosis.

Asimetría

La asimetría indica el grado en que los datos se distribuyen de manera uniforme a ambos lados de la media aritmética.

  • Una distribución es simétrica cuando los valores se distribuyen de forma equitativa a ambos lados de la media.
  • Es asimétrica a la derecha (o positiva) cuando hay una "cola" más larga de valores hacia la derecha, es decir, más valores altos.
  • Es asimétrica a la izquierda (o negativa) cuando hay una "cola" más larga de valores hacia la izquierda, es decir, más valores bajos.

Coeficientes de Asimetría

  • Coeficiente de Asimetría de Pearson: Válido solo para distribuciones campaniformes y unimodales.
  • Coeficiente de Asimetría de Fisher: Válido para cualquier tipo de distribución.

Curtosis

La curtosis mide el grado de apuntamiento o achatamiento de la distribución de frecuencias en su zona central, en comparación con una distribución normal (campana de Gauss). Solo es aplicable a distribuciones campaniformes, unimodales, simétricas o ligeramente asimétricas.

  • Distribución Platicúrtica: Es una distribución menos puntiaguda y más "achatada" que la distribución normal.
  • Distribución Mesocúrtica: Es una distribución con un grado de apuntamiento similar al de la distribución normal (campana de Gauss).
  • Distribución Leptocúrtica: Es una distribución más puntiaguda y con colas más pesadas que la distribución normal.

Entradas relacionadas: