Principios de Estadística Descriptiva: Frecuencias, Gráficos y Medidas de Tendencia Central y Dispersión

Clasificado en Matemáticas

Escrito el en español con un tamaño de 4,54 KB

ESTADÍSTICA DESCRIPTIVA: Conceptos Fundamentales y Representación de Datos

La Estadística Descriptiva es la rama de la estadística que se encarga de recolectar, organizar, resumir y presentar los datos de manera informativa. A continuación, se definen algunos de sus conceptos esenciales:

Definiciones Preliminares

  • Se define Frecuencia Absoluta (denotada comúnmente como fi o ni) de un valor de la característica (si es discreta) o de un intervalo de clase (si es continua) al número de veces que dicho valor se ha repetido en la población o muestra.
  • La Frecuencia Relativa (denotada comúnmente como hi o fr) es la frecuencia absoluta dividida por el número total de individuos de la población o muestra (N). Se expresa como hi = fi / N.

1º Tablas Estadísticas

Una vez realizada una recogida de datos (a veces llamada "encuesta"), es útil reflejar dicha información en una tabla estadística para su organización y visualización. Dentro de las tablas, es común encontrar las frecuencias acumuladas:

  • Se entiende por Frecuencia Absoluta Acumulada (denotada como Fa([x=xi]) o Ni) la suma de las frecuencias absolutas de los valores menores o iguales a xi. Es decir, Fa([x=xi]) = fa([x=x1]) + fa([x=x2]) + ... + fa([x=xi]).
  • La Frecuencia Relativa Acumulada (denotada como Fr([x=xi]) o Hi) es la suma de las frecuencias relativas de los valores menores o iguales a xi. Se define como Fr([x=xi]) = fr([x=x1]) + fr([x=x2]) + ... + fr([x=xi]), o equivalentemente, Fr([x=xi]) = Fa([x=xi]) / N.

2º Gráficos Estadísticos

Es usual exponer partes de la tabla mediante una gráfica para una mayor comprensión del gran público. En estos gráficos, el eje horizontal (eje X) representa los valores de la variable aleatoria (xi).

El eje vertical (eje Y) variará según el tipo de frecuencia que se desee representar:

  • fa: si el gráfico es de frecuencia absoluta.
  • fr o p: si el gráfico es de frecuencia relativa o de probabilidad.
  • %: si el gráfico es de porcentaje.
  • Fa: si el gráfico es de frecuencia absoluta acumulada.
  • Fr: si el gráfico es de frecuencia relativa acumulada.

3º Medidas de Centralización y Dispersión

a) Medidas de Centralización

Las medidas de centralización nos indican alrededor de qué valores se agrupan los datos.

  • Definimos como Esperanza Matemática (también llamada Media o Promedio, denotada comúnmente como E[X] o μ) al siguiente valor de la variable aleatoria:

    Para una variable aleatoria discreta, se calcula como la suma de cada valor de la variable multiplicado por su frecuencia relativa (o probabilidad):

    E[X] = Σ xi ⋅ fr(xi)

    Donde xi son los valores de la variable aleatoria (para variable aleatoria discreta) o las marcas de clase (para variable aleatoria continua).

b) Medidas de Dispersión

Las medidas de dispersión nos informan sobre la variabilidad de los datos.

  • Definimos la Desviación Típica (o Desviación Estándar, denotada universalmente como σ) de la característica al siguiente valor: es la raíz cuadrada de la varianza. Mide la dispersión de los datos alrededor de la media.

σ = √Var(X)

Donde la Varianza (Var(X) o σ2) se define como la esperanza del cuadrado de la desviación de una variable aleatoria respecto a su media: Var(X) = E[(X - μ)2].

Entradas relacionadas: