Estadística Descriptiva: Conceptos Esenciales y Medidas Fundamentales

Clasificado en Matemáticas

Escrito el en español con un tamaño de 5,22 KB

Estadística Descriptiva e Inductiva

La estadística se divide principalmente en dos ramas:

Estadística Descriptiva

Trata del recuento, ordenación y clasificación de los datos obtenidos en las observaciones. Se construyen tablas y representaciones gráficas que permiten simplificar la complejidad de los datos. Se limita a realizar deducciones de los datos obtenidos y de los parámetros calculados.

Estadística Inductiva

Se plantea y resuelve el problema de establecer previsiones y conclusiones generales de una población a partir de los datos obtenidos de una muestra. Utiliza datos obtenidos de la descriptiva y se apoya fuertemente en el cálculo de probabilidades.

Características Estadísticas

Propiedad que nos permite clasificar a los individuos de una población. Hay dos tipos:

  • Cualitativo: No se puede medir, origina modalidades.
  • Cuantitativo: Se puede medir y origina variables estadísticas.

Variables Discretas y Continuas

  • Discretas: Cuando pueden tomar un número finito de valores o un número infinito numerable.
  • Continuas: Son aquellas que pueden tomar, al menos teóricamente, todos los valores posibles dentro de un cierto intervalo de la recta real.

Tipos de Frecuencias

  • Frecuencia Absoluta: Número de veces que se repite un determinado valor de la variable.
  • Frecuencia Absoluta Acumulada: La suma de las frecuencias absolutas de todos los valores anteriores a un determinado valor de la variable, más lo que le corresponda a dicho valor.
  • Frecuencia Relativa: Cociente entre la frecuencia absoluta de un determinado valor de la variable y el total de datos.
  • Frecuencia Relativa Acumulada: Cociente entre la frecuencia absoluta acumulada y el total de datos.

Tratamiento de la Información Estadística

El proceso de tratamiento de la información estadística incluye los siguientes pasos:

  1. Recogida de datos.
  2. Ordenación de datos en orden creciente.
  3. Recuento de frecuencias.
  4. Agrupación de los datos: En el caso de que la variable sea continua o discreta con un número de datos muy grande, es aconsejable agrupar los datos en clases (intervalos).

Parámetros Estadísticos

Permiten resumir y sintetizar un gran número de datos en unos pocos valores que proporcionan una idea lo más aproximada posible de toda la distribución.

Parámetros de Centralización

Tienden a situarse hacia el centro del conjunto de datos ordenados.

  • Media Aritmética: Suma de todos los valores de dicha variable dividido por el número total de valores.
  • Moda: Es el valor de la variable que presenta mayor frecuencia absoluta; no tiene por qué ser única, pudiendo ser una distribución bimodal, trimodal, etc.
  • Mediana: Valor de la variable que deja el mismo número de observaciones mayores y menores que él.
  • Cuartiles: Tres valores de la variable que dividen el total de datos en cuatro partes iguales.
  • Deciles: Son nueve valores de la variable que dividen el total de datos en diez partes iguales.
  • Quintiles: Cuatro valores de la variable que dividen el valor de la variable en cinco partes iguales.
  • Percentiles: Son noventa y nueve valores de la variable que dividen el valor de la variable en cien partes iguales.

Parámetros de Dispersión

El estudio de una distribución queda incompleto si solo se estudian las medidas de centralización, ya que es imprescindible conocer si los datos numéricos están agrupados o no en torno a los valores centrales. A los parámetros que miden las desviaciones respecto de la media se les llama medidas de dispersión.

  • Rango: Diferencia entre el menor y el mayor valor de la variable.
  • Varianza: Es la media aritmética de los cuadrados de las desviaciones respecto a la media.
  • Diagrama de Cajas y Bigotes (Box Plot):
    • Caja: Abarca el intervalo formado por el cuartil 1 y el cuartil 3; se señala en ella el valor de la mediana.
    • Bigotes: Se trazan hasta abarcar la totalidad de los datos con la condición de que cada lado no se alargue más de una vez y media la longitud de la caja.

Teorema de Chebyshev

Se aplica cuando las distribuciones tienen que ser unimodales y simétricas o ligeramente asimétricas.

Desviación Típica

Raíz cuadrada positiva de la varianza.

Propiedades de la Varianza y la Desviación Típica

  1. Ambas dependen de todos los valores de la distribución y de la media.
  2. En los casos en los que no se puede calcular la media, tampoco se pueden calcular la varianza y la desviación típica.
  3. La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos; en cambio, la desviación típica sí, y por eso es más utilizada.

Entradas relacionadas: