Fundamentos Esenciales de Estadística: Conceptos, Variables y Medidas Clave

Clasificado en Matemáticas

Escrito el en español con un tamaño de 6,79 KB

Introducción a la Estadística

La estadística se ocupa de los métodos y procedimientos para recoger, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos, con la finalidad de ayudar en la toma de decisiones.

Clasificación de la Estadística

  • Estadística Descriptiva

    Es la que describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

  • Estadística Inferencial

    Apoyándose en el cálculo de las probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Conceptos Fundamentales en Estadística

  • Población: Conjunto de individuos o elementos que cumplen ciertas propiedades comunes.
  • Individuos o Elementos: Personas u objetos que contienen cierta información que se debe estudiar.
  • Muestra: Subconjunto representativo de una población.
  • Parámetro: Función definida sobre los valores numéricos de características medibles de una población.
  • Población Finita: Se refiere al tamaño de la población. Por ejemplo, el número de personas que llegan al servicio de urgencias en un día.
  • Población Infinita: Por ejemplo, el estudio de un mecanismo aleatorio que describe la secuencia de caras y sellos obtenida en el lanzamiento repetido de una moneda al aire.
  • Características (o Caracteres): Son propiedades, rasgos o cualidades de los elementos de una población. Estas características pueden dividirse en cualitativas y cuantitativas. Las características también pueden denominarse variables.

Tipos de Variables Estadísticas

Al hablar de variable estadística haremos referencia a un símbolo (x, y, a, etc.) que puede tomar cualquier valor de un conjunto determinado, al que llamaremos dominio o rango de la variable. En función del tipo de dominio, las variables se clasificarán como:

  • Variables Cualitativas

    Cuando las modalidades son de tipo nominal o representan alguna cualidad de la población. Por ejemplo, pertenecer a un grupo sanguíneo.

  • Variables Cuasicuantitativas u Ordinales

    Por ejemplo, pertenecer a la modalidad de grados de recuperación (nada, poco, moderado, etc.). También se representan en escalas numéricas, por ejemplo, de 1 a 5, donde 1 es lo más deficiente y 5 es excelente.

  • Variables Cuantitativas o Numéricas

    Dentro de esta variable distinguimos dos tipos:

    • Discreta

      Cuando no admite valores intermedios. Por ejemplo, el número de hijos dentro de una población de familias (número de hijos 1 o 2).

    • Continua

      Cuando admite cualquier valor intermedio. Por ejemplo, el peso de un niño al nacer; los valores obtenidos son números reales.

Organización de Datos: Tablas de Frecuencias

Al considerar una población estadística de "N" individuos, descrita según una característica o una variable, cuyas modalidades, agrupadas en un número determinado de clases, se organizan en una tabla de frecuencias ordenada de menor a mayor.

Conceptos Clave en Tablas de Frecuencias

  • Frecuencia Absoluta Acumulada (F): Es la acumulación de la frecuencia absoluta.
  • Frecuencia Relativa: Es el cociente entre las frecuencias y el número total de observaciones (H).
  • Frecuencia Porcentual: Es la frecuencia relativa multiplicada por 100.

Tablas de Frecuencias para Datos Agrupados

En la ordenación de datos muy numerosos, es usual presentarlos agrupados y ordenados en clases o categorías. Al determinar cuántos elementos pertenecen a cada clase, establecemos la frecuencia de clases.

Para ordenarlos y agruparlos, establecemos los intervalos que se usarán para distribuirlos, determinando el rango de estos datos, el cual se calcula con la diferencia del dato mayor y el dato menor.

De acuerdo con el rango y teniendo en cuenta la cantidad de intervalos en que queramos representar los datos, realizamos el cociente respectivo.

Elementos de las Tablas de Datos Agrupados

  • Tamaño o Amplitud de una Clase: Corresponde a la diferencia entre el límite superior y el límite inferior de cada clase.
  • Marca de Clase: Es el promedio entre los límites de cada intervalo.

Medidas de Tendencia Central

  • Media Aritmética o Promedio: La media aritmética de un conjunto de datos numéricos es el cociente entre la suma de todos los datos y la frecuencia total (N).
  • Moda: La moda de un conjunto de datos numéricos es aquel que tiene mayor frecuencia.
  • Mediana: La mediana de un conjunto de datos numéricos ordenados de forma creciente o decreciente, es el dato que se encuentra en el centro de dicha ordenación o también será la media aritmética de los dos datos centrales. La mediana nos da una mejor información sobre los datos cuando existe un valor atípico que se aleja de los demás y distorsiona la representatividad de la media aritmética.

Medidas de Dispersión

  • Rango: Es la diferencia entre el mayor y el menor de los datos de un conjunto de datos.
  • Varianza: La varianza de un conjunto de datos se define como el cuadrado de la desviación estándar.

Medidas de Posición: Cuartiles, Deciles y Percentiles

  • Cuartiles

    Los cuartiles de una distribución de datos numéricos son los 3 valores que dividen la distribución en 4 partes iguales. Se designan como Q1, Q2 y Q3.

    • Q1: Es el primer cuartil y corresponde al 25% inferior de la muestra.
    • Q2: Es el segundo cuartil y corresponde al 50% inferior de la muestra (coincide con la mediana).
    • Q3: Es el tercer cuartil y corresponde al 75% inferior de la muestra.
  • Deciles

    Son los 9 valores que dividen la serie de datos en 10 partes iguales. Los deciles representan los valores correspondientes al 10%, 20%, 30%, etc., de los datos.

  • Percentiles

    Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

  • Quintiles

    Se refieren a cuando la población se divide en 5 partes iguales. Cada una de ellas se denomina quintil y representa el 20%, 40%, 60% y 80% de los datos.

Entradas relacionadas: