Conceptos Fundamentales de Distribución de Frecuencias y Representación Gráfica

Clasificado en Matemáticas

Escrito el en español con un tamaño de 3,69 KB

Distribución de Frecuencias: Agrupación y Resumen de Datos

La distribución de frecuencias consiste en la agrupación de los datos observados en grupos o clases. El objeto de la agrupación es resumir la información para presentarla de forma tabular. Es importante considerar que la cantidad ideal de grupos o clases no debe ser menor de 5 ni mayor de 15, lo cual dependerá de la cantidad de datos y su amplitud.

Determinación del Número de Clases (K)

Para determinar el número de clases, se puede utilizar la conocida Fórmula de Sturges:

$$K = 1 + 3.3 \cdot \log(N)$$

Alternativamente, se puede utilizar otro método, el cual es válido si $N < 100$.

Este valor de $K$ sirve de base para el cálculo de la amplitud de cada clase o tamaño del intervalo, dividiéndolo entre el rango de los datos (el valor mayor menos el valor menor).

Medidas Derivadas de la Distribución

Se definen varios conceptos clave a partir de la agrupación de datos:

Frecuencia Acumulada

La frecuencia acumulada permite obtener la distribución acumulada de las frecuencias. Su finalidad es señalar el número de casos que son menores o iguales a un determinado valor.

  • Para obtener la frecuencia acumulada, se suman las frecuencias absolutas de las clases.
  • En la primera clase, se tiene la frecuencia absoluta correspondiente.
  • En la última clase, se obtiene el total de datos o la suma de frecuencias absolutas.

Frecuencia Relativa

La frecuencia relativa permite representar la frecuencia absoluta de manera relativa. Se obtiene dividiendo la frecuencia de cada clase entre la sumatoria de frecuencias. Al multiplicarla por 100, se obtiene en términos porcentuales.

Punto Medio o Marca de Clase

Debido a que al agrupar los datos en las diferentes clases no es posible reconocer qué valores exactos se tienen dentro de ellas (solo se supone una distribución uniforme de los datos registrados), determinar el punto medio ayuda a tener una representación de cada clase dentro de la distribución. Se determina de la siguiente forma:

$$\text{Punto Medio} = \frac{\text{Límite Inferior} + \text{Límite Superior}}{2}$$

Gráficas de una Distribución de Frecuencias

La representación gráfica es esencial para interpretar la distribución:

Histograma

El histograma es un diagrama de área. Se supone que en cada rectángulo la superficie es igual a la frecuencia de la clase, correspondiente al producto de una base unitaria (el intervalo de la clase) por la frecuencia de la clase. El área total bajo el histograma es igual al total de observaciones.

Polígono de Frecuencias

El polígono de frecuencias se construye utilizando los puntos medios de clase sobre el histograma, uniéndolos con segmentos de recta. Se debe agregar media clase antes de la primera y media clase después de la última, ambas con frecuencia cero.

Curva de Frecuencias

La curva de frecuencias se traza sobre el histograma a mano alzada y permite observar la tendencia de la distribución. Es más útil cuando se tiene un número muy grande de datos y el intervalo de clase puede ser más pequeño.

Ojiva

La ojiva se utiliza específicamente para representar la distribución de frecuencias acumulada.

Entradas relacionadas: