Fundamentos de Estadística Descriptiva: Conceptos Esenciales y Métodos

Clasificado en Matemáticas

Escrito el en español con un tamaño de 7,47 KB

Introducción a la Estadística

La Estadística es el método científico que permite recoger, organizar, resumir y analizar datos para obtener conclusiones válidas basadas en dicho análisis.

Conceptos Fundamentales

  • La Población es el grupo completo de individuos u objetos que constituyen la base de interés para un estudio estadístico. Es el conjunto de todos los elementos que cumplen una determinada característica que deseamos medir y estudiar. Ejemplo: estudiantes de un colegio.

  • La Muestra es una parte representativa de una población. Es todo subconjunto de una población sobre el que se va a realizar el estudio. El número de elementos de la muestra se denomina tamaño de la muestra. Sirve para estimar los resultados que se obtendrían del estudio completo de la población. Ejemplo: 5 alumnos de cada curso.

  • El Individuo (u objeto) es cada uno de los elementos de la población en estadística.

  • La Unidad Estadística es el elemento de la población que reporta la información y sobre el cual se realiza un determinado análisis.

  • Una Variable es una característica susceptible de tomar distintos valores en los elementos de un grupo o conjunto.

Tipos de Variables

Variables Cualitativas

Las Variables Cualitativas son aquellas que definen cualidades o atributos de los individuos; usualmente pueden subdividirse en categorías. Ejemplo: Variable: Sexo. Categorías: M (Masculino), F (Femenino).

Las Variables Indicadoras son valores numéricos que se le asignan a las categorías de una variable cualitativa (también conocidas como variables ficticias o dummy variables).

Variables Cuantitativas

Las Variables Cuantitativas son aquellas cuyos atributos son cuantificables o medibles numéricamente.

Las variables cuantitativas pueden ser Discretas o Continuas:

  • Las Variables Discretas son aquellas que solo pueden tomar valores determinados (asumen valores de uno en uno); es decir, pueden tomar un número finito o bien infinito numerable de valores.

  • Las Variables Continuas son aquellas que pueden asumir cualquier valor dentro de un intervalo, es decir, pueden tomar todos los valores entre dos enteros consecutivos y tan próximos como se quiera.

Ejemplos: Variable Cuantitativa: Número de alumnos de una universidad. Variable Cualitativa: Comida favorita.

Características de una Muestra y Tipos de Muestreo

Características de una Muestra

  • Ubicación Temporal: Se refiere a la fecha en que se realizó el estudio.

  • Ubicación Espacial: Se refiere al lugar donde se realizó el estudio.

  • Representativa: La muestra debe estar formada por un número razonable de elementos que reflejen las características de la población.

  • Aleatoria: Debe ser escogida al azar, de modo que cada elemento de la población tenga la misma oportunidad de ser seleccionado.

Tipos de Muestras Aleatorias

  • Muestra Aleatoria Simple (MAS): Cada posible muestra de la población tiene igual probabilidad de ser seleccionada.

  • Muestra Aleatoria Sistemática: Los elementos son seleccionados de una manera ordenada, por ejemplo, cuando la población se encuentra organizada por algún código.

  • Muestra Aleatoria Estratificada: La selección tiene en cuenta los diferentes grupos o estratos que conforman la población.

  • Muestra Aleatoria por Conglomerados: Se sigue el siguiente procedimiento:

    • Se divide la población en grupos (conglomerados) que sean convenientes para el muestreo.
    • Se selecciona una parte de los grupos al azar o por un método sistemático.
    • Se toman todos los elementos o parte de ellos al azar dentro de los grupos seleccionados.

Organización y Representación de Datos

Tablas de Frecuencia

  • Una Tabla de Frecuencia es un resumen de datos en el cual cada opción de respuesta de la variable se relaciona con el número de datos.

  • La Frecuencia (F) es el número de datos que pertenecen a cada clase.

  • La Frecuencia Relativa (Fr) es la proporción de datos que pertenecen a cada clase respecto al número total de datos.

Cálculo de Intervalos de Clase (para datos agrupados)

Para la construcción de tablas de frecuencia con datos agrupados, se suelen calcular los siguientes parámetros:

  • Rango (R): Es la diferencia entre el valor máximo y el valor mínimo de los datos. Se calcula como: R = Dato Máximo - Dato Mínimo.

  • Número de Clases (k): Es la cantidad de intervalos en los que se agruparán los datos. Se puede estimar con la regla de Sturges (k = 1 + 3.322 * log10(n) donde n es el número de datos), o se puede definir por el investigador.

  • Longitud o Amplitud de Clase (L): Es el tamaño de cada intervalo. Se calcula como: L = R / k (donde k debe ser diferente de 0). A menudo, este valor se redondea al siguiente entero o a un decimal conveniente para facilitar la interpretación.

Gráficos Estadísticos

  • Un Histograma de Frecuencia es la manera más común de representar gráficamente la distribución de frecuencia de datos. Se construye dibujando rectángulos cuya base corresponde a cada intervalo de clase y su altura se ajusta al valor de la frecuencia (puede ser la relativa o la absoluta).

  • Un Polígono de Frecuencia se obtiene uniendo con segmentos de recta los puntos medios (marca de clase) de la parte superior de cada barra de un histograma, o directamente uniendo los puntos correspondientes a la marca de clase y la frecuencia.

  • Una Ojiva se usa para representar la frecuencia acumulada (relativa o absoluta). Se obtiene uniendo con segmentos de recta los puntos correspondientes a los límites superiores de cada clase y sus respectivas frecuencias acumuladas.

  • Un Diagrama Circular (o de pastel) representa la proporción de cada categoría respecto al total. El ángulo de cada sector circular es proporcional al valor de la frecuencia respectiva. Ejemplo: Para una Frecuencia Relativa (Fr) de 0.025, el porcentaje es 0.025 * 100 = 2.5%. El ángulo sería 0.025 * 360° = 9°.

Medidas de Tendencia Central

  • La Media Muestral (o promedio aritmético) es la suma de todos los datos dividida por el número total de datos. Se representa comúnmente con ̄x (equis barra).

  • La Moda (Mo) es el dato que más se repite en un conjunto de datos.

  • La Mediana Muestral (Me) es el valor central en un conjunto de datos ordenados.

Entradas relacionadas: