Conceptos Fundamentales de Estadística: Un Glosario Esencial para Matemáticas

Clasificado en Matemáticas

Escrito el en español con un tamaño de 7,8 KB

Conceptos Fundamentales de Estadística

La Estadística es una rama de las matemáticas que se ocupa del recuento, ordenación y clasificación de los datos obtenidos a partir de observaciones, con el fin de realizar comparaciones y extraer conclusiones significativas.

Proceso Estadístico Básico

  1. Recopilación de datos
  2. Organización y representación de datos
  3. Análisis de datos
  4. Obtención de conclusiones

Ramas de la Estadística

  • Estadística Descriptiva: Proporciona reglas para recolectar, organizar y procesar los datos de una población. Su objetivo principal es describir las características de un conjunto de datos.
  • Estadística Inferencial: Ofrece reglas para analizar los datos, extraer conclusiones y tomar decisiones sobre una población basándose en una muestra.

Elementos Clave en un Estudio Estadístico

Población

La Población es el conjunto de todos los individuos o elementos que poseen información sobre el fenómeno que se investiga.

  • Finita: Una población que puede ser contada en su totalidad.
  • Infinita: Poblaciones tan extensas que son difíciles o imposibles de contar.
  • Real: Grupos de elementos tangibles y existentes.
  • Hipotética: Poblaciones posibles que podrían estudiarse en caso de un acontecimiento imprevisto.

Individuo

Un Individuo es cualquier elemento que aporta información sobre el fenómeno que se investiga dentro de una población.

Muestra

La Muestra es un subconjunto representativo de la población, seleccionado para el estudio.

Muestreo

El Muestreo es el proceso de reunión de datos que se desean estudiar, obtenidos de una proporción reducida y representativa de la población.

Tipos de Muestreo

  • Muestreo Aleatorio: Técnica que ofrece la misma posibilidad a todos los elementos de la población de ser seleccionados, ya que son tomados al azar.
    • Simple: Los elementos se eligen completamente al azar de una lista.
    • Sistemático: El primer elemento se elige al azar, y luego los siguientes se seleccionan en intervalos constantes.
    • Estratificado: La población se divide en partes o estratos (grupos homogéneos) según características establecidas, y luego se eligen aleatoriamente individuos de cada estrato.
    • Conglomerado: La población se divide en grupos heterogéneos (conglomerados), y luego se seleccionan algunos conglomerados completos para el estudio. Estos conglomerados, a su vez, pueden contener grupos homogéneos.
  • Muestreo No Aleatorio o por Selección Intencionada: La elección de los elementos se basa en el conocimiento o juicio del investigador. La representatividad puede ser subjetiva y existe un riesgo de sesgo.

Datos y Variables Estadísticas

Valor

Un Valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico.

Datos

Los Datos son cada uno de los valores que se han obtenido al realizar un estudio estadístico.

  • Datos Agrupados: Datos organizados en intervalos o clases (ej., [1 - 10], [11 - 20]).
  • Datos Sin Agrupar: Datos individuales sin organizar en clases (ej., 3, 5, 5, 6, 6, 6, 7, 7, 7).

Origen de los Datos

  • Datos Internos: Información ya disponible dentro de la organización, recabada con anterioridad (ej., ventas, compras, personal, clientes, proveedores, inventarios, salarios).
  • Datos Externos: Información que se requiere compilar y que proviene de fuentes fuera de la empresa.
    • Primarios: Obtenidos directamente de la fuente original (ej., observación directa, cuestionarios, entrevistas).
    • Secundarios: Obtenidos de fuentes ya existentes (ej., bibliotecas, revistas especializadas, internet, departamentos de estadísticas, periódicos).

Variable

Una Variable es una característica o cualidad de cada sujeto o caso que puede ser medida o clasificada (ej., Variable: “sexo”; Valores: “mujer” y “hombre”).

Tipos de Variables

  • Cuantitativas: Se refieren a características que pueden ser expresadas numéricamente.
    • Discreta: Toma valores enteros (ej., número de hijos, cantidad de exámenes).
    • Continua: Puede tomar cualquier valor dentro de un rango, incluyendo decimales (ej., edad, ingresos, calificación de un examen, kilómetros).
  • Cualitativas: Describen características o cualidades que no pueden ser medidas con números, sino que se clasifican en categorías.
    • Nominales: Categorías sin un orden inherente (ej., color de ojos, estado civil).
    • Ordinales: Categorías con un orden o jerarquía establecida (ej., 1º, 2º, 3º; nivel de satisfacción: bajo, medio, alto).

Cálculos y Representaciones Gráficas

Límites Reales de Clase

Para datos agrupados, los límites reales se utilizan para asegurar la continuidad entre clases:

  • Límite Real Inferior (LRI): Límite inferior del intervalo menos 0.5 (o la mitad de la unidad de medida).
  • Límite Real Superior (LRS): Límite superior del intervalo más 0.5 (o la mitad de la unidad de medida).

Marca de Clase (Xi)

La Marca de Clase (Xi) es el punto medio de cada intervalo de clase, calculado como:

Xi = (Límite Real Inferior + Límite Real Superior) / 2

Frecuencias

  • Frecuencia (f): Cantidad de datos o números que incluye cada clase o categoría.
  • Frecuencia Acumulada (Fa): Suma de las frecuencias de una clase y todas las clases anteriores. El último valor de la frecuencia acumulada debe ser igual al número total de datos (n).
  • Frecuencia Relativa (Fr): Proporción de la frecuencia de una clase respecto al total de datos, generalmente expresada como porcentaje.

Fr = (Frecuencia / n) * 100

Frecuencia Relativa Acumulada (Fra): Suma de las frecuencias relativas de una clase y todas las clases anteriores. El último valor de la frecuencia relativa acumulada debe ser 100%.

Distribuciones de Frecuencia Acumulada

  • "Menor Que" (Less Than): Se refiere a la frecuencia acumulada de valores menores que el límite superior de cada clase.
    • La frecuencia acumulada comienza en cero y aumenta hasta el total de datos (n).
  • "Mayor Que" (Greater Than): Se refiere a la frecuencia acumulada de valores mayores que el límite inferior de cada clase.
    • La frecuencia acumulada comienza en el total de datos (n) y disminuye hasta cero.

Representaciones Gráficas Comunes

  • Histograma: Gráfico de barras adyacentes que representa la distribución de frecuencias de datos agrupados.
    • Eje vertical: Frecuencia
    • Eje horizontal: Intervalos de clase (límites reales)
  • Ojiva: Gráfico lineal que representa la frecuencia acumulada.
    • Eje vertical: Frecuencia acumulada
    • Eje horizontal: Límites reales de clase ("menor que" o "mayor que")

Entradas relacionadas: