Estadística Aplicada: Resolución de Problemas de Medidas, Probabilidad y Regresión
Clasificado en Matemáticas
Escrito el en español con un tamaño de 130,49 KB
Ejercicio 1: Medidas Descriptivas para Datos Agrupados
A continuación, se presenta una tabla de distribución de frecuencias con el número de paquetes enviados (X) y su frecuencia (ni):
Paquetes enviados (X) | Frecuencia (ni) |
---|---|
[0, 50) | 8 |
[50, 100) | 15 |
[100, 150) | 12 |
[150, 200) | 5 |
Preguntas:
- Calcula la media del número de paquetes enviados.
- Calcula la varianza muestral. (P.D.: Σ xi2ni = 430000)
- ¿Qué valor de X deja el 50% de las observaciones a la izquierda? (Calcula la mediana)
- El coste total de envíos diarios (en cientos de euros) se estima como Y = 2 + 0.8X. Calcula la media y varianza de Y.
Resolución del Ejercicio 1
Para resolver las preguntas, primero construimos la tabla de frecuencias completa con las marcas de clase (xi), frecuencias acumuladas (Ni), frecuencias relativas (fi), frecuencias relativas acumuladas (Fi), y los productos necesarios para los cálculos:
Li | Li+1 | ci (Amplitud) | xi (Marca de clase) | ni (Frecuencia absoluta) | Ni (Frecuencia acumulada) | fi (Frecuencia relativa) | Fi (Frecuencia relativa acumulada) | xi·ni | xi2·ni |
---|---|---|---|---|---|---|---|---|---|
0 | 50 | 50 | 25 | 8 | 8 | 0.2 | 0.2 | 200 | 5000 |
50 | 100 | 50 | 75 | 15 | 23 | 0.375 | 0.575 | 1125 | 84375 |
100 | 150 | 50 | 125 | 12 | 35 | 0.3 | 0.875 | 1500 | 187500 |
150 | 200 | 50 | 175 | 5 | 40 | 0.125 | 1 | 875 | 153125 |
Sumas totales: Σni = 40, Σxi·ni = 3700, Σxi2·ni = 430000
a) Cálculo de la media del número de paquetes enviados
La media (X̄) se calcula como la suma de los productos de las marcas de clase por sus frecuencias, dividida por el número total de observaciones:
X̄ = Σ(xi·ni) / Σni = 3700 / 40 = 92,5
b) Cálculo de la varianza muestral
La varianza muestral (s2) se calcula utilizando la fórmula:
s2 = [ (Σxi2ni / N) - X̄2 ] * N / (N-1)
s2 = [ (430000 / 40) - 92,52 ] * 40 / 39
s2 = [ 10750 - 8556,25 ] * 40 / 39
s2 = 2193,75 * 40 / 39 = 2250
c) Cálculo del valor de X que deja el 50% de las observaciones a la izquierda (Mediana)
El valor que deja el 50% de las observaciones a la izquierda es la mediana (Me). Primero, encontramos la posición de la mediana: N/2 = 40/2 = 20. La clase mediana es aquella donde la frecuencia acumulada (Ni) supera por primera vez a 20. En este caso, es la clase [50, 100) con Ni = 23.
La fórmula para la mediana en datos agrupados es:
Me = Li + [ (N/2 - Ni-1) / ni ] * ci
Donde:
- Li = Límite inferior de la clase mediana (50)
- N/2 = Posición de la mediana (20)
- Ni-1 = Frecuencia acumulada de la clase anterior a la mediana (8)
- ni = Frecuencia absoluta de la clase mediana (15)
- ci = Amplitud de la clase mediana (50)
Me = 50 + [ (20 - 8) / 15 ] * 50
Me = 50 + [ 12 / 15 ] * 50
Me = 50 + 0,8 * 50 = 50 + 40 = 90
d) Cálculo de la media y varianza de Y = 2 + 0.8X
Para una transformación lineal Y = a + bX, la media y la varianza se calculan como:
- Media de Y (Ȳ) = a + b · X̄
- Varianza de Y (sY2) = b2 · sX2
Aplicando esto a Y = 2 + 0,8X:
- Media de Y = 2 + 0,8 · 92,5 = 76
- Varianza de Y = 0,82 · 2250 = 0,64 · 2250 = 1440
Ejercicio 2: Frecuencias Condicionadas y Medias en Tablas de Contingencia
Se presenta una tabla de contingencia que relaciona el número de viajes mensuales (X) con diferentes clases de edades (Y):
Viajes (por mes) | ≤ 25 | (25, 50] | > 50 |
---|---|---|---|
1 | 5 | 7 | 6 |
2 | 8 | 10 | 5 |
3 | 12 | 9 | 4 |
Preguntas:
- ¿Cuál es la media del número de viajes mensuales? Use 10, 35 y 60 para cada clase de edades.
- Entre las personas mayores de 25 años, ¿Qué porcentaje realizó como máximo 2 viajes?
Resolución del Ejercicio 2
Primero, completamos la tabla de contingencia con las marcas de clase para las edades (Y) y las sumas marginales:
Viajes (X) \ Edad (Y) | 10 | 35 | 60 | Total (nx) |
---|---|---|---|---|
1 | 5 | 7 | 6 | 18 |
2 | 8 | 10 | 5 | 23 |
3 | 12 | 9 | 4 | 25 |
Total (ny) | 25 | 26 | 15 | 66 |
a) Cálculo de la media del número de viajes mensuales
Para calcular la media del número de viajes (X̄), necesitamos la distribución marginal de X. A partir de las frecuencias marginales de X (nx), calculamos la tabla de frecuencias y, a partir de esta, obtenemos la media:
x (Viajes) | nx (Frecuencia) | x·nx |
---|---|---|
1 | 18 | 18 |
2 | 23 | 46 |
3 | 25 | 75 |
Total | 66 | 139 |
X̄ = Σ(x·nx) / Σnx = 139 / 66 ≈ 2,106
b) Porcentaje de personas mayores de 25 años que realizaron como máximo 2 viajes
Se trata de una frecuencia condicionada. La condición es"personas mayores de 25 año", lo que corresponde a las clases de edad (25, 50] y > 50, es decir, las columnas con marcas de clase 35 y 60. El evento es"como máximo 2 viaje", lo que corresponde a las filas X=1 y X=2.
- Casos totales (personas mayores de 25 años): Suma de las frecuencias en las columnas de 35 y 60 años.
Total = (7 + 10 + 9) + (6 + 5 + 4) = 26 + 15 = 41 personas.
Casos favorables (personas mayores de 25 años Y como máximo 2 viajes): Suma de las frecuencias en las intersecciones de las filas X=1 y X=2 con las columnas de 35 y 60 años.Favorable = (7 + 10) + (6 + 5) = 17 + 11 = 28 personas.
Porcentaje = (Casos favorables / Casos totales) * 100Porcentaje = (28 / 41) * 100 ≈ 68,29%
Ejercicio 3: Probabilidad y Variables Aleatorias Discretas
Se presenta la distribución de probabilidad del número de accidentes en una semana:
Número de accidentes (X) | 0 | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|
Probabilidad P(X) | 0.3 | 0.4 | 0.2 | 0.08 | 0.02 |
Preguntas:
- ¿Cuál es la probabilidad de que haya más de 2 accidentes en una semana?
- Halla la media y la varianza de X.
- Define los sucesos A: “como máximo 2 accidentes”, B: “al menos 1 accidente”. Calcula P(A) y P(B).
- Calcula P(A∩B), P(A|B), P(A∪B).
Resolución del Ejercicio 3
a) Probabilidad de que haya más de 2 accidentes en una semana
P(X > 2) = P(X=3) + P(X=4) = 0,08 + 0,02 = 0,10
b) Cálculo de la media y la varianza de X
Construimos la siguiente tabla para facilitar los cálculos de la media y la varianza:
x | P(x) | x·P(x) | x2·P(x) |
---|---|---|---|
0 | 0.3 | 0 | 0 |
1 | 0.4 | 0.4 | 0.4 |
2 | 0.2 | 0.4 | 0.8 |
3 | 0.08 | 0.24 | 0.72 |
4 | 0.02 | 0.08 | 0.32 |
Sumas: Σx·P(x) = 1,12; Σx2·P(x) = 2,24
- Media (E[X]) = Σx·P(x) = 1,12
- Varianza (Var[X]) = Σx2·P(x) - (E[X])2 = 2,24 - 1,122 = 2,24 - 1,2544 = 0,9856
c) Definición de sucesos A y B y cálculo de sus probabilidades
- Suceso A: “como máximo 2 accidentes” (X ≤ 2)
P(A) = P(X=0) + P(X=1) + P(X=2) = 0,3 + 0,4 + 0,2 = 0,9
Suceso B: “al menos 1 accidente” (X ≥ 1)P(B) = P(X=1) + P(X=2) + P(X=3) + P(X=4) = 0,4 + 0,2 + 0,08 + 0,02 = 0,7
d) Cálculo de P(A∩B), P(A|B), P(A∪B)
- P(A∩B): Para que se cumplan A y B a la vez, debe haber al menos 1 accidente y como máximo 2 accidentes. Por lo tanto, X puede ser 1 o 2.
P(A∩B) = P(X=1) + P(X=2) = 0,4 + 0,2 = 0,6
P(A|B): Probabilidad de A dado B.P(A|B) = P(A∩B) / P(B) = 0,6 / 0,7 ≈ 0,8571
P(A∪B): Probabilidad de A unión B.P(A∪B) = P(A) + P(B) - P(A∩B) = 0,9 + 0,7 - 0,6 = 1,0
Ejercicio 4: Correlación y Regresión Lineal Simple
Se presenta una tabla con datos de dos variables, XX (millones) y YY (millones), para diferentes empresas:
Empresa | XX (millones) | YY (millones) |
---|---|---|
A | 2 | 8 |
B | 3 | 9 |
C | 4 | 12 |
D | 5 | 15 |
E | 1 | 5 |
Preguntas:
- Calcula el coeficiente de correlación.
- Determina la recta de regresión.
- Interpreta los coeficientes de regresión.
- Evalúa la bondad del ajuste.
Resolución del Ejercicio 4
Las siguientes imágenes contienen los cálculos detallados para el coeficiente de correlación, la determinación de la recta de regresión, la interpretación de sus coeficientes y la evaluación de la bondad del ajuste.
Ejercicio 5: Índices de Precios y Salarios Reales
Se presenta una tabla con el salario medio anual y el Índice de Precios al Consumo (IPC) para varios años:
Año | Salario medio (€) | IPC |
---|---|---|
2018 | 25000 | 95% |
2019 | 26000 | 98% |
2020 | 27000 | 100% |
2021 | 28000 | 105% |
2022 | 29000 | 110% |
Preguntas:
- ¿Cuál es el año base?
- Convierte los salarios a salarios reales respecto al año 2020.
- Cambia la base del IPC al año 2021.
- Convierte los salarios a salarios reales respecto al año 2021.
Resolución del Ejercicio 5
a) Identificación del año base
El año base es 2020, ya que su IPC es 100.
b) Conversión de salarios a salarios reales respecto al año 2020
Para convertir el salario nominal en salario real respecto a 2020, se utiliza la fórmula:
Salario Real = (Salario Nominal / IPC2020) * 100
Aplicando esta fórmula, obtenemos la siguiente tabla:
Año | Salario medio (€) | IPC2020 | Salario real (€) |
---|---|---|---|
2018 | 25000 | 95 | 26315,789 |
2019 | 26000 | 98 | 26530,612 |
2020 | 27000 | 100 | 27000,000 |
2021 | 28000 | 105 | 26666,667 |
2022 | 29000 | 110 | 26363,636 |
c) Cambio de la base del IPC al año 2021
Para cambiar la base del IPC a 2021, se utiliza la fórmula:
IPC2021 = (IPC2020 / IPC2020 en 2021) * 100
Donde IPC2020 en 2021 es el valor del IPC con base 2020 para el año 2021, que es 105.
Aplicando esta fórmula, obtenemos la siguiente tabla:
Año | IPC2020 | IPC2021 |
---|---|---|
2018 | 95 | 90,476 |
2019 | 98 | 93,333 |
2020 | 100 | 95,238 |
2021 | 105 | 100,000 |
2022 | 110 | 104,762 |
d) Conversión de salarios a salarios reales respecto al año 2021
Para convertir el salario nominal en salario real respecto al año 2021, se deben multiplicar los valores de la columna del salario medio por 100 y luego dividirlos por los valores respectivos de la columna de IPC2021.