Dominio de Estadística Descriptiva y Visualización de Datos en R
Clasificado en Diseño e Ingeniería
Escrito el en
español con un tamaño de 5,4 KB
Laboratorio 1: Frecuencias y Visualización Básica
1. Tipos de Construcción
Pregunta: ¿Cuántos tipos de construcción hay en esta base? (Tabla de frecuencias y porcentajes por categorías).
Respuesta 1:
t1 <- table(Tipo_Construcción)
t2 <- round(prop.table(t1) * 100)
tabla <- cbind(t1, t2)
colnames(tabla) <- c("Frecuencia", "Porcentaje")
addmargins(tabla, 1)
2. Gráficos de Porcentajes
Pregunta: Haga un gráfico de los porcentajes de la tabla realizada en el punto anterior (barra y circular).
Respuesta 2:
barplot(t2, main = "% tipos de construcción", col = "green") # Gráfico de barra básico
pie(t2, main = "% tipos de construcción", col = rainbow(5)) # Gráfico básico circular
3. Distribución de Metros Cuadrados
Pregunta: Haga un histograma y un gráfico de caja para la distribución de los mt2 de estas construcciones.
Respuesta 3:
hist(Area_m2, main = "Mt2", col = "lightblue") # Histograma de mt2
boxplot(Area_m2, main = "Mt2", horizontal = TRUE) # Gráfico de caja
4. Distribución Porcentual por Estado de Obra
Pregunta: Calcule la distribución porcentual del tipo de construcción, según cada estado de la obra. Graficar los porcentajes.
Respuesta 4:
t3 <- table(Tipo_Construcción, Estado_Obra)
tab4 <- round(prop.table(t3, 2) * 100) # Porcentajes
addmargins(tab4, 1)
Laboratorio 2b: Relaciones y Resúmenes Numéricos
1. Relación Lineal
Pregunta: ¿Existe una relación de tipo lineal entre mt2 y costo estimado? Realice un gráfico de dispersión.
Respuesta 1:
plot(datos$Area_m2, datos$Costo_Estimado)
2. Resumen Numérico del Costo
Pregunta: Obtenga un resumen numérico del costo estimado, separado por tipo de construcción.
Respuesta 2:
tapply(datos$Costo_Estimado, datos$Tipo_Construcción, summary)
3. Comparativa de Costos
Pregunta: Realice un gráfico de caja del costo estimado, separado por tipo de construcción.
Respuesta 3:
boxplot(datos$Costo_Estimado ~ datos$Tipo_Construcción)
Laboratorio 3: Análisis Específico y Filtrado
1. Proporción de Obras Comerciales
Pregunta: ¿Qué porcentaje de las obras de tipo comercial están a cargo de la constructora ABC?
Respuesta 1:
t1 <- table(Tipo_Construcción, Constructora)
prop.table(t1, 1)
2. Promedio de Metraje
Pregunta: ¿Cuál es el promedio de mt2 de las obras finalizadas?
Respuesta 2.1:
tapply(Area_m2, Estado_Obra, mean)
3. Costo Medio por Comuna
Pregunta: ¿Cuál es el costo medio estimado de los departamentos construidos en la comuna 1?
Respuesta 3.1:
tapply(Costo_Estimado, list(Tipo_Construcción, Comuna), FUN = mean)
4. Detección de Datos Anómalos
Pregunta: ¿Hay datos anómalos en el tiempo de duración en la construcción de departamentos según comuna?
Respuesta 4.1:
otra <- base[Tipo_Construcción == "Departamentos", ]
boxplot(otra$Duración_Meses ~ otra$Comuna)
5. Cuantiles de Metraje
Pregunta: ¿Cuántos mt2 como máximo tienen el 25% de las construcciones de menor metraje?
Respuesta 5:
quantile(Area_m2, 0.25)
summary(Area_m2)
Referencia Rápida de Comandos R
- install.packages("rio"): Instalar el paquete para manejo de datos.
- Datos <- rio::import(file.choose()): Importar una base de datos desde el explorador de archivos.
- table(X): Muestra una tabla de frecuencias.
- table(X, Y): Muestra una tabla de contingencia con dos variables.
- plot(datos$X, datos$Y): Genera gráficos de dispersión con dos variables.
- summary(datos$X): Proporciona un resumen numérico (mínimo, máximo, media, etc.).
- boxplot(datos$X): Genera un gráfico de caja y bigotes.
- mean(datos$X): Calcula el promedio dentro de una base de datos.
- tapply(datos$X, datos$Y, FUN): Toma los datos de X y los separa según las categorías de Y para aplicar una función.
- (X ~ Y): Expresa la variable X en función de Y, ideal para modelos y boxplot.