Dominio de Estadística Descriptiva y Visualización de Datos en R

Clasificado en Diseño e Ingeniería

Escrito el en español con un tamaño de 5,4 KB

Laboratorio 1: Frecuencias y Visualización Básica

1. Tipos de Construcción

Pregunta: ¿Cuántos tipos de construcción hay en esta base? (Tabla de frecuencias y porcentajes por categorías).

Respuesta 1:
t1 <- table(Tipo_Construcción)
t2 <- round(prop.table(t1) * 100)
tabla <- cbind(t1, t2)
colnames(tabla) <- c("Frecuencia", "Porcentaje")
addmargins(tabla, 1)

2. Gráficos de Porcentajes

Pregunta: Haga un gráfico de los porcentajes de la tabla realizada en el punto anterior (barra y circular).

Respuesta 2:
barplot(t2, main = "% tipos de construcción", col = "green") # Gráfico de barra básico
pie(t2, main = "% tipos de construcción", col = rainbow(5)) # Gráfico básico circular

3. Distribución de Metros Cuadrados

Pregunta: Haga un histograma y un gráfico de caja para la distribución de los mt2 de estas construcciones.

Respuesta 3:
hist(Area_m2, main = "Mt2", col = "lightblue") # Histograma de mt2
boxplot(Area_m2, main = "Mt2", horizontal = TRUE) # Gráfico de caja

4. Distribución Porcentual por Estado de Obra

Pregunta: Calcule la distribución porcentual del tipo de construcción, según cada estado de la obra. Graficar los porcentajes.

Respuesta 4:
t3 <- table(Tipo_Construcción, Estado_Obra)
tab4 <- round(prop.table(t3, 2) * 100) # Porcentajes
addmargins(tab4, 1)

Laboratorio 2b: Relaciones y Resúmenes Numéricos

1. Relación Lineal

Pregunta: ¿Existe una relación de tipo lineal entre mt2 y costo estimado? Realice un gráfico de dispersión.

Respuesta 1:
plot(datos$Area_m2, datos$Costo_Estimado)

2. Resumen Numérico del Costo

Pregunta: Obtenga un resumen numérico del costo estimado, separado por tipo de construcción.

Respuesta 2:
tapply(datos$Costo_Estimado, datos$Tipo_Construcción, summary)

3. Comparativa de Costos

Pregunta: Realice un gráfico de caja del costo estimado, separado por tipo de construcción.

Respuesta 3:
boxplot(datos$Costo_Estimado ~ datos$Tipo_Construcción)

Laboratorio 3: Análisis Específico y Filtrado

1. Proporción de Obras Comerciales

Pregunta: ¿Qué porcentaje de las obras de tipo comercial están a cargo de la constructora ABC?

Respuesta 1:
t1 <- table(Tipo_Construcción, Constructora)
prop.table(t1, 1)

2. Promedio de Metraje

Pregunta: ¿Cuál es el promedio de mt2 de las obras finalizadas?

Respuesta 2.1:
tapply(Area_m2, Estado_Obra, mean)

3. Costo Medio por Comuna

Pregunta: ¿Cuál es el costo medio estimado de los departamentos construidos en la comuna 1?

Respuesta 3.1:
tapply(Costo_Estimado, list(Tipo_Construcción, Comuna), FUN = mean)

4. Detección de Datos Anómalos

Pregunta: ¿Hay datos anómalos en el tiempo de duración en la construcción de departamentos según comuna?

Respuesta 4.1:
otra <- base[Tipo_Construcción == "Departamentos", ]
boxplot(otra$Duración_Meses ~ otra$Comuna)

5. Cuantiles de Metraje

Pregunta: ¿Cuántos mt2 como máximo tienen el 25% de las construcciones de menor metraje?

Respuesta 5:
quantile(Area_m2, 0.25)
summary(Area_m2)

Referencia Rápida de Comandos R

  • install.packages("rio"): Instalar el paquete para manejo de datos.
  • Datos <- rio::import(file.choose()): Importar una base de datos desde el explorador de archivos.
  • table(X): Muestra una tabla de frecuencias.
  • table(X, Y): Muestra una tabla de contingencia con dos variables.
  • plot(datos$X, datos$Y): Genera gráficos de dispersión con dos variables.
  • summary(datos$X): Proporciona un resumen numérico (mínimo, máximo, media, etc.).
  • boxplot(datos$X): Genera un gráfico de caja y bigotes.
  • mean(datos$X): Calcula el promedio dentro de una base de datos.
  • tapply(datos$X, datos$Y, FUN): Toma los datos de X y los separa según las categorías de Y para aplicar una función.
  • (X ~ Y): Expresa la variable X en función de Y, ideal para modelos y boxplot.

Entradas relacionadas: