Minería de Datos, Limpieza y Sistemas de Información Geográfica (SIG): Fases y Aplicaciones
Clasificado en Informática
Escrito el en español con un tamaño de 2,94 KB
Fases de la Minería de Datos
Las fases de la minería de datos incluyen: Selección, preprocesamiento de datos, Selección de variables, Extracción de conocimiento Interpretación y evaluación.
Data Cleansing
El data cleansing, data scrubbing o limpieza de datos, es el proceso de descubrimiento, corrección o eliminación de datos erróneos de una base de datos. Este proceso permite identificar datos incompletos, incorrectos, inexactos, no pertinentes, etc., y luego substituir, modificar o eliminar estos datos "sucios" ("data duty"). Después de la limpieza, la base de datos podrá ser compatible con otras bases de datos similares en el sistema.
Las inconsistencias descubiertas, modificadas o eliminadas pueden haber sido causadas por: las definiciones de diccionario de datos diferentes de entidades similares, errores de entrada del usuario y corrupción en la transmisión o el almacenaje.
La limpieza de datos se diferencia de la validación de datos ("data validation") en que la validación de datos cumple la función de rechazar los registros erróneos durante la entrada al sistema. El proceso de data cleansing incluye la validación y, además, la corrección de datos, para alcanzar datos de calidad ("Data quality").
Sistemas de Información Geográfica (SIG)
Un Sistema de Información Geográfica (SIG o GIS, en su acrónimo inglés Geographic Information System) es una integración organizada de hardware, software y datos geográficos diseñada para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y gestión geográfica. También puede definirse como un modelo de una parte de la realidad referido a un sistema de coordenadas terrestre y construido para satisfacer unas necesidades concretas de información.
En el sentido más estricto, es cualquier sistema de información capaz de integrar, almacenar, editar, analizar, compartir y mostrar la información geográficamente referenciada. En un sentido más genérico, los SIG son herramientas que permiten a los usuarios crear consultas interactivas, analizar la información espacial, editar datos, mapas y presentar los resultados de todas estas operaciones.
La tecnología de los Sistemas de Información Geográfica puede ser utilizada para investigaciones científicas, la gestión de los recursos, gestión de activos, la arqueología, la evaluación del impacto ambiental, la planificación urbana, la cartografía, la sociología, la geografía histórica, el marketing, la logística, por nombrar unos pocos.