Minería Web: Estrategias para el Descubrimiento de Información en Internet

Clasificado en Informática

Escrito el en español con un tamaño de 2,73 KB

Web Mining: Conceptos y Aplicaciones

Algunos autores definen a la Web Mining como el uso de técnicas para descubrir y extraer de forma automática información de los documentos y servicios de la Web.

La Web Mining es el proceso de descubrir y examinar información “útil” de los documentos de la Web. Sin embargo, y tomando en cuenta lo expuesto en la introducción, la minería web se puede definir como el descubrimiento y estudio de información relevante que involucra el uso de técnicas y acercamientos basados en la minería de datos (Data Mining) orientados al descubrimiento y extracción automática de información de documentos y servicios de la Web, teniendo en consideración el comportamiento y preferencias del usuario.

Niveles de Recolección de Datos

En la Web Mining, los datos pueden ser coleccionados en diferentes niveles:

  • En el área del servidor.
  • En el lado del cliente (cookies).
  • En los servidores proxys (log files), etc.

El Proceso General de la Web Mining

De acuerdo con Etzioni, el proceso general de la Web Mining es el siguiente:

1. Recuperación de Información (IR)

Nos referimos básicamente al proceso del descubrimiento automático de documentos relevantes de acuerdo a una cierta búsqueda. Documentos relevantes disponibles en la Web tales como:

  • Noticias electrónicas.
  • Newsgroups.
  • Newswires.
  • Contenido de las páginas HTML, etc.

2. Extracción de Información (IE)

Tiene como objetivo transformar los documentos extraídos en el proceso de recuperación de información, en documentos que sean más digeribles, fáciles de leer y de estudiar.

3. Generalización (Generalization)

Consiste en el reconocimiento de patrones generales de una página en particular o bien también patrones de diferentes páginas.

4. Evaluación (Analysis)

Una vez que los patrones han sido identificados, la parte humana juega un papel importante haciendo uso de herramientas adecuadas para entender, visualizar e interpretar los patrones.

Importancia Actual de la Minería Web

La Web Mining ha despertado gran interés en la actualidad, particularmente debido a los avances de la comunidad científica en distintas líneas de investigación relacionadas con Data Mining orientado a la WWW. En los últimos años, esto se ha potenciado fuertemente en virtud del gran aumento en volumen del tráfico, tamaño y complejidad de las fuentes de información disponibles en la Web y el reciente interés en el desarrollo de aplicaciones para el comercio electrónico.

Entradas relacionadas: