Diferencia entre contenido web, estructura web y minería de uso web

La minería web es una aplicación de la técnica de minería de datos que se utiliza para encontrar patrones de información a partir de los datos web. Web Mining ayuda a mejorar el poder de los motores de búsqueda web al identificar las páginas web y clasificar los documentos web.

Tipos de minería web:

1. Minería de contenido
web: la minería de contenido web se puede utilizar para extraer datos, información y conocimientos útiles del contenido de la página web. La minería de contenido web realiza el escaneo y la minería del texto, las imágenes y el grupo de páginas web de acuerdo con el contenido de la entrada, al mostrar la lista en los motores de búsqueda.

Hay dos enfoques que se utilizan para la minería de contenido web:

  • (i) Enfoque basado en agentes:
    este enfoque involucra sistemas inteligentes. Por lo general, se basa en agentes autónomos, que pueden identificar sitios web que son relevantes.
  • (ii) Enfoque basado en datos: el enfoque basado en
    datos se utiliza para organizar datos semiestructurados presentes en Internet en datos estructurados.

2. Minería de estructuras
web: la minería de estructuras web se puede utilizar para descubrir la estructura de enlaces de los hipervínculos. El propósito de Structure Mining es producir el resumen estructural de sitios web y páginas web similares. Interesado en la estructura de hipervínculos dentro de la web. Este tipo de minería se aplica a nivel de documento ya nivel de hipervínculo. Web Structure Mining juega un papel muy importante en el proceso de minería.

3. Minería de uso
web: la minería de uso web se utiliza para extraer registros de weblog (información de acceso de páginas web). Ayuda a descubrir los patrones de acceso de los usuarios a las páginas web. Hay muchos proyectos de investigación y herramientas disponibles que analizan esos patrones para diferentes propósitos. Existen principalmente cuatro técnicas de minería aplicadas a la minería web, a saber, Minería de reglas de asociación, Patrón secuencial, Agrupación y Clasificación.

Diferencia entre el contenido web, la estructura web y la minería de uso web:

Criterio Contenido web Estructura Web Uso de Internet
VISTA IR VISTA BD
vista de datos
  • no estructurado
  • Estructurado
  • semiestructurado
  • Sitio web como base de datos
  • Estructura de enlace
  • interactividad
Datos principales
  • Documentos de texto
  • Documentos de hipertexto
Documentos de hipertexto Estructura de enlace
  • registros del servidor
  • registros del navegador
Método
  • Aprendizaje automático
  • Estadística (incluyendo PNL)
  • Algoritmo propietario
  • reglas de asociación
Algoritmo propietario
  • Aprendizaje automático
  • Estadístico
  • Reglas de asociación
Representación
  • Bolsa de palabras, términos n-gram
  • Frases, conceptos u ontología
  • Relacional
  • Gráfico etiquetado con bordes
  • Relacional
Grafico
  • Tabla relacional
  • Grafico
Categorías de aplicaciones
  • Categorización
  • Agrupación
  • Encontrar reglas de extracción
  • Encontrar patrones en el texto
  • Encontrar subestructuras frecuentes
  • Detección de esquemas de sitios web
  • Categorización
  • Agrupación
  • Sitio de construcción
  • Adaptación y gestión

Publicación traducida automáticamente

Artículo escrito por sugandha18bcs3001 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *