La minería web es una aplicación de la técnica de minería de datos que se utiliza para encontrar patrones de información a partir de los datos web. Web Mining ayuda a mejorar el poder de los motores de búsqueda web al identificar las páginas web y clasificar los documentos web.
Tipos de minería web:
1. Minería de contenido
web: la minería de contenido web se puede utilizar para extraer datos, información y conocimientos útiles del contenido de la página web. La minería de contenido web realiza el escaneo y la minería del texto, las imágenes y el grupo de páginas web de acuerdo con el contenido de la entrada, al mostrar la lista en los motores de búsqueda.
Hay dos enfoques que se utilizan para la minería de contenido web:
- (i) Enfoque basado en agentes:
este enfoque involucra sistemas inteligentes. Por lo general, se basa en agentes autónomos, que pueden identificar sitios web que son relevantes. - (ii) Enfoque basado en datos: el enfoque basado en
datos se utiliza para organizar datos semiestructurados presentes en Internet en datos estructurados.
2. Minería de estructuras
web: la minería de estructuras web se puede utilizar para descubrir la estructura de enlaces de los hipervínculos. El propósito de Structure Mining es producir el resumen estructural de sitios web y páginas web similares. Interesado en la estructura de hipervínculos dentro de la web. Este tipo de minería se aplica a nivel de documento ya nivel de hipervínculo. Web Structure Mining juega un papel muy importante en el proceso de minería.
3. Minería de uso
web: la minería de uso web se utiliza para extraer registros de weblog (información de acceso de páginas web). Ayuda a descubrir los patrones de acceso de los usuarios a las páginas web. Hay muchos proyectos de investigación y herramientas disponibles que analizan esos patrones para diferentes propósitos. Existen principalmente cuatro técnicas de minería aplicadas a la minería web, a saber, Minería de reglas de asociación, Patrón secuencial, Agrupación y Clasificación.
Diferencia entre el contenido web, la estructura web y la minería de uso web:
Criterio | Contenido web | Estructura Web | Uso de Internet | |
---|---|---|---|---|
VISTA IR | VISTA BD | |||
vista de datos |
|
|
|
|
Datos principales |
|
Documentos de hipertexto | Estructura de enlace |
|
Método |
|
|
Algoritmo propietario |
|
Representación |
|
|
Grafico |
|
Categorías de aplicaciones |
|
|
|
|
Publicación traducida automáticamente
Artículo escrito por sugandha18bcs3001 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA