¿QUÉ ES POLARIS VERSIÓN 3.0?
Polaris V3.0  es una Herramienta para la Minería Web de Uso y Estructura y Análisis Estadístico de Tráfico Web desarrollado por estudiantes pertenecientes al Grupo de Investigación GRIAS (Grupo de Investigación Aplicado a Sistemas) dirigido por Ricardo Timaran Pereira Ph. D., del Programa de Ingeniería de Sistemas de la Universidad de de Nariño de la ciudad de Pasto (Nariño – Colombia).

POLARIS VERSIÓN 3.0 por el momento es una herramienta que realiza dos tipos de minería Web y Análisis Estadístico de Tráfico Web: Minería de Uso y Análisis Estadístico de Tráfico Web a partir de archivos logs de acceso de servidores web y Minería de Estructura a partir de un Web Crawler el cual recolecta la información vía Internet para este tipo de minería.

POLARIS VERSIÓN 3.0 contiene en el módulo de Minería de Uso Web una completa variedad de algoritmos de asociación y clasificación, y un algoritmo de minería de uso llamado HPG (Gramática Probabilística de Hipertexto), también tiene siete formatos de visualización que ayuda a entender todo el proceso de minería.

Para el caso del módulo de Minería de Estructura Web posee algoritmos como  HITS y Page Rank, Los cuales son los algoritmos más reconocidos de minería de estructura, además contiene una implementación de un algoritmo, Linker Web, creado por los estudiantes del grupo GRIAS, también permite la visualización del grafo formado por el Web Crawler a través de GraphView, Radia y Domain, ofrece la oportunidad de observar el grafo con el objetivo de que el usuario final interactué con la herramienta, se implemento el algoritmo DIkJSTRA con el objetivo de encontrar la mejor ruta que se debe seguir entre dos páginas Web, esto teniendo en cuenta el cálculo de los tres algoritmos anteriormente mencionados, por ultimo permite visualizar la información procesada en el módulo de minería de estructura.

En cuanto al módulo Análisis Estadístico de Tráfico Web posee diferentes utilidades que permiten realizar analisis estadístico y observar los resultados en diferentes formatos graficos. Las utilidades de analisis estadístico permiten obtener las siguientes estadisticas: Actividad estadística por dìa, por fecha y por hora, estadísticas de archivos, extensiones y tipos de archivos, estdísticas de IPs, estadísticas de codigos de estado HTTP, estadísticas de sistemas operativos, browsers y crawlers, estadísticas de dominios, estadísticas de motores de búsqueda, estadísticas de sitios web referentes y estadísticas de cadenas de búsqueda.

 

REQUERIMIENTOS

Para el correcto funcionamiento de la herramienta se necesita tener instalado el siguiente software:

Postgres 8.4 o superior
La Maquina Virtual de Java jre6 o superior
Componente de Java3D 1.5.0 o superior
Usuario del SGBD Postgres que tenga permiso de creación de base de datos

Como requisito adicional se requiere conexión a Internet, con el objetivo de trabajar con datos en tiempo real para el Módulo Minería de Estructura Web.