EJEMPLO PARA EL MÓDULO DE ANÁLISIS ESTADÍSTICO DE TRÁFICO WEB (WEB STATISTICS)
Una vez abierta la aplicación, se debe seleccionar la pestaña WEB STATISTICS, para acceder al módulo de análisis estadístico de tráfico web. Se debe tener en cuenta que debe empezar con un nodo WEB DATA SOURCE, por tanto, ninguna otro nodo pede ejecutarse hasta que un elemento de este tipo sea arrastrado al área de trabajo.
ARRASTRAR UN WEB DATA SOURCE
Seleccionamos el elemento Web Server y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo), la pantalla se verá de la siguiente manera:
ABRIR UN ARCHIVO LOG
Lo primero que debemos hacer es dar clic derecho en el nodo Web Server, y seleccionar la opción Open File entonces aparecerá una ventana que permite seleccionar el archivo log del satema de archivos:
Para este ejemplo se tomara como archivo de prueba el log ext120511.log, el cual registra los accesos realezados al sitio http://vipri.udenar.edu.co.
Una vez seleccionado el archivo log, se abrirá una ventana dode se debe ingresar la url del dominio al cual pertenece el archivo log (esto es util para visualizar en linea los archivos solicitados):
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado.
EJECUTAR WEB SERVER
Una vez seleccionado el archivo log (necesario para ejecutar el nodo) se hace clic derecho en el nodo y se selecciona la opción Run. Se visualizará una barra de porgreso que donde se observar el proceso de carga del archivo log. Si todo salio bien se observará la siguiente ventana:
Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
UTILIZACIÓN UN NODO FILTER
EL nodo Filter permite eliminar registros que puedan entorpecer el analisis de al archivo log cargado. Primero se debe arrastrar al área de trabajo un nodo Filter de la categoría Preproces. Una nodo Session solo puede conectarse a un nodo Web Server, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Web Server.
Para ejecutar el nodo Filter se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se podra realizar el proceso de filtrado de registros:
En la secció Table de la ventana Filter se observa la totalidad de request del archivo log cargado. En la sección Find se tiene un campo de texto donde se podrá ingresar todo o parte del nombre del archivo que se desea eliminar. Al hacer click en Find, el resultado de la busqueda sera almacenado en la tabla inferior, estos registros pueden ser eliminados de la base de datos al hacer click en el boton Delete Lines.
Al realizar doble click sobre unos de los items de la columna request, el archivo solicitado se visualiza en el navegadoe web predeterminado en el sistema.
UTILIZACIÓN UN NODO SESSION
Primero se debe arrastrar al área de trabajo un nodo session de la categoría Preproces. Una nodo Session solo puede conectarse a un nodo Web Server, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Web Server.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el tipo de sessiones que se utilizara: Sessiones por timeout donde se realiza un proceso de sesionalización donde se identifica sesiones basandose en un tiempo muerto de 30 minutos; Sessiones por intervalos donde cada sesión debera durar un rango de tiempo determinado.
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las sesiones de usuario generadas:
UTILIZACIÓN UN NODO SUMMARY
Primero se debe arrastrar al área de trabajo un nodo Summary de la categoría General Statistics. Una nodo Session solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El nodo Summary no necesita ser configurado, po lo que el siguiente paso es ejecutar el nodo. Para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrirá una ventana donde se observa el resultado de las estadisticas generales:
UTILIZACIÓN NODOS ACTIVITY STATISTICS
En la categoría Activity Statistics se encuaentran los nodos Activity Statistics by Date, Activity Statistics by Day y Activity Statistics by Hour, los cuales se configuran y ejecutan de igual forma. Para utilizar un nodo de tipo Activity Statistics, primero se debe arrastrar al área de trabajo un nodo Activity Statistics by Date, Activity Statistics by Day y/o Activity Statistics by Hour de la categoría Activity Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Page Views, Visitors o Data Transfer.
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Activity Statistics.
Se debe configurar el nodo Chart para seleccionar el tipo de gráfico que se desea generar, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el tipo de gráfico: Bar Chart o Line Chart.
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormete se abrirá una ventana donde se visualiza las estadísticas generadas por el nodo tipo Activity Statistics.
UTILIZACIÓN DE UN NODO ACCESS STATISTICS
Para utilizar un nodo Access Statistics, primero se debe arrastrar al área de trabajo un nodo Acces Statistics de la categoría Access Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Access Statistics.
Los nodos Chart y Table conectados a un nodo Access Statistics no nesesitan ser configurados.
Para ejecutar el nodo Chart se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Access Statistics:
La
La ventana anterior permite generar graficos de forma interactiva y acceder desde un navegador web al archivo solicitado: al hacer doble click sobre uno de los items de la lista "Extension File" (enmarcada en rojo), se crea un grafico y una lista (enmarcada en azul) con los archivos que tengan la extensión seleccionada. Al hacer doble click en uno de los items de la lista "File Name" (enmarcada en azul), se creara una lista (enmarcada en verde) con la URL del archivo solicitado. Al realizar doble click sobre la URL, esta se visualiza en el navegadoe web predeterminado en el sistema.
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Access Statistics:
Al realizar doble click sobre unos de los items de la columna request, el archivo solicitado se visualiza en el navegadoe web predeterminado en el sistema.
UTILIZACIÓN DE UN NODO FILE TYPE
Para utilizar un nodo File Type, primero se debe arrastrar al área de trabajo un nodo File Type de la categoría Access Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer.
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Access Statistics.
El nodo Chart conectado a un nodo File Type no nesesitan ser configurado.
Para ejecutar el nodo Chart se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo File Type:
UTILIZACIÓN DE UN NODO USER AGENTS TYPES
Para utilizar un nodo User Agents Types, primero se debe arrastrar al área de trabajo un nodo User Agents Types de la categoría User Agents Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrira una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo User Agents Types.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo User Agents Types:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo User Agents Types:
UTILIZACIÓN DE UN NODO OPERATING SYSTEMS
Para utilizar un nodo Operating Systems, primero se debe arrastrar al área de trabajo un nodo Operating Systems de la categoría User Agents Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Operating Systems.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Operating Systems:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Operating Systems:
UTILIZACIÓN DE UN NODO BROWSERS
Para utilizar un nodo Browsers, primero se debe arrastrar al área de trabajo un nodo Browsers de la categoría User Agents Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Browsers.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Browsers:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Browsers:
UTILIZACIÓN DE UN NODO CRAWLERS
Para utilizar un nodo Crawlers primero se debe arrastrar al área de trabajo un nodo Crawlers de la categoría User Agents Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Crawlers.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Crawlers:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Crawlers:
Si se hace doble click sobre uno de los items de la columna CRAWLERS, se abrirá una pagina web que contiene la ifnformación sobre el robot, crawler o spider seleccionado. Por ejemplo si se hace doble click sobre Googlebot, se observará la siguiente información:
UTILIZACIÓN DE UN NODO DOMAINS
Para utilizar un nodo Domains primero se debe arrastrar al área de trabajo un nodo Domains de la categoría Referrer Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Domains.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Domains:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Domains:
UTILIZACIÓN DE UN NODO SEARCH ENGINES
Para utilizar un nodo Search Engines primero se debe arrastrar al área de trabajo un nodo Search Engines de la categoría Referrer Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Search Engines.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Search Engines:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Search Engines:
UTILIZACIÓN DE UN NODO SEARCH WORDS
Para utilizar un nodo Search Words primero se debe arrastrar al área de trabajo un nodo Search Words de la categoría Referrer Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Search Words.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Search Words:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Search Words:
UTILIZACIÓN DE UN NODO REFERRING SITES
Para utilizar un nodo Referring Sites primero se debe arrastrar al área de trabajo un nodo Referring Sites de la categoría Referrer Statistics. Una nodo de este tipo solo puede conectarse a un nodo Session, para realizar la conexión se hace click derecho sobre el nodo, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Session.
El siguiente paso es la configuración del nodo, para esto se hace click derecho sobre el nodo y se selecciona el item Settings, esto abrirá una ventana donde se debe seleccionar el parametro de medición que se utilizará para generar las estadisticas de este nodo: Hits, Visitors o Data Transfer. Tambien se debe seleccionar los tipos de archivo que se desa analizar:
Al hacer click en aceptar el nodo cambiará a color amarillo, lo que indica que el nodo esta configurado y listo para ser ejecutado. Una ves el nodo este configurado, para ejecutarlo se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente.
Para visualizar las estadisticas generadas en este nodo, se debe realizar una conexon desde un nodo Chart o Table de la catgoría VIEWS. Para realizar la conexión se hace click derecho sobre el nodo Chart o Table, se selecciona el item Add Connection y se arrastra la conexión hasta el nodo Referring Sites.
Para ejecutar el nodo Chart, este debe ser configurado para seleccionar el tipo de gráfico que se desea generar, posteriormente se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza un gráfico de las estadisticas generadas por el nodo Referring Sites:
Para ejecutar el nodo Table se hace click derecho sobre el nodo y se selecciona el item Run. Al terminar la ejecución el nodo cambiará a color verde, esto indica que el nodo se ejecuto correctamente. Posteriormente se abrira una ventana donde se visualiza una tabla con las estadisticas generadas por el nodo Referring Sites:
EJEMPLO PARA EL MÓDULO DE MINERÍA DE USO WEB (WEB USAGE MINING)
Una vez abierta la aplicación, un nuevo proyecto es abierto automáticamente, por tanto podemos realizar un algoritmo de minería de uso. Para armar el algoritmo se debe tener en cuenta que este siempre empieza por un WEB DATA SOURCE, por tanto, ninguna otra herramienta se habilita hasta que un elemento de este sea arrastrado al área de trabajo.
ARRASTRAR UN WEB DATA SOURCE
Seleccionamos el elemento Web Server y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo), la pantalla se vera de la siguiente manera:
Una vez arrastrado el Web Server ya podemos arrastrar cualquier otra herramienta.
Existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo
Se puede armar el algoritmo de uso y luego hacer la ejecución de los nodos en su totalidad
CONFIGURAR UN WEB SERVER
Lo primero que debemos hacer es dar clic derecho en el nodo Web Server, y seleccionar la opción Settings entonces aparecerá una pequeña ventana:
Hay dos opciones de configuración:
Extensions
Se establece las extensiones validas para realizar el análisis.
En la lista izquierda se encuentra el listado de posibles extensiones y en la lista derecha se encuentran las extensiones validas para el análisis, esta última lista se arma seleccionando una extensión de la lista izquierda y presionando el botón (>) – en la imagen de color azul – o simplemente dándole doble clic, de la misma manera se puede retirar de la lista derecha seleccionando la extensión y presionando el botón (<) o dándole doble clic así vuelve la extensión a la lista izquierda.
Para este ejemplo, tomamos como extensiones validas: HTML, HTM.
Open Source
Se escoge el archivo web server log que se va a analizar. Estos archivos tienen en su mayoría extensión .log, la ventana que aparece es:
Para este ejemplo vamos a tomar el log de prueba: documentolog.log
El nodo ha cambiado de estado porque ya ha sido configurado.
EJECUTAR WEB SERVER
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
SOURCE NODE EXECUTED: (Tipo Log) – (Cantidad de registros) records are saved…
Para el ejemplo,
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR DE PREPROCESS UNA SESION Y CONECTAR A WEB SERVER
Seleccionamos para el ejemplo, el elemento Inter.Session y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el Inter.Session, existen dos opciones para hacer en el momento:
CONFIGURAR UN NODO SESION
Lo primero que debemos hacer es dar clic derecho en el nodo Inter.Session, y seleccionar la opción Settings entonces aparecerá una pequeña ventana:
Hay dos opciones de configuración:
Minutes range, es decir, Rango en minutos. Se escoge el intervalo en minutos de la sesión, este puede ser (10, 20, 30, 40, 50, 60 minutos) como predeterminado esta el rango de 30 minutos (esto porque es el periodo de intervalo estándar)
Is MFR. Se habilita o deshabilita esta opción, que se encarga de decir si se realizan transacciones con Maximal Foware Reference, esto en caso de ser un log extendido.
Para este caso tomamos los valores por defecto (30 minutos como rango y deshabilitado IsMFR) y Aceptamos.
EJECUTAR UN NODO SESION
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
INTERVAL NODE EXECUTED: (Cantidad de sesiones) (Tipo Sesion) sessions are saved…
Para el ejemplo,
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)ARRASTRAR UN NODO DE ASSOCIATION RULES Y CONECTAR A INTER.SESSION
Seleccionamos para el ejemplo, el elemento Apriori y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el Apriori, existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo.
Se puede hacer la conexión con el Inter.Session
Para el ejemplo, vamos a conectar Apriori con Inter.Session: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Inter.Session.
La pantalla ahora se vera de la siguiente manera:
CONFIGURAR UN NODO ASSOCIATION RULES
Lo primero que debemos hacer es dar clic derecho en el nodo Apriori, y seleccionar la opción Settings entonces aparecerá una pequeña ventana:
Hay tres opciones de configuración:
Support, Soporte. Es el porcentaje de soporte para la creación de los ítems frecuentes.
Confidence, Confianza. Es el porcentaje de confianza para considerar una regla de asociación como válida.
Lift, medida de sorpresa de una regla. Esta puede o no puede habilitarse y si se habilita se calculara y se observara su resultado.
Para este caso tomamos los valores por defecto (Soporte 5%, Confianza 70% y Lift no aparece) y Aceptamos.
EJECUTAR UN NODO ASSOCIATION RULES
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run (ver 3.4.1). Al terminar la ejecución el nodo cambia de estado (ver 3.4.3) y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
APRIORI NODE EXECUTED: Frequents items had been created…
Para el ejemplo,
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR DE PREPROCESS UN DISCRETIZE Y CONECTAR A INTER.SESSION
Seleccionamos para el ejemplo, el elemento Discretize y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el Discretize, existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo
Se puede hacer la conexión con el Inter.Session
Para el ejemplo, vamos a conectar Discretize con Inter.Session: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Inter.Session.
La pantalla ahora se vera de la siguiente manera:
CONFIGURAR UN NODO DISCRETIZE
Lo primero que debemos hacer es dar clic derecho en el nodo Discretize, y seleccionar la opción Settings entonces aparecerá una pequeña ventana:
Hay tres opciones de configuración:
Puede configurar los intervalos de 3 atributos de manera manual
Puede configurar los 3 intervalos por defecto presionando el botón Default.En caso de no configurar el atributo, este tomara valores por defecto.
CONFIGURACIÓN DE ATRIBUTO CON IGUAL TAMAÑO DE INTERVALOS
Se escoge el atributo de la lista Atributte, se escoge el numero de intervalos de la lista Num – puede tener 2, 3, 4, 5 intervalos – y se escoge la opción Same de la lista Size.
Entonces se presiona el botón Do (Hacer) e inmediatamente se construyen los intervalos del atributo seleccionado. Los nombres de los intervalos serán: Intervalo(# intervalo).
Y aparece un mensaje en la barra de estado de la ventana así: (Atributo) Interval is save…
CONFIGURACIÓN DE ATRIBUTO CON DIFERENTE TAMAÑO DE INTERVALOS
Se escoge el atributo de la lista Atributte, se escoge el numero de intervalos de la lista Num – puede tener 2, 3, 4, 5 intervalos – y se escoge la opción Diferent de la lista Size.
Entonces se presiona el botón Do (Hacer) e inmediatamente aparece la ventana de construcción de los intervalos así:
El nombre del recuadro es: (Atributte) Intervals
A continuación se describe los elementos de la ventana:
El recuadro donde hay un cero (0) es la caja de texto donde aparece el mínimo valor que puede tener el atributo.
De ahí hay unas separaciones y según la cantidad de intervalos aparecen cajas de texto blancas, donde se colocan los limites de los intervalos, teniendo como primer intervalo el que empieza por el mínimo valor.
El recuadro donde hay un treinta (30) es la caja de texto donde aparece el máximo valor que puede tener el atributo. El último atributo es el que tiene como límite superior el máximo valor.
Aparecen además, sobre cada intervalo una caja de texto que contiene: Intervalo(# intervalo). Que viene siendo el nombre del intervalo, el cual puede ser cambiado, en caso que se quiera darle un nombre. Este es el que se mostrara en las visualizaciones tipo árbol.
Presionamos Aceptar para construir los intervalos.
Y aparece un mensaje en la barra de estado de la ventana así: (Atributo) Interval is save…
CONFIGURACIÓN POR DEFECTO
La configuración por defecto se activa así:
Si no se entra a la opción Settings, este toma los valores por defecto.
Si un atributo no es configurado, este toma los valores por defecto debido a que es necesario discretizarlo.
Si se presiona el botón Default de la ventana Interval Settings.
Los intervalos por defecto son:
Atributo |
Intervalos |
Duration |
Corta: Menos de 1/3 de sesión |
Request Amount |
Pocas: Menos de 10 solicitudes |
Download Size |
Baja: Menos de -2 Mb |
Para este caso tomamos los valores por defecto y Aceptamos.
EJECUTAR UN NODO DISCRETIZE
Configurado o no (Porque si no se configura, el nodo tomara los valores por defecto) se hace clic derecho en el nodo y se selecciona la opción Run (ver 3.4.1). Al terminar la ejecución el nodo cambia de estado (ver 3.4.3) y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
DISCRETIZE NODE EXECUTED: Transformed sessions Para el ejemplo,
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR UN NODO DE CLASIFICATION Y CONECTAR A DISCRETIZE
Seleccionamos para el ejemplo, el elemento C 4.5 y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el C 4.5, existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo
Se puede hacer la conexión con el Discretize
Para el ejemplo, vamos a conectar C 4.5 con Discretize (esto porque para hacer clasificación es necesario discretizar los valores): dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Discretize.
La pantalla ahora se vera de la siguiente manera:
CONFIGURAR UN NODO CLASIFICATION
Lo primero que debemos hacer es dar clic derecho en el nodo C 4.5, y seleccionar la opción Settings entonces aparecerá una pequeña ventana:
Hay una opción de configuración:
Target Class, Clase Etiqueta. Es el atributo del cual se hará el estudio de clasificación, de los 6 atributos de estudio, se escoge uno.
Para este caso tomamos Download size y Aceptamos.
EJECUTAR UN NODO CLASIFICATION
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run (ver 3.4.1). Al terminar la ejecución el nodo cambia de estado (ver 3.4.3) y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
C 4.5 NODE EXECUTED: Running Algorithm…
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR UN NODO DE WEB USAGE MINING Y CONECTAR A INTER.SESSION
Seleccionamos para el ejemplo, el elemento HPG y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el HPG, existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo
Se puede hacer la conexión con el Inter.Session
Para el ejemplo, vamos a conectar HPG con Inter.Session: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Inter.Session.
La pantalla ahora se vera de la siguiente manera:
CONFIGURAR UN NODO HPG
Lo primero que debemos hacer es dar clic derecho en el nodo HPG, y seleccionar la opción Settings (ver 3.4.1.) entonces aparecerá una pequeña ventana:
Hay una opción de configuración:
Alfa. Este puede tomar 3 valores (1, 0, 0.5) e indica que paginas son tomadas como iniciales.
Para este caso tomamos Alfa = 0.5 y Aceptamos.
EJECUTAR UN NODO HPG
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run (ver 3.4.1). Al terminar la ejecución el nodo cambia de estado (ver 3.4.3) y aparece un mensaje en la barra de estado con el resultado de la ejecución:
Si todo ha resultado con éxito el mensaje es:
HPG NODE EXECUTED: Successful – Productions had been created… Total: (# producciones)
Para el ejemplo,
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)ARRASTRAR UN NODO DE WEB VIEWS Y CONECTAR A UN NODO DE PROCESO (Cualquier nodo de categorías previas)
Un nodo VIEW presenta la visualización de un proceso del algoritmo y según sea el nodo al que se desee mirar los resultados será el nodo VIEW que se escogerá.
Los nodos VIEW no tienen la opción Settings, así que solamente se ejecutan con la opción Run
ARRASTRAR Y CONECTAR A UN TABLE
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el TABLE, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar TABLE con Inter.Session: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Inter.Session
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO TABLE
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
Una ventana de visualización con una tabla de datos:
A – Web Server Log, Nombre del archivo analizado.
B – Process, Nombre del proceso que se visualiza.
C – Save Report, Opción para salvar reporte en formato html.
En caso de que se conecten con un Nodo Sessions:
D – Botón Extensions, Opción para ver las extensiones de la sesión.
E – Botón Pages, Opción para ver las transacciones de la sesión.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR A UN TREE
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el TREE, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar TREE con C 4.5: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo C 4.5
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO TREE
Se hace clic derecho en el nodo y se selecciona la opción Run Al terminar la ejecución el nodo cambia de y aparece:
Una ventana de visualización con una tabla de datos:
Barra de título: Nombre de Visualizador - Proceso – Nombre del archivo analizado.
Árbol de toma de decisión resultante de los algoritmos de clasificación, Nodos azul claro son raíz y hojas. Los nombres de los intervalos son los dados en la configuración del nodo Discretize .
Scroll, para bajar o subir por todo el tamaño del árbol resultante.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR A UN STAT (Statistical)
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el STAT, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar STAT con Web Server: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Web Server
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO STAT
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
Una ventana de visualización con una tabla de datos:
Ventana que muestra las estadísticas generales de un log, las que son:
Nombre del Archivo
Fecha de Inicio del log
Fecha Final del log
Total de bytes enviados
Cantidad de Peticiones
Día de Mayor descarga
Pagina mas descargada
Referencia más popular
Cliente Ip mas popular
Código de Estado más popular
Además aparece un recuadro Graphics que es para la visualización de graficas estadísticas, así:
Se escoge de la lista atributte que estadística se va a realizar, y de la lista type selecciono la forma de visualización. Presionamos el botón Run y observaremos:
En la barra de titulo la estadística y el nombre de archivo.
La grafica de Barras que se escogió.
El listado de las páginas.
Pueden ser Graficas de Barras, Grafica de Paste (si los elementos son menos de 100) y la Grafica lineal.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR A UN GRAMMAR
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el GRAMMAR, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar GRAMMAR con HPG: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo HPG.
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO GRAMMAR
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
Una ventana de visualización con una tabla de datos:
A – Barra de título: Nombre de Visualizador - Proceso – Nombre del archivo analizado
B – Grafo de la gramática resultante de los algoritmos de clasificación, grafo base en tono gris.
C – Radius: Manejo de tamaño del arco del grafo, predeterminado 50, en caso de cambio escribir en la caja de texto y aceptar.
D – Listado de las páginas que arman el nodo, cada fila contiene: Numero con el que se identifica en el nodo y el nombre de la página.
E – Descripción de los colores que se manejan en el grafo.
Color |
Descripción |
|
Gris claro |
Grafo base |
|
Rojo |
Nodo Actual |
|
Azul Oscuro |
Probabilidad |
|
Azul Claro |
Nodos de donde sale para Nodo Actual |
|
Amarillo |
Nodos a donde parte desde Nodo Actual |
Funcionamiento
Cuando se selecciona una página de la lista, en el grafo se visualiza el nodo actual, los nodos de referencia y los nodos hacia donde parte con la probabilidad.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR A UN JTREE
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el JTREE, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar JTREE con C 4.5: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo C 4.5.
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO JTREE
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
Una ventana de visualización con una tabla de datos:
A – Web Server Log, Nombre del archivo analizado.
B – Target, Clase que se analiza en el algoritmo de clasificación.
C – Process, Nombre del proceso que se visualiza.
D – Árbol de toma de decisión resultante de los algoritmos de clasificación, Nodos hojas cargan imagen en forma de hoja. Los nombres de los intervalos son los dados en la configuración del nodo Discretize.
E – Scroll para bajar.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR UN RULES
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el RULES, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar RULES con Apriori: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Apriori.
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO RULES
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
A – Web Server Log, Nombre del archivo analizado.
B – Soporte, Porcentaje y Confianza, Porcentaje.
En caso de no ser proceso Association Rules, sino Clasification en vez de los ítems B se mostrara la clase Target.
C – Process, Nombre del proceso que se visualiza.
D – Save Report, Opción para salvar reporte en formato html.
E – Result, Muestra la reglas que resultan del proceso mencionado.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
ARRASTRAR Y CONECTAR UN HPGTABLE
Seleccionamos el nodo y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el HPGTABLE, se debe conectar a un nodo valido que desea visualizarse con este formato.
Para el ejemplo, vamos a conectar HPGTABLE con HPG: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo HPG.
La pantalla ahora se vera de la siguiente manera:
EJECUTAR UN NODO HPGTABLE
Se hace clic derecho en el nodo y se selecciona la opción Run. Al terminar la ejecución el nodo cambia de estado y aparece:
Una ventana de visualización con una tabla de datos:
A – Barra de titulo. Proceso - Algoritmo
B – Web Server Log, Nombre del archivo analizado.
C – Índice Alfa.
D – Modelo Gramática.
E – Process, Nombre del proceso que se visualiza.
F – Save Report, Opción para salvar reporte en formato html.
G – Result, Muestra la producciones que resultan del proceso mencionado de la siguiente manera: Nodo Origen -> Nodo Destino Con Probabilidad.
H – Lista de Páginas, Muestra el Identificador y la pagina correspondiente.
I – Barra de Estado, Muestra la cantidad de producciones resultantes.
Si ocurre algún error el mensaje es:
ERROR: (mensaje de error)
EJEMPLO PARA EL MÓDULO DE MINERÍA DE ESTRUCTURA WEB (WEB STRUCTURE MINING)
Una vez abierta la aplicación, procedemos a seleccionar la pestaña de minería de estructura y un nuevo proyecto es abierto automáticamente, por tanto podemos realizar un algoritmo de minería de estructura.
Para armar el algoritmo se debe tener en cuenta que este siempre empieza por un WEB DATA SOURCE, por tanto, ninguna otra herramienta se habilita hasta que un elemento de este sea arrastrado al área de trabajo.
ARRASTRAR UN WEB DATA SOURCE
Seleccionamos uno de los tres elementos pertenecientes a la categoría Web Server y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo), la pantalla se vera de la siguiente manera:
Una vez arrastrado el Web Server, para el caso de nuestro ejemplo un Crawler, ya podemos arrastrar cualquier otra herramienta.
Existen dos opciones para hacer en el momento:
Se puede configurar y ejecutar el nodo
Se puede armar el algoritmo de estructura y luego hacer la ejecución de los nodos en su totalidad.
CONFIGURACIÓN DE UN WEB CRAWLER.
Lo primero que se debe hacer es dar clic derecho sobre el nodo Crawler, y seleccionar la opción Settings, en ese momento se desplegara una pequeña ventana.
El paso a seguir es escribir una dirección URL valida, de lo contrario el Crawler no recibirá respuesta alguna. Para esto la URL debe ingresarse de manera completa con su protocolo y extensión, para nuestro caso trabajaremos con la página de la universidad:
http://www.udenar.edu.co
Se nos presentan dos parámetros, los cuales deben ser configurados, el primero es search level, el cual consiste en el nivel de profundidad que debe recorrer el Crawler, el cual se lo toma de una lista desplegable teniendo como valor mínimo el 2 y como máximo 10, se ha limitado este parámetro, ya que al tomar un valor demasiado grande, el Crawler puede tardar demasiado tiempo en la recuperación de información debido a la gran cantidad de páginas que debe procesar. Para nuestro ejemplo trabajaremos con un nivel de profundidad igual a tres.
El segundo parámetro a configurar es Links by Page, el cual hace referencia a la cantidad máxima de links por pagina, este de igual manera se lo puede seleccionar de por medio de un spiner o puede ser ingresado por el usuario, el valor menor que puede tomar es uno y el mayor queda abierto a consideración del usuario; al igual que el parámetro anterior entre mayor cantidad de enlaces por pagina mayor será el tiempo de procesamiento. Para nuestro ejemplo trabajaremos con 10 links por cada página.
Una vez terminada a la anterior configuración, damos click en el botón Domain,
Allí aparecerá la siguiente ventana:
En esta ventana se debe seleccionar o establecer los dominios de las páginas con las cuales se desea trabajar, esto se lo hace agregando o eliminando los dominios a la lista de Acceptted, los que quedan en el área de Filtered no serán tenidos en cuenta por el Crawler al momento de ser ejecutado.
Por último, se debe establecer los o el protocolo con el cual se desea trabajar esto se hace mediante el botón Protocols, en la cual se despliega la siguiente ventana.
En el cual se debe escoger el protocolo Web con el cual se quiere trabajar, este servirá como un filtro ya que el Crawler únicamente tomara las URL que se encuentre dentro de los protocolos que se hayan seleccionado, se configura exactamente igual que el parámetro anterior.
Para efectos del ejemplo que se viene trabajando se dejara los parámetros preestablecidos por la herramienta en lo concerniente a los dominios y protocolos.
La configuración del Crawler para nuestro ejemplo se presentará de la siguiente manera:
Una vez terminemos la configuración del Crawler procedemos a aceptar.
EJECUTAR WEB CRAWLER
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run.
Tomamos la opción Start para dar inicio a la ejecución del nodo, en cualquier momento podemos cancelar la ejecución del nodo presionando la opción Cancel.
Al terminar la ejecución el nodo cambia de estado.
ARRASTRE DEL PREPROCESS Y CONEXIÓN DEL NODO LINKS AL CRAWLER.
Seleccionamos el nodo Links y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el nodo Links, existen dos opciones para hacer en el momento:
Se puede configurar el nodo.
Se puede hacer la conexión con el Web Server.
Para el ejemplo, vamos a conectar Links con Crawler: dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Crawler.
CONFIGURACIÓN DEL NODO LINKS
Lo primero que debemos hacer es dar clic derecho en el nodo Links, y seleccionar la opción Settings, entonces aparecerá una pequeña ventana:
en esta ventana claramente se presentan dos áreas en la cual se encuentran los diferentes tipos de links existente, los External Links que hacen referencia a los enlace externos al dominio de la URL ingresada por el usuario y estos a su vez se clasifican en In Links y Out Links, que son los enlaces entrantes y salientes respectivamente. En la sigunda área se presentan los Internal Links los cuales se refieren a los links internos, es decir que se encuentran en el mismo dominio de la URL ingresada y de igual manera a su vez se dividen en In Links y Out Links.
En esta ventana podemos escoger cualquier tipo de combinación de los enlaces tanto internos como externos, se pueden generar quince grafos diferentes dependiendo de la combinación de links que el usuario realice, para nuestro caso vamos a dejar marcados los cuatro tipos de enlaces con la finalidad de mirar el grafo de manera completa. Una vez terminada la configuración tomamos la opción Accept.
EJECUTAR UN NODO LINKS
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run. En este momento de despliega la siguiente ventana:
Se presiona la opción Start para iniciar la ejecución del nodo, en cualquier momento se puede cancelar la ejecución con la opción Cancel. Al terminar la ejecución el nodo cambia de estado.
ARRASTRAR UN NODO DE WEB STRUCTURE MINING Y CONECTAR A LINKS
Seleccionamos para el ejemplo, el nodo Page Rank y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el Page Rank, existen dos opciones para hacer en el momento:
Se puede configurar el nodo
Se puede hacer la conexión con Links
Para el ejemplo, vamos a conectar Page Rank con Links dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Links
La pantalla ahora se vera de la siguiente manera:
CONFIGURAR UN NODO DE WEB STRUCTURE MINING
Lo primero que debemos hacer es dar clic derecho en el nodo Page Rank, y seleccionar la opción Settings, entonces aparecerá una pequeña ventana:
Se presentan dos opciones de configuración:
Dampening: El cual hace referencia al grado de veracidad del grafo, generalmente se establece en 0.85. Esta opción presenta un mínimo de 0.05 y un máximo de 1. Entre más cerca el valor se encuentre a uno mayor grado de veracidad para el grafo. La configuración por defecto para este parámetro es de 0.85.
Number of iteration: Hace referencia al numero de iteraciones que debe hacer el algoritmo para lograr calcular los valores, esta opción presenta como mínimo valor 1 y un máximo de 100. Entre mayor iteraciones se realice más alto será el grado de acierto en el cálculo del valor del nodo de cada página. La configuración por defecto para este parámetro es de 70, el cual es el valor que se considera necesario para ser aceptados los valores calculados por el algoritmo.
EJECUTAR UN NODO WEB STRUCTURE MINING
Una vez configurado el nodo (Porque si no se configura, el nodo no se podrá ejecutar) se hace clic derecho en el nodo y se selecciona la opción Run. En este momento de despliega la siguiente ventana:
Se presiona la opción Start para iniciar la ejecución del nodo, en cualquier momento se puede cancelar la ejecución con la opción Cancel. Al terminar la ejecución el nodo cambia de estado.
ARRASTRAR DE GRAPH VIEW UN GRAPH Y CONECTAR A PAGE RANK
Seleccionamos para el ejemplo, el elemento Graph y lo arrastramos a una posición cualquiera (preferiblemente una que permita una buena organización del algoritmo).
Una vez arrastrado el nodo Graph se debe hacer la conexión con el Page Rank ya que este no funciona si no tiene asociado un algoritmo o un Links, este tipo de visualizaciones no necesitan una configuración previa por lo cual únicamente necesitan ser conectados de manera adecuada.
Para el ejemplo, vamos a conectar Graph con Page Rank dando clic derecho en el nodo y seleccionando la opción Add Connection y luego escogiendo el nodo Page Rank.
La pantalla ahora se vera de la siguiente manera:
VISUALIZAR EL GRAFO CON EL NODO GRAPH
Para visualizar el grafo es necesario dar clic derecho al nodo GRAPH y escogemos la opción Run, en ese momento se despliega una ventana como la siguiente:
En la gráfica se puede mirar la estructura web y el lado izquierdo toda la información de cada uno de los nodos que se seleccionen.
A - Nombre del tipo de visualización.
B - Información general de todo el grafo y especifica del nodo cuando es seleccionado un nodo.
C - Botón que carga la página Web seleccionada.
D - Variables para dejar más estable la visualización del grafo.
E - Presentación visual del grafo.
El color de los enlaces (aristas) representan los enlaces internos y externos de los sitios Web.
Enlaces color verde son los internos del nodo o sitio Web.
Enlaces color azul son los externos del nodo o sitio Web.
GENERANDO MÁS GRÁFICOS CON DIFERENTES ALGORITMOS.
Después de arrastrar los nodos necesarios la pantalla se debe mostrar de la siguiente manera:
Podemos agregar otros tipos de visualizaciones para así observar mas gráficos de diferentes tipos, algunos ejemplos son los siguientes:
Con el nodo Radial podemos generar graficos de tipo mas estaticos y ordenados para trabajar, este a su vez fue conectado al nodo Hits para obtener los calculos realizados por este algoritmo.
La visualización que presenta el nodo Radial es la siguiente:
De igual manera en el lado izquierdo de la ventana se indica los valores calculados por el algoritmo aplicado que en este caso fue el algoritmo Hits, esto lo hace para la página que se seleccione de las recuperadas por el Crawler.
El color de los enlaces (aristas) representan los enlaces internos y externos de los sitios Web.
Enlaces color verde son los internos del nodo o sitio Web.
Enlaces color azul son los externos del nodo o sitio Web.
La siguiente visualización la genera el nodo Domain el cual genera un grafo de la URL semilla, pero a diferencia del Graph, lo agrupa por los host que utilizan donde se encuentra almacenada la información, es decir muestra diferentes tipos de islas, en las cuales se encuentran alojadas las páginas.
La visualización que nos presenta es la siguiente:
Al igual que en las anteriores visualizaciones, en el lado izquierdo se puede mirar la información del host al cual pertenece el conjunto de páginas que se haya seleccionado, si por el contrario lo que se selecciona es una página o nodo, mostrará la información correspondiente con el valor otorgado por el algoritmo Web Linker, ya que se conecto el nodo Domain con el nodo Web Linker.
Si se desea en algún momento hacer uso de cualquiera de estos grafos sin necesidad de mirar la importancia o calificación otorgada por los algoritmos se lo puede hacer haciendo la conexión directamente al nodo Links. Este tipo de conexiones posibles ya fueron explicadas con anterioridad.
Cabe la pena resaltar que en cualquiera de los tres grafos anteriores, podemos dar click sobre la página deseada y presionar el botón Go To URL, el cual se encarga de abrir el navegador predeterminado y cargar la pagina seleccionada.
ALGORITMO DIJKSTRA
Existe un algoritmo mas, el cual es especial ya que él trabaja sin necesidad de un Graph View, debido a que el genera su propio grafico, este es el algoritmo Dijkstra el cual se encarga de buscar la ruta entre dos páginas.
Una vez agregado el nodo Dijkstra la visualización será la siguiente:
Luego se debe generar la visualización de este algoritmo, la manera de hacerlo es dando click derecho sobre el nodo y se escoge la opción Run, en ese momento aparecerá una nueva ventana:
Para realiza el cálculo de la ruta optima entre dos nodos, simplemente se debe dar click sobre la pagina origen y posteriormente sobre la página destino, el sistema inicia a calcular todas las rutas posibles y la importancia o el valor de la ruta.
Este proceso puede tardar varios minutos dependiendo de la cantidad de rutas posibles que se puedan encontrar.
Una vez la herramienta haya terminado el cálculo la ventana que se indicara será la siguiente:
En la parte inferior se puede mirar la ruta encontrada con su respectivo valor de relevancia.
Si en algún momento se desea cancelar el proceso se puede presionar el botón Restart el cual se encarga de iniciar el proceso para hacer nuevamente la selección de las páginas.
La ruta más corta se representa al cambiar de color rojo los enlaces entre los nodos seleccionados.
Para guardar las rutas procesadas se debe seleccionar primero el numero de rutas para grabar con el spinner Number Of Rout... y luego presionar el botón SAVE.
NODO TABLE.
El nodo Table permite visualizar y exportar los datos en formad e tabla. Los formatos en los cuales es capaz de explotarse la información son: HTML, TXT, PDF.
La información que se carga en la tabla depende de la conexión previa que se haya realizado, y si se aplico uno o más algoritmos para obtener los pesos de cada página.
Para caso de nuestro ejemplo lo hemos conectado con el algoritmo Page Rank, para obtener los valores proporcionados por este algoritmo.
Una vez se de click derecho en el nodo y se tome la opción Run tendremos la siguiente ventana:
En la parte superior se encuentran los tres botones con el nombre del formato en el cual se puede exportar la información que se está presentando en la tabla.
El resto de las columnas muestran toda la información necesaria para que el administrador del portal web en estudio tome las decisiones pertinentes y aplique las correcciones del caso que mejoren la navegabilidad de su portal.
NODO TREE
El nodo Tree es otra formas más de presentar la información, se generan diferentes vistas en forma de árbol, lo cual facilita entender los enlaces que se están generando entre las páginas.
Para el caso de nuestro ejemplo lo hemos asociado al algoritmo Hits, ya que deseamos visualizar la información proporcionada por este algoritmo.
La ventana quedaría como la siguiente:
La forma de ejecutar este nodo, es igual a las vistas, simplemente se da click derecho sobre el nodo y se toma la opción Run. La ventana que nos mostrará en ese momento es la siguiente:
En el lado izquierdo, se puede observar la información de cada nodo sobre el cual se da click.
Para abrir el árbol simplemente basta con dar click sobre la página que deseamos abrir y esta se despliega, indicando las paginas con las cuales se conecta.
Los nodos que aparecen de color rosa son los nodos que no se encuentran referenciados y pueden seguir abriéndose, los nodos que aparecen en color azul son los que ya han sido referenciados por otra página y por ende no se pueden seguir desplegándose, ya que de lo contrario nunca tendría final el árbol.
En la parte izquierda superior, se presentan tres botones con los cuales se puede cambiar la orientación del árbol, un ejemplo de esto sería la siguiente imagen, en la cual se ha cambiado la orientación del árbol original.