Estandarizar (Standarize)

 

Este filtro está realizado para trabajara sólo con atributos de tipo numérico (integer o double) para realizar correcciones a la información que contengan con el propósito de evitar los valores extremos y/o atípicos.

1.         De la pestaña Data cleaning se selecciona el ícono correspondiente a Standarize y con clic sostenido se lo lleva al área Drag and Drop.

 

2.         Una vez realizado el paso anterior se debe establecer la conexión con el objeto contenedor de los datos (Plain text, Connection DB u otro filtro).  Para esto se debe tomar con clic sostenido cualquiera de los 8 puntos que se encuentran alrededor del objeto de datos y llevarlo a cualquiera de los puntos de conexión del objeto Standarize.

 

3.         Ahora se debe dar clic derecho sobre el objeto Standardize y del menú de opciones que se despliega seleccionar la opción Configure… Con la cual se desplegará una ventana de configuración.

 

4.         En la ventana de configuración se presenta una tabla donde se muestra la información de los atributos de tipo numérico.  Una de las opciones que permite el filtro es la realización de una normalización de atributos marcando la casilla de verificación NUMERICAL.

 

5.         Si lo que se desea es estandarizar el atributo, se debe marcar la casilla de verificación en la columna STANDARIZE.

 

6.         Una vez establecidos los métodos (NUMERICAL O STANDARIZE) en los atributos que se desea filtrar se debe dar clic al botón play para que la configuración quede establecida.

 

7.         Finalmente, para cerrar la ventana de configuración se debe dar clic en el botón Close que permitirá volver a la ventana principal.

8.          Nuevamente en la ventana principal se debe dar clic derecho al elemento Standarize y seleccionar la opción Run… de las opciones que se despliegan. Hecho esto el filtro será ejecutado.

 

9.         Realizado el procedimiento anterior, se debe dar clic derecho nuevamente en el objeto Standarize y seleccionar la opción View… del menú de opciones para poder visualizar los resultados de aplicar el filtro a los atributos seleccionados en el paso número 4 y 5.

 

10.      En la ventana de resultados se observa en la pestaña Attributes los atributos numéricos del conjunto de datos y algunos estadísticos descriptivos (máximo, mínimo, media, varianza, desviación estándar) que son los datos que utiliza el filtro para su procedimiento.

 

11.      En la ventana de resultados, en la pestaña Filtered Data se puede observar el resultado del filtro en los atributos que fueron seleccionados para ello, así en el ejemplo se puede ver el atributo precipitación_1 al cual se le aplicó el método STANDARIZE, el cual organiza los datos en base a su media y desviación estándar.

 

  1. Así mismo, el atributo edad tiene aplicado el método NUMERICAL, el cual organiza los datos en base a la normalización de los mismos tomando una media de 0 y una desviación estándar de 1.

 

  1. También esta disponible como en los anteriores métodos la posibilidad de guardar los datos filtrados, para esto se debe dar clic en el botón Filtered de la ventana de resultados.