Este filtro está realizado para trabajara sólo con atributos de tipo numérico (integer o double) para realizar correcciones a la información que contengan con el propósito de evitar los valores extremos y/o atípicos.
1.
De
la pestaña Data cleaning se selecciona el ícono correspondiente a
Standarize y con clic sostenido se lo lleva al área Drag
and Drop.
2. Una vez realizado el paso anterior se debe establecer la conexión con el objeto contenedor de los datos (Plain text, Connection DB u otro filtro). Para esto se debe tomar con clic sostenido cualquiera de los 8 puntos que se encuentran alrededor del objeto de datos y llevarlo a cualquiera de los puntos de conexión del objeto Standarize.
3. Ahora se debe dar clic derecho sobre el objeto Standardize y del menú de opciones que se despliega seleccionar la opción Configure… Con la cual se desplegará una ventana de configuración.
4.
En
la ventana de configuración se presenta una tabla donde se muestra la
información de los atributos de tipo numérico. Una de las opciones que permite
el filtro es la realización de una normalización de atributos marcando la
casilla de verificación NUMERICAL.
5. Si lo que se desea es estandarizar el atributo, se debe marcar la casilla de verificación en la columna STANDARIZE.
6. Una vez establecidos los métodos (NUMERICAL O STANDARIZE) en los atributos que se desea filtrar se debe dar clic al botón play para que la configuración quede establecida.
7. Finalmente, para cerrar la ventana de configuración se debe dar clic en el botón Close que permitirá volver a la ventana principal.
8. Nuevamente en la ventana principal se debe dar clic derecho al elemento Standarize y seleccionar la opción Run… de las opciones que se despliegan. Hecho esto el filtro será ejecutado.
9. Realizado el procedimiento anterior, se debe dar clic derecho nuevamente en el objeto Standarize y seleccionar la opción View… del menú de opciones para poder visualizar los resultados de aplicar el filtro a los atributos seleccionados en el paso número 4 y 5.
10.
En
la ventana de resultados se observa en la pestaña Attributes los
atributos numéricos del conjunto de datos y algunos estadísticos descriptivos
(máximo, mínimo, media, varianza, desviación estándar) que son los datos que
utiliza el filtro para su procedimiento.
11. En la ventana de resultados, en la pestaña Filtered Data se puede observar el resultado del filtro en los atributos que fueron seleccionados para ello, así en el ejemplo se puede ver el atributo precipitación_1 al cual se le aplicó el método STANDARIZE, el cual organiza los datos en base a su media y desviación estándar.