3.7 Categorización de variables numéricas (Discretize)
Este filtro presenta la posibilidad de realizar categorización de atributos de carácter numérico tanto valores continuos como valores discretos.
1.
De
la pestaña Data cleaning se selecciona el ícono correspondiente a
Discretize y con clic sostenido se lo lleva al área Drag
and Drop.
2. Una vez realizado el paso anterior se debe establecer la conexión con el objeto contenedor de los datos (Plain text, Connection DB u otro filtro). Para esto se debe tomar con clic sostenido cualquiera de los 8 puntos que se encuentran alrededor del objeto de datos y llevarlo a cualquiera de los puntos de conexión del objeto Discretize.
3. Ahora se debe dar clic derecho sobre el objeto Discretize y del menú de opciones que se despliega seleccionar la opción Configure… Con la cual se desplegará una ventana de configuración.
4.
En
la ventana de configuración se debe seleccionar el atributo de tipo numérico
que será filtrado.
5. En el apartado Discretize by se tiene de dos opciones para realizar la categorización. En primer lugar por número de rangos (Number of Range) en donde se debe digitar el número de rangos que se desea obtener del filtrado. La segunda opción permite realizar rangos por tamaño de rango, para lo cual se tiene que digitar el número de datos que abarcará cada categoría como máximo (Size of Range).
6. Una vez realizado el paso anterior por cualquiera de las dos opciones se debe dar clic al botón Play para ejecutar el filtrado.
7. Luego se debe dar clic al botón Close para volver a la ventana principal.
8. En la ventana principal se debe dar clic derecho al objeto Discretize y seleccionar la opción Run… del menú que se despliega con el propósito de ejecutar la función del objeto.
9. Luego nuevamente con dando clic derecho sobre el objeto, se selecciona la opción View… del menú que se despliega con el objetivo de mirar los resultados de aplicar el filtro.
10.
En
la ventana de resultados se debe centrar la atención en el apartado Filtered
Data en el cual se presenta los resultados de aplicación del filtro.
11. La variable a la cual se le aplicó el filtro mostrará los datos de acuerdo a la categorización obtenida por el filtro.