Las asociaciones buscan patrones en los que la presencia de algo implica la presencia de algo más. Aquí se presenta a los ítems y una colección de transacciones que son subconjuntos de esos ítems. La tarea es encontrar relaciones entre los ítems de esos subconjuntos para descubrir reglas de asociación que cumplan unas especificaciones mínimas dadas por el usuario, expresadas en forma de soporte y confianza. Estas dos medidas son las que dan validez al modelo de asociación.
Una regla o patrón de asociación es una implicación de la forma X Þ Y, que significa que si X está presente en una transacción entonces Y también está presente. El soporte para una regla de asociación del tipo X Þ Y es la proporción (frecuencia) de transacciones en el conjunto de datos que contienen tanto a X como a Y (ref: Larose, 2004).
La confianza de una regla de asociación X Þ Y es una medida de exactitud (fuerza de implicación) de la regla determinada por el porcentaje de transacciones en el conjunto de datos que contienen a A y B (ref: Larose, 2004).
Los algoritmos que contempla la herramienta para el caso de la asociación son: Apriori, FPGrouth y EquipAsso.
Este algoritmo ejecuta todas las combinaciones posibles en el conjunto de datos, basándose en el conocimiento previo o “a priori” de los conjuntos frecuentes, esto conduce a reducir el espacio de búsqueda y aumentar la eficiencia.
En ref se propone un interesante método para minar conjuntos de datos (itemsets) frecuentes sin la generación de candidatos denominado Frequent Pattern growth (FP-growth), basado en la construcción de un árbol denominado Frequent Pattern tree (FP-tree), el cual es una extensión de una estructura de árbol prefija donde se almacena de manera compacta, toda la información cuantitativa acerca de los patrones frecuentes. La eficiencia de la minería se apoya en las siguientes estrategias: primero, la base de datos se comprime en una estructura de datos mucho más pequeña y altamente condensada, que evita los costos de recorrer la base de datos repetidamente. Segundo, la minería basada en FP-tree adopta un método denominado pattern fragment growth para evitar la costosa generación de un gran número de itemsets candidatos, y por último se adopta la estrategia de divide y vencerás para descomponer la tarea de minería de datos en un conjunto de tareas más pequeñas, lo cual reduce drásticamente el espacio de búsqueda.
Importante: Los resultados de aplicar los algoritmos de minería de datos se podrán observar a través de las diferentes vistas que se encuentran en la pestaña Views de la ventana principal de la herramienta.
EquipAsso es un algoritmo que se basa en la combinación de dos primitivas del algebra relacional implementadas en las primitivas del SQL, pero que su fundamento es la matemática matricial.
Importante:
En el presente manual se explicará el procedimiento para aplicar el algoritmo de asociación A priori, anotando que para los otros algoritmos de asociación (FP-Growth y EquipAsso) el procedimiento es similar.
1. De la pestaña Data mining se selecciona el ícono correspondiente a Apriori y con clic sostenido se lo lleva al área Drag and Drop.
2. Una vez realizado el paso anterior se debe establecer la conexión con el objeto contenedor de los datos (Plain text, Connection DB u otro filtro). Para esto se debe tomar con clic sostenido cualquiera de los 8 puntos que se encuentran alrededor del objeto de datos y llevarlo a cualquiera de los puntos de conexión del objeto Apriori.
3. Ahora se debe dar clic derecho sobre el objeto Apriori y del menú de opciones que se despliega seleccionar la opción Configure… Con la cual se desplegará una ventana de opciones.
4.
En
la ventana de configuración se debe establecer el nivel de soporte que tendrá
la ejecución del algoritmo. Este es un valor entre 0 y 100%.
5. Luego de colocar el valor del soporte se dará clic en el botón play para dejarlo establecido y volver a la ventana principal.
6. En la ventana principal, se tiene que hacer clic derecho sobre el elemento Apriori y del menú de opciones seleccionar Run… con lo cual se ejecutará el procedimiento de Asociación Apriori.
7.
Luego
del paso anterior se debe cambiar a la pestaña Views que nos
permitirá a través de uno de sus elementos observar los resultados del algoritmo
aplicado. Para esto, de esta pestaña tomamos el ícono correspondiente a Generator
y con un clic sostenido se lo lleva al área de Drag and Drop.
8. Una vez realizado el paso anterior se debe establecer la conexión con el objeto Apriori. Para esto se debe tomar con clic sostenido cualquiera de los 8 puntos que se encuentran alrededor del objeto de datos y llevarlo a cualquiera de los puntos de conexión del elemento Generator.
9. Ahora se debe dar clic derecho sobre el objeto Generator y del menú de opciones que se despliega seleccionar la opción Configure… con la cual se desplegará una ventana de opciones.
10.
Esta
vez en la ventana de opciones que se presenta se debe seleccionar el porcentaje
de Confianza que se aplicará al modelo. El rango para este nivel es de 0 a
100%.
11. Luego de lo anterior se debe dar clic en el botón play de la ventana para que quede establecida la confianza y volver a la ventana principal.
12. Nuevamente en la ventana principal se debe dar clic derecho sobre el elemento Generator y seleccionar la opción View… del menú que se despliega.
13.
![]() |
14. Mediante el botón Save Report es posible guardar el conjunto de reglas encontrado.