• No results found

Chapter 3: Research methodology

3.6 Data collection instrument

A continuación se presenta un ejemplo del modelo de búsqueda multimodal en el que se describe cada uno de los pasos realizados: Pre-procesamiento, Indexación y Consulta. Para este ejemplo, se examina un repositorio con tres BP (BP1, BP2, y BP3) (Figura 8).

Supóngase que previo a la consulta del usuario, el sistema ha procesado los BP del repositorio aplicando los algoritmos para generar los componentes lingüístico y estructural. Estos algoritmos ponderan cada uno de los elementos que pertenecen a los BP para construir el índice multimodal. Una vez que cada BP se analiza y pondera, se almacena físicamente en el repositorio.

En la fase de búsqueda, el usuario puede utilizar un BP del repositorio o un BP externo (que no existe en el repositorio) para ejecutar la consulta. Cuando el BP no está en el repositorio se procesa aplicando todos los algoritmos mencionados anteriormente, y entonces se añade al repositorio. En este punto, el usuario puede elegir entre las opciones de consulta (textual, codebook, y multimodal). De esta manera, una vez que el usuario elija una opción, los resultados se muestran de acuerdo con la similitud entre el BP de consulta y los BP almacenados en el repositorio. A continuación, se describen en detalle los pasos ejecutados en el modelo:

Capítulo 3. Modelo de búsqueda multimodal 41 __________________________________________________________________

Figura 8. Repositorio de ejemplo (con tres BP).

Pre-procesador: inicia tomando cada uno de los BP del repositorio representado en la Figura 8 (BP1, BP2, BP3). A continuación, crea el componente de codebook, en el cual el conjunto de codebooks formados por cada BP representa una fila de la matriz (MCd), de igual forma todos los elementos lingüísticos que conforma cada BP representan una fila de la matriz (MC). La formación de cada una de estas matrices puede verse a continuación en la Figura 9.

Figura 9. Ejemplo de construcción de los componentes de codebook y lingüístico.

BP1Order Reception Verification Network Capacity Availability Assessment … StartEvent_TaskService TaskService_TaskService TaskService_TaskService …

BP2 ctj,1 ctj,2 ctj,3 ctj,4 .. .. ctj,p .. cdi,1 cdi,2 cdi,3 cdi,p

BP3ctj+1,1 ctj+1,2 ctj+1,3 ctj+1,4 .. .. ctj+1,p .. cdi+1,1 cdi+1,2 cdi+1,3 cdi+1,p

Indexación: en esta fase es tomado cada uno de elementos existentes en las matrices formadas en la etapa anterior (Figura 9), para crear la matriz multimodal

𝑀𝐼𝑖 = {MCdi,j ∪ MCi,j}. Una vez la matriz MI es construida, se realiza el cálculo de la ponderación de cada uno de sus elementos wi,j cuyos valores son calculados con la ecuación 1, como se muestra en la Tabla 6. El índice que forma el espacio de consulta es creado en el sistema de archivos, con el propósito de guardar referencia a la ruta especifica de los archivos que representan los BP, para garantizar su recuperación. Por ejemplo, el cálculo del peso para el elemento w0,0en el BP1, sería w0,0 =

1 3 ∗ Log (

3

1+1) = 0,138.

Tabla 6. Ejemplo de cálculos de ponderación wi,j.

Fuente: elaboración propia.

Consulta: en esta fase, el usuario puede introducir nuevos BP que se pre-procesan, ponderan y anexan al índice multimodal y, además se almacenan en el repositorio (con el fin de ser utilizados en futuras consultas), o selecciona un BP de consulta existente en el repositorio (Figura 8). Este BP de consulta es pre-procesado para formar un vector que incluye los componentes lingüísticos y de codebook (Tabla 7). Más tarde, se toma el vector de consulta y el peso de cada uno de sus componentes es calculado utilizando la ecuación (1). Finalmente, el vector se compara con los pesos en la matriz índice multimodal, y de esta forma los BP que más se asemejan al BP de consulta son recuperados de manera ordenada, utilizando la ecuación (2).

Figura 10. Ejemplo BP consulta.

BP1 0,138 0,301 0,301 0,602 0,602 0,301 0,000 0138 0,301 0,301 0,602 0,201 0,602 0,602 0,201 BP2 0,138 0,398 0,398 0,602 0,398 0,398 0,000 0,138 0,301 0,265 0,602 0,398 0,602 0,301 0,602 BP3 0,138 0,301 0,398 0,398 0,301 0,398 0,301 0,201 0,301 0,602 0,265 0,602 0,602 0,265 0,602

Capítulo 3. Modelo de búsqueda multimodal 43 __________________________________________________________________

Tabla 7. Ejemplo de cálculo de pesos para BPq. Fuente: elaboración propia.

Por ejemplo, en la consulta realizada con el BPq de la Figura 10, se obtiene la clasificación presentada en la Tabla 8.

Tabla 8. Resultados de las opciones de consulta.

Opciones de consulta BP1 BP2 BP3 Similitud % Similitud porcentual Similitud % % Similitud porcentual Similitud % % Similitud porcentual Consulta por Codebook 0.9506 95.06 0.9036 90.36 0.8926 89.26 Consulta textual 0.5304 53.04 0.7094 70.94 0.1735 17.35 Consulta Multimodal 0.9537 95,37 0.9693 96.93 0,9233 92,33

Fuente: elaboración propia.

Teniendo en cuenta que idealmente, el BP con la mayor similitud al BP de consulta es BP2, se puede observar que los mejores resultados fueron obtenidos con la opción multimodal, seguida de los resultados generados por el codebook y, finalmente, la textual. Esto muestra que los resultados de la opción multimodal tienen mayor nivel de relevancia, ya que la lista de resultados se organiza de una manera similar a la clasificación generada por los jueces humanos (ver capítulo 5).

3.3 Conclusiones

El uso de información heterogénea en mecanismos de búsqueda de BP, ha permitido representar formalmente los BP a través de grafos y redes de Petri, con el propósito de aumentar el nivel de relevancia en los resultados reportados y disminuir el tiempo de consulta con este tipo de mecanismos.

Por otra parte, la representación de la información estructural de comportamiento por medio de codebooks en forma de cadenas de texto, hace que disminuya el tiempo requerido para la ejecución de la indexación, ya que no utiliza algoritmos complejos y exhaustivos de isomorfismo de grafos como en el caso de algunos trabajos BPq 0,138 0,201 0,301 0,602 0,602 0,301 0,602 0,201 0,201 0,301 0,602 0,201 0,602 0,602 0,201

mencionados anteriormente [80-82]. El codebook formado por secuencias de dos componentes (N=2), permite obtener mayor nivel de precisión en las consultas ejecutadas sobre el índice multimodal.

La aplicación de una estrategia de búsqueda multimodal, permitió tener una representación ampliada de la información contenida en cada uno de los BP del repositorio. La representación de la información en el índice de búsqueda multimodal en forma de cadenas de texto, aporta mayor efectividad en las búsquedas, mayor agilidad y flexibilidad para realizar varias clases u opciones de consulta.

En el ejemplo de ejecución explicado arriba, se puede evidenciar la sencillez en el proceso de indexación y creación del índice de búsqueda. Por otra parte, el índice de búsqueda por su robustez hace posible ejecutar varios tipos de consulta que pueden ser: textual, estructural o multimodal. Los resultados obtenidos en el ejemplo y en la experimentación que son presentados en un capitulo posterior demuestran que la unión de la información lingüística y estructural de los BP en un solo espacio de búsqueda, genera resultados más relevantes en comparación con otras técnicas identificadas en el estado del arte.

Capítulo 4. Algoritmo de clustering propuesto 45 __________________________________________________________________

Capítulo 4

Algoritmo de clustering propuesto para extender el

modelo de búsqueda multimodal

En la actualidad las organizaciones definen BP que representan líneas de productos o servicios basados en conjuntos de características que permanecen constantes en función de una familia de productos o servicios dada [88]. En consecuencia, identificar manualmente un grupo de BP que represente una familia de productos, puede considerarse como una tarea dispendiosa que demanda tiempo considerable. Como alternativa, se han planteado mecanismos para la detección automática de BP que puedan explicar el comportamiento de las líneas de productos trabajadas en la empresa [89]. Estos mecanismos han incorporado algoritmos de agrupación o

clustering, con el propósito de reunir en un mismo grupo un conjunto coherente de BP que representen una línea o familia de productos, con base en características comunes que pueden ser de flujo, de control, de finalidad, de estructura, de función del proceso o producto que representan, de manera que cada grupo podría ser utilizado posteriormente para generar un modelo de proceso de mayor comprensión [90]. En este sentido, los ingenieros (modeladores de BP) pueden explorar organizadamente los resultados agrupados para plantear posibles sugerencias sobre cómo rediseñar los BP, a fin de incorporar los cambios más frecuentes y significativos de una vez para todos los elementos de cada grupo.

Los resultados de la agrupación proporcionan valores de pertenencia que representan el nivel de correspondencia entre un BP y el grupo que lo contiene, esto puede considerarse como el grado de similitud entre las características de los BP pertenecientes a un mismo grupo.

A continuación se describe el algoritmo que sirve como base para extender el modelo de búsqueda multimodal para hacer agrupaciones de BP. Posteriormente son descritas las mejoras realizadas a este algoritmo y su adaptación al modelo de búsqueda multimodal, haciendo énfasis en el cálculo de similitud entre BP, la forma de agrupación de los BP y el método de etiquetado de grupos, finalmente se presenta un ejemplo de agrupación de BP.

Related documents