Las reglas, además de reconocer las opiniones y sus elementos, asignan valores de orientación semántica (OS) para cada elemento identificado y también para la opinión completa.
Nuestra propuesta consiste en calcular el valor final de OS de la opinión a partir de los valores de OS de sus elementos. Partimos de la hipótesis siguiente: la OS de la opinión es positiva si alguno de sus elementos tiene OS positiva; la OS de la opinión es negativa si alguno de sus elementos tiene OS negativa; y la OS la opinión es neutra si todos sus elementos son neutros.
Podría haber problemas si dos elementos de la opinión tuvieran valores de OS diferentes, pero creemos que esto no debería suceder si los valores son calculados correctamente y, de hecho, no encontramos hasta el momento ningún caso en ningún texto en donde esto suceda.
En el ejemplo (7.6) podemos pensar que el predicado positivo apoyar es contradictorio con los elementos subjetivos negativos farsa, sectaria y censuradas, presentes en el asunto. La contradicción desaparece si se atribuyen esas palabras negativas a su fuente, que es el autor del texto, mientras que la fuente de la opinión que se analiza, introducida por el predicado apoyar, es
Carlos Fuentes, García Márquez y Fernando del Paso. En un análisis correcto de este ejemplo
se debería asignar el valor neutro al asunto, ya que estamos reconociendo la opinión de la fuente que no es el autor del texto21.
(7.6) Carlos Fuentes, García Márquez y Fernando del Paso no han tenido la más ligera vacilación en apoyar esta farsa sectaria donde otras voces mexicanas han sido
censuradas.
En nuestro sistema de reglas, la OS del predicado y del asunto se obtienen a partir de valores que estos ya tienen establecidos en los recursos léxicos utilizados. Para los predicados, la OS se deduce de su clase, que está registrada en el repertorio de predicados; los valores posibles son neutro, positivo o negativo. Para el asunto, la OS solamente es positiva o negativa si su introductor lo es, por ejemplo, si el introductor es en contra de, el asunto es negativo, si es a
favor de, el asunto es positivo. En cualquier otro caso la OS del asunto es neutra. No tenemos en
cuenta palabras de contenido subjetivo que puedan ocurrir dentro del asunto, ya que estas son expresadas por el autor del texto y no por la fuente citada, como mostramos en (7.6).
La fuente en general es neutra, salvo cuando se incluyen palabras como optimista,
decepcionado, seguidor, detractor. Para estos casos, luego de la aplicación del módulo para el
reconocimiento de fuentes, se ejecuta un procedimiento especial que busca ocurrencias de palabras como las mencionadas dentro de las fuentes y asigna un valor de OS positivo o negativo, según el caso.
Solo si el predicado y el asunto son neutros, se toma el valor de la fuente, si esta es no neutra, como valor final de OS para la opinión. Las fuentes no neutras resultaron poco frecuentes, de hecho, en el corpus de evaluación no hubo ninguna ocurrencia de fuentes no neutras, por lo que no se evaluó el efecto que tiene la OS de la fuente sobre el valor final.
Creemos que, para casos como el entusiasmado ministro dijo ... o los optimistas creen ..., es bastante probable que la opinión completa mantenga la OS dada por la fuente. En cambio, para fuentes que incluyan palabras como seguidor o detractor, no necesariamente la opinión completa tendrá la misma OS que la fuente. Por ejemplo, en (7.7) se expresa una opinión positiva y en (7.8) una opinión es negativa, por más que en los dos casos se utiliza como fuente la palabra
seguidores.
(7.7) Con su nueva imagen Charanga Habanera ha ganado adeptos, han opinado seguidores de su música .
(7.8) De otro lado, cabría añadir que, por su parte, los seguidores del shiísmo rechazaron por completo a los Abasíes.
No trabajamos con la OS del mensaje, como se aclaró en la introducción, de modo que este elemento siempre tiene OS no determinada en nuestro sistema. Definimos un valor especial para representar la OS no determinada ('nd').
La orientación semántica final de la opinión se calcula según el siguiente algoritmo:
entrada: <OS_fuen,OS_pred,OS_asun,OS_mens> salida : OS_op
si (OS_pred <> neu) => OS_op=OS_pred
si no, si (OS_asun <> neu) => OS_op=OS_asun
si no, si (OS_fuen <> neu) => OS_op=OS_fuen si no, OS_op=OS_mens
Notación:
OS_op = OS de la opinión, ídem para los componentes <> significa "distinto de"
Figura 7.2: Algoritmo para la determinación de la orientación semántica de la opinión completa
Si bien no calculamos el valor de OS del mensaje, lo incluimos en el algoritmo ya que creemos que, una vez que este sea resuelto, quedará resuelta la OS de la opinión completa. En la salida actual de nuestro sistema, si el predicado, el asunto y la fuente son neutros, sea cual sea el contenido del mensaje, la opinión total toma el valor no determinado.
El orden en que se toma la OS de cada elemento está determinado por la certeza con la que es posible obtener la OS de cada uno. En primer lugar, el predicado y el asunto tienen una OS determinada por las entradas léxicas por lo que no habría posibilidad de errores. Entre los dos elementos le damos prioridad al predicado ya que es más frecuente encontrar predicados no neutros que introductores de asunto no neutros. Luego miramos la fuente, que en algunos casos puede llevar a errores, como en los ejemplos que mostramos antes. Finalmente, consideramos el mensaje (a incorporar en el futuro) ya que es el elemento más difícil de analizar y es más probable que se cometan errores al determinar su OS. Esto se debe a que se trata de un segmento
extenso, con estructura oracional, en la cual pueden ocurrir diversos elementos subjetivos y modificadores de subjetividad que no es sencillo combinar.
Si alguno de los cuatro elementos que intervienen en el cálculo de la OS de la opinión no está presente, se asume para él el valor de OS neutro, de modo que no influya en el valor final. En particular, si la opinión no contiene mensaje, se considera que el mensaje es neutro, en vez de considerarlo no determinado.