En el presente capítulo hemos visto que existen recomendadores para grupos de desarrollo reciente en distintos ámbitos de aplicación, en particular en el área de los contenidos audiovisuales o televisivos es en la cual ha habido mayor número de sistemas. Si bien son numerosos y diversos los trabajos revisados, hemos realizado una síntesis para abordar el estudio, distinguiendo los puntos que diferencian un sistema de recomendación para un grupo respecto a otro orientado a individuos. Ellos son (i) cómo sabe el sistema quiénes son los integrantes del grupo, (ii) cómo el sistema adquiere la información sobre las preferencias de los miembros, (iii) cómo el sistema genera recomendaciones, (iv) cómo el sistema presenta la recomendación a los miembros, (v) cómo el sistema ayuda a los miembros a llegar a un consenso sobre qué recomendación aceptar. El punto (iii) ha sido tratado con particular extensión ya que el algoritmo de recomendación para grupos representa el foco principal de nuestra tesis.
Se ha destacado que existen distintos aspectos a tener en cuenta respecto al manejo de las calificaciones otorgadas por los usuarios al ser considerados en conjunto, tales como la linealidad o la normalización.
Se ha observado que recientemente unos pocos trabajos proponen el uso de ontologías en recomendadores para grupos.
Hemos abordado las distintas estrategias para la fusión de preferencias, destacándose la de Promedio Sin Miseria como más apropiada para grupos que miran televisión, aunque en casos particulares de mirar televisión en familia la
155 estrategia de Persona Más Respetada puede ser más adecuada, con la posible variante de ponderar los pesos relativos de cada integrante del grupo en la decisión.
Se concluye asimismo, que la fusión de perfiles presenta una leve superioridad respecto al enfoque de fusión de preferencias.
157
5 Una Ontología
Multidimensional del
Dominio de la
Televisión
En este capítulo presentamos la contribución de la extensión de la ontología de la televisión, convirtiéndola de una basada solamente en la jerarquía de los géneros de los contenidos, a una multijerárquica, consiguiendo una traducción más directa y precisa entre la información recibida en formato TV- Anytime y las estructuras de datos de la ontología. Ello otorga una mayor precisión en el descubrimiento de similitudes entre contenidos, especialmente útiles en el cálculo de vecindarios, característica destacada de nuestro sistema recomendador, especialmente al recomendar para grupos heterogéneos.
158
5.1 Introducción
En capítulos previos hemos apuntado ciertas limitaciones causadas por el uso de una ontología basada en una sola jerarquía, la de los géneros de los programas de televisión. En efecto, hemos visto que ciertos razonamientos utilizados para encontrar similitudes entre dos contenidos, como la Similitud Semántica Inferencial, llegan a buen término, relacionándolos, si ambos contenidos tienen definidos atributos iguales o hermanos (es decir, atributos hijos de una misma clase). En la ontología original de AVATAR, descrita en el apartado 3.5, la similitud semántica inferencial se aplica para todos los esquemas de clasificación de TV-Anytime (exceptuando el de género ya que ha sido estructurado en la jerarquía de la ontología), así como a la información geográfica y temporal. Para estos esquemas de clasificación, que también pueden estructurarse de manera jerárquica, los valores definidos en el nivel más específico de la norma, es decir, el nivel más especializado en el cual por debajo de ellos ya no hay más descripciones realizadas, en la ontología original se definen como instancias. Eso permite la comparación entre los programas del historial y los nuevos, para ver si comparten esas instancias. A su vez, los que están en niveles más genéricos, son los que identifican las clases a las que pertenecen dichas instancias. Sin embargo, la Similitud Semántica Jerárquica, es capaz de descubrir similitudes a partir de la jerarquía, aunque dos contenidos sean instancias de dos clases más distantes. En la ontología original solamente la clasificación de género estaba estructurada en una jerarquía, lo cual podía implicar que cierta información presente en la ontología no estuviera al alcance del recomendador.
Al implementar una ontología monojerárquica, resulta natural optar por la clasificación de género, ya que es la que tiene información más rica y relevante. Posee varios niveles de profundidad. La ubicación de los programas en las clases hoja aporta importante información sobre ellos. Esta clasificación la hemos comentado previamente, y aparece descrita en detalle en el Anexo A.
Teniendo en cuenta al máximo las capacidades de TV-Anytime, hemos concebido un modelo ontológico mejorado que refleja el esquema de clasificación de contenido multidimensional de TV-Anytime. Las descripciones de los programas a ser emitidos, que son creadas por los productores de contenidos en un formato TV-Anytime que incluye sus clasificaciones en estos esquemas, ahora se traducen de una manera más directa a la ontología. Las instancias de los programas puestos en agenda para emitirse, se agregan a la base de datos del sistema, enlazando y
159 clasificándolas en una o varias de las jerarquías del sistema, permitiendo comparaciones en múltiples dimensiones para computar su similitud. La implementación actual del recomendador trabaja con cuatro jerarquías extraídas de los esquemas de clasificación definidos en el estándar TV-Anytime:
i. Intention – que describe con la intención que fue realizado el programa (entretener, informar, educar…)
ii. Format – que describe el formato del programa (show, dibujo animado, interactivo…)
iii. Content - que describe el género del programa (si es una película de acción, si es un programa de deportes automovilísticos…) iv. IntendedAudience – que describe la audiencia objetivo a la que va
dirigido el programa (niños, adultos, mujeres preferentemente…) La ontología continúa incorporando otros atributos semánticos de los programas de televisión, tales como los créditos involucrados, alertas de contenido, idiomas del contenido, tiempo e información geográfica, y en general todos aquellos que estaban en la implementación original de AVATAR, y que se describieron en el apartado 3.5.2. Estas otras características semánticas se siguen empleando en el cómputo de la similitud semántica inferencial. Se ha realizado una redistribución de las características, pasando parte de ellas de contribuir a la similitud semántica inferencial, a hacerlo en la jerárquica, con la consiguiente ganancia en la información proporcionada por las comparaciones.