[Orador 2]: Hola, a continuación os vamos a presentar investigación que desde la UPM venimos desarrollando recientemente con motivo del proyecto Escaparate Interactivo Turístico ESITUR, realizado en colaboración con la Universidad Carlos III y con la empresa Moviloc. En la actualidad disponemos de una amplia y variada oferta de redes sociales orientadas a compartir contenidos multimedia. Estos contenidos, al margen de las propias imágenes y vídeos, suelen ir acompañados de valiosos metadatos, como por ejemplo el número de likes, de vistas, comentarios o puntuaciones. Estos contenidos son proporcionados por los propios usuarios y en su conjunto reflejan de forma objetiva el valor percibido de tales contenidos. En ese contexto, nuestro objetivo en particular consiste en aprovechar la disponibilidad de ambos recursos para el desarrollo de modelos computacionales para la inferencia automática del valor percibido por los espectadores de una determinada imagen. Para ello, mantenemos dos líneas principales de trabajo. Por un lado, la búsqueda de nuevas soluciones para la notación automática del valor de una imagen a partir de sus correspondientes metadatos, como podría ser el caso del empleo de algoritmos de clustering o agrupamientos no supervisados aplicados a los propios metadatos. Y por el otro, identificar y medir, sobre todo medir, por medio de técnicas de procesamiento digital de imagen, diferentes aspectos o características de la propia imagen que expliquen la manera, mejor o peor, en la que ésta es percibida por sus espectadores. La naturaleza de tales indicadores es diversa, pudiendo emplearse desde descriptores básicos, como por ejemplo el brillo, el color o la complejidad de la imagen, a otros más complejos y sofisticados, inspirados por ejemplo en los mecanismos de atención de nuestro sistema visual o conectados con algunos de los recursos para la composición más populares del mundo de la fotografía, como puede ser por ejemplo el uso de la regla de los tercios o el uso de la perspectiva. A partir de las imágenes recuperadas a modo de ejemplos convenientemente etiquetados y por medio de técnicas de aprendizaje automático, finalmente es posible aprender diferentes modelos probabilísticos que, apoyados en las métricas o características visuales anteriormente mencionadas, permiten inferir el valor de una determinada imagen tal y como éste sería percibido por sus potenciales espectadores. En general, esta tecnología permitiría mejorar las capacidades de los actuales sistemas de indexación y recomendación de imágenes, ayudándonos, por ejemplo, a diferenciar entre diferentes clases o niveles de atractivo visual o a ordenarlas en virtud al valor estético estimado de las mismas. Desde el punto de vista de su potencial aplicación, y a modo de ejemplo, esta tecnología podría aplicarse al desarrollo de soluciones de turismo inteligentes que facilitaran información acerca de diferentes lugares de interés turístico. En particular, dicha información podría presentarse acompañada de imágenes recuperadas automáticamente desde diferentes fuentes, pero empleando para ello solamente una selección de aquellas que mejor ensalzasen el atractivo turístico de cada lugar. mejorando así la experiencia de los usuarios de nuestro sistema. [Orador 1]: Tal y como ha comentado Fernando, una de las estrategias estudiadas para solventar el problema de inferencia del valor estético percibido se basa en la extracción de características visuales de cada una de las imágenes. A modo de ejemplo, vamos a presentar algunas de las que podrían ser empleadas. La composición de una fotografía hace referencia al posicionamiento de los elementos relevantes dentro de la misma, lo cual puede cambiar de forma sustancial la manera en la que la imagen y por extensión dichos elementos son percibidos. Así, uno de los recursos más empleados es la conocida regla de los tercios, que consiste en hacer coincidir la ubicación de los objetos o sujetos dentro de la imagen con aquellas rectas imaginarias que la dividirían en tercios de forma vertical y horizontal o con sus intersecciones. Otra de las características más relevantes de una fotografía en cuanto a cómo es percibida por un espectador viene determinada por las combinaciones de colores incluidas en la misma o incluso por la ausencia de color, como podría ser el caso de una fotografía en blanco y negro. Como podemos imaginar, el uso de la perspectiva es otro recurso de composición de una imagen que puede influir de forma relevante en la percepción. La presencia de un punto de fuga, es decir, la convergencia natural de ciertas líneas dentro de la escena, ayuda a dirigir la atención del espectador a la región de la imagen en la que dicho punto se encuentra. Otros ejemplos de descriptores visuales a emplear serían la entropía, que nos permite distinguir la complejidad de las diferentes texturas presentes en la imagen, o la saliencia visual, que nos permite identificar qué regiones dentro de una imagen son aquellas que captan en mayor medida nuestra atención. Características visuales todas ellas con un evidente impacto en la percepción de la imagen por parte del espectador.