The itinerary <em>TITULORECORRIDO</em> has been successfully created. Now you can add in works from the Collection browser
<em>TITULOOBRA</em> added to <em>TITULORECORRIDO</em> itinerary

El Grafo de Conocimiento del Museo

La lectura aumentada de la colección: contenidos anotados, más accesibles y cercanos

La nueva evolución del Prado en la web se plateó como objetivo hacer intelectualmente más cercanos y más accesibles los contenidos no estructurados del museo. Quizá el más significativo de todos ellos sea el que se ofrece en las muy ricas y a veces complejas descripciones de sus obras. La Lectura Aumentada reconoce y extrae las entidades en ellos contenidas, facilitando de ese modo información adicional y contextual de las mismas, con el fin de que cualquiera que pueda leerlos sin renunciar a comprenderlos en profundidad.

A menudo, la comprensión de una obra de arte no contemporáneo requiere acceder y conocer un contexto que a las mujeres y hombres contemporáneos les puede, en muchos casos, resultar ajeno. No es frecuente que el poblado mundo de referencias mitológicas, religiosas, literarias, sentimentales o filosóficas de la antigüedad, tan frecuentemente citado y revisitado en muchas de las obras del Prado, por poner un solo caso, resulte no familiar, sino siquiera conocido por el público actual que se acerca a su colección. Lo mismo ocurre con aquellas obras que son representación de un hecho histórico, que acontecen en un lugar más o menos olvidado, remoto, raro o directamente mitológico o que nos hablan de costumbres, útiles o formas de vida periclitadas. Para la mayor parte de las personas que visitan el Prado o su web “Leda”, “Andrios”, “Panofsky”, “Dionysios”, “Ares”, “bacanales”, “Palas Atenea”, “Demeter”, “Cantueso”, “Piorno”, “Anás”, “Calisto”, “Clío”, “Herodías”, “Demócrito”, “Josué”, “Lucio Quincio Cincinato”, “canon por tonos”, “alegoría de las horas” o incluso “guerra de Troya” pueden resultar términos extremadamente extraños.

La Lectura Aumentada del Prado ofrece de manera automática, pero con la supervisión necesaria y la garantía del Museo del Prado, un contexto explicativo de los textos que describen la obra, contribuyendo a convertirlos en textos didácticos y orientados al aprendizaje. Es uno de los elementos de lo que podríamos llamar el Prado Educativo o del Prado para la Educación.

Si la inteligencia son contextos, la Lectura Aumentada del Prado en la Web contribuye al desarrollo de una cierta inteligencia colectiva o entendimiento colectivo de la obra expuesta en la Web del Prado que puede, además, ser la puerta de acceso a otros conocimientos que están más allá de la obra de arte, pero que son apuntados o señalados por ella.

El proyecto de la Lectura Aumentada ha tenido un segundo nivel de explotación, más técnico y orientado a mejorar los procesos de documentación y representación de las obras de la colección. En la medida en la que, gracias a la Lectura Aumentada de los textos, el Prado ha sido capaz de extraer y reconocer con precisión nuevas entidades en la descripción de sus obras, ha podido, al incorporarlas al sistema de metadatos de la obra, enriquecer la descripción formal de la misma, descubriendo, a la par, conexiones previamente ocultas. En suma, el proyecto de Lectura Aumentada ha contribuido a mejorar significativamente el proyecto de documentación del conjunto de obras de la colección del museo.

La tecnología que soporta el proyecto de Lectura Aumentada del Museo del Prado

NLU son las siglas de Natural Language Understanding, en inglés, o Comprensión del Lenguaje Natural, en español. La comprensión del lenguaje natural (NLU) es un área específica del Procesamiento del Lenguaje Natural (NLP) y de la Inteligencia Artificial que se ocupa de la lectura y comprensión automática de textos. Uno de los elementos centrales de la comprensión de un texto, el más importante de hecho, es el reconocimiento de las entidades contenidas en el mismo. Este es considerado uno de los problemas difíciles dentro de la Inteligencia Artificial.

GNOSS es la plataforma que soporta el proyecto digital del Museo del Prado. GNOSS contiene y actualiza el Grafo de Conocimiento del museo, a la par que facilita los sistemas de interacción con los usuarios: buscadores, fichas de obra, contextos para cada obra, etc. Para realizar esta segunda fase del proyecto hemos utilizado y entrenado de manera específica un servicio del que no habíamos hecho uso hasta ahora: un motor de comprensión de lenguaje natural y de reconocimiento de entidades y desambiguación capaz de analizar un texto y de extraer a partir de su contenido las entidades nombradas de un modo cuasiautomático, reconociendo diferentes escrituras de una misma entidad (por ejemplo, Velázquez, Diego Velázquez, Diego de Velázquez…), y los principales conceptos o temas tratados en dicho texto.

El motor incluye una base de conocimiento que toma como referencia los contenidos de la Wikipedia, la ontología general de Dbpedia y algoritmos de procesamiento de lenguaje natural, así como servicios de entrenamiento y aprendizaje orientados a construir modelos personalizados de procesamiento y comprensión del lenguaje para dominios específicos y privados de conocimiento. Dispone, además, de potenciadores de desambiguación y un sistema de herramientas que refuerza su seguridad y acierto. En el caso del Prado, hemos entrenado específicamente las capacidades del motor en el dominio específico de conocimiento del museo incorporando a su base de conocimiento los datos provenientes del mismo.

La aplicación de las tecnologías que concurren en el procesamiento y la comprensión del lenguaje natural y la consolidación de sus resultados en un grafo del conocimiento que contenga los conjuntos de entidades y datos reconocidos y extraídos puede permitir descubrir conexiones e ideas previamente ocultas en los textos y es, por eso, un modo de descubrir conocimiento implícito y de facilitar el aprendizaje a las personas. Además, una vez que las entidades contenidas en un conjunto de textos han sido reconocidas y extraídas pueden enlazarse a través de sus atributos comunes, no sólo entre sí, sino con entidades de terceras partes, consolidándose de este modo en un grafo de conocimiento que puede evolucionar y aprender.

El trabajo del área de Documentación en la construcción de la experiencia que ofrece la Lectura Aumentada

Aunque el procesamiento y comprensión de los textos que describen la obra de arte y el reconocimiento de las entidades contenidas y nombradas se ha realizado de manera automática, pues de eso se trata en un proyecto de Inteligencia Artificial (IA), hemos desarrollado para el equipo de Documentación un conjunto de herramientas de monitorización, supervisión y validación de los servicios de procesamiento y comprensión automáticos con el fin de minimizar al máximo los posibles errores cometidos por el motor. Este conjunto de herramientas le ha permitido al área de Documentación del museo navegar por el grafo del Prado, ahora enriquecido gracias al trabajo realizado de enlazado con terceras fuentes.

Gracias a estas herramientas, el área de Documentación ha podido revisar progresivamente las distintas entidades extraídas, identificando aquellas que no estuvieran en la base de datos que contiene los metadatos de la colección del Prado. Este trabajo continuado ha permitido entrenar y refinar el motor de comprensión del lenguaje natural, personalizando su modelo de procesamiento y comprensión para el dominio específico de conocimiento del museo. El resultado es un motor cada vez más experto, que necesita menos supervisión o supervisión menos exhaustiva.

¿Se puede equivocar el servicio de Lectura Aumentada?

El servicio de Documentación del Museo del Prado tiene como misión el que la información que describe y explica la obra sea lo más fiable y actualizada posible y, por tanto, que contenga una cantidad mínima o incluso indetectable de errores. Es por ello por lo que se consideró la supervisión del trabajo realizado por el motor de comprensión de lenguaje natural como una condición tanto para la mejora de las capacidades de reconocimiento y aprendizaje del propio motor, como para asegurar la calidad de los resultados del proyecto. Así, de las fichas de las obras revisadas por el área de documentación se puede decir que tienen un 100% de fiabilidad con relación a las entidades reconocidas y enlazadas con información de terceras partes. Ello no obsta para que, a pesar de todo, pueda haber algunos errores. Los habrá, pues el trabajo es tan basto que no es posible revisar todo lo que hace el Motor de Comprensión de Lenguaje Natural, sino aquello en lo que demuestra menos pericia o resulta más importante.

Número de obras con Lectura Aumentada disponible

Actualmente está disponible la función de Lectura Aumentada para 5.603 obras en español y 2.690 obras en su versión inglesa. Se trata de las obras principales y más visitadas del Museo y de la Web del Museo. Más del 90% de la navegación e interés de los usuarios se concentra en ellas. Con el fin de hacerse una idea de la dimensión exacta del proyecto, basta decir que el Museo expone en el edificio de Villanueva unas 1.900 obras. En la Web del Prado pueden visitarse, en la actualidad, unas 17.000. Más de 5.500 obras supone más que el doble de las que el Museo ofrece al público en sus salas de exposiciones y casi un tercio de las que ofrece en su Web, pero en todo caso más del 90% de las consultadas por los usuarios.

Crecimiento constante del número de obras que ofrecen la experiencia de Lectura Aumentada

El objetivo es continuar con el procesamiento y comprensión del conjunto de textos que componen las obras de la colección y extenderlo al 100 % de todas las que dispongan de un texto descriptivo. El proyecto digital del museo busca poner a disposición del público, necesariamente a través de la web, aquello que el Prado tiene y sabe sobre el 100% de su colección. Todas las piezas deben ser expuestas con el mismo cuidado y detalle, por eso todas deben disponer de un sistema de Lectura Aumentada que facilite contextos explicativos y de aprendizaje a los diferentes grupos de usuarios.

Las obras más conocidas tienen, en general, mejores y más amplias descripciones y, además, pueden acceder a un mayor y más ajustado conocimiento contextual; aquellas obras menores o secundarias a menudo adolecen de ambas cosas, pero son las que más necesitan ser explicadas cuando alguien se acerca a ellas. Satisfacer esta necesidad de una manera eficaz y útil es una tarea ardua, pero es uno de nuestros objetivos.

Up