Eliminar barreras para construir puentes a travès de la Web semántica : Isidore, un buscador trilingüe para las Ciencias Humanas y Sociales

StŽephane Pouyllau (stephane.pouyllau@cnrs.fr), CNRS, Huma-Num, France and Laurent Capelli (laurent.capelli@huma-num.fr), CNRS, Huma-Num, France and Adeline Joffres (adeline.joffres@huma-num.fr), CNRS, Huma-Num, France and Desseigne Adrien (adrien.desseigne@huma-num.fr), CNRS, Huma-Num, France and Gautier Hélène (helene.gautier@huma-num.fr), CNRS, Huma-Num, France

“ISIDORE” es un buscador creado por una infraestructura francesa de investigación: la TGIR Huma-Num. No solamente ofrece una plataforma de búsqueda, sino que también normaliza y enriquece los datos y metadatos que cosecha, integrándolos en la Web semántica.

Desde hace dos años, la plataforma “ISIDORE” lanzada en diciembre de 2010 puede enriquecer e indizar metadatos y recursos digitales en Ciencias Humanas y Sociales (CHS) en 3 idiomas: francés, inglés y español. Esta posibilidad es un gran avance para “ISIDORE” y abre perspectivas de colaboración científica en distintos continentes. Conforme a los principios de ciencia abierta y respetuosa de los principios “FAIR”, este enfoque permite el intercambio cada vez más estrecho de numerosos datos integrados en la Web de datos.

De hecho, ahora cuenta con más de 5 millones de recursos digitales (libros, revistas científicas, artículos científicos, anuncios y programas de eventos, convocatorias, blogs, mapas, archivos, documentos audiovisuales, etc.) interconectados mediante referenciales, indizados por un motor de búsqueda. Estos datos enriquecidos son accesibles en tres formas : un portal web (http://www.rechercheisidore.fr/), una API (http://www.rechercheisidore.fr/api) y un acceso unificado (http://www.rechercheisidore.fr/sparql) en una óptica de metadatos abiertos según el formalismo RDF. De hecho “Isidore” promueve el uso de estándares interoperables.

Así, “ISIDORE” es capaz de cosechar corpus y bases de datos en español y en inglés, pero ofrece también enriquecimientos multilingües enlazados entre sí mediante las posibilidades ofrecidas por el linked data. Para lograrlo, “ISIDORE” utiliza las alineaciones de los conceptos entre tesauros y vocabularios disponibles en la web semántica como los Registros de Autoridad y Referencia de Materia de la Biblioteca Nacional de España (http://datos.bne.es/temas) para los datos en español, o bien los encabezamientos de materias del referencial de la Biblioteca del Congreso de EEUU (Library of Congress Subject Headings – LCSH, http://id.loc.gov/authorities/subjects.html) para los datos en inglès. De esta manera, los conceptos de estos dos referenciales mayores están alineados en parte con los conceptos del referencial francès Rameau de la BnF (Biblioteca Nacional Francesa).

Junto con tesauros multilingües ya integrados en “ISIDORE” (como Pactols, Lexvo, GeoEthno, GEMET, etc.), y con el sistema de categorización/clasificación también multilingüe (categorías del sistema francés de archivos abiertos HAL-SHS y del sistema “Calenda” de anuncios de eventos científicos y convocatorias del CLEO-CNRS), “ISIDORE” es capaz de proponer un sistema de enriquecimientos/clasificación en 3 idiomas con la posibilidad de cambiar de idioma durante la búsqueda en la interfaz del portal www.rechercheisidore.fr y de la interfaz para tableta/smartphone (http://m.rechercheisidore.fr/?lang=es).

Esta característica permite al investigador no-francófono de tener acceso a nuevos datos con enriquecimientos, enlaces y clasificaciones en tres idiomas, permitiéndole medir, por ejemplo, el interés de fuentes en idioma francés sugeridas por “ISIDORE” en la interfaz (bien sea en inglés o en español).

De momento, casi 220 000 documentos en español se encuentran en “ISIDORE” y la plataforma contempla cosechar aún más en el futuro.

En paralelo, otros desarrollos que hacen de “ISIDORE” una herramienta cada vez más personalizada, han venido completando sus funcionalidades y abriendo perspectivas. Es el caso del widget “IMoCO”, ISIDORE Motor Constructor que permite crear sólo en unos clics, una interfaz de consulta personalizada de los recursos disponibles en la plataforma “ISIDORE” (por ejemplo recursos específicos sobre un tema). Así, “IMoCO” está diseñado para los usuarios que deseen incluir en su sitio Web el buscador “ISIDORE” haciendo una simple copia/pega de un código HTML. Simple y neutral, se adapta a la mayoría de los sitios Web. Además, IMoCO puede ser totalmente personalizado con sus estilos CSS. También el widget multiligue WordPress “ISIDORE suggestions” (https://fr.wordpress.org/plugins/isidore-suggestions/) permite al usuario de blogs WordPress conseguir sugerencias de documentos presentes en “ISIDORE”. Estas sugerencias se hacen basadas en palabras claves asociadas al artículo que el usuario esté leyendo. Es posible afinar su búsqueda, subrayando el contenido del artículo consultado o seleccionando una o varias disciplinas.

Con este poster, quisiéramos mostrar todas las posibilidades que ofrece actualmente “ISIDORE” para el mundo hispánico en CHS, con lo que nos permite también contemplar colaboraciones fructuosas que contribuirán sin duda a alimentar esta plataforma y, al final, a enriquecer las búsquedas de investigadores o estudiantes francófonos de “ISIDORE” que tendrían acceso a más recursos en español, así como las investigaciones de usuarios hispanohablantes y angloparlantes. También tener la oportunidad de presentar este póster en el cuadro del congreso DH en México permitiría intercambiar con usuarios potenciales sobre sus necesidades, y alrededor de los futuros desarrollos de la plataforma.