Cómo abordar la semántica y la geoanotación con Recogito

Monday, 25/Jun/2018: 9:00am – 12:30pm
Location: Colonia

Gimena del Río Riande (gdelrio.riande@gmail.com), (CONICET), Argentina
Romina De León (rdeleon@conicet.gov.ar), (CONICET), Argentina
Nidia Hernández (nidiahernandez@conicet.gov.ar), (CONICET), Argentina
Leif Isaksen (l.isaksen@exeter.ac.uk), University of Exeter, United Kingdom

This workshop introduces Recogito 2, a tool developed by Pelagios Commons that enables annotation of geographic place references in text, images and data through a user-friendly online platform. Perhaps the most notable feature of Recogito 2 is the ability to produce semantic data without the need to work with formal languages directly, while at the same time allowing the user to export the annotations produced as valid RDF, XML and GeoJSON formats.

The work of Pelagios Commons has shown that connecting historical data according to their common reference to places (expressed via URIs stored in gazetteers) is a particularly powerful approach: information about material culture, archaeological excavations, ancient texts and related scholarship can be connected and cross referenced through the geodata.

The Recogito annotation tool aims to facilitate the creation and publication of Linked Open Data by dramatically reducing some commonly encountered obstacles. First developed in 2014, the community-oriented philosophy behind Pelagios Commons has made users an active agent in shaping its functionality and interface.

Recogito code is Open Access and available through GitHub where discussions of Recogito’s more technical aspects are held. After a year of intensive redevelopment from the ground up, Recogito 2 was launched in December 2016 and now has almost 1,500 registered users. Introductory documentation is available in English, Spanish, German and Italian with the interface itself being translated into multiple languages in February 2018.

Recogito now supports both additional image standards (such as IIIF) and text standards (TEI export). This allows researchers to use the annotation tool as either a starting or intermediate point for their workflow in the production of semantic annotations that can be then built upon with other technologies.

Originally conceived for data related to the ancient world, Recogito 2 has become a valuable tool for annotating many other kinds of historical and modern sources, especially (but not confined to) those containing geographical information. Recogito 2 facilitates the annotation of any named entity. Where applicable, they can be resolved against a number of aligned digital gazetteers, including the ancient world (Pleiades) and modern (Geonames). Although the annotation of geographical information is its most principal focus, Recogito 2 also allows “people” and “event” references to be annotated (currently without semantic resolution), and the opportunity to add tags and comments to disambiguate and refine later searches.

This workshop walks participants through all stages of using Recogito 2 to annotate different types of source documents: from uploading a file to the online platform, through annotation, to the download of the annotations in the available data formats. More specifically, the workshop will show practical examples of:

Annotation of sources in text format
Attendees will learn how to benefit from Recogito’s automatic recognition of named entities, and how to refine it manually. They will create annotations ex novo, and check or modify those identified by Recogito. The geo-annotations produced on the text can then be plotted on a digital map, through a user-friendly visualisation mode.

Annotation of images and tables
After beginning with text files, attendees will work on the semantic annotations of images. Maps are especially well suited to geo-annotation but Recogito 2 can also be used for the annotation of other types of image, such as photographs or even textual sources in the form of digitised manuscripts. Users will upload images to the Recogito platform and be able to select, transcribe, annotate and, georesolve toponyms within the image. Workshop attendees will also see how Recogito can import and annotate or align tabular (CSV) data such as that derived from spreadsheets, databases or gazetteers.

Exporting data from Recogito
Finally, participants will learn how to export data from Recogito in a variety of formats suitable for visualizing and analysis in other tools, such as spreadsheets, databases or GIS.

To maximise the benefit of the workshop, participants are invited to bring their own data and documents to annotate.

 

Spanish version

Este taller presenta Recogito 2 , una herramienta desarrollada por Pelagios Commons que permite la anotación de lugares geográficos en texto, imágenes y datos a través de una plataforma en línea fácil de usar. Quizás la característica más destacada de Recogito 2 es la capacidad de producir datos semánticos sin la necesidad de trabajar directamente con los lenguajes formales, al mismo tiempo permite al usuario exportar las anotaciones producidas en formatos RDF, XML y GeoJSON.

El trabajo de Pelagios Commons ha demostrado que la conexión de datos históricos según su referencia a lugares (expresada a través de URI almacenados en diccionarios geográficos) es un enfoque particularmente poderoso: información sobre cultura material, excavaciones arqueológicas, textos antiguos y estudios relacionados se pueden conectar y cruzar referenciado a través de los geodatos.

La herramienta de anotación Recogito tiene como objetivo facilitar la creación y publicación de Datos Enlazados en Abierto mediante la reducción de algunos obstáculos que se encuentran comúnmente. Desarrollado por primera vez en 2014, Pelagios Commons, con su filosofía orientada a la comunidad, ha convertido a los usuarios en agentes activos que modelan su funcionalidad e interfaz. El código de Recogito es de acceso abierto y está disponible a través de GitHub donde se llevan a cabo discusiones sobre sus aspectos más técnicos. Después de un año de intensa remodelación desde cero, Recogito 2 se lanzó en diciembre de 2016 y ahora cuenta con casi 1.500 usuarios registrados. La documentación introductoria está disponible en inglés, español, alemán e italiano, y la interfaz se traduce a varios idiomas desde febrero de 2018.

Recogito ahora es compatible con estándares de imágenes (como IIIF ) y textos (exportación de TEI). Esto permite a los investigadores utilizar la herramienta de anotación como un punto inicial o intermedio para su flujo de trabajo en la producción de anotaciones semánticas que luego se puede fortalecer con otras tecnologías.

Originalmente Recogito 2 fue concebido para datos relacionados con el mundo antiguo, sin embargo, se ha convertido en una herramienta valiosa para anotar muchos otros tipos de fuentes históricas y modernas, especialmente (pero no limitadas a) aquellas que contienen información geográfica. Además, facilita la anotación de cualquier entidad nombrada. En su caso, se puede resolver contra varios gazetteer digitales alineados, incluidos el mundo antiguo (Pleiades) y el moderno (Geonames). Aunque la anotación de información geográfica es su enfoque principal, Recogito 2 también permite que se anoten las referencias de “personas” y “eventos” (actualmente sin resolución semántica), y la oportunidad de agregar etiquetas y comentarios para eliminar la ambigüedad y refinar las búsquedas posteriores.

Este taller conducirá a los participantes a través de todas las etapas de uso de Recogito 2 para anotar diferentes tipos de fuentes: desde cargar un archivo a la plataforma, realizar anotaciones, hasta la descarga de las anotaciones en los formatos de datos disponibles. Más específicamente, el taller mostrará ejemplos prácticos de:

Anotación de fuentes en formato de texto
Los asistentes aprenderán cómo beneficiarse del reconocimiento automático de entidades nominales con Recogito, y cómo refinarlo manualmente. Crearán anotaciones nuevas y verificarán o modificarán las identificadas por Recogito. Las geoanotaciones producidas en el texto se pueden trazar en un mapa digital, a través de un modo de visualización amigable.

Anotación de imágenes y tablas
Después de anotar archivos de texto, los participantes trabajarán en anotaciones semánticas de imágenes. Los mapas son los más adecuados para la anotación geográfica, pero Recogito 2 también se puede utilizar para la anotación de otro tipo de imágenes, como fotografías o incluso fuentes textuales de manuscritos digitalizados. Los usuarios subirán imágenes a Recogito, allí podrán seleccionar, transcribir, anotar y geo-referenciar topónimos dentro de las imágenes. Los asistentes al taller también conocerán como Recogito puede importar, anotar y/o alinear datos tabulares (CSV) como los de hojas de cálculo, bases de datos o gazetteers.

Exportar datos de Recogito
Finalmente, los participantes aprenderán cómo exportar datos de Recogito en una variedad de formatos adecuados para visualizar y analizar los mismos en otras herramientas, tales como hojas de cálculo, bases de datos o SIG.

Para maximizar el beneficio del taller, se invita a los participantes a traer sus propios datos y documentos para hacer anotaciones.

Source: Getting to Grips with Semantic and Geo-annotation using Recogito 2/ Cómo abordar la semántica y la geoanotación con Recogito 2