Técnicas para la creación, enriquecimiento y análisis de textos digitales

Los textos digitales permiten nuevas posibilidades de actividad académica, tales como enriquecer y analizar textos a través de una computadora. Sin embargo, no siempre se encuentran disponibles para todos los períodos e idiomas. Así, en las tradiciones pre-modernas los editores y lectores críticos deben enfrentar problemas multitextuales adicionales.

Este taller está orientado a técnicas de transformación de ediciones críticas impresas en texto digital. Se realizará una breve introducción a la construcción de un corpus de textos medievales con demostraciones de posibilidades de análisis y enriquecimiento semántico. Se discutirá además la importancia de los datos abiertos en las disciplinas humanísticas desde una perspectiva de disponibilidad, acceso, reutilización y participación ciudadana.

El taller se concentrará en el trabajo del proyecto Open Medieval French (github.com/OpenMedFr) pero es de interés para todo investigador en lengua y literatura pre-moderna.

Actividad gratuita. Se entregarán certificados de asistencia. 

Requisitos para la participación:

– Comprensión oral de la lengua inglesa, ya que una parte importante del curso se dictará en ese idioma.

– Traer una computadora personal para poder realizar las actividades prácticas.

– No es necesario tener conocimientos de programación o Humanidades Digitales para cursar este taller.

Aquí Inscripción

Objetivos

Los participantes del taller podrán:

    • acceder a un panorama de corpus disponibles para investigación en lenguas medievales -en particular francés- así como a las limitaciones de acceso a estos corpora,
    • explorar la importancia de la disponibilidad de datos textuales abiertos para las nuevas modalidades de investigación literaria,
    • tener un aprendizaje práctico del proceso de reconocimiento óptico de caracteres (OCR) y comprender los desafíos que implica para lenguas no modernas,
    • explorar qué metadatos asociar a los textos,
    • aprender acerca de licencias Creative Commons y en particular la utilizada en el proyecto OpenMedFr, CC BY-NC-SA 4.0 International,
    • adquirir conocimientos básicos de análisis y manipulación de post-procesamiento: utilización de texto plano para análisis digital (Voyant Tools, AntConc, Juxta) de textos existentes o “distant reading”,
    • utilizar plataformas de gestión de versiones (GitHub) útiles para la creación colaborativa y el almacenamiento de datos,
    • aprender acerca de procesos avanzados de investigación en humanidades digitales,
    • participar activamente del desarrollo del taller.

Responsables:

David Wrisley, Gimena del Rio Riande, Gustavo Fernández Riva.

Carga horaria:

10 horas

Source: Acta Académica – Técnicas para la creación, enriquecimiento y análisis de textos digitales