Tous les événements se tiendront au bâtiment Olympe de Gouges.

Lundi 28 octobre 2019

Lundi matin (9h30-12h30)

Salle 341 : L. Liégeois et A. Falaise (LLF)
TXM : Introduction à l’outil et initiation aux expressions régulières

Salle 342 : L. Noreskal
Introduction à Unitex

Lundi après-midi (14h-17h)

Salle 119 : Réunion ouverte à celles et ceux qui participent ou qui souhaitent participer aux actions des Groupes Projet « Multimodalités et nouvelles formes de communication » (GP2) et « Annotation » (GP5) du consortium CORLI.

Mardi 29 octobre 2019

Mardi matin (9h-13h)

Accueil à partir de 9h. Début à 9h30.

Amphi 1 : Demie-journée d'étude autour des outils et des bonnes pratiques pour l'annotation de corpus linguistiques.

Mardi après-midi (14h-17h)

Salle 341 : S. Heiden
TXM : annotation par concordances

Salle 342 : S. Caët
Transcription et analyse de données avec CLAN

Mercredi 30 octobre 2019

Mercredi matin (9h30-12h30)

Salle 341 : M. Quignard
TXM : annotation en plein texte (application à la co-référence)

Salle 342 : B. Bigi
Annoter avec SPPAS (1/2) : À propos de SPPAS

Mercredi après-midi (14h-17h)

Salle 342 : B. Bigi
Annoter avec SPPAS (2/2)

Salle 341 : Charlotte Hauser
ELAN : gestion des "templates" pour l'annotation

×

TXM : Introduction à l’outil et initiation aux expressions régulières
L. Liégeois et A. Falaise (LLF)

Cette formation propose d'aborder l'utilisation des expressions régulières pour l'interrogation de données textuelles. Après une courte partie théorique, l'utilisation des expressions régulières sera appliquée à l'outil TXM.
×

Introduction à Unitex
L. Noreskal

Unitex est un logiciel libre qui permet d’analyser et d'annoter du texte en utilisant un système de graphes. Les graphes permettent la modélisation des structures recherchées en appliquant des ressources linguistiques telles que des dictionnaires et des grammaires. Ainsi, lors de cette formation, nous aborderons les bases du logiciel : la création et l'application de graphes pour la recherche d’occurrences et l'annotation en travaillant sur Le tour du monde en 80 jours de Jules Verne.
×

TXM : annotation par concordances
S. Heiden

Une connaissance de base de l'outil TXM et du langage CQL est préférable. Si vous ne possédez pas ces connaissances, nous vous conseillons de suivre la formation du lundi matin intitulée "TXM : Introduction à l’outil et initiation aux expressions régulières.

La formation introduira de façon pratique l'annotation par concordances d’un corpus, qui consiste à associer à certains mots en contexte, repérés par une requête CQL, des informations comme une catégorie, un mot clé, un commentaire etc. puis à exploiter ces informations avec les outils de TXM.

On abordera successivement :

  • l'ajout ou la modification de propriétés de mots par concordances (comme les propriétés 'pos' ou 'lemme')
  • l'ajout de structures et de propriétés autour de séquences de mots par concordances (comme des entités de lieux ou de personnes)
  • Pour chaque mode d'annotation, on vérifiera et on exploitera les annotations réalisées.
×

Transcription et analyse de données avec CLAN
S. Caët

Cette session de formation a pour but d’initier les personnes présentes au programme CLAN. CLAN est un programme permettant notamment de transcrire des corpus oraux (avec alignement entre son/vidéo et transcription) et de conduire une série d’analyses automatiques. Nous verrons également comment exporter une transcription vers d’autres programmes permettant le traitement de corpus oraux, comme PRAAT ou ELAN.
×

TXM : annotation en plein texte (application à la co-référence)
M. Quignard

Une connaissance de base de l'outil TXM et du langage CQL est préférable. Si vous ne possédez pas ces connaissances, nous vous conseillons de suivre la formation du lundi matin intitulée "TXM : Introduction à l’outil et initiation aux expressions régulières.

×

Annoter avec SPPAS (1/2) : À propos de SPPAS
B. Bigi

Nous verrons comment intégrer SPPAS dans une méthodologie de construction semi-automatique de corpus oraux et/ou multimodaux. Une démonstration présentera l'ensemble des fonctionnalités de SPPAS en ce qui concerne les annotations automatiques, l'analyse des annotations produites et la conversion des fichiers annotés (textgrid, eaf, csv, ...)
×

Annoter avec SPPAS (2/2)
B. Bigi

Cette seconde partie de la formation se focalisera sur la segmentation automatique et l'analyse de ces annotations (extraction par filtres et statistiques).
×

ELAN : gestion des "templates" pour l'annotation
C. Hauser

Cette formation a pour but de fournir une aide pratique aux personnes ayant un projet impliquant la transcription vidéo via ELAN. Plus précisément, nous créerons un template ELAN sur mesure adapté à votre projet de recherche. Il est primordial que vous sachiez DEJA vous servir des fonctions de bases du logiciel ELAN.