All events will take place at Olympe de Gouges building.

Monday, October the 28th, 2019

Morning (9h30-12h30)

Salle 341 : L. Liégeois et A. Falaise (LLF)
TXM : Introduction à l’outil et initiation aux expressions régulières

Salle 342 : L. Noreskal
Introduction à Unitex

Afternoon (14h-17h)

Salle 119 : Réunion ouverte à celles et ceux qui participent ou qui souhaitent participer aux actions des Groupes Projet « Multimodalités et nouvelles formes de communication » (GP2) et « Annotation » (GP5) du consortium CORLI.

Tuesday, October the 29th, 2019

Morning (9h-13h)

Amphi 1 : Demie-journée d'étude autour des outils et des bonnes pratiques pour l'annotation de corpus linguistiques.

Afternoon (14h-17h)

Salle 341 : S. Heiden
TXM : annotation par concordances

Salle 342 : S. Caët
Transcription et analyse de données avec CLAN

Wednesday, October the 30th, 2019

Morning (9h30-12h30)

Salle 341 : M. Quignard
TXM : annotation en plein texte (application à la co-référence)

Salle 342 : B. Bigi
Annoter avec SPPAS (1/2) : À propos de SPPAS

Afternoon (14h-17h)

Salle 342 : B. Bigi
Annoter avec SPPAS (2/2)

Salle 341 : Charlotte Hauser
ELAN : gestion des "templates" pour l'annotation

×

TXM : Introduction à l’outil et initiation aux expressions régulières
L. Liégeois et A. Falaise (LLF)

Cette formation propose d'aborder l'utilisation des expressions régulières pour l'interrogation de données textuelles. Après une courte partie théorique, l'utilisation des expressions régulières sera appliquée à l'outil TXM.
×

Introduction à Unitex
L. Noreskal

Unitex est un logiciel libre qui permet d’analyser et d'annoter du texte en utilisant un système de graphes. Les graphes permettent la modélisation des structures recherchées en appliquant des ressources linguistiques telles que des dictionnaires et des grammaires. Ainsi, lors de cette formation, nous aborderons les bases du logiciel : la création et l'application de graphes pour la recherche d’occurrences et l'annotation en travaillant sur Le tour du monde en 80 jours de Jules Verne.
×

TXM : annotation par concordances
S. Heiden

Une connaissance de base de l'outil TXM et du langage CQL est préférable. Si vous ne possédez pas ces connaissances, nous vous conseillons de suivre la formation du lundi matin intitulée "TXM : Introduction à l’outil et initiation aux expressions régulières.

La formation introduira de façon pratique l'annotation par concordances d’un corpus, qui consiste à associer à certains mots en contexte, repérés par une requête CQL, des informations comme une catégorie, un mot clé, un commentaire etc. puis à exploiter ces informations avec les outils de TXM.

On abordera successivement :

  • l'ajout ou la modification de propriétés de mots par concordances (comme les propriétés 'pos' ou 'lemme')
  • l'ajout de structures et de propriétés autour de séquences de mots par concordances (comme des entités de lieux ou de personnes)
  • Pour chaque mode d'annotation, on vérifiera et on exploitera les annotations réalisées.
×

Transcription et analyse de données avec CLAN
S. Caët

Cette session de formation a pour but d’initier les personnes présentes au programme CLAN. CLAN est un programme permettant notamment de transcrire des corpus oraux (avec alignement entre son/vidéo et transcription) et de conduire une série d’analyses automatiques. Nous verrons également comment exporter une transcription vers d’autres programmes permettant le traitement de corpus oraux, comme PRAAT ou ELAN.
×

TXM : annotation en plein texte (application à la co-référence)
M. Quignard

Une connaissance de base de l'outil TXM et du langage CQL est préférable. Si vous ne possédez pas ces connaissances, nous vous conseillons de suivre la formation du lundi matin intitulée "TXM : Introduction à l’outil et initiation aux expressions régulières.

×

Annoter avec SPPAS (1/2) : À propos de SPPAS
B. Bigi

Nous verrons comment intégrer SPPAS dans une méthodologie de construction semi-automatique de corpus oraux et/ou multimodaux. Une démonstration présentera l'ensemble des fonctionnalités de SPPAS en ce qui concerne les annotations automatiques, l'analyse des annotations produites et la conversion des fichiers annotés (textgrid, eaf, csv, ...)
×

Annoter avec SPPAS (2/2)
B. Bigi

Cette seconde partie de la formation se focalisera sur la segmentation automatique et l'analyse de ces annotations (extraction par filtres et statistiques).
×

ELAN : gestion des "templates" pour l'annotation
C. Hauser

Cette formation a pour but de fournir une aide pratique aux personnes ayant un projet impliquant la transcription vidéo via ELAN. Plus précisément, nous créerons un template ELAN sur mesure adapté à votre projet de recherche. Il est primordial que vous sachiez DEJA vous servir des fonctions de bases du logiciel ELAN.