Qu’est-ce que la textométrie?
La textométrie, née en France dans les années 80, a développé des techniques puissantes et originales pour l’analyse de grands corpus de textes. Reprenant les acquis de la lexicométrie et de la statistique textuelle, elle propose des outils et des méthodes éprouvés dans de multiples branches des SHS et statistiquement solidement fondés. Le projet Textométrie fédère les développements logiciels académiques du domaine pour mettre en place une plateforme modulaire et open-source appelée TXM. Il s’agit à la fois d’une opération patrimoniale au rayonnement international et du lancement d’une nouvelle génération de recherche textométrique, en synergie avec les technologies de corpus actuelles (Unicode, XML, TEI, outils de TAL, CQP, R).
La formation est animée par Serge Heiden, responsable du projet « Textométrie ».
Pourquoi utiliser TXM?
La plateforme TXM est couramment utilisée par des projets de recherche de différentes disciplines de lettres, sciences humaines et sociales comme l’histoire, la littérature, la géographie, la linguistique, la sociologie et les sciences politiques. La plateforme TXM combine des techniques puissantes et originales pour l’analyse de grands corpus de textes au moyen de composants modulaires et open-source. TXM permet actuellement de : construire des sous-corpus à partir de différentes métadonnées (propriétés) des textes (eg. : date de publication, auteur, type de texte, thème) ; construire des partitions à partir de ces propriétés permettant d’appliquer des calculs de contraste entre les textes ou entre groupes de textes ; produire des concordances kwic à partir de recherches de motifs lexicaux complexes – construits à partir des propriétés des mots (eg. : « un mot de lemme ’aimer’ suivi à au plus de 2 mots d’un mot commençant par ’pouv’) ; calculer le vocabulaire d’ensemble d’un corpus ou la liste des valeurs attestées d’une propriété de mot donnée ; construire une édition HTML de base pour chaque texte du corpus et des tableaux de contingence croisant les mots, les textes et leurs structures, etc.
- 11 et 12/05/2015 ; il n’est pas possible d’assister partiellement à la formation
- 9h30-16h30
- Lieu : salle de formation Urfist, Bibliothèque Droit-Lettres, 4 avenue D. Diderot 33607 Pessac – 1er étage
- Contenus : initiation aux outils d’analyse et initiation à la préparation de corpus et prise en main de TXM
- Publics : doctorants, enseignants-chercheurs et chercheurs analysant des corpus de textes.
- Pré-requis : analyser des corpus de textes ; avoir une utilisation courant de la bureautique. La formation est également adaptée aux « faux débutants » TXM.
- Intervenant : ingénieur de recherche en informatique linguistique à l’ENS de Lyon, Serge Heiden est responsable du projet « Textométrie » et exerce au sein de l’unité mixte de recherche Icar.
- S’inscrire
- Ce stage peut vous intéresser : Organiser un événement scientifique avec la plateforme Sciencesconf ; L’identité du publiant à l’épreuve du numérique : enjeux et perspectives pour l’identification des auteurs ; Visualiser et cartographier ses données