InicioFormations en textométrie pour historiens
Formations en textométrie pour historiens
Textometric training for historians
Publicado el lundi 14 de décembre de 2015
Resumen
Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative. Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.
Anuncio
Présentation
Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative.
Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.
Parmi les différents traitements présentés, une attention particulière est portée à la numérisation et la constitution d’un corpus textuel, ainsi qu'a l'étiquetage des textes et la lemmatisation des formes. Les concordances, l'analyse temporelle, la recherche des segments répétés sont abordées, comme les cooccurrences et les poly-cooccurrences. Les outils statistiques mobilisés sont « classiques » : analyses factorielles, méthodes de classification, etc. Enfin, quelques logiciels sont présentés : Lexico 3, Coocs2, TreeTagger, TXM et IraMuTeQ.
Les matinées seront consacrées à des conférences de manière à exposer les notions théoriques préalables aux formations pratiques, qui auront lieu les après-midis en salle informatique afin de proposer aux participants des exercices concrets sur des jeux de données historiques.
Toute la formation se déroule sur le site Sorbonne. Les conférences du matin ont lieu en salle Perroy et les travaux pratiques de l'après-midi dans les salles informatiques 01 et 02 (accessibles par l'entrée du 14 rue Cujas).
Inscription et modalités de sélection
L'inscription est obligatoire sur http://pireh-dev.univ-paris1.fr/inscriptions/index.php/882624/lang-fr
avant le 03/01/2016
La formation est ouverte à tous les chercheurs intéressés à partir d'un niveau doctorat, les candidatures sont retenues par ordre d'arrivée dans la limite des places disponibles (20 places).
La priorité est donnée aux doctorants en histoire de l'Université Paris 1, mais les inscriptions extérieures sont les bienvenues.
Informations supplémentaires sur http://www.univ-paris1.fr/axe-de-recherche/pole-informatique-de-recherche-et-denseignement-en-histoire/doctorat/
Programme
04/01/2016 La textométrie pour l’historien : aspects théoriques et pratiques
Conférence de (10h-12h, salle Perroy)
Atelier (12h-13h, salle informatique 01)
Présentation et installation des logiciels utilisés durant la formation
TP : (14h-17h, salle informatique 01)
-
Numériser un corpus de textes
-
Nettoyer des textes en utilisant les expressions rationnelles
-
Importer les données dans un logiciel de textométrie
05/01/2016 La linguistique de corpus
Conférence (10h-12h)
TP (13h-16h, salle informatique 01)
-
Utilisation et évaluation des partitions
-
Etude du dictionnaire des formes
06/01/2015 Exploration des textes et mesures du langage
Conférence (10h-12h)
TP (13h-16h, salle informatique 01) :
-
Phrases, mots, formes et occurences
-
Modèle statistique (loi hypergéométrique, spécificités)
-
Usage des formes (rafales, densité textuelle, segments répétés)
07/01/2016 Les enjeux de la lemmatisation
Conférence (10h-12h)
TP (13-16h, salle informatique 01)
-
Utilisation de Treetagger, CQP/CQL, CWB
08/01/2016 Le système des mots
Conférence (10h-12h) :
De la cooccurrences aux trames
TP (13h-16h, salle informatique 01)
-
Analyse des cooccurences (AFC des cooccurents dans un corpus, polycooccurences, trames)
Categorías
- Historia (Categoría principal)
- Pensamiento y Lenguaje > Epistemología y métodos > Métodos de tratamiento y de representación > Métodos cuantitativos
- Pensamiento y Lenguaje > Epistemología y métodos > Cartografía, tratamiento de la imagen, SIG
- Pensamiento y Lenguaje > Epistemología y métodos > Métodos de tratamiento y de representación
- Pensamiento y Lenguaje > Epistemología y métodos > Enfoques de corpus, encuestas, archivos
- Pensamiento y Lenguaje > Epistemología y métodos > Humanidades digitales
Lugares
- 14 rue Cujas
París, Francia (75005)
Fecha(s)
- dimanche 03 de janvier de 2016
Palabras claves
- textométrie, statistique, analyses factorielles, méthodes de classification, corpus
Contactos
- Stéphane Lamassé
courriel : stephane [dot] lamasse [at] univ-paris1 [dot] fr - Léo Dumont
courriel : leo [dot] dumont [at] univ-paris1 [dot] fr
URLs de referencia
Fuente de la información
- Léo Dumont
courriel : leo [dot] dumont [at] univ-paris1 [dot] fr
Para citar este anuncio
« Formations en textométrie pour historiens », Informaciónes varias , Calenda, Publicado el lundi 14 de décembre de 2015, https://calenda-formation.labocleo.org/350084