Clioweb
Enseigner l'Histoire avec internet
.


L’histoire à l’épreuve du numérique.


Le séminaire Fichet-Heynlin s’intéresse à l’impact de la numérisation à l’université.
Le 26 mars 2014, deux historiens étaient invités : Jean-Philippe Genet et Frédéric Clavert.
Le premier a co-dirigé l’ouvrage Les historiens et l’informatique : un métier à réinventer,
Le second a fait une thèse sur Schacht
et codirigé l’ouvrage « L’histoire contemporaine à l’ère numérique ».

Le fichier audio est disponible, mais la vidéo n’affiche que les six premières minutes.
http://www.reseau-terra.eu/article1309.html

Frédéric Clavert a mis en ligne la transcription du contenu de son intervention.
http://www.clavert.net/seminaire-fichet-heynlin
et le billet L’administration de la preuve en histoire à l’ère numérique
http://www.clavert.net/ladministration-de-la-preuve-a-lere-du-numerique-et-du-reseau-suites-du-seminaire-fichet-heynlin/


Présentation dans Historiens & Géographes no 427
Que change le numérique au travail des historiens ? L’historien doit-il devenir un programmeur ?

Le séminaire ne se limite pas aux réponses habituelles sur le rapport aux archives (bases disponibles en ligne, usage  parfois autorisé de la photo numérique) et sur la publication des travaux (le traitement de texte et l’export en pdf sont des passages obligés, y compris pour les adversaires déterminés de la modernité). Les enjeux centraux sont abordés : la pertinence des questions posées au passé, la qualité du traitement et de l’interprétation des données.

Jean-Philippe Genet énumère les opportunités manquées. Il dresse un réquisitoire vigoureux. Les historiens ont été actifs
dès les années 1960 au sein d’équipes comportant des techniciens. L’étude des Florentins au XVe a été une réussite, celle des conscrits de la Restauration, un échec relatif. Vers 1980, l’institution a retardé d’au moins dix ans le passage des historiens à la micro-informatique. Dans la gestion des carrières, elle est incapable de prendre en compte le changement volontaire, la pluridisciplinarité assumée ou le travail en équipe.

http://aphgcaen.free.fr/chronique/427/aphg427.pdf


Notes prises à partir des interventions de Jean-Philippe Genet
(notes privées, non relues par l'historien).

Question : Quelles sont en histoire les transformations liées au numérique, modifiant le processus allant de la recherche à sa diffusion publique (données, traitement, édition, pédagogie, valorisation) ?

3e minute (environ)
JPG fait la distinction entre les mutations qui auraient dû se produire, mais qui ne se sont pas produites ou insuffisamment et celles qui se sont produites, parfois à l’insu des historiens (cf la numérisation)

- Ces transformations qui ne sont pas arrivées sont celles qui reposent sur une pratique pluridisciplinaire.
Pour faire évoluer l’histoire, il faut se doter d’outils d'analyse des données, travailler soit directement avec des statisticiens et des mathématiciens, soit indirectement, avec des sociologues qui ont fait depuis longtemps ce type de révolution.
Autre domaine aussi important, la textométrie, la statistique lexicale, l’étude du langage, la linguistique. En dépit de critiques féroces de Foucault, les historiens en sont restés à une approche très empirique de lecture des textes, se considérant comme étant les seuls interprètes légitimes des textes, substituant leur propre narration à celui qui leur sert de source. Etudier la source à fond, cela supposerait un travail de lexicométrie, de mise en dictionnaire, d’étude du contexte, des co-occurrences, toutes choses que les linguistes font depuis longtemps mais que les historiens ont peiné à faire. Quelques-uns l’ont fait, mais ce n’est pas une pratique majoritaire dans la discipline.
Plus récemment, l’analyse spatiale s’impose quand l’historien dispose de données géo-référencées. Il aurait fallu travailler avec les géographes, mais ces derniers n’y mettent pas une bonne volonté extrême.

Ces transformations sont d’ordre méthodologique, elles touchent à l’essentiel de la discipline, le raisonnement et la démarche critique.
Pourquoi n’est-ce pas arrivé ?
En raison du manque de formation, la démarche est restée au sein de cercles convaincus mais fermés.

C’est aussi parce que les historiens vivent dans un espace limité volontairement : ils lisent la sociologie ou la science politique, ils sont influencés par elles, mais ils ont une peur panique de voir leur métier confondu avec celui de leurs voisins ; ils redoutent la concurrence des autres sciences sociales, la sociologie et les sciences politiques. C’est surtout vrai des historiens contemporanéistes. Si bien que le développement s’est fait plus facilement en médiévale ou chez les antiquisants.
Cette pratique pluridisciplinaire qui est à mon avis essentielle pour la transformation du métier s'est peu ou mal faite, elle a été insuffisante. Chez les historiens, la formation au métier est le lieu où il faut essayer d’agir pour changer les choses.

- Des mutations se sont produites : la numérisation bouleverse le travail des historiens. C’est un processus en cours, c’est plus facile, parce que c’est une transformation qui est imposée de l’extérieur. Aujourd’hui, par internet, par Wikipedia, n’importe quel étudiant peut accéder à une masse d’informations. Le problème n’est pas différent du celui du livre. Si le livre est lu par un crétin, même avec une bibliographie étoffée, cela n’arrangera rien (donnera des crétineries). Si Wikipedia est consultée par un imbécile, cela produira des imbécillités, c'est clair.
Mais Wikipedia exploité par des étudiants intelligents, curieux et subtils, cela donne accès à des sources qui étaient hors de portée des étudiants de la génération précédente. Avec un accès facilité aux articles de revue, le travail d'un étudiant intelligent est beaucoup plus efficace. Autrefois, seuls ceux qui possédaient bonne biblio et lisaient langues étrangères accédaient à une érudition facile et pouvaient faire illusion. Aujourd’hui, cette érudition est à la portée de tout le monde.

9e :
Dans beaucoup d’ouvrages d’histoire, la description des sources occupe une place démesurée. Aujourd’hui, ces sources sont directement accessibles. Cela donne davantage de temps pour l’analyse et pour l’interprétation. Normalement, on ne devrait plus consacrer des pages et des pages à répéter sous forme de paraphrase ce que contient une source. Dans la thèse magnifique de Georges Duby, vous pouvez aller voir l’indication de la source en note de bas de page. Aujourd’hui, cela ne suffit plus, on doit pouvoir, dans un délai proche accéder aussi à une copie du contenu de l’archive.

Tout un pan de ce travail peu enrichissant devrait disparaître, surtout en contemporaine. En médiévale, un document ne parle pas tout de suite, il faut le lire (paléographie), il faut le traduire… Mais quand vous citez un discours de Jules Ferry, il n’est pas acceptable de seulement le paraphraser. Il faut publier le discours et mettre en avant les trois idées importantes. C’est le plus difficile du métier, ce qui devrait changer avec le numérique.
Ce changement va se faire, que les historiens le veuillent ou non. Européana prévoit que les archives en Europe seront numérisées à l’horizon 2050. C’est déjà le cas pour les fonds notariés pour la période récente. L’essentiel, ce ne sera pas de recopier les archives, ce sera de savoir naviguer, de maîtriser les outils nécessaires pour stocker et traiter cette information.

Il reste un problème général : la capacité à décrire la donnée et à la transformer (la « métasource »). Avec le numérique, la « métasource » peut inclure le contenu de la source. Le terme est peut-être à changer.
L’essentiel, c’est l’analyse de la source, ce que l’historien peut en tirer. Cela reste le cœur du métier, avec l’esprit critique qui est celui de l’historien, qu’il y ait ou non numérisation.

23e :
Dans un cours sur le numérique, on fait toujours un historique long, en commençant avec les machines du XVIIe.
Pour l’historien, l’ordinateur est une rupture complète, d’un tout ordre que celui de la rupture de l’archive
Les historiens travaillent avec des archives et ont conscience de ce qu’est l’archive depuis au moins le XVIe. Dès le Moyen-Age, les Anglais savent qu’à la Tour de Londres, il existait des éléments utiles pour connaître ce qui s’était passé par exemple au XIIIe.
La place centrale des archives, elle n’est pas due à la discipline, mais à l’institution qui a introduit le recours aux archives comme un élément central dans la carrière de l’historien professionnel.

L’ordinateur introduit deux ruptures fondamentales, il sert à mesurer ; il sert à ordonner.
Cela introduit la mesure en histoire, de sorte qu’il n’y a plus de différence entre le quantitatif et le qualitatif, la conversion est possible dans les deux sens. D’autre part, l’ordinateur apporte des capacités fantastiques d'ordonner la donnée, le fait historique, une action qui était impossible avant. Potentiellement, c’est cela qu’a introduit l’ordinateur. Donc, c’est une rupture.

Mais académiquement, ce changement dans le métier n’a pas du tout été perçu et accepté.
On a battu des mains quand on a vu des choses étonnantes : l’étude du catasto florentin de 1427 par Christiane Klapisch et David Herlihy et marque une date : on pouvait étudier la démographie avec une précision fantastique à l’échelle d’une région entre 1420 et 1460. On pouvait dire le revenu moyen en 1427 , calculer l’âge au mariage. On voyait que les Florentines étaient destinées à être veuves : elles épousent des vieux qui ont 15 ans de plus qu’elles, tout cela créé un déséquilibre dans la société. Personne ne pouvait imaginer cela avant l’ordinateur.
Quand Antoine Prost a commencé à utiliser des études de vocabulaire, les historiens du XIX ont bien voulu être étonnés et impressionnés, mais ils n’ont pas suivi l’exemple.
Mais l’institution universitaire marche avec d’autres critères : des élections qui donnent accès à des postes et le CNU, une spécificité française et une aberration. Que je sache, le CNU n’a jamais demandé d’utiliser l’informatique, de produire de la mesure, de profiter de la puissance inégalée utilisable pour ordonner. L’institution universitaire n'a pas tiré les conséquences de cette révolution épistémologique et scientifique que permet l'ordinateur.

Les progrès ont été réels au début : j’ai soutenu ma thèse à plus de 50 ans, une thèse de 8000 pages. Je suis devenu maître de conférence avec un article de 40 pages. Après, je pouvais faire ce que je voulais : j’ai fait des maths, de la statistique, de l’informatique, j’ai créé un laboratoire au CNRS. Je ne suis pas le seul. Tous les gens qui ont fait de l'informatique de façon intensive ont fait la même chose.
Aujourd’hui, aucun jeune chercheur ne peut faire cela. Il doit boucler sa thèse en 5 ans, il ne peut pas s’arrêter pour aller à droite ou à gauche. Faire des études complémentaires, c'est devenu impossible. Un docteur qui fait une thèse magnifique incluant de l’informatique ne va pas être élu : la plupart des collègues qui vont la lire n’y comprendront rien ; ils ne vont pas voter pour lui. Ils préféreront quelqu’un qui leur ressemble, qui a eu le même parcours qu’eux. Au CNU, en histoire, tout ce qui est mathématique est très mal perçu et considéré comme trop aride.
Les blocages sont propres à la discipline. En histoire, la pluridisciplinarité, ce n'est pas un atout. Ce qu’on vous demande, c’est de faire la même chose que vos prédécesseurs. J’ai donné l’impression de tresser des lauriers aux médiévistes, mais aujourd’hui, ils sont devenus pires que les autres. L’histoire médiévale se replie sur une érudition d’autrefois, le latin, les pratiques chartistes, parce que c'est une catégorie qui a peur, qui protège la période. Ce sont les seuls qui se battent à mort pour la période médiévale, ce qui est absurde. Les périodes (européennes) devraient disparaître en histoire, c’est contraire à tout se qui se passe aujourd’hui : la globalisation de l’histoire, la volonté de faire une histoire sur le long terme. Les médiévistes s’enferment dans une sorte de forteresse, ils sont en train de perdre tous les avantages acquis grâce à un investissement précoce dans l’usage de l’informatique.

La numérisation, c’est un autre enjeu. Elle change tout, tout le monde y a accès et cela circule. Elle est imposée par la société parce ce qu’on vit dans un univers numérique,. Tous les historiens, même les plus réactionnaires, les plus conservateurs, les plus ancrés dans leurs vieilles certitudes, même eux sont obligés d’y passer.


30e : une question interminable. En résumé, la rupture actuelle se fait-elle par rapport aux méthodes issues de la bureautique du XIXe (la prise de notes, la mise en fiches…) ou par rapport aux pratiques issues des débuts de l’informatique, dans les années 1960 ?

L’arrivée des ordinateurs se fait à la fin des années 1960 aux USA. La France a suivi très vite : c’était un pays administrativement bloqué, on était tous obligé de passer par les grosses machines du CNRS. Cette situation a suscité une communauté de travail, petite mais très dynamique, où tout le monde se connaissait et où les progrès dans les méthodes ont été très forts. Mais en dehors de ce cercle restreint, le changement d’ordre épistémologie a eu peu d’effets dans la pratique des historiens. Il a toujours aussi peu d’effet.

Là dessus se greffe un deuxième changement, celui du numérique. La numérisation fait rejouer des choses qui datent du XIXe, elle va fatalement conduire à intégrer des changements qui datent de la période des années 1960.
Il y a toujours de gens qui essaient de faire une informatique ouverte, de changer la manière de faire de l’histoire. Mais ils ne sont pas nombreux.

39e : Les pratiques sont liées au technologies.
L’EHESS connaissait à la fois une direction hiérarchisée et une division du travail. Les directeurs discutaient entre eux des programmes (JP Genêt ignore si E. Le Roy Ladurie a jamais touché un ordinateur), d’autres faisaient le travail sur le plan intellectuel, des étudiants étaient embauchés en vacataires pour faire la saisie, le traitement était fait par des techniciens. Les données étaient codées, ce qui est catastrophique aujourd’hui. Mais ce travail énorme a permis de faire en détail la biographie de 247 000 Florentins.
Mon idée, quand j’ai commencé à enseigner l’informatique, c’était de former les étudiants pour qu’ils puissent devenir vacataires, travailler sur ce type de projet et apprendre le métier et la réflexion.
Cela marchait plus ou moins bien. Le Roy Ladurie a fait des choses remarquables, mais il a aussi échoué : l’histoire des conscrits a été un échec sanglant. Les archives venant des conseils de révision sont formidables. Mais LRL n’a pas vu que les mots n’ont pas le même sens d’une région à l’autre. Les résultats se sont révélés inexploitables. On avait un magnifique dossier, mais on ne pouvait rien en faire. Cela a beaucoup refroidi les historiens.
En plus, l’EHESS a une structure hiérarchique, comme le reste de la France. Quand la Statistique générale de la France a été exploitée, il a fallu énormément de réunions préparatoires. Finalement, elle n’a jamais été complètement exploitée. De plus, le choix technique a été mauvais : les données ont été stockées sur des bandes magnétiques, très vite, on n’a plus eu les appareils pour les lire. L’université de Chicago ne s’est pas posée de questions. Elle a fait des copies. C’est heureux, mais les données sont à Chicago, pas à Paris.

44e :
Le passage à la micro-informatique a été un désastre en France. L’administration universitaire a refusé énergiquement aux chercheurs du CNRS et de l’université l'accès aux micro-ordinateurs. Qu’allaient-ils en faire ? Jouer à une sorte de ping-pong ? (la seule chose qu’on pouvait programmer avec ce type d’écran). Cette situation a duré dix ans, et il fallait toujours aller travailler sur les machines d’Orsay. A Paris 1, grâce aux économistes, on avait un ordinateur sur lequel on pouvait travailler.

Celui qui a changé les choses, c’est Jean-Pierre Bardet, un historien de la démographie. Au ministère, il a fait équiper tous les départements d’histoire en France. A Paris 1, les ordinateurs sont arrivés dans le bureau de Robert Fossier qui ne savait pas quoi en faire. Il a pensé les donner à chaque directeur. Il a accepté de laisser les dix machines ensemble, de les faire installer dans une salle au sous-sol. Elles ont servi à poursuivre la formation des historiens, sans passer par les grosses machines d’Orsay.
Dans les autres universités, les machines ont trôné sur le bureau des patrons.

Avec la micro, des travaux ont avancé. Le travail de Zysberg sur 60 000 galériens a été fait avec 9 variables. Difficile de faire plus avec un Apple 48 ko. Cela n’a rien à voir avec les machines actuelles qui ont plus de puissance de calcul que les machines d’Orsay dans les années 1970.

Les historiens du quantitatif n’ont pas été les plus moteurs. Ce qu’ils faisaient, ce sont des économistes qui ont continué à le faire.
Le problème est interne : pourquoi l’histoire a-t-elle abandonné le quantitatif et l’histoire économique ? L’informatique n’a pas sauvé ces deux types d’histoire. Cette rupture serait à analyser (poids de l’histoire culturelle).

Le numérique ajoute la possibilité énorme de travailler en réseau. Mais personne ne sait encore comment faire travailler les historiens ensemble.

JPh Genet mentionne deux initiatives :

- Studium est une base de données avec les biographies de tous les membres de l'université de Paris. Ce dictionnaire en ligne ne concerne pour l’instant que les trois derniers siècles du Moyen-Age, , mais rien n’empêche de le continuer. Dans cette base, toutes les personnes habilitées peuvent écrire, on a besoin de toutes les disciplines. L’ambition est de créer une communauté de professionnels.
Pour l’instant, 18 000 fiches ont été amassées, de longueur et d’importance variables. Certaines font plus de 100 pages imprimées (St Thomas d’Aquin)
http://lamop-vs3.univ-paris1.fr/studium/


- Palm, Meditext est une bibliothèque numérisée à partir de la plateforme Palm de lemmatisation semi-automatique. Au Moyen-Age, il n’y a pas d’orthographe établie , le mot king connaît 13 déclinaisons différentes. Cela permet de faire des statistiques lexicales, de la recherche de contexte, créer des taggeurs pour d’autres langues, italien ou espagnol. Il faut concevoir ce genre de projets pour créer des réseaux et leur donner vie. Ces outils sont branchés sur d’autres outils, d’analyse statistique ou numérique, de proche en proche, on peut espérer que les pratiques issues de la première révolution informatique vont se généraliser.
http://lamop.univ-paris1.fr/spip.php?article849 (13.07.2014 : les adresses Lamop plantent...) 

Pour que cette mutation ait lieu, il faut qu’elle répondre à une demande et à deux types de besoins, un besoin intellectuel, très puissant (faire de la recherche instrumentée intelligente), un besoin académique (on ne vit pas de l’air du temps, il faut disposer d’un poste et avoir les moyens de travailler).
Pour l’instant, la pression académique ne joue pas encore en faveur de la numérisation.
Elle ne joue surtout pas en faveur du travail collectif. Dans l’immédiat, c’est même un blocage total.
Essayez de vous présenter au CNU avec une thèse faite à deux. Pourtant, cela semble une solution raisonnable pour brasser des volumes énormes de données (cf la médecine). Les articles avec plusieurs signatures sont aussi très rares en histoire.


DL 2014

-