En utilisant des méthodes transversales aux différentes disciplines des lettres et
sciences humaines, les humanités numériques contraignent celles-ci à une
redéfinition de leur champ. Les disciplines ayant une dimension historique
(histoire politique, histoire économique, histoire des idées, histoire de la
littérature, histoire de la philosophie, etc.) n’échappent pas à cette
confrontation. L’historicité de leurs sources pose à l’ensemble de ces approches
disciplinaires des questions méthodologiques similaires.
Si certains corpus historiques
[1] semblent présenter une adéquation inédite avec le
potentiel à tirer d’un traitement numérique (comme c’est le cas pour certaines
bases de données), il existe inversement des domaines dans lesquels l’inadéquation
entre la méthode numérique et le corpus ou la question à traiter fait émerger de
manière particulièrement éclatante des lacunes dans les corpus historiques, que ce
soit au niveau de leur constitution, de leur transmission ou dans leur nature
même, dont l’objectivité, considérée à travers le spectre de méthodes nouvelles,
nécessite soudain une redéfinition. Les méthodes numériques contraignent à se
poser à nouveaux frais la question : qu’est-ce que construire et interpréter une
source historique ? Comme le montre Jean-Philippe Genet, la critique des sources
historiques telle qu’elle s’est élaborée au cours du
xxe siècle nous donne les moyens de reprendre de manière
fructueuse les principes scientifiques énoncés à la fin du
xixe siècle pour les rendre opérationnels
dans le cadre du travail numérique sur les sources scientifiques
[2]. Le but de la
réflexion qui suit est, d’une part, d’explorer des concepts permettant d’élaborer
une réponse à cette question et, d’autre part, d’en éprouver la validité à partir
d’un exemple issu d’un contexte numérique. La première partie portera sur la
conceptualisation des notions de trace et d’archive. La deuxième partie sera
consacrée à la mise en perspective de telles réflexions dans le domaine numérique
en partant de l’édition numérique
Lettres et textes — Le
Berlin intellectuel autour de 1800
[
Baillot depuis 2012] et du répertoire de manuscrits qui lui est associé,
qui contient le catalogue des manuscrits de l’helléniste August Boeckh [
Baillot depuis 2013]. En conclusion, on reviendra sur la place de la
réflexion sur l’architecture des données dans l’espace de publication numérique,
de manière à remettre en perspective l’usage des concepts de trace et d’archive
présentés dans la première partie.
Conserver et détruire : les sources comme traces
Les approches numériques interrogent la notion de source et la mettent dans une
perspective en partie nouvelle. Cela tient au fait qu’elles sont les héritières
de traditions scientifiques diverses. Les notions de « document
[3] » et d’« archive » sont chargées d’histoires disciplinaires et de
significations différentes en sciences humaines et en sciences de
l’information, ce qui n’est pas sans créer des confusions. Si l’on ne parle pas
de la même chose lorsqu’on parle d’archive par exemple, comment
opérationnaliser ce concept à l’interface de ces deux types de recherches
[4]? Or, il n’est pas simple de
faire l’effort de conceptualiser systématiquement et en profondeur
l’archéologie du corpus sur lequel on se penche,
a
fortiori dans le cas de la recherche sur projets, limitée dans le
temps. Mais dans le monde des humanités numériques, et précisément du fait de
l’interdisciplinarité qui lui est inhérente, il est impossible de ne pas
commencer par ces questions, faute de passer à côté d’éléments primordiaux pour
la recherche qu’il s’agit de mener. Idéalement, deux aspects doivent être
explicités pour qu’une recherche sur des sources historiques soit réalisable :
la définition du corpus-source et le type de modélisation qu’il s’agit d’y
appliquer, qui est la grille de lecture numérique de l’interprétation. Il
s’agira ici dans un premier temps, de se demander à la fois ce qui constitue
une source historique et comment le chercheur se positionne dans ce travail de
constitution de la source sur laquelle il s’appuie. Le point de départ choisi
est
Temps et Récit, où Paul Ricœur part de la
tradition documentaire pour faire émerger la place de la trace dans
l’historiographie :
L’histoire en tant que recherche s’arrête au document
comme chose donnée, même lorsqu’elle élève au rang de document des traces
du passé qui n’étaient pas destinées à étayer un récit historique.
L’invention documentaire est donc encore une question d’épistémologie. Ce
qui ne l’est plus, c’est la question de savoir ce que signifie la visée
par laquelle, en inventant des documents […], l’histoire a conscience de
se rapporter à des événements « réellement » arrivés. C’est dans
cette conscience que le document devient trace, c’est-à-dire […] à la
fois un reste et un signe de ce qui fut et n’est plus.
[Ricœur 1985, 13]
Deux aspects méritent ici d’être soulignés : d’une part, la relation entre
document et réalité (qualité d’invention de l’histoire comme un discours à la
fois forgé et se voulant porteur d’une vérité descriptive de faits
objectivables), d’autre part, la posture épistémologique qui en découle et qui
suppose de poser la source comme trace
[5]. Ricœur argumente que ce
dernier travail est moins le fait d’historiens praticiens, qui utilisent la
trace davantage qu’ils ne la pensent, que de philosophes ou de « moralistes »
[
Ricœur 1985, 226]
[6] comme
Levinas : « […] l’historien, en tant que tel, ne sait pas ce qu’il
fait en constituant des signes en traces. Il reste, à leur égard, dans un
rapport d’usage »
[
Ricœur 1985, 227]. Il ne s’agit pas ici de s’engager dans une polémique disciplinaire,
mais plutôt de se demander comment intégrer méthodologiquement la notion de
trace dans le travail sur les sources historiques. De fait, le rapport de
l’historien à la trace n’est pas nécessairement seulement un rapport
d’utilisation. On peut dire que la trace constitue sa source originaire, même
lorsque sa source primaire n’est pas la source originaire à proprement parler,
mais une mise en œuvre de celle-ci – comme lorsqu’un historien de la
littérature ne travaille pas sur le manuscrit, mais sur l’
editio princeps d’un ouvrage, par exemple, ou qu’un
archéologue étudie un artefact en dehors de l’espace des fouilles d’où il a été
exhumé. L’intérêt, si ce n’est croissant, du moins marqué, pour la matérialité
des objets de la recherche en sciences humaines a contribué à faire émerger des
questionnements sur la constitution même de la source et son rapport à son
espace de préservation. Pour Ricœur, la pensée levinasienne de la trace a ceci
d’essentiel qu’elle met en évidence le fait que la trace, par définition,
dérange un ordre [
Ricœur 1985, 226]. Or, en dérangeant un
ordre, elle en constitue un autre, ou bien elle est constituée en un tel ordre,
alors même que son évanescence est sa qualité ontologique première. La trace « est fragile »
[
Ricœur 1985, 218–219] : cette assertion est vraie à différents niveaux. Tout d’abord, au sens
où le présente ici Ricœur, parce qu’à tout instant elle est matériellement
susceptible de disparaître. Mais aussi parce qu’elle n’est jamais la chose en
soi, mais seulement un signe, un symbole de quelque chose qui a été, dans un
contexte donné, et est désormais dans un autre contexte ; la trace est « vestige d’un passage »
[
Ricœur 1985, 219]. La temporalité donne à la trace sa friabilité. Enfin, et c’est ce qu’il
va s’agir d’approfondir, la trace est autant signe d’une absence que signe
d’une présence
[7]. La trace est porteuse,
in
nuce, de tout ce dont elle n’est pas la trace, tout ce qui a
disparu. Qui plus est, tout mécanisme d’archivage de ces traces est lui aussi
inéluctablement confronté à une discrimination, une sélection, un choix « (quoi conserver ? quoi détruire ?) »
[
Ricœur 1985, 212]. Derrida, dans
De la grammatologie, va plus
loin dans la postulation d’une évanescence ontologiquement première de la
trace :
La trace n’est pas seulement la disparition de
l’origine, elle veut dire ici […] que l’origine n’a même pas disparu,
qu’elle n’a jamais été constituée qu’en retour par une non-origine, la
trace, qui devient ainsi origine de l’origine. Dès lors, pour arracher le
concept de trace au schéma classique qui la ferait dériver d’une présence
ou d’une non-trace originaire et qui en ferait une marque empirique, il
faut bien parler de trace originaire ou d’archi-trace. Et pourtant nous
savons que ce concept détruit son nom et que, si tout commence par la
trace, il n’y a surtout pas de trace originaire.
[Derrida 1967, 59]
Dans cette perspective, il est non seulement impossible de discerner la
dimension originaire de la trace, mais même essentiellement inconcevable de
faire coïncider la notion de trace et celle d’origine. Ainsi, la trace n’est
que construction, signe de quelque chose qui n’a aucun caractère originaire ou
premier, et dont la pertinence pour la recherche historique nécessite bien
d’être, à chaque instant, déconstruite pour être réévaluée.
La trace, vestige du passage autant que du passé, accumulée hors contexte et
selon des mécanismes de sélection divers et parfois peu transparents, reste
cependant l’objet principal matérialisant les sources telles qu’elles sont
utilisées dans les disciplines à dimension historique et leurs recherches. Sa
fragilité même se transmet à l’institution qui en garantit la transmission en
l’ordonnant : l’archive.
Comme institutions ordonnantes, l’archive (l’unité archivistique, le dossier,
la boîte) et les archives (l’institution patrimoniale) ont des structures
similaires. Il s’agit, pour l’une comme pour les autres et chacune à leur
échelle, de rassembler et de consigner les traces (majoritairement écrites) du
passé de manière à ce qu’elles soient consultées non pas une, mais plusieurs
fois, et non par une, mais par plusieurs personnes. Réactualisées dans des
contextes différents, il leur est ainsi possible de déployer une variété de
significations et d’exister non plus seulement en elles-mêmes, mais dans une
pluralité de contextes. Archiver des traces écrites du passé, c’est donc, en ce
sens, rendre possible l’émergence d’une pluralité de significations qui
nécessite toujours la reconstruction d’un contexte perdu pour faire sens,
reconstruction inévitablement spéculative puisque l’originaire, par définition,
n’est plus. La nécessité de reconnaître ce manque est évidemment plus aisément
acceptable mentalement lorsque le temps qui nous sépare de la trace est grand –
l’archéologie ne peut se passer d’hypothèses de reconstruction. Inversement,
plus l’histoire nous est proche, plus nous pouvons être tentés de croire que
nous ne reconstruisons pas de contexte, mais que nous en saisissons la réalité
d’origine. Il est plus facile de déconstruire ce qui nous est étranger que ce
qui nous est proche, plus facile aussi de penser la reconstruction des pans
manquants dans ce pour quoi les traces sont lacunaires que dans ce pour quoi on
peut considérer ses sources comme une totalité.
Dans l’article qu’il consacre aux études classiques dans le
Companion to Digital Humanities, Gregory Crane revient
sur les relations entre méthodes numériques et corpus classique [
Crane 2004]. Il insiste sur le fait que des erreurs ont été
commises, notamment dans les choix de logiciels qui semblaient, au premier
abord, adéquats, avant de s’avérer, une fois en phase d’opérationnalisation,
inadaptés. Retraçant une histoire faite de tâtonnements, d’échecs et
d’itérations, il insiste sur le fait que les outils numériques n’ont pu prendre
une telle ampleur dans les études classiques que parce que la tradition de
recherche centenaire, voire millénaire, sur laquelle celles-ci s’appuient,
était solidement structurée, entre autres en ce qui concerne le décloisonnement
des différents formats d’accès à l’information
[8]. La conscience de la nécessité d’ordonner
des informations parcellaires pour pouvoir en tirer du savoir est ainsi
essentielle pour la mise en œuvre de méthodes numériques. Les études classiques
peuvent du moins se targuer d’y être parvenu à grande échelle. Les sources
issues du
xxe siècle sont un
miroir aux alouettes dans ces deux sens : non seulement elles nous sont proches
en termes de mentalité, mais elles nous sont parvenues en bien plus grande
masse documentaire que les sources des siècles antérieurs. Il s’agit là d’une
spécificité du
xxe siècle,
car avec le
xxie siècle et
l’émergence de sources originairement numériques (
born-digital), la question se déplace à nouveau. Les éléments
d’identification du statut épistémologique des sources originairement
numériques se déploient (par opposition aux sources analogues) sur plusieurs
dimensions en même temps, prenant en compte les relations avec d’autres sources
(qui y sont inscrites), les relations entre données et métadonnées, l’évolution
temporelle qui existe sans être visible au premier abord. Nous ne savons
toujours pas aujourd’hui comment citer une source numérique de manière fiable,
de façon à savoir exactement, en la référençant, de quoi on parle.
Mais revenons au monde analogue. Là aussi, Derrida propose une vision radicale
de la fonction des archives en tant qu’instance de consignation :
[…] s’il n’y a pas d’archive sans consignation en
quelque lieu extérieur qui assure la possibilité de la mémorisation, de
la répétition, de la reproduction ou de la réimpression, alors
rappelons-nous aussi que la répétition même, la logique de la répétition,
voire la compulsion de répétition reste, selon Freud, indissociable de la
pulsion de mort. Donc de la destruction. […] L’archive travaille toujours
et a priori contre elle-même.
[Derrida 1995, 26–27]
Chaque consultation et interprétation de la trace archivale contribue ainsi à
sa destruction ; aucune reprise à l’identique n’est possible. L’assertion est
vraie à deux niveaux : tout d’abord, matériellement, la consultation – de même
que la conservation sans consultation d’ailleurs – n’empêchent pas le temps de
faire son office. La consultation, qui seule peut faire émerger un sens de la
trace, accélère le processus de délitement matériel. Si l’on scanne un document
ou un artefact qui se dégrade, on ne contribue pas à conserver la source
elle-même, mais une représentation de celle-ci, une trace de la trace, pour
ainsi dire. Cela revient à dévaluer la trace de départ et à générer l’illusion
d’une identité entre la trace et sa représentation.
L’archive se délite en même temps qu’elle déploie ses mécanismes de
conservation ; il est impossible de dissocier un mouvement de l’autre. Nous
savons que nous ne disposons pas de toutes les traces nécessaires pour
reconstruire la totalité du passé, mais, comme le demande Derrida : « Comment peut-[on] prétendre faire la
preuve d’une absence d’archive ? »
[
Derrida 1995, 103]. Dans cette perspective, il est seulement possible d’admettre la
co-présence d’un gouffre d’absence à côté des traces que nous percevons, comme
la partie immergée d’un iceberg dont il ne serait de toute façon possible que
de reconstruire une silhouette imprécise, qui ne serait elle-même que le dessin
approximatif d’une réalité impossible à atteindre. Plus on chercherait à
s’approcher de la trace, à embrasser l’ensemble d’une archive, à reconstituer
un objet à partir de l’archive, plus on s’entourerait de chimères, moins il
serait possible de construire un discours.
C’est à une tout autre image qu’a recours Roland Barthes dans
Le Degré zéro de l’écriture, et une image sans doute
plus encourageante pour poursuivre la recherche. Dans cet essai, c’est le texte
qui est au cœur du propos, ce qui n’est pas forcément le cas pour toute
recherche historique. Cependant, l’image et l’argument restent transposables à
des artefacts ou autres sources pertinentes pour l’historiographie, lorsque
Barthes écrit : « Toute trace écrite se précipite comme un élément
chimique d’abord transparent, innocent et neutre, dans lequel la simple
durée fait peu à peu apparaître tout un passé en suspension, toute une
cryptographie de plus en plus dense. »
[
Barthes 1972, 20]. L’image de l’encre magique est tout à l’opposé de celle de l’archive
inéluctablement prise dans l’autodestruction. L’encre magique fait apparaître
de nouvelles strates de sens comprises comme un enrichissement et non comme un
appauvrissement, inclut l’histoire et donc la temporalité dans ces strates de
sens, sans essayer de les dissocier l’une de l’autre.
Que l’on considère l’approche des sources historiques comme un processus de
destruction ou comme un processus d’enrichissement, il semble dans tous les cas
difficile, voire impossible, d’échapper à un travail de reconstruction –
chirurgie plastique destinée à rendre la trace interprétable –, ou à un travail
de déconstruction, sans lequel le chercheur n’est pas à même d’articuler le
point de vue à partir duquel il opère la reconstruction. Si l’on n’échappe ni à
la reconstruction, ni à la déconstruction, alors la tâche essentielle du
chercheur travaillant sur des sources historiques est bien, inévitablement,
d’ordre épistémologique ; elle consiste à auto-réfléchir ses propres mécanismes
et les nommer, car il s’agit là,
in fine, du
seul moyen de rendre possible le travail scientifique sur des sources qui sont
par nature fragmentaires et prises dans la temporalité. Ce travail
épistémologique qui, comme le met d’ailleurs en évidence Ricœur lorsqu’il
distingue historien-savant et historien-philosophe [
Ricœur 1985, 227], peine parfois à trouver sa place dans l’historiographie
traditionnelle, où l’ancrer dans le travail numérique sur les sources
historiques ? Quel est le lieu de cet auto-positionnement à partir duquel
s’ouvrir à d’autres interprétations, quand il ne s’agit pas de le présenter
très abstraitement comme cela vient d’être exposé, de manière pour l’essentiel
spéculative, mais de l’associer à une démarche singulière d’exploration de
sources et de recherche ?
Construire, déconstruire, reconstruire ? L’exemple de l’édition Lettres et
textes. Le Berlin intellectuel autour de 1800
Pour aborder ces questions, cette deuxième partie partira de l’expérience de
constitution de corpus dans le contexte de l’édition numérique
Lettres et textes — Le Berlin intellectuel autour de
1800
[
Baillot depuis 2012]. Cette édition numérique rassemble divers types de
textes signés par des auteurs différents, réunis autour d’une question de
recherche, à savoir les stratégies de publication développées par les
intellectuels berlinois autour de 1800 (voir [
Baillot et Busch 2015]).
Faire émerger des tendances au sein de telles stratégies prises dans leur
ensemble suppose d’avoir des points de comparaison, de manière, notamment, à ne
pas surinterpréter des phénomènes présents chez certains auteurs qui sont
peut-être tout aussi bien présents chez d’autres. Les corpus édités s’étendent
donc de 1760 jusqu’à la révolution de 1848
[9]. Comment le choix des sources s’est-il opéré ? Les lettres
éclairent les phénomènes de genèse et de réception sous un angle que l’équipe
éditoriale a décidé de recouper avec les phénomènes textuels observables dans
les brouillons d’œuvre. La question des stratégies de publication chez les
intellectuels suppose de prendre en compte toute une série d’aspects, dont
quatre particulièrement significatifs ont été retenus : la dimension politique
de la parole savante ; les différences de stratégies développées par les hommes
et par les femmes dans ce contexte ; le rôle de catalyseur de discours
intellectuel joué par la fondation de l’Université [
Baillot 2014a] et l’inscription dans une tradition héritée des Lumières francophones [
Baillot 2014b].
Il va de soi qu’il aurait été souhaitable de travailler avec une plus grande
quantité de textes pour pouvoir faire mieux émerger les structures en question,
le but étant d’aller au-delà de l’étude de cas pour pouvoir tirer des
conclusions générales. Mais ce qui fait la faiblesse de cette édition fait
aussi sa force : si nous n’avons pas édité davantage de textes, c’est que nous
avons annoté en profondeur. L’annotation est conçue pour permettre de mettre en
évidence les phénomènes de collaboration et d’intertextualité : d’une part, les
entités nommées sont informées en détail (personnes, lieux, œuvres,
institutions, liens avec les fichiers d’autorité autant que cela est
possible) ; d’autre part, un appareil d’annotation génétique (très allégé par
rapport au module
TEI Critical Apparatus
[
http1]
[10])
permet de repérer les phénomènes de réécriture et de correction
[11]. La combinaison des deux niveaux
d’encodage est destinée à faire émerger les types de censure observables, ainsi
que de les attribuer aux instances correspondantes. Plutôt que de postuler le
fait que les éditeurs adaptaient les textes (soit pour qu’ils soient moralement
acceptables, soit pour qu’ils se vendent mieux) aux
xviiie et
xixe siècles, il est maintenant possible de montrer qui
censurait quoi, comment et quand, de retracer des évolutions, de faire émerger
des tendances, de suivre des circulations d’ouvrages et de matérialiser
l’intertextualité. Cela n’est possible qu’à une échelle qui, en l’état, n’est
pas statistiquement représentative, et qui limite la portée des conclusions
générales qu’il est possible d’en tirer. Aussi faudrait-il pouvoir soit éditer
au moins encore autant de textes qui ce qui est déjà en ligne, pour commencer à
obtenir une masse critique acceptable, soit y agréger d’autres corpus déjà
édités. L’objectif est de procéder à ces deux types d’ajouts au cours des
années à venir en adaptant l’interface à mesure.
Pour revenir sur la dimension de construction numérique d’une telle masse
documentaire, soulignons les dimensions qu’elle fait ressortir au regard des
réflexions faites en première partie. Tout d’abord, il s’agit d’un corpus
construit de toutes pièces à partir d’une question de recherche et non à partir
d’une tradition ou d’une autorité. Il n’est ni centré sur un auteur, ni sur une
tradition historique (un tout dont l’unité proviendrait de la conservation), ni
sur une construction idéologique propre à l’époque (comme l’aurait été le fait
d’axer le propos ne serait-ce que sur le romantisme, notion qui apparaît très
peu de temps après dans le discours d’époque, contrairement à l’usage de la
notion d’intellectuels autour de laquelle s’articule l’édition et la recherche
afférente
[12]). De
plus, les sources choisies proviennent de différentes archives et
bibliothèques, et constituent, ainsi mises ensemble, une archive virtuelle
singulière. Il s’agit d’un corpus ouvert, qui peut toujours être enrichi et ne
sera
a priori jamais achevé. L’annotation,
elle aussi, est ouverte, et elle est susceptible d’être approfondie ;
l’ensemble constitue en quelque sorte un échantillon, une heuristique destinée
à continuer d’être développée. Cette dimension très expérimentale,
problématique pour une partie importante de la communauté scientifique, est
pour ainsi dire compensée par le fait que cette mosaïque de textes fabriquée à
partir de la question de recherche contient quelques perles, à savoir des
manuscrits jusqu’ici inédits et de grande valeur du point de vue du canon
historique ou littéraire, et sur lesquels ce travail éditorial a été
pionnier.
Le premier aspect à interroger pour comprendre ce travail de construction d’une
métasource, au sens proposé par Jean-Pierre Genet
[13], concerne les
métadonnées. Pourquoi, contrairement à sa réception parfois fraîche par la
communauté scientifique, les archives et les bibliothèques reconnaissent-elles
la valeur de cette ressource ? Pourquoi cela leur importe-t-il peu que cette
édition ne prétende pas faire le tour complet d’un corpus ou d’un sujet ? Parce
que les archives et les bibliothèques savent en général que rien ne sera jamais
complet et que la seule façon de travailler dans l’univers de sources
parcellaires consiste à mettre, si ce n’est en commun, du moins en relation, ce
dont dispose chacun. Le plus important, ce seront donc les métadonnées, car ce
sont elles qui permettront la connexion avec d’autres ressources, mais aussi
parce que, d’un point de vue bibliothécaire ou archivistique, l’architecture
des métadonnées renseigne sur l’approche adoptée. Le format, les types de
champs, le niveau de détail avec lequel ces champs sont renseignés, bref, la
structure des métadonnées représente la carte de visite de la perspective de
recherche dans laquelle elles ont été conçues et implémentées. Elles
documentent l’architecture, le mode d’emploi de la construction du corpus
(compris ici comme métasource). Cela ne signifie pas pour autant que la
recherche devrait complètement basculer vers un fonctionnement bibliothécaire
ou archivistique. Tout d’abord, parce qu’il règne là aussi un joyeux chaos en
termes de standards, qui ne garantit pas vraiment l’interopérabilité
souhaitable. Ensuite, parce que, bien que certains formats permettent fort bien
de composer avec les informations manquantes, par exemple en intégrant des
substituts (
surrogates) à l’endroit
ad hoc (que ce soit au niveau d’un champ, d’un
document ou d’un ensemble de documents), la communication entre les ressources
ne permet pas d’échapper à des inexactitudes ou, par exemple, à des saisies
concurrentes et redondantes. Le cas des doublons dans les fichiers d’autorité
de personnes en témoigne. En effet, lorsque deux autorités (deux bibliothèques)
ont chacune procédé à une saisie biographique portant sur la même personne avec
des données très légèrement différentes, comment procéder à la correction ?
Quelle sera l’autorité correctrice ? La régulation est inscrite dans la
structure elle-même puisque chaque saisie est accompagnée d’une indication
concernant le degré de fiabilité de l’information saisie ; ainsi, les données
recoupées plusieurs fois ont par définition un statut d’autorité supérieur à
celles qui ne le sont qu’une fois. Il n’en reste pas moins que l’élimination
des doublons biographiques reste problématique pour la recherche et son travail
sur des sources historiques.
Les prémisses de saisie sont également problématiques du point de vue de la
recherche
[14]. Par définition, les notices d’autorité
sont gérées par les bibliothèques et saisissent en priorité des données
pertinentes d’un point de vue bibliothécaire. Pour les personnes historiques,
cela signifie que ce sont principalement les personnes ayant publié des livres
qui seront mises à l’honneur. Mais même au sein de cette catégorie de personne
privilégiée dans les fichiers d’autorité de personnes, c’est-à-dire les
écrivains, la saisie n’est pas homogène.
Les fichiers d’autorité perpétuent en bonne partie le canon et ne permettent
pas fondamentalement de correctif historiographique puisque se trouvent en
général, ou en tout cas à un niveau statistiquement significatif, exclues de
ces ressources les personnes « secondaires », notamment les femmes. Or, il faut
attendre le xxe siècle pour
que les femmes publient plus souvent sous leur nom, ou à tout le moins sans
être dissimulées derrière un homme ou un nom d’homme. Pour tous les corpus
antérieurs à cette période, il est donc nécessaire non pas de se contenter d’un
lien de la ressource scientifique vers le fichier d’autorité pour pouvoir
agréger les données issues d’autres ressources : dans ce cas, la recherche doit
contribuer à structurer le fichier d’autorité, à mettre en lien, par exemple,
le prête-nom masculin et l’auteur femme, justifier des sources, et ce, pour
faire entrer un auteur de plus (certes de sexe féminin) au registre des traces
biographiques des temps passés, en restant donc dans le fond dans la tradition
historiographique de la domination existante du texte imprimé. Des acteurs
aussi essentiels au monde du livre que le sont les éditeurs jouent en
comparaison un rôle secondaire dans ce travail de référencement.
Ce cas particulier est intéressant dans la mesure où il montre tout d’abord la
domination de la trace textuelle dans notre rapport aux sources historiques.
Qui plus est, les ressources numériques étant elles-mêmes essentiellement
textuelles, toute cette épistémologie encore à développer ne pourra pas
vraiment se passer d’être une épistémologie textuelle. Enfin, on voit bien ici
qu’il est moins facile de s’affranchir du canon que ce que l’on voudrait bien
prétendre, alors même que voilà des décennies que la recherche est censée
s’être affranchie de la domination de l’auteur (mais l’auteur est-il vraiment
mort ?).
Venons-en, pour finir, à la question la plus complexe. Si tant est qu’on soit
en mesure de travailler avec le manque, avec la lacunarité des traces qui font
nos sources – ce qui suppose de lier activité de recherche et activité
d’archivage de manière très étroite – comment et où définir cette posture
singulière ? La ressource numérique ne devrait-elle pas être en mesure de se
passer d’une notice explicative formulée via
un autre média pour être recevable ? Combien d’articles faut-il écrire pour que
le principe même d’une édition numérique soit accessible à la communauté
scientifique ? On le voit, le travail de modélisation, de sa documentation, de
dissémination de cette modélisation et de sa documentation, est au cœur de
l’approche numérique des sources historiques. Pas davantage que l’archive
analogue, mais peut-être d’une manière rendue plus explicite par l’exigence
fondamentale de mise en réseau, l’archive numérique ne peut se passer d’une
réflexion sur la posture de celui qui archive la source pour comprendre ce qui
est archivé. La tâche de l’historien numérique est à la fois de constituer la
source (selon des principes de mise en relation et de mutualisation des
ressources propres à Internet), de s’interroger sur la manière dont il a
constitué la source, et d’expliciter l’ensemble de ce processus en formulant
autant que possible les choix de sélection, les biais – une exigence qui
nécessite également de repenser les moyens dont nous disposons pour communiquer
l’ensemble de ces informations, entre édition, article, documentation, ouvrage,
etc.