Les Graciés de l'Histoire de Marlène Sándor, un livre à découvrir !

Le dépôt légal à la BnF : l’exemple du web

Le dépôt légal est central dans le fonctionnement de la BnF. Retour ici sur l'histoire de cette notion et son adaptation récente au web.
Bibliothèque François-Mitterrand à Paris, l’un des principaux sites de la BnF, inauguré en 1995 | Domaine public
Bibliothèque François-Mitterrand à Paris, l’un des principaux sites de la BnF, inauguré en 1995 | Domaine public

La Bibliothèque nationale de France (BnF) est la plus grande bibliothèque de France et l’une des plus importantes du monde. Son fonctionnement repose largement sur la notion de dépôt légal, qui constitue à la fois sa spécificité et sa richesse.

Notion essentielle, le dépôt légal est défini dans le Code du patrimoine comme « la remise du document à l’organisme dépositaire ou son envoi en franchise postale, en un nombre limité d’exemplaires, ou son acheminement par voie électronique » (Article L132-1).

C’est un aspect fondamental de la pratique française, qu’il convient d’examiner, notamment en ce qui concerne son adaptation aux défis techniques, avec l’exemple du web.

Le dépôt légal a une histoire qui remonte au XVIe siècle, où il trouve ses racines, avant de se développer progressivement pour devenir une composante essentielle de la patrimonialisation.

Historiquement, on fait généralement remonter la BnF à Charles V et son goût pour la collection d’ouvrages, dans ce que l’on appelle la « Librairie Royale ». Cette tradition est conservée par ses successeurs, notamment François Ier, qui joue un rôle majeur à ce sujet en instaurant ce que l’on appelle le « dépôt légal » en 1537, avec l’ordonnance de Montpellier.

Ce système permet alors le dépôt des productions imprimées sur le territoire français, initialement au sein du château de Blois. Les motivations de François Ier sont cependant plutôt politiques : assurer le dépôt permet de garantir le contrôle de l’édition et de faciliter la censure, si nécessaire, dans un contexte historique marqué par l’émergence des conflits religieux en France et en Europe.

Château de Blois | Domaine Public
Le château de Blois, qui était le premier lieu de stockage de la bibliothèque| Domaine Public

En plus de cette raison, une telle initiative constitue une opportunité d’enrichir les collections royales. Cependant, au fil du temps, il devient difficile d’établir une distinction claire entre la Librairie Royale et la collection personnelle du roi, les deux coexistant souvent.

L’évolution de la BnF jusqu’à nos jours

La bibliothèque poursuit son évolution, particulièrement sous Colbert et durant la première moitié du XVIIIe siècle, période marquée par d’importantes acquisitions en plus du dépôt légal, ainsi que par la mise en place d’une organisation en départements. Elle devient nationale sous la Révolution française et continue son expansion, notamment en raison des problématiques d’espace aux XIXe et XXe siècles.

C’est pour répondre à ce besoin constant de place et face aux progrès technologiques que la BnF voit le jour, inaugurée en plusieurs étapes dans les années 1990, avec la fusion de la Bibliothèque nationale et de l’Établissement public de la Bibliothèque nationale de France.

Si l’on ne peut pas appliquer la notion de patrimonialisation telle que nous la concevons aujourd’hui aux intentions de François Ier – la notion de patrimoine, bien qu’existante, étant alors liée aux biens hérités au sein de la famille – ses objectifs s’en rapprochent. L’ordonnance en est un bon témoignage, notamment lorsque l’on y lit que ce dépôt est organisé « pour avoir recours aux dits livres si, de fortune, ils étaient ci-après perdus dans la mémoire des hommes. » En tant qu’institution, le dépôt légal est une création française, comme l’affirme le bibliothécaire Frédéric Saby.

Le dépôt légal est d’abord impressionnant par la diversité des documents qu’il prend en compte : imprimés, photographiques, sonores, audiovisuels, numériques… Toutes ces catégories sont progressivement intégrées au dépôt légal, en réponse à une production de plus en plus abondante et incontournable, reflétant la manière dont la pensée se diffuse.

Ainsi, si cela commence en 1537 avec les imprimés, les estampes sont conservées dès 1648, les photographies et phonogrammes en 1925, les logiciels en 1992, et Internet en 2006. À titre d’exemple, en 2023, ce sont 88 760 livres, 185 249 fascicules, 7 803 recueils, 6,3 milliards de sites web, et 2 672 supports multimédias qui ont été déposés. À ce dépôt légal s’ajoutent également des dons et des achats qui viennent enrichir les fonds de la BnF.

Bien évidemment, il existe des conditions encadrant ce dépôt, fixées par la loi, notamment « lorsqu’ils sont mis à la disposition d’un public ». Par conséquent, certains documents sont exclus, comme les réimpressions identiques d’une œuvre passée, les archives en général, ou encore les correspondances.

L’exemple de l’archivage du web

On l’a vu, les supports pris en compte par le dépôt légal ont évolué conjointement avec les progrès techniques. Dès lors, on peut se questionner sur la façon dont le web a pu être archivé à la BnF dans le cadre du dépôt légal.

La genèse : la Wayback machine

Avec la naissance du web dans les années 1990 et son déploiement intense, la question de la patrimonialisation se pose. Comment mettre en place celle-ci ? Il ne faut pas longtemps à la fondation américaine Internet Archive pour créer en 1996 la Wayback Machine, qui est ouverte au public en 2001. Sa création répond à un besoin important d’archiver ce qui disparaît et devient rapidement obsolète.

Si un livre est réédité plusieurs fois, il est possible de retrouver les différentes éditions et d’y constater les différences. Mais rien ne permettait de retrouver un site internet une fois qu’il était mis à jour, et c’était alors une véritable façon d’appréhender Internet qui était égarée à jamais. La Wayback Machine permet aux utilisateurs d’accéder à des pages web aujourd’hui obsolètes et de retracer parfois la généalogie d’un site internet, de naviguer dessus…

Au début de l’année 2024, plus de 866 milliards de pages étaient conservées. Cette prise de conscience de la fondation Internet Archive joue un rôle crucial dans le développement de l’archivage web et s’accompagne des efforts d’autres structures, comme les bibliothèques nationales de Suède ou d’Australie.

Photographie de Brewster Kahle en 2019 par Joey Vangness | Domaine public
Photographie de Brewster Kahle en 2019 par Joey Vangness | Domaine public

Que propose la BnF ?

De son côté, la BnF s’est également intéressée à cette question. En 2002, des expérimentations sont réalisées, notamment sur la thématique politique. Avec le second tour qui oppose Jean-Marie Le Pen à Jacques Chirac et l’exclusion de Lionel Jospin, il a semblé pertinent de réaliser une cartographie du web.

Mais c’est la date de 2006 qu’il faut retenir pour comprendre comment le dépôt légal du web est devenu logique. La loi DAVSI affirme que :

Les logiciels et les bases de données sont soumis à l’obligation de dépôt légal dès lors qu’ils sont mis à disposition d’un public par la diffusion d’un support matériel, quelle que soit la nature de ce support.

Sont également soumis au dépôt légal les signes, signaux, écrits, images, sons ou messages de toute nature faisant l’objet d’une communication au public par voie électronique.

Code du patrimoine, Article L131-2

Ce changement est essentiel et permet à la BnF de s’affirmer sur la question de l’archivage web. L’archivage est réparti de la manière suivante : l’Institut national de l’audiovisuel (INA) doit archiver les sites internet des télévisions et radios, tandis que la BnF récupère le reste, c’est-à-dire les sites dont les producteurs sont domiciliés en France ou dont les contenus sont produits en France.

Néanmoins, l’archivage de la BnF n’encadre pas les premiers moments du web français ; c’est donc grâce aux dons de la Wayback Machine qu’il a été possible de compléter les collections françaises.

Quel fonctionnement pour l’archivage web ?

Cet archivage est cependant largement automatisé et vise plutôt à assurer une représentativité du web français à un moment donné, plutôt qu’à une exhaustivité, comme recherchée auparavant. Dès lors, ce processus passe par des robots, en l’occurrence le logiciel Heritrix, un crawler, c’est-à-dire un robot moissonneur qui, à partir d’adresses URL, suit les pages une par une et les archive, en retenant le code source, la mise en page et les fichiers binaires (images, vidéos…).

Il existe donc un système plutôt large, qui consiste à archiver une fois par an des sites identifiés, tandis qu’un système plus ciblé se concentre sur des sites désignés au préalable, en les capturant plus régulièrement, voire de manière plus approfondie, en allant le plus loin possible dans le site afin d’en avoir une image complète.

Cela permet de faire collaborer les bibliothécaires et archivistes qui jugent qu’un site a un intérêt et qu’il faut le suivre en détail, par exemple. Ces pages archivées sont ensuite disponibles à la BnF dans les Archives de l’internet.

Quelques limites et difficultés à ces pratiques

De façon générale, le dépôt légal n’est pas infaillible. Il était possible de passer outre, mais aujourd’hui, la mission de la BnF est d’autant plus difficile en raison de certains phénomènes comme l’autoédition, qui oblige les structures à effectuer une veille pour repérer autant d’ouvrages que possible.

Des limites existent cependant, par exemple en raison d’une évolution trop rapide du web, ou de la nécessité de garantir le format des sites web afin d’éviter leur obsolescence lors de l’archivage et d’empêcher leur réutilisation.

Des aspects juridiques sont également en jeu, ce qui oblige la BnF à ne proposer la consultation de ces pages archivées que dans ses locaux. Le respect de la propriété intellectuelle et la protection des données personnelles viennent donc freiner, en quelque sorte, le déploiement de ces initiatives. La situation est d’autant plus palpable en ce qui concerne Internet Archive. Si la fondation propose publiquement les pages, elle copiait également d’autres documents, dont des livres, ce qui lui a valu un procès qu’elle a perdu en septembre 2024.

De façon générale, le dépôt légal joue donc un rôle essentiel. Il permet, depuis près de cinq siècles, d’avoir une idée fidèle de la production française dans des domaines multiples, allant du livre jusqu’à Internet plus récemment. Dès lors, cet archivage numérique soulève aussi de nouvelles opportunités, comme en témoigne l’archivage, durant l’été 2023, des blogs actifs sur Skyblog alors que la plateforme annonçait sa fermeture. Cette masse de documents permet ainsi de faire émerger de nouveaux questionnements et offre aux chercheurs une approche nouvelle.

Quelques liens et sources utiles

BLASSELLE (Bruno) et TOSCANO (Gennaro) (dir.), Histoire de la Bibliothèque nationale de France, Paris, BnF Éditions, 2022, 564 p.

SABY (Frédéric), « Approche historique du dépôt légal en France », Sociétés & Représentations, n°35, 2013, p. 15-26.

Rejoignez
la Newsletter Revue Histoire !

Sujets exclusifs, récapitulatifs, coups de cœur et vidéos à retrouver une à deux fois par mois.

Articles populaires

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Rejoignez notre Newsletter !

Sujets exclusifs, récapitulatifs, coups de cœur et vidéos à retrouver une à deux fois par mois.

Rejoignez notre Newsletter !

Sujets exclusifs, récapitulatifs, coups de cœur et vidéos à retrouver une à deux fois par mois.

Découvrez nos posters sur notre boutique !

Nos affiches, imprimées en France et scannées par nos équipes, sont de véritables vestiges historiques !

Pour le lancement de notre boutique, découvrez deux illustrations incroyables en provenance du Petit Journal (1893), ainsi qu’un document intitulé Action de cent francs au porteur (1923).

Ces objets de décoration magnifiques plairont à tous les passionnés et curieux.