Coopération et partage autour des pratiques collaboratives

Numérisation en bibliothèque : quelles marges de manoeuvre aux États-Unis et en France ?

Cette semaine a été définitivement adoptée une loi « modifiant la propriété littéraire et artistique » qui contient notamment des dispositions importantes à propos des oeuvres orphelines introduites dans le droit français pour transposer une directive européenne de 2012. Même si de sérieuses restrictions ont été fixées par le texte, les bibliothèques, musées et archives en France vont se voir ouvrir de nouvelles possibilités – attendues depuis longtemps – de numériser et mettre en ligne des œuvres orphelines. L’adoption de cette loi constitue un jalon important et il est intéressant à ce stade d’essayer de dresser un parallèle entre deux pays comme la France et les États-Unis pour évaluer les marges de manœuvre laissées aux bibliothèques afin de numériser les segments de leurs collections couverts par le droit d’auteur.

Interlock MCLS Digitization Tour

Image par Brian Boucheron. CC-BY. Source : Flickr.

Côté français, l’adoption de cette loi sur les œuvres orphelines intervient en effet après une décision de la Cour de Justice de l’Union Européenne rendue en septembre 2014, qui a clarifié les limites de l’exception « Bibliothèques » figurant dans la directive de 2001. Du côté des États-Unis, des événements importants ont également eu lieu récemment, avec notamment début janvier un tournant lors d’un procès décisif opposant le consortium de bibliothèques HathiTrust et la Guilde des Auteurs (Author’s Guild) à propos de l’utilisation du fair use (usage équitable) dans le cadre de la numérisation. Les auteurs ont finalement choisi de jeter l’éponge dans cette affaire et l’issue de ce procès, qui confirme certains aspects de la décision Google Books rendue en 2013, s’ajoute à une série de décisions plutôt favorables aux bibliothèques rendues aux Etats-Unis en 2014.

Depuis plus de 10 ans à présent, avec le lancement du projet Google Books et ses nombreux rebondissements, la numérisation de masse en bibliothèque aura fait couler beaucoup d’encre, en soulevant des enjeux comme celui des exceptions au droit d’auteur, des oeuvres orphelines, des œuvres épuisées ou plus récemment du Text et Data Mining. Au terme de plusieurs décisions de justice et adaptations législatives, où en est-on à présent aujourd’hui ? Les possibilités de numérisation et de diffusion de leurs collections par les bibliothèques sont-elles plus larges en Europe ou aux États-Unis ?

Vous allez voir que la réponse à cette question n’est pas simple à apporter, la situation étant encore relativement contrastée : de part et d’autre de l’Atlantique, des marges de manœuvre non négligeables ont été consacrées au bénéfice des bibliothèques, mais des blocages subsistent également, qui ne sont pas exactement les mêmes. Je vais tenter de synthétiser les différents facettes du sujet, en passant successivement en revue la question de la numérisation pour conservation, de la diffusion des copies numériques, du Text et Data Mining, de la numérisation des oeuvres orphelines et enfin de celles des oeuvres épuisées.

Numérisation pour conservation, de larges possibilités consacrées

La décision HathiTrust rendue en appel en juin dernier aux États-Unis a consacré une large possibilité pour les bibliothèques américaines de numériser leurs collections dans l’intention d’assurer la préservation numérique des oeuvres. Le juriste Jonathan Band a écrit un article de synthèse (What Does The HathiTrust Decision Mean For Libraries) qui détaille les apports de ce jugement. Les bibliothèques regroupées dans le consortium HathiTrust étaient à l’origine les partenaires de Google dans le programme Google Books et HathiTrust est un entrepôt numérique commun grâce auquel ces établissements conservent les copies remises par le moteur de recherche à l’issue de la numérisation de leurs collections. Les juges américains ont admis que la numérisation de masse des collections, y compris celles couvertes par le copyright, était bien couverte par le fair use (usage équitable), dès lors que « le stockage des copies numériques assure la préservation des oeuvres pour les générations à venir et garantie qu’elles continueront à exister après l’expiration de la durée du droit d’auteur« . Les bibliothèques américaines peuvent donc numériser n’importe quelle oeuvre figurant dans leurs collections à des fins de préservation (mais nous verrons qu’elles restent par contre assez limitées dans la diffusion du résultat).

La situation est relativement identique en Europe et en France, même si le fondement juridique est différent. La Cour de Justice de l’Union Européenne a en effet consacré en septembre dernier la possibilité d’utiliser une exception spécifique, prévue dans la directive européenne de 2001, pour numériser les oeuvres figurant dans leurs collections. Cette faculté est à vrai dire très large, car la Cour admet qu’elle reste ouverte même lorsque les éditeurs de contenus proposent des versions numériques des mêmes oeuvres aux établissements. Cela signifie par exemple que même lorsque des eBooks commerciaux existent, les bibliothèques peuvent quand même produire par elles-mêmes des versions numériques des ouvrages inclus dans leurs collections. Chaque Etat a ensuite la faculté de limitée le périmètre de l’exception et en France, elle a été transposée en la restreignant à des copies réalisées « à des fins de à des fins de conservation ou destinée à préserver les conditions de sa consultation sur place« . Néanmoins, tant que les reproductions s’inscrivent bien dans cette finalité de préservation, les possibilités ouvertes sont quasiment aussi larges qu’aux Etats-Unis et on va voir que les bibliothèques françaises ont même plus de marges de manœuvre ensuite pour la diffusion.

Diffusion des copies numériques, un avantage certain à la France

Aux États-Unis, le procès HathiTrust a essentiellement consacré deux types d’usages des copies numériques sur la base du fair use. D’une part, les juges ont admis que les reproductions puissent être diffusées dans leur intégralité à des publics handicapés. D’autre part, le texte numérisé peut être indexé pour proposer une fonctionnalité de recherche en plein texte dans les ouvrages, indiquant en fonction d’une requête la présence de termes recherchés dans un livre et leur localisation. La Cour d’appel a en effet considéré que cette usage était « transformatif » et que dans la logique du fair use, il ne fait pas de concurrence aux titulaires de droits. Mais en dehors de cela, les bibliothèques américaines ne peuvent pas faire grand chose d’autres des oeuvres protégées qu’elles numérisent ou du moins, elles sont pas assurées d’être dans la légalité si elles vont au-delà. Jonathan Band estime qu’elles pourraient sans doute aussi montrer de courts extraits (snippets), en se basant sur les conclusions de la justice dans l’affaire Google Books qui a admis cet usage, mais le juge ne s’est pas explicitement prononcé sur cet aspect dans la décision HathiTrust et cette bibliothèque numérique ne pratique pas l’affichage d’extraits par précaution.

hathitrust

Un exemple de recherche du terme « France » dans un ouvrage protégé figurant dans la bibliothèque numérique HathiTrust, où l’on voit bien l’indication des occurrences repérées, mais pas d’affichage d’extraits.

La situation est différente en Europe et en France où l’exception permet non seulement de numériser des oeuvres dans leur intégralité, mais aussi de les offrir à la consultation « dans les emprises des établissements » (c’est-à-dire sur place) par le biais de « terminaux dédiés« , à des lecteurs venant effectuer des « recherches ou études privées« . Ces éléments ont été explicitement confirmés par la CJUE dans sa décision de septembre, qui a même admis, lorsqu’une exception pour copie privée est prévue dans la législation nationale (comme c’est le cas en France), que les usagers puissent télécharger les oeuvres à partir des terminaux et les emporter sur des clés USB. La limite par contre porte sur la diffusion à distance, qui reste impossible que ce soit sur Internet, mais aussi par le biais de réseaux sécurisés (intranet ou extranet). Cette restriction découle directement d’un considérant (n° 40) de la directive européenne qui prévoit que les exceptions établies au bénéfice des bibliothèques ne s’appliquent pas à la « fourniture en ligne d’oeuvres protégées« .

Néanmoins le régime applicable en France ne découple pas complètement la numérisation et la diffusion, même s’il la restreint à de la diffusion sur place (ce qui annule l’essentiel des bénéfices du numérique). Aux États-Unis en revanche, la situation est plus fermée et les bibliothécaires en sont réduits à supputer sur les limites du fair use, à la lumière des décisions récentes. Jonathan Band estime par exemple qu’une marge de manoeuvre existe pour la diffusion sur la base de « l’usage transformatif » consacré par la décision HathiTrust. Il imagine en effet que les bibliothèques pourraient repérer parmi leurs collections physiques les ouvrages à faible rotation, qui ne sont plus qu’exceptionnellement empruntés. Pour ces ouvrages peu utilisés, formant la « longue traîne » des collections, donner accès en version numérique n’aurait pas selon lui un effet de substitution par rapport aux ouvrages papier. L’usage serait différent, car il concernait des chercheurs intéressés par l’histoire d’une matière et non les lecteurs primaires auxquels ces oeuvres étaient destinées à l’origine. De telles oeuvres pourraient dès lors être diffusées en intégralité aux usagers d’une bibliothèque, à condition de s’assurer que leurs motivations portent bien sur la recherche. Cette interprétation est intéressante, notamment parce qu’elle envisage d’une autre manière la notion « d »oeuvre épuisée » (définie ici non pas par l’indisponibilité commerciale, mais par le faible usage d’une oeuvre constaté par le biais des statistiques de la bibliothèque). Mais elle n’a pas été explicitement consacrée par le juge dans la décision HathiTrust et elle sera sans doute assez difficile à manier en pratique, notamment pour déterminer les frontières de cette « longue traîne des collections ».

Pour donner accès à des oeuvres numérisées, les bibliothécaires américains peuvent aussi d’appuyer sur une autre décision rendue en 2014, qui s’est appuyée sur le fair use. Dans l’affaire Cambridge University vs Patton, l’université de Georgia State s’est vue reconnaître la possibilité de numériser des extraits d’ouvrages pour constituer des réserves électroniques, destinées ensuite à l’enseignement et la recherche. Une telle latitude pourrait être articulée à la numérisation des collections des bibliothèques, mais d’après les commentaires, ce jugement reste délicat à appliquer à large échelle, car les juges ont estimé que le caractère équitable de l’usage doit être apprécié oeuvre par oeuvre, ce qui laisse la porte ouverte à beaucoup d’incertitudes.

Text et Data Mining, le retard se creuse au détriment de la France et de l’Europe

Si donc les bibliothèques françaises ont un avantage en matière de diffusion des oeuvres protégées qu’elles numérisent par rapport aux Etats-Unis, elles accusent par contre un retard patent dans la possibilité de déployer des technologies de fouille de données (Text et Data Mining) sur les contenus numérisés ou d’offrir à des chercheurs la possibilité de le faire. Tel n’est pas le cas aux USA où la décision Google Books a consacré au contraire que le Text et Data Mining relevait bien des « usages transfomatifs » couverts par le fair use. Étant donné que cette latitude a été reconnu pour l’acteur commercial que constitue Google, on peut en déduire a fortiori que les usages de recherche sont bien compris dans le périmètre de l’usage équitable. Par ailleurs, en insistant sur le fait que la mise en place d’une recherche en plein texte était bien permise pour HathiTrust sur la base également de « l’usage transformatif », les juges américains ont confirmé que le Text et Data Mining disposait à présent d’une base juridique solide aux États-Unis.

Les choses sont bien différentes en France et plus largement en Europe, où le statut du Text et Data Mining n’a pas fait l’examen d’un examen par une juridiction supérieure. Un débat féroce a lieu en ce moment pour savoir si ces opérations d’exploration de données à partir de contenus protégés tombent ou non sous le coup des prérogatives des titulaires de droits. Les bibliothèques européennes de recherche, réunie dans l’association LIBER, viennent de réaffirmer la semaine dernière par le biais de la Déclaration de la Haye que l’exploration de données devait être considérée comme un droit associé au « droit de lire », sur lequel les titulaires de droits ne devraient pas avoir de contrôle, y compris dans le cas où ces opérations sont effectuées dans un cadre commercial.

Cette interprétation est battue en brèche par les grands éditeurs scientifiques qui ont mis en place des systèmes de licences pour affirmer au contraire leur droit à contrôler et à monétiser ces nouveaux usages ouverts par le numérique. Entre les deux, on trouve une approche visant à sécuriser le Text et Data Mining par le biais d’une nouvelle exception au droit d’auteur. C’est la voie choisie par exemple par l’Angleterre, qui a décidé en septembre dernier de modifier sa loi sur le droit d’auteur pour introduire une telle exception, et c’est aussi un des points actuellement en débat au niveau du parlement européen, avec le rapport de l’eurodéputée Julia Reda sur la réforme du droit d’auteur, qui aborde la question du Text et Data Mining.

Oeuvres orphelines, sécurité légale en France contre fair use au Etats-Unis

En matière de Text et Data Mining, l’avantage est donc clairement du côté des États-Unis, mais ce n’est nécessairement pas le cas en ce qui concerne la numérisation des oeuvres orphelines. Avec la loi adoptée cette semaine pour transposer la directive de 2012, la France s’est dotée d’un mécanisme qui va permettre aux bibliothèques, musées et archives de numériser des oeuvres orphelines (c’est-à-dire pour lesquelles il est impossible d’identifier ou de contacter le ou les titulaires de droits) et de les mettre en ligne pour consultation. Le dispositif reste cependant relativement complexe et restrictif, puisque les établissements vont devoir conduire des « recherches diligentes », oeuvre par oeuvre, pour établir qu’elles sont bien orphelines. Au cas où des titulaires de droits viendraient à se manifester après la numérisation et la mise en ligne, ils garderaient la possibilité de demander une compensation financière aux établissements, à négocier au cas par cas. Enfin, certaines catégories d’oeuvres, comme les images fixes, restent exclues de ce système et ne pourront pas être numérisées.

orphan

Image par opensource.com. CC-BY-SA. Source : Flickr

Il y a donc des risques non négligeables que ce nouveau mécanisme reste utilisé seulement à la marge par les bibliothèques en France, mais il offre tout de même l’intérêt d’exister et d’offrir une certaine sécurité juridique aux établissements qui l’emploieront. Aux Etats-Unis en revanche, le Congrès n’a jamais réussi à aboutir à une loi sur les oeuvres orphelines, alors qu’elles se sont longtemps trouvées au centre de l’affaire Google Books. A l’origine, HathiTrust avait un programme pour la numérisation et la diffusion des oeuvres orphelines, et c’est même ce qui a déclenché le procès avec l’Author’s Guild. Mais suite aux poursuites et à des dysfonctionnements, HathiTrust a préféré renoncer à ce projet en 2011 et la décision de justice rendue en juin n’aborde pas cette question, pas plus d’ailleurs que le jugement de 2013 rendu dans l’affaire Google Books.

Les bibliothécaires américains restent donc dans une grande incertitude quant à leurs possibilités de numériser et de diffuser des oeuvres orphelines. Ils estiment cependant que le fair use peut leur donner une base pour le faire et en décembre 2014, un rapport important a été publié par plusieurs organisations, intitulé « Statement of Best Practices in Fair Use of Orphan Works in Librairies and Archives« . Ce texte s’efforce de fixer une méthodologie pour traiter les oeuvres orphelines dans le cadre de programme de numérisation de masse, en s’appuyant autant que faire se peut sur les décisions de justice existantes. Mais en l’absence de jurisprudence explicite, il ne peut s’agir que de directives générales qui pourraient être contestées en justice par les titulaires de droits et qui n’offrent pas le même degré de sécurité que la directive européenne et les lois nationales qui vont en découler, comme c’est le cas en France.

Oeuvres épuisées, un enjeu toujours décisif

Au-delà des oeuvres orphelines, l’enjeu majeur de la numérisation de masse des collections des bibliothèques porte en réalité sur les oeuvres épuisées (c’est-à-dire celles qui ne sont plus disponibles à la vente). Ces dernières étaient d’ailleurs au coeur de l’affaire Google Books et elles ont fait l’objet de longues discussions en France, jusqu’à ce qu’intervienne la loi sur la numérisation des livres indisponibles du 20ème siècle en mars 2012.

Cette loi, largement contestée, a eu pour effet de geler complètement la situation en France, car elle instaure un système permettant aux éditeurs de sécuriser leurs droits sur ces ouvrages et favorise uniquement la recommercialisation de ces titres en version numérique. La Bibliothèque nationale de France est associée à ce système par le biais du registre ReLIRE, permettant aux auteurs et éditeurs d’exercer un retrait et parce que la numérisation s’effectuera à partir de ses collections. Mais aucun accès public n’est prévu dans ce système, si ce n’est un accès sur place dans les seules emprises de la BnF. On sait cependant à présent que ce système organisé pour les livres indisponibles ne fera pas obstacle à l’application par les autres bibliothèques des dispositions prévues pour la numérisation des oeuvres orphelines, alors que c’est longtemps un point resté incertain. Mais les livres orphelins parmi les indisponibles devraient sans doute rester peu nombreux.

Aux États-Unis, les livres épuisés ont aussi fait l’objet d’une grande attention, avec la mise en place de projets alternatifs de numérisation visant l’objectif de donner un accès public et gratuit à ces oeuvres. C’est le cas par exemple de la DPLA (Digital Public Library of America) lancée par Robert Darnton, qui pensait pouvoir s’appuyer sur le fair use ou des solutions négociées pour donner accès à une partie des oeuvres épuisées. En avril 2014, l’Author’s Guild elle-même a interpellé le Congrès américain pour lancer un grand programme de numérisation des oeuvres épuisées, visant à mettre en place une National Digital Library avec un accès pour tous aux contenus des livres, sans que l’on sache exactement quelles contreparties seraient exigées.

Mais le mouvement le plus intéressant de ces dernières semaines aux Etats-Unis vient d’un programme de numérisation de livres de sciences humaines indisponibles, lancé par la fondation Mellon et le National Endowement for Humanities, qui va débloquer 2 millions de dollars pour numériser des milliers de livres épuisés et les publier sous licence libre gratuitement sur Internet. La démarche passe nécessairement par des accords avec les auteurs et les éditeurs, mais elle a le mérite de continuer à explorer une voie pour permettre un accès public aux oeuvres épuisées en ligne.

***

Au terme de ce tour d’horizon, j’ai l’impression qu’un avantage se dessine en faveur de la France et de l’Union européenne par rapport aux États-Unis en matière de numérisation des collections des bibliothèques. Ce constat paraît à première vue contre-intuitif, car on a l’habitude de dire que le fair use offre des marges de manœuvre plus grandes que les exceptions au droit d’auteur du système européen. Mais les différents régimes issus du droit européen garantissent pour l’instant tout de même plus de sécurité juridique et des opportunités plus larges en termes de diffusion. Les bibliothécaires américains ont dû de leur côté se battre âprement en justice (et c’est tout à leur honneur) pour sécuriser leurs possibilités d’action sur la base du fair use. Mais le résultat, s’il est globalement positif, reste à mon sens en-deçà de ce que l’on trouve aujourd’hui en Europe (sauf en matière de Text et Data Mining).

Les choses sont néanmoins susceptibles de bouger car aussi bien aux Etats-Unis qu’au niveau de l’Union européenne, des réformes importantes du droit d’auteur sont annoncées et dans les deux cas, la question de la numérisation en bibliothèque fera partie des questions abordées.

 

Classé dans :Bibliothèques, musées et autres établissemerents culturels Tagged : Bibliothèques, Bibliothèques numériques, droit d’auteur, exception conservation, fair use, livres indisponibles, Numérisation, oeuvres épuisées, oeuvres orphelines, text et data mining