Coopération et partage autour des pratiques collaboratives

La licence Etalab, un atout pour la diffusion des données culturelles et de recherche

Les données culturelles ou celles qui concernent la recherche recherche occupent une place particulière parmi les données publiques. Elles restent de fait encore en retrait au sein du mouvement d’Open Data qui se développe en France.

Dandelion illustration. Par Thomas Rockstar. CC-BY-NC-SA. Source : Flickr

Pas tout à fait des données comme les autres…

En effet, un statut juridique particulier a été fixée par la loi sur la réutilisation des informations publiques, pour les données produites par “des établissements et institutions d’enseignement ou de recherche” ou par des “établissements, organismes ou services culturels“. Ce régime particulier, dit “exception culturelle”, permet à ces établissements de fixer les conditions de la réutilisation de leurs données, tandis que les autres administrations relèvent du régime général de cette loi, qui instaure un droit à la réutilisation des informations publiques au profit des citoyens.

Jusqu’à présent, les institutions culturelles et de recherche se sont plutôt servies de cette exception pour restreindre la réutilisation de leurs données, ce qui a pu faire dire que la culture constituait le “parent pauvre de l’Open Data en France“. Des tensions sont même apparues entre certains services culturels, comme des archives, et des entreprises à qui la réutilisation des données a été refusée. Les institutions culturelles (bibliothèques, musées, archives) et les institutions de recherche sont pourtant détentrices de données de grande qualité, dont l’apport pourrait être décisif pour le mouvement de l’Open Data

Un traitement particulier sur data.gouv.fr

Le lancement du portail Etalab, de ce point de vue, n’a pas complètement permis de lever les obstacles à la diffusion de ces données. Le Ministère de la Culture et de la Communication, ainsi que celui de l’Enseignement supérieur et de la Recherche participent bien à data.gouv.fr par le biais de plusieurs jeux de données. En effet, les ministères en eux-mêmes ne bénéficient pas de l’exception culturelle prévue dans la loi de 1978, celle-ci n’étant ouverte qu’aux profits des établissements, institutions et services relevant de leurs tutelles ou de celles des collectivités territoriales. De ce fait, ces ministères ont dû, de la même manière que tous les autres, se plier à l’obligation, imposée par la circulaire émise le 26 mai 2011 par François Fillon, de verser leurs données dans data.gouv.fr. La circulaire a posé dans ce cadre un principe de réutilisation gratuite des données publiques, les administrations ne pouvant imposer de redevances que si “des circonstances particulières le justifient” et par le biais de la procédure relativement lourde d’un décret du Premier Ministre.

Néanmoins l’exception culturelle, si elle ne joue pas au niveau des ministères, continue à protéger les établissements publics. En effet, la circulaire du 26 mai 2011 précise que :

L’article 11 de la loi prévoit un régime dérogatoire pour les établissements et les institutions d’enseignement et de recherche ainsi que pour les établissements, organismes ou services culturels qui fixent, le cas échéant, leurs conditions de réutilisation de leurs informations publiques. Ces établissements ainsi que les collectivités territoriales et les personnes de droit public ou de droit privé chargées d’une mission de service public peuvent, s’ils le souhaitent, mettre à disposition leurs informations publiques sur le portail « data.gouv.fr ». Dans ce cas, une convention fixe les conditions de réutilisation de ces informations.

La participation à Etalab reste donc facultative pour les organismes culturels ou de recherche et c’est bien que que traduit la liste des contributeurs, puisque seule la Bibliothèque nationale de France y figure à ce jour, pour une partie de ses données.

Dandelion illustration 2. Par Thomas Rockstar. CC-BY-NC-SA. Source : Flickr

Une ouverture possible grâce à la licence Etalab ?

Cependant, cette mise à l’écart des données culturelles et de recherche n’est pas une fatalité. Car comme j’avais déjà eu l’occasion de le dire, les établissements peuvent user des latitudes dont ils bénéficient au titre de l’exception culturelle pour poser des règles favorables à la réutilisation. Rien ne les oblige à aller dans le sens de la fermeture.

De ce point de vue, Etalab leur offre un instrument essentiel pour mettre en place des conditions ouvertes de diffusion des données : la Licence Ouverte/Open Licence, retenue pour le portail data.gouv.fr. Cette licence Etalab présente l’intérêt d’être ancrée dans le droit des données publiques français, tout en étant compatible avec les principes de l’Open Data et les licences libres employées dans le cadre de ces initiatives. S’appuyant sur le droit à la réutilisation des données publiques reconnues par la loi de 1978, la licence Etalab permet la réutilisation gratuite, y compris à des fins commerciales, tout en maintenant les exigences minimales du texte et notamment la mention obligatoire de la source des données (paternité).

Depuis l’ouverture du portail Etalab, un seul établissement culturel avait utilisé la licence Etalab de manière volontaire pour la diffusion de ses données. Il s’agit comme rappelé plus haut de la BnF pour les données bibliographiques enrichies qu’elle diffuse au format RDF par le biais du site data.bnf.fr.

La licence ouverte pour une démarche globale de libération des données

Néanmoins la semaine dernière, une autre bibliothèque, la Bibliothèque Nationale et Universitaire de Strasbourg (BNUS) a annoncé qu’elle adoptait la licence Etalab pour se lancer dans une démarche globale de libération de ses données. Une interview de l’un des responsable de l’établissement, le conservateur Frédéric Blin, a été publiée sur le blog “A la toison d’or“, qui explique la démarche de l’établissement et les raisons l’ayant poussé à faire ce choix.

La première originalité de la BNUS consiste à avoir choisi d’utiliser la licence Etalab aussi bien pour diffuser les métadonnées produites par l’établissement que pour les documents numérisés eux-mêmes, qu’elle produit à partir des oeuvres du domaine public qu’elle conserve :

La décision exacte votée par notre Conseil d’administration est formulée de la manière suivante :

  • les données bibliographiques (dont les métadonnées des documents numériques) produites par la BNU sont considérées comme des données publiques et à ce titre placées sous Licence Ouverte ou autre licence compatible (libre réutilisation, y compris à des fins commerciales, sous réserve de mentionner la source de l’information) ;
  • les fichiers numériques issus de la numérisation par la BNU d’œuvres du domaine public conservées dans ses collections sont considérés comme des données publiques et à ce titre placés sous Licence Ouverte ou autre licence compatible.

Par ailleurs, Frédéric Blin explique le calcul économique qui a conduit son établissement à renoncer à tarifer les réutilisations à des fins commerciales de ses données :

Avant notre décision, nous appliquions une redevance d’usage, de l’ordre de 35€ par image [...] Cependant, les sommes récoltées par la BNU chaque année au titre de la redevance d’usage étaient minimes, de l’ordre de 3000€. Elles ne couvraient naturellement pas le temps de travail de la secrétaire chargée de gérer les factures et la correspondance avec les lecteurs, ni le temps des autres personnes – y compris de l’Administrateur – impliquées en cas de demande d’exonération ponctuelle ou systématique. En outre, nous espérons que l’abandon de la redevance d’usage entrainera une augmentation des demandes de numérisation de documents, service qui lui restera payant. Dans notre cas particulier, nous pensons qu’en autorisant la libre réutilisation, l’établissement sera au final bénéficiaire au strict plan financier.

D’autre part, nous estimons que la libération des données favorise la créativité artistique et intellectuelle, de même que commerciale : établissement public, il est dans l’intérêt de la BNU de favoriser le dynamisme économique et commercial du pays, créateur d’emplois et générateur de rentrées fiscales. La BNU devient ainsi indirectement une source d’activité économique : le retour sur l’investissement consenti par la Nation pour le financement de la BNU trouve ici une concrétisation potentiellement mesurable.

Cette logique, complètement en phase avec les principes mêmes de l’Open Data, est hélas fort peu répandue dans le secteur culturel. J’avais eu l’occasion de montrer par exemple, à partir d’une analyse systématique des pratiques, qu’une part écrasante des bibliothèques françaises restreignent l’utilisation des oeuvres du domaine public qu’elles numérisent, en recourant à des droits de propriété intellectuelle revendiqués dans des conditions contestables. La situation n’est pas différente, sinon plus fermée encore, dans les services d’archives et de musées, et le discours au niveau central reste celui d’une valorisation économique des données, assortie d’une défense de l’exception culturelle.

Quelques établissements commencent à adopter une attitude plus ouverte, en employant notamment la Public Domain Mark, pour les documents du domaine public qu’ils diffusent. L’exemple de la BNUS offre une nouvelle piste, plus générale, par la laquelle la licence Etalab permet la libre diffusion à la fois des métadonnées et des documents numérisés. Cette licence, qui a a été conçue à l’origine pour le portail des données de l’Etat, peut être utilisée plus largement, à la fois par des établissements publics relevant de la tutelle de l’Etat, mais aussi par tout producteur de données publiques, relevant du cadre de la loi de 1978.

***

L’enjeu de ces discussions n’est pas seulement juridique. Il est aussi celui de la participation des données produites par les institutions françaises, culturelles et de recherche, au mouvement général de l’Open Data et à la constitution du web sémantique.

Beaucoup de temps a sans doute été perdu en France autour de débats stériles à propos de cette exception culturelle, dont l’utilité reste encore à démontrer. Pendant ce temps, au niveau européen, une nouvelle directive sur la réutilisation des informations du secteur public est en préparation, dont l’un des enjeux consiste justement à savoir s’il faut maintenir un statut particulier pour les données de la culture et de la recherche.

Dandelion test render. CC-BY. Par Futurilla. Source : Flickr

Appendice sur les licences :

Suite à la parution de cet article sur OWNI, plusieurs personnes m’ont demandé sur Twitter des précisions concernant les différents types de licences qui peuvent être employées dans le cadre d’une politique de libération des données. J’ajoute donc des développements pour donner quelques éclaircissements sur ces licences et leurs caractéristiques respectives.

CC0 (Creative Commons Zero)

Cet outil n’est pas à proprement parler une licence, mais un instrument juridique permettant à un titulaire de droits de renoncer entièrement à ceux-ci sur n’importe quel type d’objet (oeuvre, base de données, etc). Son effet est très puissant, car il délie le réutilisateur de toutes formes d’obligation. C’est la solution qui va actuellement le plus loin dans la voie de la libération des données, en neutralisant l’application du droit d’auteur, du droit des marques, du droit des bases de données et de tout autre forme de propriété intellectuelle.

Ces effets sont si puissant que l’on pourrait se demander si une administration est bien en droit d’employer la CC0 pour des données publiques, car celle-ci semble mettre de côté la loi de 1978 qui fixe tout de même un certain nombre d’obligations “plancher” (mention de la source, non altération et dénaturation des données, etc).

En fait, le recours à la CC0 est possible en raison de la formation de l’article 12 de la loi :

Sauf accord de l’administration, la réutilisation des informations publiques est soumise à la condition que ces dernières ne soient pas altérées, que leur sens ne soit pas dénaturé et que leurs sources et la date de leur dernière mise à jour soient mentionnées.

Ce “sauf accord de l’administration” figurant au début de l’article indique bien qu’un producteur de données publiques peut lever ces exigences minimales, s’il le souhaite. Dans le champ culturel, Europeana a récemment publié un Data Exchange Agreement, qui impose aux contributeurs et agrégateurs de placer leurs métadonnées sous cette licence CC0.

A noter que la CC0 est utilisable pour des métadonnées, mais pas pour des oeuvres du domaine public numérisées (sauf à considérer qu’elle exprime alors abandon du droit de l’administration sur les données publiques produites à partir de l’oeuvre numérisée).

ODbL (Open Database Licence)

Cette licence concerne comme son nom l’indique des bases de données, dont il permet la libération sous conditions : 1) Mention de la source (Paternité) 2) Partage à l’identique en cas de réalisation d’une nouvelle base de données “dérivée” à partir de la première (Share Alike). C’est donc grosso modo l’équivalent d’une CC-BY-SA, mais appliquée à des bases de données. En France, la Ville de Paris a choisi cette solution pour la libération de ses données sur opendata.paris.fr, en procédant à cette occasion à la traduction de cette licence en français.

Par rapport à la licence Etalab, la principale différence de l’ODbL est de comporter une clause de partage à l’identique, qui fait que le réutilisateur doit placer les enrichissements qu’il produit à partir des données récupérées auprès de l’administration sous la même licence ouverte. Avec la licence Etalab, le réutilisateur peut tout à fait s’ en abstenir et remettre une couche de droit propriétaire sur les données publiques récupérées.

Certains estiment (comme Silvère Mercier) qu’une telle clause est essentielle pour éviter que de nouvelles enclosures soient posées sur les données publiques, conçues comme des biens communs devant le rester. D’autres pensent qu’il est normal que les entreprises réutilisant les données publiques puissent valoriser les enrichissements qu’elles apportent. Ce sont deux philosophies différentes de l’Open Data.

La licence ODbL est adaptée pour des métadonnées, mais elle ne s’applique pas aux éléments au sein de cette base, et notamment pas à des oeuvres du domaine public numérisées.

Licence ouverte d’Etalab

J’en ai déjà parlé dans le billet ; je vais donc passer rapidement. La différence avec la l’ODbL est que la licence Etalab est ancrée dans le droit des données publiques et pas dans un droit de propriété intellectuelle, comme le droit d’auteur ou le droit des bases de données. Elle a cependant été conçue pour être compatible avec les licences libres, qui elles, trouvent leur fondement dans le droit de la propriété intellectuelle.

C’est une licence très ouverte, qui permet la réutilisation des données, y compris à des fins commerciales, à condition de mentionner leur source et de ne pas les altérer ou les dénaturer.

Cette licence convient bien entendu pour des métadonnées, mais l’exemple de la BNUS montre qu’elle peut aussi s’appliquer à des documents numérisés, notamment à des oeuvres du domaine public, saisies dans leur dimension “données” (la numérisation transforme en effet ces oeuvres en une série de 0 et de 1, donc des données, qui parce qu’elles sont produites par l’administration constituent des données publiques).

La licence Etalab présenterait donc l’avantage sur les autres licences de pouvoir être appliquée, dans le cas d’une bibliothèque numérique, à la fois aux métadonnées et aux documents numérisés, offrant un statut juridique homogène à l’ensemble.

Mais… ce n’est pas si sûr, comme on va le voir ci-dessous.

Public Domain Mark

Tout comme la CC0, la Public Domain Mark n’est pas à proprement parler une licence, mais plutôt une certification, indiquant qu’une oeuvre numérisée appartient bien au domaine public. Elle est notamment soutenue par Europeana, mais commence également à être employée par un certain nombre d’établissements culturels, y compris en France.

Par définition, la Public Domain Mark ne s’applique pas à des métadonnées (on pourrait dire qu’elle EST une métadonnée). Sa vocation est d’être utilisée pour marquer des oeuvres du domaine public numérisées, afin d’indiquer leur statut juridique et ne pas rajouter de couches supplémentaires de droits portant atteinte à l’intégrité du domaine public. LA PDM laisse le domaine public “à l’état pur”.

D’un point de vue purement juridique, on peut se demander si la Public Domain Mark n’est pas préférable à la licence Etalab pour les oeuvres numérisées du domaine public. En effet, il existe un doute quant à l’applicabilité même de la loi de 1978 à des oeuvres du domaine public numérisées (or cette loi constitue le fondement de la licence Etalab). Ce doute provient du fait que la loi de 1978 ne s’applique pas à des informations contenues dans des documents sur lesquels des tiers à l’administration disposent de droits de propriété intellectuelle. Or pour le cas d’une oeuvre du domaine public, il ne fait aucun doute que l’auteur est un tiers à l’administration et du point de vue du droit français, le droit moral subsiste perpétuellement, qui est bien constitutif d’un droit de propriété intellectuelle, même si les droits patrimoniaux sont éteints (voyez ici pour la démonstration complète).

Du coup, ma recommandation, dans le cas d’une bibliothèque numérique, serait d’utiliser la licence Etalab (ou ODbL ou CC0) pour les métadonnées et la Public Domain Mark pour les oeuvres numérisées elles-mêmes, lorsqu’elles appartiennent au domaine public.

Licences Creative Commons

Elles ne sont pas applicables à l’heure actuelle pour les bases de données et donc pas adaptées pour conduire une initiative d’Open Data. C’est du moins le cas dans leur version actuelle 3.0, mais il semblerait que la version 4.0 prendrait en compte le cas du droit sui generis des bases de données. Il est pourtant des pays où les Creative Commons sont appliquées à des bases de données, mais il s’agit de systèmes juridiques qui ne connaissent pas le droit sui generis tel qu’il existe en Europe et où celles-ci sont considérées comme des oeuvres (en fait des compilations ; c’est le cas en Australie ou aux Etats-Unis par exemple).

Néanmoins, en ce qui concerne les données culturelles et de recherche, les licences Creative Commons conservent un intérêt certain. En effet, la loi de 1978 précise bien (nous l’avons vu plus haut) qu’elle ne s’applique pas aux informations contenues dans des documents grevés de droit de propriété intellectuelle appartenant à des tiers. Or dans le secteur de la culture et de la recherche, bon nombre de documents de l’administration sont susceptibles d’être des oeuvres de l’esprit protégées par des droits d’auteur. Pensons par exemple à des photographies ou à des textes écrits par des agents publics de ces administrations.

La CADA a déjà explicitement indiqué qu’elle considérait les agents publics comme des tiers à l’administration (ils ont en effet une personnalité juridique distincte) et quand bien même depuis la loi DADVSI, ils ne disposent plus que d’une forme de droit moral amoindri (droit de paternité uniquement) sur les créations qu’ils produisent dans le cadre de leur mission de service public, la Commission considère qu’il s’agit encore d’un droit de propriété intellectuelle, écartant l’application de la loi de 1978.

Du coup, pour les oeuvres créées par les agents publics, les licences Creative Commons demeurent applicables et elles sont même toutes indiquées. C’est le choix d’ailleurs qu’a fait la BNUS qui, d’après des informations m’ayant été données par Frédéric Blin, va appliquer une licence CC-BY-NC-SA aux créations des agents publics de l’établissement.

***

Ouf ! Et voilà ! J’espère que ces mises au point pourront s’avérer utiles pour éclairer le choix de ceux qui veulent passer à la libération de leurs données (ou convaincre leurs tutelles de le faire). N’hésitez pas à poser vos questions en commentaire !

Classé dans :Domaine public, patrimoine commun, Données publiques et Open Data Tagged : Bibliothèques, BnF, BNUS, Culture, données culturelles, données publiques, Etalab, exception culturelle, informations publiques, open data, recherche