Coopération et partage autour des pratiques collaboratives

Rapport du CSPLA sur le Text et le Data Minig "reculer pour ne jamais sauter !"

« Il est urgent d’attendre ». C’est à peu près le seul enseignement que l’on peut retenir du désespérant rapport du CSPLA sur la question du Text et Data Mining.

Le ton est donné dès la préface dans laquelle l’exploration de données est qualifiée d’activité de « nature parasitaire ». Ce terme est particulièrement choquant, puisqu’il il englobe sous cette dénomination péjorative des activités d’étude et de recherche, qui sont les premiers bénéfices que l’on peut attendre du développement des pratiques de fouilles de données.

Partant de telles bases, on ne s’étonnera pas que le rapport ferme une à une toutes les portes qui auraient pu permettre de sécuriser juridiquement le Data Mining, pour finalement préconiser d’attendre un délai de « deux années au terme duquel un bilan sectoriel sera dressé et l’éventuelle nécessité d’une intervention de nature législative évaluée. »

Panneaux d'information.

Panneaux d’information. Par Geralt. CC0. Source : Pixabay

 

Une telle attitude traduit le rejet systématique que le CSPLA oppose à l’introduction de nouvelles exceptions au droit d’auteur, visant à favoriser de nouveaux usages. Concernant le Text et Data Mining, cet attentisme aura de graves conséquences, car l’absence d’intervention du législateur laissera le champ libre à de gros acteurs du monde de l’édition, comme Elsevier ou Springer, pour imposer leurs propres termes au monde de la recherche par le biais de licences, renforçant encore un peu plus leur situation dominante et la privatisation des résultats de la recherche. Le fétichisme du droit exclusif dont fait montre ce rapport provoquera également un handicap pour le développement de la recherche en France, comparé aux Etats-Unis ou à l’Angleterre où le cadre juridique est plus favorable à l’exploration de données.

SavoirsCom1 attire l’attention de la communauté des chercheurs sur cette question, à propos de laquelle la mobilisation sera indispensable pour faire bouger les lignes face aux pesanteurs du système français.

Du point de vue de la mission, les deux points rédhibitoires pour le développement de l’exploration de données dans le respect de la propriété littéraire et artistique sont les suivants :

I- le TDM constitue une atteinte au droit de reproduction

« toute reproduction de tout ou partie d’une œuvre dans le cadre d’une opération d’exploration de données sans autorisation préalable des auteurs constitue une contrefaçon. Dès lors, il faut se poser la question de savoir si les actes nécessaires à l’exploration de données peuvent bénéficier d’une exception au droit d’auteur. » (p.25)

Le vieux logiciel du CSPLA bloque sur la question de l’application de l’exception de copie provisoire. Rappelons l’enjeu : pour procéder à une fouille de données, il est nécessaire de réaliser une copie provisoire de la base de données. D’après le CSPLA, il faut écarter l’exception de copie provisoire au motif que deux conditions ne sont pas remplies :

1) Première condition : « une reproduction provisoire transitoire ou accessoire »

« Le caractère transitoire de la copie peut faire défaut dans de nombreux cas. En effet, la suppression de la reproduction nécessaire par exemple pour la collecte des données, dépendra de la seule volonté de l’utilisateur, dont il n’est nullement certain qu’il veuille s’en défaire, ce qui a pour conséquence que la dite reproduction risque de subsister pendant une période prolongée en fonction des besoins de l’utilisateur. » (p.29)

Si on résume le propos du CSPLA : les usagers des API qui permettent de faire du TDM sont des délinquants potentiels. Interdisons une liberté dans la mesure où certains concitoyens seraient susceptibles d’en user pour commettre un délit. C’est un point de vue paranoïaque. A ce compte-là, interdisons les fontaines publiques parce que certains seraient susceptibles d’en détourner l’usage, coupons Internet puisqu’il met en capacité certains internautes de diffuser des copies non autorisées, etc.

2) Deuxième condition : « une reproduction sans signification économique indépendante »

« En effet, le résultat issu du processus d’exploration de données crée une valeur spécifique ajoutée à celle des données premières grâce, par exemple, à la détection des corrélations entre ces données. » (p. 29)

Mais dans de nombreux cas, l’exploration de données est menée par des chercheurs dans une optique non-commerciale. Et quand bien même la recherche aurait, de façon accidentelle et incidente, quelques retombées commerciales indirectes, il reste à déterminer si le but de la recherche l’emporte ou non sur le but commercial. C’est bien pour cela que le rapport de la misssion menée par Jean-Paul Triaille, « Study on the legal framework of text and data mining (TDM)« , proposait d’inclure dans le champ d’une future exception de TDM les recherches menées « principalement » (et pas « seulement ») dans un but de recherche.

II – Le TDM porte atteinte au monopole du producteur de bases de données

« S’agissant du droit sui generis des producteurs de bases de données, les opérations d’exploration de données peuvent conduire à des extractions quantitativement ou qualitativement substantielles d’une base de données protégée. Celles-ci nécessitent l’autorisation du producteur de la base de données sauf à bénéficier d’une exception. L’interprétation restrictive des exceptions pertinentes conduit à écarter, dans la plupart des cas, leur application aux activités d’exploration de données. » (p.35)

« Interprétation restrictive » : voilà tout est dit. Il n’y a pas une once d’imagination dans ce rapport. On est à cent lieues des conclusions du rapport de la mission conduite par le Professeur Ian Hargreaves, « Standardisation in the area of innovation and technological development, notably in the field of Texte and Data Mining« , qui proposait une « norme ouverte » permettant d’interpréter le test en trois étapes de façon moins restrictive de façon à aboutir à une liste non fermée d’exceptions. L’une des autres conclusions du même rapport était d’opérer une distinction entre « la copie d’oeuvres « expressives », [c’est-à-dire empreintes de l’originalité d’un auteur],(..) et la copie par le biais d’un traitement automatisé, qui est à la base même du fonctionnement d’Internet et de l’exploration de données, et qui résulte en des produits « transformés » qui n’entrent pas en rivalité avec les travaux originaux ou jeux de données copiés par les ordinateurs ».

Conclusion du rapport :

« Il faudrait donc encourager le développement de la solution contractuelle dans la mesure où celle-ci offre un cadre juridique souple pour une pratique aux contours évolutifs. Il est possible de recommander d’engager un processus de concertation et d’autorégulation sectorielle pour permettre la recherche et l’élaboration des équilibres les plus pertinents et les plus adaptés aux secteurs concernés » (p. 40)

La possibilité d’une exception au droit des bases de données est évoquée, mais seulement du bout des lèvres, et sous forme de propos rapportés :

« Au cours des auditions, certains utilisateurs ont appelé de leurs vœux une modification de la directive 2001/29/CE voire de la directive 96/9/CE relative aux bases de données ne serait-ce que pour les activités de recherche non-commerciales. Il pourrait s’agir d’une exception au droit de reproduction mais également au monopole du producteur de base de données » (p. 44-45)

Mais l’espoir est immédiatement douché :

« À l’heure actuelle, il ne semble pas envisageable de modifier le droit national dans la mesure où la liste des exceptions prévue par les directives 2001/29/CE est limitative. Par conséquent,la prévision d’une exception ne peut être effectuée qu’au niveau européen. » (p.45)

Juridiquement, c’est incontestable. Le droit européen constitue un carcan rigide et la liste des exceptions est fermée. Mais politiquement, une autre voie est possible. L’Irlande et la Grande-Bretagne ne se sont pas résignées. Elles ont choisi une approche bottom-up : faire bouger l’Union Européenne par une modification de la législation nationale. Ce type de stratégie n’est pas étranger à la France : quand il s’est agi de baisser le taux de TVA sur les e-books, la France n’a pas attendu l’autorisation de la Commission Européenne… Pourquoi une telle frilosité du CSPLA sur le dossier du TDM ?