Libérons les données ! De quelques aspects juridiques
A l’heure où l’on évoque la libération des données publiques et le Web des données, ou encore le data journalisme, voici une étude du sujet du point de vue de la loi.
A l’heure où l’on évoque la libération des données publiques [1] et le Web des données [2], ou encore le data journalisme, il semblait utile d’approfondir cette question que l’on avait abordée en 2006 pour les données de la recherche.
Les enjeux
Dans le domaine scientifique, il est essentiel de partager les informations. Pouvoir reconnaître la qualité de biens collectifs aux résultats de la recherche devient donc un impératif. Quant au Web de données, autre exemple retenu, il implique que l’on puisse relier et interroger de manière simple les données dispersées sur le web [3], mais aussi d’en disposer sans se heurter à des obstacles juridiques.
Or, pour accéder à des données et avoir le droit de les utiliser, on s’aperçoit qu’il faut bien souvent contacter les ayants droit et négocier des licences, ce qui s’avère généralement lent et coûteux.
Pour pallier les risques croissants de réappropriation des données, liés à l’expansion actuelle de la propriété intellectuelle, ont été développées parallèlement, depuis plusieurs années, des approches techniques et juridiques dites « ouvertes ».
Les données libres et ouvertes permettent ainsi de disposer d’un fonds commun de données dans lequel n’importe qui peut puiser et ce, malgré les différences importantes des contextes juridiques et institutionnels de leur création.
Quelques rappels
DÉFINITIONS
donnée : un fait, notion ou instruction représentée sous forme conventionnelle convenant à la communication, l’interprétation ou au traitement par des moyens humains ou automatiques (afnor)
donnée publique : donnée collectée ou produite dans le cadre de sa mission, par un service public, sur des fonds publics.
donnée libre : une donnée que l’on est libre d’utiliser, de modifier et de rediffuser
donnée ouverte : l’ouverture s’applique la notion d’interopérabilité, assurée par des standards.
licence libre : contrat par lequel un titulaire d’un droit de propriété intellectuelle concède à un tiers tout ou une partie de la jouissance d’un droit, en accordant au moins la possibilité de modifier, de rediffuser et de réutiliser l’œuvre dans des œuvres dérivées. Ces libertés peuvent êtres soumises à conditions [4] (Wikipédia).
domaine public : des œuvres protégées par le droit d’auteur dont la durée des droits patrimoniaux a expiré (droit d’auteur) ou des choses communes qui n’appartiennent à personne mais dont l’usage est commun à tous (art. 714 Code civil).
LE CADRE JURIDIQUE
Le droit d’auteur. Les données « brutes » ne sont pas protégées par le droit d’auteur, mais leur mise en forme (sous forme de graphiques, diagrammes, etc.) pourrait l’être, dès lors que celle-ci s’avère originale et que la présentation des données ne découle pas automatiquement de l’utilisation d’un procédé technique ou d’un logiciel. Si, par ailleurs, la structure et choix des données sont originaux, la base de données sera protégée par le droit d’auteur.
Le droit sui generis des bases de données. Si le producteur de la base de données peut en outre prouver avoir investi de manière substantielle pour constituer et gérer sa base, il peut s’opposer à toute extraction ou réutilisation substantielle de celle-ci.
Le droit de réutilisation des données publiques. Dans ce cadre, l’administration met à la disposition du public les données qu’elle a produites ou qu’elle détient [5].
D’autres mécanismes. L’accès aux données peut être protégé a priori par un contrat et a posteriori par une action en concurrence déloyale, pour parasitisme ou pour enrichissement sans cause.
Libérer les données
Pourquoi adopter une licence ?
Même dans le cas où les données ne sont pas protégées par un droit (droit d’auteur, droit sui generis du producteur de base de données), il est recommandé de les diffuser accompagnées d’un contrat de licence.
Les utilisateurs ont, en effet, besoin de savoir d’où viennent les données (notion d’attribution), si celles-ci elles ont été modifiées (souci d’intégrité et de validation) et de connaître toutes les modalités de réutilisation autorisées.
Les recours à des contrats de licences reconnus dans le monde entier, même si celles-ci nécessitent une adaptation au droit national, permet d’organiser le partage des données en évitant, puisque les contrats sont la loi des parties, de se pencher sur le problème de la loi applicable et de se heurter à des concepts juridiques différents.
L’extrême diversité des licences
Dans son rapport, le Conseil supérieur de la propriété littéraire et artistique (CSPLA) note qu’il existe des œuvres sous licences mixtes (contenant des éléments sous licences libres et d’autres sous contrats propriétaires) ou encore des licences doubles (permettant d’opter soit pour une licence libre qui impose certaines contraintes, soit pour une licence propriétaire).
A côté des « domaines historiques d’expansion » que sont les logiciels libres, des modèles « généralistes » (licences Creative Commons ou Art Libre, par exemple), diverses communautés (informaticiens, chercheurs [6], musiciens, …) ont développé des licences qui répondent à leurs priorités. En outre, afin de les améliorer, pour s’adapter à de nouvelles pratiques ou de nouvelles législations, ces licences ont pu évoluer dans le temps et se présenter sous de nouvelles versions numérotées [7]. Le mouvement ne s’est étendu qu’ensuite et plus récemment aux données [8].
Quelle licence choisir ?
Pour s’assurer que les données restent libres et bâtir un fonds commun de données, il est important de pouvoir contrôler leurs usages. Abandonner tous ses droits de manière anticipée, en choisissant une licence qui fait entrer son œuvre dans le domaine public (comme l’Open Data Commons – Public Domain Dedication & Licence (PPDL) ou la licence CC Zéro), permet certes de les utiliser pour créer des œuvres dérivées, mais ne répond pas obligatoirement à un tel objectif, puisqu’il n’oblige pas à partager les résultats obtenus à partir des données utilisées. N’importe qui, une entreprise par exemple, pourrait se réapproprier ces données, d’où le paradoxe qui consiste à créer un droit de propriété, qui ne devrait pas exister, pour empêcher cette action.
Si l’on entend bâtir un fonds commun de collaboration, il s’avère de ce fait prudent d’adopter une logique de Copyleft qui « force » le partage. Classées dans le rapport du CSPLA parmi les licences offrant une liberté pérenne, les licences Copyleft[9] ne « se limitent pas à l’octroi du droit d’utiliser, de modifier et de diffuser l’oeuvre : elles veillent à ce que l’usage de l’œuvre copiée ou modifiée demeure libre. Dès lors que sont combinés les éléments de l’oeuvre mise à disposition, l’oeuvre seconde devra obéir au même régime », ce qui permet de s’assurer de l’existence d’un fonds commun d’oeuvres que l’on peut utiliser librement.
La licence Creative Commons BY-SA[10] qui oblige à citer la source et à partager les données obtenues à partir des données utilisées sous la même licence CC BY-SA, a été adoptée notamment par les concepteurs du projet OpenStreetMap, projet qui connaît un grand succès, qui vise à cartographier des villes à partir de données géographiques libres. Considérant toutefois qu’une licence CC vise à protéger des œuvres protégées par le droit d’auteur, les concepteurs d’OpenStreetMap songent à adopter la licence ODbL, adaptée au droit sui generis des bases de données
Le choix d’une licence n’est pas neutre
S’il convient, en préalable, de s’assurer que l’on est en mesure de céder tous les droits que la licence va conférer (coauteurs éventuels, droits d’auteur sur les œuvres incorporées, …), il convient aussi d’en apprécier l’impact avant d’opter pour l’une d’entre elles.
Kobé
Mes plus vifs remerciements à Benjamin Jean, Linagora
Ce texte sera également publié sur le site de l’ADBS
Notes
[1] Les portails gouvernementaux en Australie, aux Etats-Unis, ou encore au Royaume-Uni proposent tous des données en libre accès. Mais ces portails seraient moins riches en données que le portail français, tel que préfiguré aujourd’hui. Le niveau « d’ouverture » des données publiques accessibles via le portail français d’accès aux données publiques annoncé par l’Agence du patrimoine immatériel de l’Etat (APIE), variera selon les administrations. Le Chapitre français Creative Commons a interrogé les candidats aux élections régionales pour les sensibiliser à l’utilité de libérer les données publiques régionales.
[2] Voir aussi : L’avenir de l’information : le web de données, Hubert Guillaud, InternetActu.net, 4 décembre 2008
[3] Démontrant ainsi la nécessité de l’intéropérabilité, une condition facilitée par le mouvement Libre.
[4] La licence libre GPL (General Public License), par exemple, impose que l’on redistribue le logiciel « enrichi » après l’avoir récupéré, étudié et amélioré.
[5] Le principe d’une réutilisation des informations publiques ne s’applique pas aux informations élaborées dans le cadre d’une mission de service public à caractère industriel et commercial, ni à celles dont les tiers détiennent des droits de propriété intellectuelle, ni à celles qui contiennent des données personnelles non anonymisées lorsque l’accord des personnes concernées n’a pas pu être obtenu.
[6] Des licences spécifiques ont été développées pour certaines disciplines, BiOS Open source dans le domaine des biotechnologies, par exemple.
[7] La version 3.0 des licences Creative Commons, par exemple, tient compte du droit sui generis qui peut être conféré à certains producteurs de bases de données.
[8] Les réflexions autour des Science Commons [12] et le succès d’OpenStreetMap [17] ont joué à cet égard un rôle majeur
[9] La licence CC BY SA ou la licence Art Libre, par exemple
[10] Licence CC qui oblige à mentionner la source (BY) qui autorise les modifications, mais qui impose que les oeuvres dérivées soient proposées au public avec les mêmes options Creative Commons que l’œuvre originale.
Références
1. Rennes et Keolis: ils ont osé ! LiberTic, 1er mars 2010
2. Vers des données régionales en libre accès, Michaël Szadkowski, blog du Monde, 10 février 2010
3. Rennes passe à l’open source pour diffuser ses infos pratiques, Christophe Guillemin, 01Net, 24 février 2010
4. Atelier Communia « Les institutions de mémoire et le domaine public » – Barcelone 1 & 2 oct. 2009 (Compte-rendu et impressions), Calimaq, S.I.Lex, 13 octobre 2009
5. The legal status of raw data : a guide for research practice, Madeleine de Cock Buning, Allard Ringnalda, CIER and Tina van der Linden (Centre for Intellectual Property Law, Surf Foundation, July 2009
6. La mise à disposition ouverte des œuvres de l’esprit, Valérie-Laure Bénabou et Joëlle Farchy, Conseil supérieur de la propriété littéraire et artistique juin 2007
7. CC0 : une nouvelle licence Creative Commons pour « marquer » le domaine public en ligne , Calimaq, S.I.Lex, 17 mars 2009
8. Mon œuvre est dans le domaine public, Michèle Battisti, Actualités du droit de l’information, 16 mars 2009
9. (Petit) Guide à l’usage des licences libres, Benjamin Jean, Intervention lors de la matinée juridique, Syntec informatique du 14 mars 2008.
10. Comment puis-je mettre mes documents sous licence Creative Commons ? Michèle Battisti, Actualités du droit de l’information, janvier 2008
11. Principes pour des données publiques ouvertes, Hubert Guillaud Internet Actu, 20 décembre 2007
12. Science Commons : une solution pour le partage des résultats scientifiques, Michèle Battisti avec la collaboration d’Arabelle Baudette, Actualités du droit de l’information, n° 67, mars 2006
13. Les contrats Creative Commons, Michèle Battisti, Actualités du droit de l’information, n° 52, novembre 2004
Définitions. Guide
14. Open Definition. Un tableau des licences. Sur le site Open Definition
15. Guide to Open Data Licensing. Sur le site Open Knowledge Foundation Wiki
16. Openstreetmap. Sur le site Wikipédia
Présentations ppt
17. Le statut juridique de la donnée libre, Benjamin Jean, Linagora, 17 septembre 2008
18. Data sharing : social and normative, Kaitlin Thaney, 25 octobre 2009
19. Rights Statements on the Web of Data, Leigh Dodds, 25th October 2009
Présentation audiovisuelle
20. Le web des données. Emmanuelle Bermès, 5 à 7, ADBS (en ligne prochainement)
Billet initialement publié sur Paralipomènes
Image bionicteaching sur Flickr
Laisser un commentaire