Licences d'utilisation

Des licences ouvertes pour partager vos données

Qu'est-ce qu'une licence ?

C’est un contrat dans lequel l’auteur·trice précise les modalités d’utilisation de son œuvre, La licence lui offre la possibilité de concéder des droits d’utilisation non exclusifs, tout en ne transférant pas ses droits d’auteur (CCdigitallaw 2017).

Les données de recherche sont-elles protégées par le droit d’auteur ?

Oui et non.

Selon la Loi sur le droit d’auteur (LDA), une œuvre est protégée si trois conditions sont réunies : c’est une création de l’esprit (le fruit d’une activité humaine), qui a un caractère individuel (une tierce personne réalisant la même tâche ne peut pourra pas créer d’œuvre identique) et qui est exprimée d’une manière ou d’une autre (qui peut être perçue par les sens) (CCdigitallaw 2020).

Cela signifie que :

  • les données scientifiques brutes ou primaires, par exemple les données non traitées, ne sont généralement pas protégées par le droit d'auteur.
  • les données traitées ou enrichies qui répondent aux critères de la création intellectuelle, par exemple les graphiques, les données contenant des textes ou des images créés intellectuellement avec une certaine individualité sont généralement protégées par le droit d'auteur. (Hirschmann 2020)

A quoi faut-il faire attention lorsqu’on distribue du contenu sous une licence ?

  • Seules les œuvres protégées par le droit d’auteur peuvent être mise à disposition sous licence.
  • Seul l’auteur·trice ou le ou la titulaire des droits d’auteur peut choisir de diffuser son œuvre sous une licence. Cela veut dire que si un dataset contient des données protégées dont les droits appartiennent à des tiers, il faudra leur demander leur autorisation.
  • Une qu’un contenu est mis sous une licence, celle-ci s’applique à toute personne qui voudrait le réutiliser, y compris son auteur·trice.
  • Les licences sont irrévocables. Une fois que le choix s’est porté sur une licence, il n’est pas possible de la changer.

Que sont les licences Creative Commons ?

Les licences Creative Commons sont les licences de droit d’auteur les plus utilisées dans le monde scientifique car elles sont compatibles tant avec les données que les publications, internationales et relativement faciles à comprendre.

Attention, les licences Creative Commons ne sont cependant pas adaptées aux logiciels. Pour ce type d’œuvre, d’autres licences Open Source existent.

Explication des licences Creative Commons

Présentation sur les licences CC par Tania Germond & Janelise Favre, dans le cadre de capsules vidéo sur la divulgation d'oeuvres protégées par le droit d'auteur. Production du CSE de l'Unil.

Les licences Creative Commons en 180 secondes

Pourquoi est-il important d’attribuer une licence aux données ?

Les licences jouent un rôle essentiel dans la distribution du savoir scientifique puisqu’elles encouragent sa réutilisation. En l’occurrence, attribuer une licence à un jeu de données c’est lever les incertitudes légales et éviter le « tous droits réservés » qui est problématique dans le contexte de la science ouverte.

En principe, les dépôts de données vous permettent de choisir la licence d'utilisation qui vous convient. Il faut garder à l'esprit que plus une licence est ouverte, plus elle favorise la réutilisation de vos données et des connaissances nouvelles qui pourraient en émerger, ce qui donne également de la visibilité à votre travail de recherche.

Qu’est-ce qu’une licence ouverte ?

Selon l’Open Definition de l’Open Knowledge Foundation, des données sont ouvertes si elles peuvent être librement utilisées, modifiées et partagées par tout le monde et dans n’importe quel but. Ainsi, seules les licences Creative Commons CC-BY, CC-BY-SA et CC0 sont des licences ouvertes.

Quels sont les problèmes liés aux licences fermées non commerciales (NC) et interdisant la modification (ND) ?

Il est problématique d’interdire la modification parce qu’elle empêche de combiner des jeux de données, de les enrichir avec des données additionnelles, les traduire ou encore d’en corriger des erreurs éventuelles (The Open Data Institute 2015).

Il est problématique d’interdire l’usage commercial parce qu’aucun consensus n’existe sur la définition d’un « usage non commercial ». Ainsi, certaines des situations suivantes peuvent être considérées comme un usage commercial : des partenariats publics-privés ; une entreprise qui utilise les données pour fournir un service utile et payant à des organisations à but non lucratif ; la publication des données sur un blog dont l'hébergement gratuit est couvert par des recettes publicitaires (ex. WordPress) ou encore la publication des résultats d’une recherche sur les données dans une revue commerciale (The Open Data Institute 2015).

Quels sont les problèmes liés aux licences ouvertes de partage à l’identique (SA) et d’attribution (BY) ?

Bien que les licences demandant le partage à l’identique et/ou l’attribution soient ouvertes, elles posent également des problèmes dans le contexte des données de recherche.

Le partage à l’identique (Share Alike) est limitant car les licences de type copyleft (comme la CC-BY-SA) ne sont pas compatibles avec d’autres licences copyleft. Cette situation affecte donc l'interopérabilité des données et augmente le problème de l’incompatibilité des licences entre elles.

L’attribution (BY), quant à elle, peut se révéler problématique parce que dans le cas de données, cela peut devenir rapidement chronophage et ingérable de citer un à un tous les auteurs·trices, souvent nombreux·ses, de tous les jeux de données réutilisés, notamment si les informations d’attribution sont incomplètes ou au contraire, très détaillées et contraignantes (The Open Data Institute 2015). De plus, l'attribution ne peut pas être rendue juridiquement obligatoire à l’aide d’une licence si les données ne sont pas protégées par le droit d'auteur... et ne peuvent pas faire l'objet d'une licence.

Notre recommandation : partager les données sous la licence CC0

Nous recommandons le partage des données de recherche avec la licence CC0 pour les raisons suivantes :

  • La plupart des données de recherche ne sont pas protégées par le droit d’auteur et déjà dans le domaine public.
  • La licence CC0 résout le problème de l’incompatibilité des licences et permet l’interopérabilité légale des jeux de données entre eux.
  • Il y a une certaine logique à mettre les données issues de recherche financées par des fonds publics dans le domaine public.
  • L’Open Science est plus facile à réaliser quand le moins de restrictions possibles entravent la réutilisation des données.

Attention, toutes les données ne peuvent pas être partagées ouvertement. Il peut y avoir des problèmes liés à la protection de la vie privée, de confidentialité commerciale, de sécurité, de données sensibles, etc. qui empêchent une ouverture complète des données. Afin de tenir compte de ces possibles limitations, l'UNIL préconise donc l'approche d'un partage « aussi ouvert que possible et aussi fermé que nécessaire ».

En cas de questions liées aux enjeux commerciaux, à la propriété intellectuelle ou aux brevets, consultez le PACTT (Powering Academia-industry Collaborations and Technology Transfer).

Suivez nous:    

Tableau des licences CC

cc_license_spectrum-633x1024.png

“Creative Commons License Spectrum” by Shaddim (CC BY)

Compatibilité des licences CC

compatibilite_licences_cc.png

"CC License Compatibility Chart" by Kennisland (CC0)

Choisir une licence

Pour aller plus loin

Partagez: