Linee guida nazionali e licenze per l’Open Data

Torniamo su una materia che ci ha occupati in passato, ovvero se la pubblicazione di open data da parte della pubblica amministrazione richieda una licenza “attribution” (come quella predicata dalle Linee guida nazionali, ancora nell’ultima versione del 2016), oppure se sia ammissibile una licenza più “liberale”. Già ho espresso la mia preferenza, in documenti pubblici, ma vale ribadire la questione, visto che ancora recentemente ho dovuto contraddire amici molto preparati su ciò che sia ammissibile.

Breve ricapitolazione

Gli open data sono in definitiva set di dati prodotti dalla pubblica amministrazione e messi a disposizione di tutti sotto condizioni che consentano il riuso dei dati per qualsiasi scopo, anche commerciale. La previsione fondamentale è l’Art. 52 del Codice dell’amministrazione digitale.

Al fine di essere disponibili per gli scopi enunciati, devono avere determinate caratteristiche di qualità, usabilità e – per quello che qui rileva – diritti legali. Vedremo in seguito che i diritti legali che si frapporrebero alla piena riusabilità sono quelli definiti “sui generis” o “database rights”. Non c’entra quasi niente il copyright come lo intendiamo solitamente.

Le due alternative che si propongono, come già con Aliprandi descrivemmo nello studio del Freegis.net, sono:

  • licenze permissive (“Attribution”)
  • waiver

Per una migliore comprensione rimando all’articolo su queste colonne e alle linee guida per la scelta delle licenze nel progetto Freegis.net.

Le linee guida del 2014.

L’art. 52 del CAD rinvia, per gli open data, alla definizione contenuta nell’art. 68 CAD, facendo riferimento alle emanande linee guida nazionali, a cui chi rilascia un dataset come open data dovrebbe conformarsi.

L’Agenzia definisce e aggiorna annualmente le linee guida nazionali che individuano gli standard tecnici, compresa la determinazione delle ontologie dei servizi e dei dati, le procedure e le modalità di attuazione delle disposizioni del Capo V del presente Codice con l’obiettivo di rendere il processo omogeneo a livello nazionale, efficiente ed efficace. Le pubbliche amministrazioni di cui all’articolo 2, comma 2, del presente Codice si uniformano alle suddette linee guida.

La vincolatività tendenziale delle linee guida si riferisce, dunque, normativamente, solo alla parte tecnica, non (espressamente) alla parte legale delle linee guida. Le linee guida del 2014 si preoccupano di stabilire un framework legale, e dunque si occupano ‒ secondo me correttamente ‒ della tematica di quali licenze di preferenza adottare. Sennonché adottano una scelta che secondo me è errata, ovvero raccomandano di utilizzare una Creative Commons ‒ attribuzione (CC-by). Lo fanno con motivazioni che secondo me hanno dell’incredibile:

Infine, occorre ricordare che alla maggior parte dei dati e dei documenti necessari per lo svolgimento delle funzioni tipiche delle pubbliche amministrazioni non è opportuno applicare la CC0, in quanto questa prevede il rilascio dei diritti morali che sono inalienabili, indisponibili, imprescrittibili secondo le norme nazionali ed europee

Ho già criticato ampiamente l’idea secondo cui ci possa essere un diritto morale da proteggere, in particolare su queste colonne nell’articolo sugli open data in generale, mi pare ci sia poco da aggiungere. Anzi, no. Nella nuova versione delle linee guida, questa parte è sparita. Evidentemente qualcuno si è reso conto della topica, mi fa piacere, non me ne prendo il merito, spero di aver comunque dato un contributo utile alla discussione.

Siamo a posto? No. Siamo a metà del guado.

Le linee guida del 2016/2017

Le nuove linee guida continuano a consigliare la licenza CC-by 4.0, anche se a questo punto il tutto viene effettivamente formulato più di un consiglio che un’imposizione. Anche se, discutendone con persone competenti, viene interpretato come qualcosa di più di un consiglio. Si fa riferimento a un rimasuglio della vecchia motivazione, che impone non più tre, ma due motivi per scegliere una “attribution”.

In relazione a quanto sopra riportato, tenuto conto del contesto normativo di riferimento, delle indicazioni in tema di licenze contenute nella Comunicazione della Commissione 2014/C – 240/01 e dei principi di indisponibilità dei beni del demanio culturale espresso negli artt. 10 e 53 del Codice dei beni culturali (D.lgs. 22 gennaio 2004, n. 42), si ritiene opportuno fare riferimento ad una licenza unica aperta, che garantisca libertà di riutilizzo, che sia internazionalmente riconosciuta e che consenta di attribuire la paternità dei dataset (attribuire la fonte). Pertanto, si suggerisce l’adozione generalizzata della licenza CC-BY nella sua versione 4.0, presupponendo altresì l’attribuzione automatica di tale licenza nel caso di applicazione del principio “Open Data by default”, espresso nelle disposizioni contenute nell’articolo 52 del CAD.In relazione a quanto sopra riportato, tenuto conto del contesto normativo di riferimento, delle indicazioni in tema di licenze contenute nella Comunicazione della Commissione 2014/C – 240/01 e dei principi di indisponibilità dei beni del demanio culturale espresso negli artt. 10 e 53 del Codice dei beni culturali (D.lgs. 22 gennaio 2004, n. 42), si ritiene opportuno fare riferimento ad una licenza unica aperta, che garantisca libertà di riutilizzo, che sia internazionalmente riconosciuta e che consenta di attribuire la paternità dei dataset (attribuire la fonte). Pertanto, si suggerisce l’adozione generalizzata della licenza CC-BY nella sua versione 4.0, presupponendo altresì l’attribuzione automatica di tale licenza nel caso di applicazione del principio “Open Data by default”, espresso nelle disposizioni contenute nell’articolo 52 del CAD. [enfasi aggiunta]

Dunque le motivazioni per suggerire una attribution risiedono nelle due seguenti motivazioni:

  • Raccomandazione della comunicazione
  • Demanio culturale

Lo dico cercando di non offendere: nessuna di queste due motivazioni supera la soglia minima di accettabilità di un discorso giuridico.

la comunicazione 2014/C – 240/01

Il puro testo della comunicazione citata (in riferimento alla pubblicazione di documenti, ma è l’unica parte che si occupa di licensing) è già abbastanza chiaro da non meritare troppe chiose:

In questa tipologia riveste particolare interesse la devoluzione al dominio pubblico CC0 (7), strumento giuridico che, consentendo di rinunciare ai diritti di proprietà intellettuale e ai diritti sulle banche dati per le informazioni del settore pubblico, offre ai riutilizzatori una flessibilità totale e riduce le complicazioni collegate all’operatività su varie e diverse licenze con il potenziale conflitto di disposizioni che comporta. Se non possono usare la devoluzione al dominio pubblico CC0, gli enti pubblici sono incoraggiati a ricorrere a licenze aperte standard [enfasi aggiunta]

Il demanio culturale

Francamente, scorrendo la lista dei “beni culturali” non ci rinvengo dati, banche dati e dataset. I beni del demanio culturale sono quei beni culturali che appartengono allo Stato. Anche qui non trovo niente che ci illumini.

Faccio un esempio: mi spiega qualcuno cosa c’entri il demanio culturale con la banca dati contenente l’elenco dei Medicinali veterinari autorizzati alla commercializzazione o in stato di sospensione o quello contente l’analisi delle dichiarazioni dei redditi delle persone fisiche?

Già questo basterebbe. Nella maggior parte dei casi il demanio culturale c’entra come il cavolo a merenda. Non si legifera partendo da un caso eccezionale per regolare l’intera materia sulla base di quel caso. Si creano regole il più possibile generali, e poi si introducono, se necessario, eccezioni. Che qui peraltro non sono nemmeno necessarie!

È chiaro infatti che altro è un bene culturale, altro è un dato o un insieme di dati (ma anche una riproduzione digitale! di questo vedremo appresso). Un dataset contenente un insieme di informazioni su beni culturali:

  1. non esaurisce affatto la tipologia di dati che vanno resi disponibili. Se ci si prende la briga di osservare i cataloghi a vario livello, si vede che si tratta di una fattispecie specifica, di rilevanza trascurabile, degna semmai di una disposizione specifica, non di dettare la disciplina a tutti i rilasci di dati.
  2. può contenere dati, riproduzioni o altro materiale effettivamente coperto dal diritto d’autore, ma ciò non si estende affatto alla licenza sul dataset in sé.

Qui c’è una profonda confusione tra il concetto di dataset, che è sostanzialmente ciò che è protetto dal diritto sui generis e i singoli componenti del dataset, le informazioni, che potrebbero ad esempio essere fotografie. Il dataset non è un’opera derivata dei singoli componenti. La distinzione è stata operata una volta per tutte dalla stessa Direttiva sui database rights,

  1. considerando che le opere tutelate dal diritto d’autore e le prestazioni tutelate da alcuni diritti connessi che sono inserite in una banca di dati beneficiano comunque dei rispettivi diritti esclusivi e non possono pertanto essere inserite o riprodotte da una banca di dati senza l’autorizzazione del titolare dei diritti o dei suoi aventi causa;
  1. considerando che l’esistenza di un diritto separato nella scelta o nella disposizione di opere e prestazioni in una banca di dati lascia impregiudicati i diritti d’autore su tali opere e i diritti connessi sulle prestazioni inserite in una banca di dati;
  1. considerando che, oltre alla tutela del diritto d’autore per la scelta o la disposizione originali del contenuto di una banca di dati, la presente direttiva intende salvaguardare i costitutori di banche di dati dall’indebita appropriazione dei risultati dell’investimento finanziario e professionale effettuato per ottenere e raccogliere il contenuto proteggendo la totalità o parti sostanziali della banca di dati da taluni atti commessi dall’utente o da un concorrente;

Quando si parla di banche dati, si parla di un oggetto sul quale possono insistere tre distinti diritti:

  1. il diritto d’autore sui singoli elementi contenuti
  2. un diritto d’autore sulla banca dati originale per scelta o disposizione di opere e prestazioni
  3. un diritto sui generis

Posto che gli open data ben difficilmente si occupano di banche dati originali per scelta o disposizione di opere (considerando 27), e che i diritti sui singoli elementi contenuti in una banca dati sono comunque coperti da una loro licenza individuale, che non è pregiudicata dal loro inserimento in una banca dati (considerando 26), ciò di cui ci occupiamo è solo o principalmente (ma molto principalmente) il diritto sui generis. Si tratta di dati, informazioni, le quali hanno una loro consistenza solo in quanto raccolti, non in quanto individualmente considerati (se non sotto altre forme di protezione).

Dalla lettura della versione originale delle linee guida si evince che ci sia stata una confusione tra i tre punti sopra elencati. Se nel dataset è contenuto qualcosa che merita una protezione particolare (ed è l’eccezione), allora a quel dato o categoria di dati conviene dare una puntuale informazione sulla relativa licenza (e attribuzione di paternità se soggetta a diritto d’autore, cosa che non è di per sé garantita dalla semplice attribuzione di una licenza CC-by a tutto il dataset).

La finalità dell’open data

Un’ultima valutazione sul perché va preferita una licenza “waiver” rispetto a una “attribution”. La risposta non la do io. La dà la normativa dell’art. 52 CAD (che non parla di attribuzione). La norma non è un capolavoro di chiarezza, anche perché fa riferimenti incrociati ad altre norme, confondendo il piano della licenza sui diritti e il piano della tutela della privacy (che sono due elementi radicalmente differenti e vanno trattati con strumenti radicalmente differenti). La norma prevede (by default) che i dati siano liberamente riutilizzabili da chiunque, anche per finalità commerciali, anche in formato disaggregato. Un giorno faremo un discorso sull’uso fuorviante di “anche” nella normativa, ma quel giorno non è oggi.

La risposta la dà anche la comunicazione della Commissione citata dalle Line guida:

[…] offre ai riutilizzatori una flessibilità totale e riduce le complicazioni collegate all’operatività su varie e diverse licenze con il potenziale conflitto di disposizioni che comporta.

Inoltre, laddove si occupa di tutti gli scenari:

Si raccomanda di prevedere, compatibilmente con il diritto applicabile, obblighi di minima imponendo tutt’al più: a) una frase che identifica la fonte del documento; b) un collegamento alle pertinenti informazioni sulla licenza (ove fattibile).

Quel tutt’alpiù (“at most”, nella versione inglese; “tout au plus en”, in quella francese) non significa ovviamente “come minimo”, ma significa “come massimo”, enfatizzando invece che la tendenza debba essere al minimo delle complicazioni, stabilendo come tetto l’attribuzione. In coerenza, deve essere data la precedenza alle licenze che, compatibilmente con i diritti che interferiscono con il rilascio, privilegi il minimo di frizione.

Questa licenza è il modello di waiver, è la CC0.

Il mio consiglio sempre e comunque in tutti i casi in cui ciò sia possibile è quello di usare la CC0 quale licenza preferita per l’open data.

Questo articolo è stato pubblicato originariamente sulla rivista online Ingenium ‒ http://www.ingenium-magazine.it/linee-guida-nazionali-e-licenze-per-lopen-data/
Viene licenziato sotto le condizioni Creative Commons Attribution – Share Alike 2-5 (cc by-SA-NC 2.5) http://creativecommons.org/licenses/by-nc-sa/2.5/it/legalcode