La qualità degli Open Data
Posted by Vincenzo Patruno | Posted in Open Data, Open Government | Posted on 18-12-2012-05-2008
0
di Vincenzo Patruno e Daniele Frongia

Quando qualche anno fa si è cominciato a parlare di Open Data, lo si è fatto in un primo momento essenzialmente in termini di Open Government, ossia evidenziando gli aspetti legati alla trasparenza che la pubblicazione dei dati avrebbe potuto generare nei processi amministrativi. I dati pubblici vengono infatti generati dalla attività quotidiane delle Pubbliche Amministrazioni centrali e locali. Sono generalmente dati amministrativi, (pensiamo ad esempio ai dati sulla spesa della PA, sugli appalti, sulle consulenze, …), ma anche dati scientifici (ad esempio i dati delle centraline che troviamo nelle nostre città per il rilevamento delle polveri sottili) o ancora dati statistici (pensiamo ai dati economici e sociali di un territorio). Rendere pubblici i dati prodotti dalla Pubblica Amministrazione ha come effetto quello di poter far conoscere e di rendere quindi “trasparenti” sia i processi interni alle PA nonchè i fenomeni descritti da quei dati. Sappiamo bene come la generale opacità dell’azione della Pubblica Amministrazione possa diventare terreno fertile per il clientelismo e il malaffare. E i dati possono rivestire un ruolo chiave per restituire ai cittadini quel controllo sociale delle politiche pubbliche tanto auspicabile in questo particolare momento, soprattutto in Italia. Il caso dell’ILVA di Taranto e dei dati ambientali taroccati per anni è soltanto l’ultimo di una lunga serie, ma è un esempio che ci ricorda l’inestimabile valore che possono avere i dati per la società civile, per il territorio e per un intero Paese.
Open Data non vuol dire però soltanto rendere pubblici i dati. Una caratteristica fondamentale degli Open Data è infatti quella del riuso. I dati resi pubblici dalle PA devono in altre parole poter essere riutilizzati senza restrizioni e per qualunque scopo. Anche quindi con l’idea di consentire al mercato di avviare una qualche forma di business sui dati. Questo è un aspetto che viene messo in evidenza dalla Agenda Digitale europea e ripreso da tutte le Agende Digitali nazionali e locali. In tutte viene dato ampio risalto agli Open Data ritenendoli un interessante elemento in grado di fungere efficacemente da stimolo per l’economia digitale. E’ stato stimato che il volume di affari teorico che potrebbe essere sviluppato complessivamente attorno ai dati del settore pubblico dell’intera Europa si aggiri attorno ai 140 miliardi di Euro all’anno. Si tratta a questo punto di capire come fare.
La prima iniziativa Open Data lanciata in Italia è stata quella della Regione Piemonte a cui ne sono seguite diverse altre: quella della regione Emilia-Romagna, della Regione Lombardia, del Veneto, della Liguria, dei comuni di Firenze, Torino, Roma, Bologna, della Provincia di Roma e del Governo italiano con la piattaforma dati.gov.it, solo per citarne alcune. Quello che però sta emergendo è che, nonostante il moltiplicarsi delle iniziative e di conseguenza della quantità di dati complessivamente disponibili, sta accadendo molto poco di quanto si era ipotizzato in un primo momento: le imprese IT del territorio di fatto non stanno investendo sui dati. I creativi del Web, gli sviluppatori e gli startupper non riescono a trovare grossi stimoli negli Open Data al momento disponibili. Il risultato è che sono ancora poche le applicazioni web o le applicazioni mobile nate sugli Open Data, e quelle poche difficilmente riescono ad avere caratteristiche tali da essere realmente monetizzabili. Sicuramente questo può dipendere dalle caratteristiche delle imprese IT in Italia, generalmente poco attenti alla innovazione e abituate a generare profitti attraverso i più rassicuranti sistemi gestionali. Sicuramente può dipendere dal fatto che, nonostante il moltiplicarsi delle iniziative, il volume di Open Data attualmente disponibili è ancora limitato. Possiamo aggiungere che questo può dipendere anche da una poco diffusa cultura del dato che funge da freno alla nascita di idee e progetti basati sui dati.
C’è però probabilmente un altro fattore da tener presente, ed è quello legato alla qualità degli Open Data. I dati infatti non sono tutti uguali e non tutti esprimono le stesse potenzialità. Possiamo dire che i dati di qualità sono anche dati che hanno elevate potenzialità e sono proprio questi che possono avere un forte “appeal” verso i cittadini, il mercato, la Rete, gli sviluppatori, i creativi, gli startupper. E’ quindi molto probabile che quello che scarseggia non sono gli Open Data in quanto tali, ma gli Open Data di qualità. Ma cosa dobbiamo intendere per qualità del dato?
Ci si aspetta innanzitutto che i dati pubblicati da qualunque PA siano accurati. Questo sembra scontato dirlo, ma purtroppo non è sempre così. Più i dati riguardano fenomeni che hanno alle spalle affari e politica, più le amministrazioni coinvolte sono restie a renderli pubblici. E quando lo fanno non è detto che quelli diffusi siano effettivamente i dati reali. Ricordiamo ancora una volta i dati “ufficiali” diffusi a proposito dell’ILVA di Taranto, ma anche, nel Texas d’Italia, quelli relativi alla presenza di idrocarburi delle acque del Pertusillo, i dati ambientali nei dintorni della centrale a carbone di Vado Ligure o ancora i dati di dettaglio della spesa sanitaria che nessuna Regione al momento ha ritenuto dover rendere pubblici. Avere dati di dettaglio è infatti un altro elemento di qualità degli Open Data. Diffondere dati in forma aggregata vuol dire di fatto depotenziarli, vuol dire inevitabilmente che il valore aggiunto che si può creare da quei dati viene ridotto rispetto a quanto si potrebbe fare se fossero diffusi in forma “grezza”. Ovviamente non sempre questo è possibile. Il dato grezzo infatti spesso si porta dietro problemi legati alla privacy, alla riservatezza e alla confidenzialità del dato stesso. Spesso quindi diffondere dati in forma grezza semplicemente non si può fare. In questo caso si può sempre però pensare di diffondere i dati in forma aggregata ma comunque a livelli spinti di disaggregazione tali che possano comunque preservare in parte le potenzialità iniziali del dato. Potenzialità che sono comunque strettamente legate anche al momento in cui il dato viene reso pubblico.
Più tempo passa dal momento in cui un certo dato viene generato al momento in cui questo viene reso pubblico e più infatti il dato viene depotenziato. Questo accade tanto più velocemente quanto più il dato in questione descrive fenomeni che cambiano rapidamente nel tempo. Pensiamo ad esempio ai dati Meteo (non vengono rilasciati come Open Data, ma è solo per fare un esempio) o ai dati sui trasporti urbani o sul traffico. A nessuno verrebbe mai in mente realizzare una app per sapere il tempo di ieri o per visualizzare la situazione del traffico della settimana passata su un particolare tratto di strada. Nella recente competizione AppsForItaly, il concorso nazionale sugli Open Data conclusosi nello scorso mese di Maggio, tra i dati pubblici che hanno riscontrato più successo ci sono stati quelli relativi ai parcheggi del Comune di Torino. Erano dati che descrivevano in tempo reale il numero di posti ancora liberi nei vari parcheggi della città. Sono state diverse le proposte presentate che sfruttavano proprio questi dati. E questo ovviamente non perché la Rete sia frequentata da sviluppatori che a Torino non sanno dove parcheggiare la loro auto, ma semplicemente perché dati accurati, dettagliati e ottenibili in tempo reale attraverso API sono dati ad alta potenzialità e che si prestano molto bene ad essere utilizzati in modo “interattivo” all’interno di applicazioni web o apps per dispositivi mobili. Consentire l’uso interattivo dei dati ne amplifica pertanto le potenzialità, rendendoli appetibili per immaginare le più svariate applicazioni e servizi. Per chi produce i dati, questo si traduce nel rendere pubblici gli Open Data non più (o non solo) attraverso file scaricabili (Excel, csv, …) ma attraverso quelli che possiamo chiamare “Open Services” o “Open API”. Questi sono API (o anche servizi Web) che è possibile richiamare all’interno di applicazioni e che consegnano i dati richiesti direttamente ai programmi che li utilizzano. Significa in altre parole dare la possibilità di “agganciare” le applicazione ai dati, senza intermediari, direttamente dove questi vengono prodotti. Erogare pertanto Open Data accurati e dettagliati attraverso Open Services, corredandoli di tutti quei metadati necessari a consentirne un corretto utilizzo, vuol dire offrire dati ad alta potenzialità, e questo indipendentemente dalla tipologia di dati a cui si sta facendo riferimento. Chi produce dati dovrà provvedere a mantenere aggiornata la base dati man mano che nuovi dati vengono prodotti. Garantire la disponibilità di dati freschi e tempestivi è infatti un requisito fondamentale per spingere sviluppatori, startupper, creativi, più in generale la Rete a puntare sugli Open Data.
Questo articolo è stato pubblicato sul blog SegnalazionIT






