La qualità degli Open Data

Posted by Vincenzo Patruno | Posted in Open Data, Open Government | Posted on 18-12-2012-05-2008

0

Submit to StumbleUponDigg This

 di Vincenzo Patruno e Daniele Frongia

Quando qualche anno fa si è cominciato a parlare di Open Data, lo si è fatto in un primo momento essenzialmente in termini di Open Government, ossia evidenziando gli aspetti legati alla trasparenza che la pubblicazione dei dati avrebbe potuto generare nei processi amministrativi. I dati pubblici vengono infatti generati dalla attività quotidiane delle Pubbliche Amministrazioni centrali e locali. Sono generalmente dati amministrativi, (pensiamo ad esempio ai dati sulla spesa della PA, sugli appalti, sulle consulenze, …), ma anche dati scientifici (ad esempio i dati delle centraline che troviamo nelle nostre città per il rilevamento delle polveri sottili) o ancora dati statistici (pensiamo ai dati economici e sociali di un territorio). Rendere pubblici i dati prodotti dalla Pubblica Amministrazione ha come effetto quello di poter far conoscere e di rendere quindi “trasparenti” sia i processi interni alle PA nonchè i fenomeni descritti da quei dati. Sappiamo bene come la generale opacità dell’azione della Pubblica Amministrazione possa diventare terreno fertile per il clientelismo e il malaffare. E i dati possono rivestire un ruolo chiave per restituire ai cittadini quel controllo sociale delle politiche pubbliche tanto auspicabile in questo particolare momento, soprattutto in Italia. Il caso dell’ILVA di Taranto e dei dati ambientali taroccati per anni è soltanto l’ultimo di una lunga serie, ma è un esempio che ci ricorda l’inestimabile valore che possono avere i dati per la società civile, per il territorio e per un intero Paese.

Open Data non vuol dire però soltanto rendere pubblici i dati. Una caratteristica fondamentale degli Open Data è infatti quella del riuso. I dati resi pubblici dalle PA devono in altre parole poter essere riutilizzati senza restrizioni e per qualunque scopo. Anche quindi con l’idea di consentire al mercato di avviare una qualche forma di business sui dati. Questo è un aspetto che viene messo in evidenza dalla Agenda Digitale europea e ripreso da tutte le Agende Digitali nazionali e locali. In tutte viene dato ampio risalto agli Open Data ritenendoli un interessante elemento in grado di fungere efficacemente da stimolo per l’economia digitale. E’ stato stimato che il volume di affari teorico che potrebbe essere sviluppato complessivamente attorno ai dati del settore pubblico dell’intera Europa si aggiri attorno ai 140 miliardi di Euro all’anno. Si tratta a questo punto di capire come fare.

La prima iniziativa Open Data lanciata in Italia è stata quella della Regione Piemonte a cui ne sono seguite diverse altre: quella della regione Emilia-Romagna, della Regione Lombardia, del Veneto, della Liguria, dei comuni di Firenze, Torino, Roma, Bologna, della Provincia di Roma e del Governo italiano con la piattaforma dati.gov.it, solo per citarne alcune. Quello che però sta emergendo è che, nonostante il moltiplicarsi delle iniziative e di conseguenza della quantità di dati complessivamente disponibili, sta accadendo molto poco di quanto si era ipotizzato in un primo momento: le imprese IT del territorio di fatto non stanno investendo sui dati. I creativi del Web, gli sviluppatori e gli startupper non riescono a trovare grossi stimoli negli Open Data al momento disponibili. Il risultato è che sono ancora poche le applicazioni web o le applicazioni mobile nate sugli Open Data, e quelle poche difficilmente riescono ad avere caratteristiche tali da essere realmente monetizzabili. Sicuramente questo può dipendere dalle caratteristiche delle imprese IT in Italia, generalmente poco attenti alla innovazione e abituate a generare profitti attraverso i più rassicuranti sistemi gestionali. Sicuramente può dipendere dal fatto che, nonostante il moltiplicarsi delle iniziative,  il volume di Open Data attualmente disponibili è ancora limitato. Possiamo aggiungere che questo  può dipendere anche da una poco diffusa cultura del dato che funge da freno alla nascita di idee e progetti basati sui dati.

C’è però probabilmente un altro fattore da tener presente, ed è quello legato alla  qualità degli Open Data. I dati infatti non sono tutti uguali e non tutti esprimono le stesse potenzialità.  Possiamo dire che i dati di qualità sono anche dati che hanno elevate potenzialità e sono proprio questi che possono avere un forte “appeal” verso i cittadini, il mercato, la Rete, gli sviluppatori, i creativi, gli startupper. E’ quindi molto probabile che quello che scarseggia non sono gli Open Data in quanto tali, ma gli Open Data di qualità. Ma cosa dobbiamo intendere per qualità del dato?

Ci si aspetta innanzitutto che i dati pubblicati da qualunque PA siano accurati. Questo sembra scontato dirlo, ma purtroppo non è sempre così. Più i dati riguardano fenomeni che hanno alle spalle affari e politica, più le amministrazioni coinvolte sono restie a renderli pubblici. E quando lo fanno non è detto che quelli diffusi siano effettivamente i dati reali. Ricordiamo ancora una volta i dati “ufficiali” diffusi a proposito dell’ILVA di Taranto, ma anche, nel Texas d’Italia, quelli relativi alla presenza di idrocarburi delle acque del Pertusillo, i dati ambientali nei dintorni della centrale a carbone di Vado Ligure o ancora i dati di dettaglio della spesa sanitaria che nessuna Regione al momento ha ritenuto dover rendere pubblici. Avere dati di dettaglio è infatti un altro elemento di qualità degli Open Data. Diffondere dati in forma aggregata vuol dire di fatto depotenziarli, vuol dire inevitabilmente che il valore aggiunto che si può creare da quei dati viene ridotto rispetto a quanto si potrebbe fare se fossero diffusi in forma “grezza”.  Ovviamente non sempre questo è possibile. Il dato grezzo infatti spesso si porta dietro problemi legati alla privacy, alla riservatezza e alla confidenzialità del dato stesso.  Spesso quindi diffondere dati in forma grezza semplicemente non si può fare. In questo caso si può sempre però pensare di diffondere i dati in forma aggregata ma comunque a livelli spinti di disaggregazione tali che possano comunque preservare in parte le potenzialità iniziali del dato. Potenzialità che sono comunque strettamente legate anche al momento in cui il dato viene reso pubblico.

Più tempo passa dal momento in cui un certo dato viene generato al momento in cui questo viene reso pubblico e più infatti il dato viene depotenziato.  Questo accade tanto più velocemente quanto più il dato in questione descrive fenomeni  che cambiano rapidamente nel tempo. Pensiamo ad esempio ai dati Meteo (non vengono rilasciati come Open Data, ma è solo per fare un esempio) o ai dati sui trasporti urbani o sul traffico. A nessuno verrebbe mai in mente realizzare una app per sapere il tempo di ieri o per visualizzare la situazione del  traffico della settimana passata su un particolare tratto di strada. Nella recente competizione AppsForItaly, il concorso nazionale sugli Open Data conclusosi nello scorso mese di Maggio, tra i dati pubblici che hanno riscontrato più successo ci sono stati quelli relativi ai parcheggi del Comune di Torino. Erano dati che descrivevano in tempo reale il numero di posti ancora liberi nei vari parcheggi della città. Sono state diverse le proposte presentate che sfruttavano proprio questi dati. E questo ovviamente non perché la Rete sia frequentata da sviluppatori che a Torino non sanno dove parcheggiare la loro auto, ma semplicemente perché dati accurati, dettagliati e ottenibili in tempo reale attraverso API sono dati ad alta potenzialità e che si prestano molto bene ad essere utilizzati in modo “interattivo” all’interno di applicazioni web o apps per dispositivi mobili. Consentire l’uso interattivo dei dati ne amplifica pertanto le potenzialità, rendendoli appetibili per immaginare le più svariate applicazioni e servizi. Per chi produce i dati, questo si traduce nel rendere pubblici gli Open Data non più (o non solo) attraverso file scaricabili (Excel, csv, …) ma attraverso quelli che possiamo chiamare “Open Services” o “Open API”. Questi sono API (o anche servizi Web) che è possibile richiamare all’interno di applicazioni e che consegnano i dati richiesti direttamente ai programmi che li utilizzano. Significa in altre parole dare la possibilità di “agganciare” le applicazione ai dati, senza intermediari, direttamente dove questi vengono prodotti. Erogare pertanto Open Data accurati e dettagliati attraverso Open Services, corredandoli di tutti quei metadati necessari a consentirne un corretto utilizzo, vuol dire offrire dati ad alta potenzialità,  e questo indipendentemente dalla tipologia di dati a cui si sta facendo riferimento. Chi produce dati dovrà provvedere a mantenere aggiornata la base dati man mano che nuovi dati vengono prodotti. Garantire la disponibilità di dati freschi e tempestivi è infatti un requisito fondamentale per spingere sviluppatori, startupper, creativi, più in generale la Rete a puntare sugli Open Data.

 

 

Questo articolo è stato pubblicato sul blog SegnalazionIT

 

 

 

OpenApp Lombardia, il valore dei dati e gli Open Data

Posted by Vincenzo Patruno | Posted in Events, Open Data, Open Government | Posted on 17-12-2012-05-2008

0

Submit to StumbleUponDigg This

Immaginate di avere la possibilità di ricercare un libro per titolo, per autore o per codice ISBN, quel codice cioè che troviamo sul retro del libro in prossimità del codice a barre. O magari, giacché ci troviamo, di ottenere l’ISBN leggendo direttamente il codice a barre attraverso la camera di uno smartphone. E una volta individuato in questo modo il libro che stavate cercando, sapere ad esempio anche quali sono le biblioteche pubbliche che lo posseggono, se il libro è disponibile per il prestito o meno, qual è la collocazione e il numero di inventario in quella biblioteca e magari anche qual è la strada per arrivarci, il numero di telefono, l’email, l’orario di apertura e così via. E magari avere la possibilità di acquistarlo con un click o semplicemente chiederlo in prestito ai nostri contatti su Facebook o su Twitter.

Se tutto questo vi sembra troppo, allora potete provare ad installare una app dal nome “ReadIT” sul vostro smartphone. Disponibile per piattaforma Android, costituisce un interessante esempio di come sia possibile creare valore aggiunto sugli Open Data andando ad integrare e a far interagire tra loro dati provenienti da fonti e sistemi diversi. In questo caso l’applicazione utilizza i dati del catalogo Opac Sbn (www.sbn.it), quelli di Google Books (http://books.google.it/) e il dataset delle biblioteche della Lombardia (https://dati.lombardia.it/cultura/biblioteche). Al momento sorvoliamo sul fatto che i soli ad essere rilasciati come Open Data siano tra questi soltanto quelli relativi alle biblioteche della Regione. Quello che invece voglio mettere in evidenza è come il mettere insieme, integrare e far interagire tra loro dati di tipo diverso e magari infilare tutto ciò all’interno di una Web application o di una app per smartphone sia uno dei modi per generare valore con i dati in generale e con gli Open Data in particolare.

 

…. Continua su Pionero.it

Data Journalism School 2 – Open Data: la filosofia e gli strumenti

Posted by Vincenzo Patruno | Posted in Big Data, Data Journalism, Data Sharing, Open Data, Open Government, Web Technologies | Posted on 14-12-2012-05-2008

0

Submit to StumbleUponDigg This

Seminario su Data Journalism a Matera

Posted by Vincenzo Patruno | Posted in Big Data, Data Journalism, Data Sharing, Open Data | Posted on 04-12-2012-05-2008

0

Submit to StumbleUponDigg This

Qui la presentazione del seminario su Data Journalism tenuto a Matera il 26 Ottobre 2012 più qualche link che ha parlato dell’iniziativa organizzata da forMedia, l’Istituto per la Formazione al Giornalismo e alla Comunicazione Multimediale della Basilicata.

 

 

Assostampa: domani a Matera seminario su “data journalism”

Assostampa: domani a Matera seminario su “data journalism”

Data Journalism: un seminario

Data Journalism School: Milano 2012

Posted by Vincenzo Patruno | Posted in Events, Open Data | Posted on 28-11-2012-05-2008

0

Submit to StumbleUponDigg This

Un pò di pubblicità alla Data Journalism School organizzata dal 13 al 15 Dicembre   a Milano da Istat e dalla fondazione <AHREF. Cliccare sull’immagine per tutti i dettagli,  i docenti, il programma delle 3 giornate di corso.

 

 

 

Gli Open Data, l’Open Government, la spesa pubblica e il Sistema informativo SIOPE

Posted by Vincenzo Patruno | Posted in Gov2.0, Open Data, Open Government | Posted on 22-10-2012-05-2008

0

Submit to StumbleUponDigg This

C’è in Italia un Sistema Informativo che “rileva in via telematica gli incassi e i pagamenti effettuati dai tesorieri e dai cassieri delle Amministrazioni pubbliche”. E’ un sistema che nasce dalla collaborazione tra la Ragioneria Generale dello Stato, la Banca d’Italia e l’ISTAT e il suo nome è SIOPE, il Sistema Informativo delle Operazioni degli Enti Pubblici. SIOPE è in sostanza uno strumento che viene utilizzato per monitorare la situazione e l’andamento dei conti pubblici. Con i dati di SIOPE vengono ad esempio redatte le relazioni trimestrali sul conto consolidato di cassa che il Ministro dell’Economia presenta al Parlamento, ma anche  tutte le statistiche trimestrali di contabilità nazionale necessarie per verificare il rispetto dei nostri conti pubblici con quanto previsto dalle norme europee. Tutto questo in modo tempestivo, visto che la raccolta dei flussi avviene per via telematica, ma soprattutto utilizzando una codifica comune per tutti gli incassi e i pagamenti.

I dati degli enti pubblici di SIOPE fanno cioè riferimento agli stessi codici gestionali e questo è un aspetto molto importante, in quanto vuol dire che tutti i dati presenti all’interno del sistema sono “armonizzati”. E’ possibile in altre parole confrontare tra loro i titoli di entrata e di spesa che si riferiscono ad incassi e pagamenti provenienti da tutte le differenti amministrazioni che riversano i loro dati nel sistema.

Sembra fantascienza. Siamo un Paese dove i cittadini, tranne qualche rara eccezione, non hanno alcuna idea di come viene impiegato il loro denaro.  Quello che oramai è certo, è che da troppo tempo si perpetua una gestione “allegra” dei soldi pubblici. Chi è chiamato ad amministrare lo fa con l’idea di poter disporre a proprio piacimento del denaro pubblico. Questo non solo ha generato sprechi e inefficienze, ma ha alimentato il clientelismo, il malcostume fino ad arrivare al malaffare e alla corruzione. La questione è purtroppo cronaca di tutti i giorni e possiamo considerarla oramai una emergenza nazionale.

… continua su SegnalazionIT

 L’articolo è stato pubblicato anche su Saperi di ForumPA

#IF2012 – Data Economy, prospettive di mercato

Posted by Vincenzo Patruno | Posted in Big Data, Data Sharing, Digital Economy, Events, Open Data | Posted on 06-10-2012-05-2008

0

Submit to StumbleUponDigg This

Internet Festival 2012 – Situazione attuale e prospettive del Data Economy in Italia

Posted by Vincenzo Patruno | Posted in Data Sharing, Events, Open Data | Posted on 03-10-2012-05-2008

0

Submit to StumbleUponDigg This

Evento a cura di CNA sullo stato dell’arte e obiettivi futuri delle iniziative di rilascio e sfruttamento di dati aperti (Open Data) nella PA italiana e sulla situazione attuale e prospettive del Data Economy in Italia

5 Ottobre ore 15.30-18.30  - Internet Festival 2012

Programma

Open Data: dai file di dati agli Open Services

Posted by Vincenzo Patruno | Posted in Data Sharing, Events, Open Data, Web Technologies | Posted on 08-08-2012-05-2008

0

Submit to StumbleUponDigg This

Here my speech at WhyMca (www.whymca.org) annual conference last May in Bologna!
I talked about Open Data and about the need we probably have to move towards Open Services. In other words, we should supply open data to the world using not anymore files to download but Open Services to query and to get structured datasets.

Data Journalism School 2012

Posted by Vincenzo Patruno | Posted in Events, Open Data | Posted on 29-05-2012-05-2008

0

Submit to StumbleUponDigg This

Si è conclusa la Data Journalism School 2012 organizzata da Istat e dalla Fondazione Ahref con la collaborazione di Enel.

Qui il programma dei  “tre giorni” di school e qui sotto le slides del mio intervento.