Open Data: perche’ abbiamo bisogno di una “fase due”

Posted by Vincenzo Patruno | Posted in Digital Economy, Open Data, Open Government | Posted on 29-04-2013-05-2008

0

Submit to StumbleUponDigg This

open data fase due

Questo articolo è stato pubblicato su Pionero.it

Era un pò di tempo che avevo in mente di scrivere questo articolo, ma  ho sempre rimandato in quanto, come sempre accade, riescono ad avere la meglio i progetti da seguire, le scadenze da rispettare, le docenze da preparare e chi più ne ha più ne metta.

Da più parti, infatti, negli ultimi tempi, stanno giungendo segnali che qualcosa sta cambiando attorno al dibattito in corso sugli Open Data. Il che rende questo articolo un pò più adatto ad essere scritto ora che non qualche tempo fa.  Negli ultimi tempi, infatti, molti tra gli attori principali che fin qui hanno agito a sostegno delle iniziative sui dati aperti stanno pian piano invocando la necessità di passare a quella che potremmo chiamare la “fase matura” degli Open Data.

Facciamo qualche considerazione. La prima è che è già da qualche anno che si parla in modo anche piuttosto “intenso” di Open Data. Pensiamo a tutte le iniziative lanciate dai vari Enti pubblici negli ultimi tempi, alle Agende Digitali locali e nazionali, alle varie competizioni sui dati aperti, alle iniziative di tipo legislativo intraprese a livello nazionale e a livello di governi regionali. Addirittura anche la presidenza britannica del G8 ha lanciato una iniziativa per arrivare a rilasciare un insieme di dataset Open in occasione del vertice dei Capi di Stato e di Governo del prossimo mese di Giugno.

Sembra quasi che Open Data abbia assunto le caratteristiche di una moda da seguire piuttosto che di una opportunità per la società. Questo fa sì che se da una parte si moltiplicano le iniziative legate a gli Open Data, dall’altra si punta ancora molto poco all’efficacia di tali iniziative.

E qui la seconda considerazione. Se infatti andiamo a guardare cosa sta accadendo sul fronte del riuso del dato, che ricordiamo essere l’elemento chiave degli Open Data, dobbiamo probabilmente constatare che sta accadendo ancora molto poco.

Le community di sviluppatori faticano al momento a trovare sufficientemente appetibili gli Open Data per progetti che possano andare al di là di un loro utilizzo come semplice esercizio. I data journalist non sono messi meglio. I dati di cui hanno più bisogno sono ancora ben custoditi all’interno degli uffici delle pubbliche amministrazioni. Le aziende e il mercato poi si stanno ancora interrogando su quali possano essere i modelli di business e di conseguenza quali possano essere gli investimenti da fare sugli Open Data per poter generare in qualche modo profitti.  Infine, chi vedeva gli Open Data come un elemento per la trasparenza dell’azione amministrativa e per l’accountability sta verificando come ci sia ancora molto lavoro da fare, e questo nonostante le iniziative di tipo legislativo che pian piano stanno finalmente vedendo la luce.

Tutto sbagliato tutto da rifare? Assolutamente no. Tutto quanto accaduto finora è stato necessario che accadesse nei modi che abbiamo conosciuto. Ma affinché gli Open Data possano effettivamente apportare quei benefici alla società che sono stati più volte ipotizzati è necessario passare ora ad una “fase due”, ad una fase “matura” dei dati aperti che potremmo chiamare probabilmente quella dell’“industrializzazione degli Open Data”.

Partiamo con ordine, e il punto di partenza è che dobbiamo riconoscere che non tutti i dati sono uguali. Abbiamo bisogno di dati che si prestano ad essere riutilizzati, e gli Open Data che esprimono potenzialità per essere riutilizzati non sono dati qualunque ma sono gli Open Data di qualità.

Ora, per qualità dobbiamo intendere non soltanto l’accuratezza del dato e magari la qualità della documentazione che va (sempre) rilasciata a corredo del dato. Un elemento fondamentale per la qualità è anche la tempestività con cui vengono rilasciati. Non dobbiamo dimenticare infatti che più tempo passa tra il momento a cui un dato si riferisce e quando quel dato viene reso pubblico che il dato inevitabilmente si depotenzia. Tutti i dati subiscono un depotenziamento con il trascorrere del tempo. Ovviamente la velocità con cui questo avviene dipenderà dal tipo di dato.  Un dato infatti si depotenzia tanto più rapidamente quanto più quel dato va a descrivere fenomeni che per loro natura cambiano più o meno velocemente nel tempo. I dati che descrivono fenomeni in tempo reale si depotenziano infatti molto più rapidamente di tutti gli altri. Pensiamo ad esempio ai dati del traffico su un tratto di strada, ai dati che indicano dove si trovano in quel momento i mezzi pubblici urbani, a quelli dei posti liberi nei parcheggi di una città, a quelli delle centraline per il rilevamento delle polveri sottili e così via.

Un’ulteriore caratteristica di qualità è il livello di dettaglio a cui il dato viene reso pubblico. Sin da quando si è cominciato a parlare di Open Data, lo si è fatto al grido di “raw data now”  quindi chiedendo a gran voce che fossero i dati “grezzi” ad essere resi pubblici.  Non sempre però il dato grezzo è pubblicabile in quanto spesso si porta dietro tutta una serie di problemi legati alla riservatezza e alla confidenzialità. Ad ogni modo, il dato va anonimizzato (quando serve farlo) e rilasciato a livelli di dettaglio spinti, ovviamente fin dove possibile, in modo da preservarne le potenzialità ma nello stesso tempo in modo da tutelare la privacy dei soggetti interessati.

Ma per ottenere dati di qualità serve puntare ad avere qualità nei processi che generano quei dati. Un ente pubblico genera dati all’interno degli uffici che gestiscono i vari processi amministrativi di cui quell’ente è responsabile. I dati vengono generati “spontaneamente” e quotidianamente in quanto conseguenza del lavoro ordinario di quella Pubblica Amministrazione. Produrre Open Data viene invece visto al momento come una attività separata da fare occasionalmente e che di frequente necessita di una fase supplementare di ricognizione e di “recupero” dei dati da rendere pubblici.

Ed è proprio da qui che bisogna partire per far si che la produzione di Open Data diventi invece parte integrante dell’attività ordinaria della PA.  In altre parole bisogna fare in modo che gli Open Data siano generati in modo strutturale all’interno dei vari processi amministrativi e questo lo si ottiene, ed è la parte più difficile, intervenendo proprio sull’organizzazione dei processi interni.

Infine una considerazione sulla copertura del dato. Un ulteriore elemento di qualità che va ad amplificare le potenzialità del dato è infatti la sua copertura territoriale, ossia la disponibilità dello stesso dato anche per altre regioni, province o comuni. Quello che invece accade è che i dati al momento hanno una caratteristica fortemente “locale”. Le amministrazioni che hanno  rilasciato il proprio catalogo Open Data lo hanno fatto in modo autonomo e indipendente e questo ha fatto sì che l’offerta di Open Data sia al momento fortemente frammentata e disomogenea sul territorio. Il che costituisce un grosso limite per chi voglia fare veramente qualcosa con i dati. Come se ne esce? Andrebbe forse sottolineato ancora una volta il valore della community, specie tra soggetti della Pubblica Amministrazione. E’ infatti attraverso il lavoro comune e la condivisione che possiamo colmare questo limite, ampliando l’offerta informativa di ognuno ed integrandola con quanto è stato fatto da altri. Per arrivare magari in modo spontaneo ad un Programma Open Data Nazionale condiviso. E questo, credetemi, varrebbe molto più di regole, programmi e normative calate dall’alto.

#Opendatadayit – Tutto quello che è accaduto a Bari

Posted by Vincenzo Patruno | Posted in Events, Open Data, Open Government | Posted on 27-02-2013-05-2008

0

Submit to StumbleUponDigg This

Lo posto giusto per la storia! :-)
Anche se gli interventi sono stati tutti interessanti e “frizzanti”!
V

Il sistema ad Hub per l’interconnessione dei nodi #SistanHub

Posted by Vincenzo Patruno | Posted in Data Sharing, Open Data, Web Technologies | Posted on 25-02-2013-05-2008

0

Submit to StumbleUponDigg This

L’utilizzo del dato statistico nelle applicazioni di Apps4Italy

Posted by Vincenzo Patruno | Posted in Events, Open Data | Posted on 25-02-2013-05-2008

0

Submit to StumbleUponDigg This

#11conf Data protocol e Widget – XI Conferenza Nazionale di Statistica

Posted by Vincenzo Patruno | Posted in Data Sharing, Open Data, Web Technologies | Posted on 22-02-2013-05-2008

0

Submit to StumbleUponDigg This

#OpenDataDayIT 2013 Bari – Programma definitivo

Posted by Vincenzo Patruno | Posted in Open Data, World News | Posted on 19-02-2013-05-2008

0

Submit to StumbleUponDigg This

Dati Comuni Beni Comuni – Open Data per Matera 2019

Posted by Vincenzo Patruno | Posted in Events, Open Data, Open Government, World News | Posted on 11-02-2013-05-2008

0

Submit to StumbleUponDigg This

http://www.matera-basilicata2019.it/it/news/239-open-data-per-matera-2019-ne-parliamo-alle-monacelle.html

Open Data Day 2013 – Bari

Posted by Vincenzo Patruno | Posted in Events, Open Data, World News | Posted on 05-02-2013-05-2008

0

Submit to StumbleUponDigg This

copy-logo-ODD11

Si organizza a Bari, in occasione dell’International Open Data Day 2013 – giornata internazionale dei dati aperti prevista per il 23 febbraio 2013 – un evento di diffusione della cultura degli opendata.

La giornata inizierà alle ore 10.00, con una tavola rotonda introduttiva sul tema “Gli open data a sud”; seguirà un hackaton per imparare ad usare gli opendata, in cui gruppi di lavoro costituiti da sviluppatori, giornalisti, cittadini e esponenti di pubbliche amministrazioni avranno l’occasione di sperimentare in concreto come utilizzare i dati aperti per sviluppare idee e soluzioni innovative.

 

Programma

h10-12. Tavola Rotonda: “Gli opendata visti da Sud” :

- Comune Bari
- Regione Puglia
- Dipartimento per lo Sviluppo e la Coesione Economica
- Università degli Studi di Bari
- Istat
- Circolo Giuristi Telematici
- TANTO blog
- Google Developers Group

h12-17

Hackaton:
gruppi di lavoro formati da sviluppatori, giornalisti, cittadini attivi o semplici curiosi lavoreranno parallelamente e a livelli diversi.
I partecipanti potranno scegliere liberamente a quale gruppo unirsi tra i seguenti:
- webscraping: quando il dataset non c’è. Applicazioni e metodi per lo scraping dei dati dal web.
data refinement: quando il dataset non è perfetto. Apllicazioni e metodi per la lettura e la pulizia dei dataset.
data visualization: comunicare i dati. Applicazioni e tool utili per la visualizzazione dei dati.
Ogni gruppo avrà a disposizione dei dataset su cui costruire le attività della giornata e con cui creare storie, applicazioni o ricavare semplici informazioni utili che rendano più consapevole l’agire quotidiano nella città.
E’ previsto un quarto gruppo di lavoro per la “passeggiata Open Coesione“,  alla scoperta dei progetti finanziati con le politiche di coesione per capire come  cittadini, esperti, giornalisti e semplici curiosi possono raccogliere dati e contribuire al monitoraggio civico.

Sono stati richiesti i patrocini di: Regione Puglia – Assessorato alle Politiche Giovanili e Innovazione, Comune di Bari, Dipartimento per lo Sviluppo e la Coesione Economica, Università degli Studi di Bari, Università degli Studi di Foggia, Università del Salento – Laboratorio di eGovernment, ISTAT, Apulia Film Commissione, Agenzia Regionale per le Tecnologie e l’Innovazione

Per informazioni generali sull’iniziativa italiana: http://www.opendataday.it

Per partecipare iscriviti QUI 

International Open Data Day: http://www.opendataday.org

 

Sul sito è disponibile un questionario nazionale sugli open data che ti invitiamo a compilare.

data, big data, open data

Posted by Vincenzo Patruno | Posted in Big Data, Open Data, Web Technologies | Posted on 30-01-2013-05-2008

0

Submit to StumbleUponDigg This

Ieri pomeriggio alla scuola “Web e Statistica” di Istat e  Società Italiana di Statistica mi sono proprio divertito. E queste sono le slides del mio intervento!. :-)

Scuola SIS “Innovazione tecnologica, Web e Statistica”

Posted by Vincenzo Patruno | Posted in Big Data, Data Sharing, Events, Open Data, World News | Posted on 27-12-2012-05-2008

0

Submit to StumbleUponDigg This

unieur

Dal 28 gennaio al 1 febbraio 2013, presso l’Università Europea di Roma, si terrà la Scuola SIS “Innovazione tecnologica, Web e Statistica”, che si propone di mettere in luce le potenzialità dell’ICT e delle tecnologie web based applicate alle fasi di raccolta, produzione e diffusione dei dati e delle informazioni statistiche, nonchè di evidenziare le potenzialità che le innovazioni tecnologiche offrono in termini di riorganizzazione dei processi produttivi statistici (qui la brochure).

Si tratta della seconda edizione della Scuola SIS che si era tenuta nel 2011 a Pisa e che si era conclusa con un mini contest di statistical graphics.

La Scuola affronterà tutte le fasi del processo statistico: progettazione dell’indagine e definizione del target, raccolta dati, analisi quantitativa e data mining, diffusione dei dati statistici. Una particolare attenzione sarà dedicata alle tematiche dell’open dataweb scraping e data visualization. Tutte le tematiche saranno presentate da un punto di vista teorico e integrate nell’ambito del laboratorio che si svilupperà nel corso delle diverse giornate e porterà alla presentazione finale dei lavori di gruppo.

Il tema dell’innovazione tecnologica è di centrale importanza in molti campi applicativi, che vanno dalla statistica ufficiale alla ricerca ed alla politica, dalla demografia alla statistica economica. La conoscenza delle nuove tecnologie in ottica integrata rappresenta una competenza essenziale per organizzare in maniera efficace i processi di produzione e diffusione statistica.

Per partecipare sono necessarie conoscenze base di produzione, analisi e diffusione statistica. La Scuola è rivolta ai soci SIS, laureati, dottorandi, ricercatori e funzionari di uffici studi e ricerche coinvolti nei processi di raccolta, produzione e diffusione dei dati e delle informazioni statistiche e che operano in Enti ed Amministrazioni pubbliche, Aziende private, Aziende sanitarie ed organizzazioni del terzo settore.

La Scuola è limitata ad un numero massimo di 20 partecipanti e le iscrizioni possono essere effettuate online, sul sito della Società Italiana di Statistica, entro l’11 gennaio 2013.

L’organizzazione della Scuola è curata da Soci SIS, docenti dell’Università di Pisa, insieme alla Scuola superiore di statistica e di analisi sociali ed economiche dell’Istat. Tutti i docenti si occupano a livello professionale degli argomenti trattati, in qualità di professori universitari, liberi professionisti, dipendenti dell’Istituto Nazionale di Statistica.

La Scuola è gentilmente ospitata dal corso di Laurea in Economia e gestione aziendale dell’Università Europea di Roma, Via Aldobrandeschi, 190.

Il programma della Scuola SIS “Innovazione tecnologica, Web e Statistica” è il seguente:

  Mattina
(09.00 /13.30)
Pomeriggio
(14.30/19.00)
Lunedì 28 gennaio Introduzione del corso- – - 

Strumenti web per la produzione statistica
– indagini statistiche on line: web aperto, web chiuso, indagini integrate
– profilo dell’errore nelle indagini via internet

 

(Monica Pratesi, Silvia Biffignandi)

Strumenti per la raccolta dati via web: la struttura e la tipicità dei questionari on line (Monica Pratesi, Giovanni Riccardi)
Martedì 29 gennaio L’analisi dei dati raccolti tramite indagini web (Stefano Marchetti) Il Data Mining ed il Web: le nuove frontiere dell’analisi predittiva (Duccio Schiavon)
Mercoledì 30 gennaio Profili giuridici della liberalizzazione dei dati (Francesca Romana Fuxa Sadurny) Data, Big data, Open data (Vincenzo Patruno)
Giovedì 31 gennaio La statistica per tutti attraverso un sito web (Giulia Mottura) Strumenti web per la statistica e la visualizzazione dati (Daniele Frongia)
Venerdì 1 febbraio Data Warehouse statistici e piani di diffusione di dati integrati (Stefania Bergamasco) Presentazione e discussione dei lavori di gruppo (Cinzia Conti, Eric Sanna, Claudia Giovene di Girasole)

 

Per informazioni contattare la Società Italiana di Statistica al numero 06.6869845 o tramite l’email scuola-web-statistica@sis-statistica.org.