Category: e-Government

Intervista a Guido Romeo ed Elisabetta Tola, progetto iData

Intervista a Guido Romeo ed Elisabetta Tola, progetto iData

Avete lanciato iData, in che cosa consiste il progetto e chi lo finanzia?

Idata è un progetto della Fondazione Ahref, avviata alla fine dell’anno scorso a Trento, per lo sviluppo della prima piattaforma italiana open source e non profit per il giornalismo basato sui dati. L’idea di iData è nata guardando a ciò che oltreatlantico fanno già molte testate, da ProPublica al NewYork Times e oltremanica, ad esempio il DataBlog del Guardian o in Francia dove sono attive Owni e Médiapart. Lo scopo è mettere a disposizione della comunità giornalistica, ma anche della società civile italiana, gli strumenti gratuiti e già disponibili per la raccolta, l’elaborazione e la visualizzazione dei dati; svilupparne di nuovi con interfacce accessibili ai non addetti ai lavori; lanciare una serie di inchieste per sperimentare questo approccio direttamente nei media italiani. I nostri progressi sono tutti raccontati nel blog Open Data.

Qual’è l’innovazione del data-journalism o giornalismo dei dati rispetto alle tecniche tradizionali?

I giornalisti si sono sempre cibati di dati, ma la disponibilità di potenza di calcolo, grandi database di informazioni elettroniche e capacità di manipolarle nei prossimi anni può radicalmente cambiare il ruolo dei giornalisti e, spero, anche rilanciare la loro importanza sociale, che negli ultimi anni è stata certamente erosa dalla diffusione della Rete e da un atteggiamento eccessivamente corporativistico. Tra gli esempi più importanti di che cosa si può fare con un approccio di data journalism vanno senz’altro citate inchieste come “Dollars for Docs”, che ha visto un team di informatici e reporter di ProPublica creare un database senza precedenti su oltre 17mila medici che avevano ricevuto lauti pagamenti da sette grandi case farmaceutiche produttrici di farmaci prescritti nella loro area di competenza. Si trattava di dati in parte già pubblicati grazie a una sentenza dei tribunali americani, ma mai organizzati in maniera sistematica e praticamente impossibili da consultare non solo per i cittadini, ma anche per gli addetti ai lavori. Il risultato del lavoro di ProPublica è un archivio online di migliaia di specialisti nei quali ogni paziente può verificare se il proprio medico ha un eventuale conflitto di interesse. Lo strumento messo a punto da ProPublica è stato poi utilizzato da decine di giornalisti di varie testate locali per andare a fare delle inchieste sui medici attivi sul proprio territorio e quindi dare strumenti di valutazione e di giudizio al pubblico anche attraverso i media locali.

Un altro esempio di data journalism di altissimo livello è proprio l’ultimo Premio Pulitzer per il giornalismo investigativo assegnato a Paige St. John, del Sarasota Herald-Tribune per il suo bellissimo lavoro sulla fragilità dei fondi assicurativi della Florida che mette a rischio la qualità della vita di milioni di residenti dello stato. L’inchiesta della St. John è durata due anni e, oltre a una serie di articoli molto solidi e approfonditi, ha prodotto anche un database accessibile e utile a capire il comportamento di molti fondi assicurativi. Una risorsa che gli informatici dell’Herald hanno saputo valorizzare sviluppando una serie di applicazioni interattive utilissime per i lettori che permettono di capire cosa fa l’istituzione con la quale hanno firmato, ma anche il mercato generale, per esempio nel caso di rischio di distruzione da uragano della propria area di residenza. Dal data journalism, insomma, possono nascere prodotti editoriali di alto valore giornalistico ma con in più un importante valore aggiunto economico. In qualche caso, infatti, questi strumenti possono non solo generare nuove inchieste ma anche diventare risorse da proporre ai lettori come app o servizio premium. E questo, in un momento di crisi e trasformazione dell’editoria non è certamente poco.

Il data journalism, come dicevate, è molto sviluppato in Usa e Gran Bretagna. C’è spazio anche in Italia? E a che cosa servirebbe qui?

In Italia c’è molto spazio e certamente anche molto bisogno. Personalmente crediamo si possano fare cose di grande impatto. Nonostante la tradizionale ritrosia dei media italiani a innovare (da noi si discute ancora se i giornalisti dell’online abbiano pari dignità contrattuale di quelli della carta stampata) credo che prevarrà la legge del “content is king”. Se l’approccio del data journalism consentirà di avere prodotti nuovi e appetibili ai lettori, la domanda di professionalità ad hoc inevitabilmente salirà. E sarà un bene per tutti. C’è però un po’ di strada da fare perché non si tratta semplicemente di importare dei format sviluppati all’estero. Con Ahref lavoriamo su due fronti: uno, sperimentale, sulla raccolta ed elaborazione dei dati in collaborazione con una rete di citizen journalists e uno più didattico per lo sviluppo di competenze e team che sappiano lavorare su questi progetti che sono tipicamente multidisciplinari perchè non coinvolgono solo giornalisti, ma anche sviluppatori di software, statistici e designer dell’informazione.

Come sapete, lavoro in Istat: pensate che ci possa essere una qualche forma di collaborazione tra iData e il nostro Istituto?

Francamente lo speriamo molto. Abbiamo avuto occasione di apprezzare il lavoro che Giovannini ha svolto all’OCSE e guardiamo con molto interesse a ciò che vorrà fare con Istat, soprattutto sul fronte del design dei database e dei metadati che vorrà mettere a disposizione. Il nostro obiettivo, come giornalisti, a lungo termine è aumentare la trasparenza della nostra società, da un lato, e del lavoro dei media, dall’altro, anche per potenziare il controllo che la società può e deve esercitare su chi amministra fondi pubblici e privati prendendo decisioni che hanno poi delle ricadute sulla qualità della vita di molti. Il mezzo per fare ciò sono i nuovi strumenti che stiamo introducendo nella cassetta degli attrezzi non solo dei giornalisti, ma anche dei cittadini, siano essi singolo o associazioni, interessati a una migliore qualità dell’informazione. Credo che in questa prospettiva il coinvolgimento delle istituzioni, ma anche dei cittadini sarà fondamentale. Per questo, la piattaforma di iData si sta collegando a un ventaglio di community intenzionate a collaborare per la raccolta, produzione ed elaborazione dei dati. I dati potranno provenire da database pubblici, da fonti di dominio pubblico o venire preparati ad hoc dalle community. Negli ultimi mesi si sono infatti moltiplicati in Italia le iniziative di “open data” per facilitare l’accesso dei cittadini ai dati pubblici (e.g.: dati.piemonte.it e openpolis.it). Resta però ancora molto da fare sul fronte di altri tipi di dati come quelli relativi all’ambiente e alla salute, a causa delle limitazioni normative e della scarsa abitudine della Pubblica amministrazione a rilasciare dati ai quali i cittadini avrebbero, sulla carta, già diritto di accedere.

Un video per spiegare gli Open Data

La buzzword “Open Data” sta diventando sempre più comune e utilizzata per indicare iniziative legate alla trasparenza e alla condivisione di conoscenza. In particolare, nel settore pubblico di tutta Europa, il tema dei dati governativi aperti è spesso in primo piano nelle agende digitali, anche in virtù della direttiva europea sulla cosiddetta Public Sector Information.

Ma cosa sono effettivamente gli Open Data? Come si definiscono? Come si applicano? In altre parole, cosa si deve fare per “aprire” i propri dati?

A questa e ad altre domande prova da tempo a rispondere la Open Knowledge Foundation (OKFn), un ente no profit britannico che si occupa di promuovere la conoscenza aperta nell’era digitale. Oltre a creare standard come la Open Definition, l’OKFn cerca di organizzare eventi di sensibilizzazione sui temi dei dati aperti. Durante l’Open Government Data Camp tenutosi a Londra a novembre 2010, una serie di interviste a “guru” e sostenitori degli Open Data per raccogliere le loro esperienze e le loro speranze sul presente e futuro dei dati aperti.

Da un efficace montaggio di tali interviste è nato il primo video (o film) sul tema degli Open Data:

Il video si concentra prevalentemente sul tema degli Open Government Data, con contributi di chi sta promuovendo questi temi in UK, USA, Canada, Olanda, Irlanda. Chi volesse contribuire alla traduzione in italiano dei sottotitoli, può volontarizzarsi qui: http://bit.ly/ogdfilm-translate.

Il tema non può di certo considerarsi esaurito, come dimostrano tante discussioni in atto negli Stati Uniti per evitare il taglio dei fondi all’iniziativa data.gov. Ma il video dell’OKFn è un piccolo ma efficace strumento di sensibilizzazione e di comunicazione su temi tanto importanti per la trasparenza e la condivisione della conoscenza, dentro e fuori la pubblica amministrazione.

Per chi volesse saperne di più:

Un convegno italiano su Open Data e trasparenza

Segnalo due eventi in qualche modo legati:

Lunedì 18 a Roma, alle 18.30 al Mokarabia di Piazza Fiume, si terrà il primo Spaghetti Data Drink, un incontro informale e a basso tasso alcolico di preparazione spirituale all’evento principale del giorno successivo. L’incontro è aperto a tutti, chi c’è c’è.

Martedì 19, sempre a Roma, questa volta nella cornice istituzionale della Camera dei Deputati, Sala delle Colonne, si terrà l’evento “La Politica della Trasparenza e dei Dati Aperti“, organizzato da Agorà Digitale insieme alle maggiori associazioni italiane che si occupano di trasparenza e dati aperti.

Saranno presenti importanti ospiti nazionali e internazionali secondo un programma molto intenso:

SESSIONE DI APERTURA – 9.30/11.30
Introduce: Luca Nicotra, Segretario di Agorà Digitale
Moderatore: Sergio Rizzo, Corriere della Sera

Emma Bonino, Vicepresidente del Senato
Ben Brandzel, cofondatore di Avaaz.org, già Direttore delle campagne online di MoveOn.org e Obama
Enrico Giovannini, Presidente Istat
Jonathan Gray, Open Knowledge Foundation
Francesco Pizzetti, Presidente dell’Autorità garante per la protezione dei dati personali
Simon Rogers, Direttore Datablog e Datastore del quotidiano The Guardian

PER UN’ANAGRAFE PUBBLICA DEGLI ELETTI, DEI NOMINATI E DELLA PA – 11.45/13.00
Moderatore: Diego Galli, Radio Radicale

Rita Bernardini, Deputato radicale eletto nel Pd
Maria Teresa Brassiolo, Presidente Transparency Italia
Giacomo D’Arrigo, Coordinatore Naz. Anci Giovani
Peter Gomez, Direttore de ilfattoquotidiano.it
Antonio Martone, Presidente della Commissione per la Valutazione, la Trasparenza e l’Integrità delle amministrazioni pubbliche
Mario Staderini, Segretario Radicali Italiani

TRASPARENZA E ACCESSIBILITÀ DEI BILANCI PUBBLICI – 14.00/15.15
Moderatore: Aline Pennisi, Ministero dell’economia e delle finanze

Vittorio Alvino, OpenPolis
Rocco Berardo, Consigliere regionale Regione Lazio Lista Bonino Pannella
Stefano Costa, Open Knowledge Foundation Italia
Simona De Luca, Ministero per lo sviluppo economico
Giancarlo Miele, Presidente Commissione sviluppo economico, ricerca, innovazione e turismo, Consiglio regionale Regione Lazio
Marco Stradiotto, Senatore del Partito Democratico

IL VALORE ECONOMICO DEGLI OPEN DATA – A cura di Linked Open Data Italia – 15.30/16.45
Moderatore: Andrea Di Benedetto, Presidente associazione Linked Open Data Italia

Lorenzo Benussi, Top-IX
Stefano Bertolo, European Commission DG Information Society and Media
Tito Bianchi, Independence public policy professional
Raimondo Iemma, Fondazione Rosselli
Giuseppe Ragusa, Docente presso LUISS
Guido Carli e membro dell’Associazione Rena

LA TRASPARENZA E I DATI PUBBLICI: OBIETTIVI ED AZIONI PER L’IMMEDIATO – 17.00/18.00
Moderatore: Guido Romeo, Wired

Michele Barbera, Linked Open Data Italia
Ernesto Belisario, Associazione italiana per l’OpenGovernment
Alberto Cottica, Spaghetti Open Data
Ettore di Cesare, OpenPolis
Luca Nicotra, Segretario di Agorà Digitale
Marco Scaloni, Informaetica

 

Al termine dei lavori si terrà un dibattito.

E’ IMPORTANTE tenere presente che:

  • per partecipare all’evento è necessaria la registrazione, da effettuare on-line all’indirizzo: http://www.agoradigitale.org/eventodatiaperti
  • nella sala delle colonne non è possibile introdurre macchine fotografiche e altri dispositivi di registrazione audio/video. Sono ammessi i telefoni cellulari, mentre chi intende portare un pc portatile è obbligato a comunicarne il modello durante la registrazione online dell’evento
  • per accedere alla Camera dei deputati gli uomini sono obbligati a indossare la giacca

Open Data, trasparenza e data visualization

L’avventura degli Open Data in Italia è agli inizi e si intreccia, fra le altre, con le norme sulla trasparenza dell’azione amministrativa contenute nel c.d. Decreto Brunetta (D.Lgs. n. 150/2009). Un piccolo esempio può dimostrare come, pur rispondendo pienamente alle norme di legge sulla trasparenza e pubblicando i dati richiesti dal Decreto, si possa essere ancora ben lontani dall’effettiva creazione di Open Data, ovvero di “dati pubblici in formato aperto, in modo da renderne facile l’accesso e il riuso” (definizione di Spaghetti Open Data).

Prendiamo in considerazione la sezione Trasparenza del sito del Consiglio Nazionale delle Ricerche: http://www.dcp.cnr.it/Trasparenza.asp. Supponiamo di voler costruire un prospetto o tracciare un grafico dell’andamento delle percentuali di assenza del personale del CNR nel corso del 2010, suddiviso per struttura organizzativa.

Andiamo dunque nella sottosezione “Tassi di assenza”, i dati sono ovviamente disponibili e aggiornati, ma sono veramente utili e facilmente riutilizzabili da tutti?

Se l’ intento è quello di costruire una tavola o un grafico dovranno esistere, come minimo, dei dati in un formato testo importabile da qualunque software di analisi di dati, o almeno in formato libero o proprietario importabile in un foglio di calcolo (es. OpenOffice Calc oppure Microsoft Excel).

I dati del CNR sono disponibili in formato .pdf, suddivisi per mese, e ogni pagina presenta i dati ed un grafico relativo alle presenze e assenze per struttura organizzativa, vediamo dunque di capire come utilizzarli.

Per prima cosa effettuiamo il download di tutti i dati sul PC e utilizziamo il comodo servizio http://www.pdftoexcelonline.com che effettua l’upload di un file .pdf e spedisce via email il relativo file .xls. Fatto questo abbiamo a disposizione 12 file Excel, il grafico iniziale non è stato convertito ma i dati sì, anche se i numeri sono interi e non decimali (es. 2158 anziché 21,58 che rappresenta il tasso di assenza della Direzione Generale nel mese di Gennaio). A questo punto sono necessarie svariate operazioni manuali per ottenere dei dati utilizzabili da un software di analisi o di visualizzazione dati: riportare su uno stesso foglio Excel tutti i dati, eliminare le righe di intestazione di ogni mese, inserire un codice per identificare il mese, applicare una trasformazione per far ridiventare decimali tutti i numeri interi, verificare i dati duplicati (es. per il mese di Luglio i dati della struttura 603.030 sono riportati due volte) e prendere in considerazione solo quelli più plausibili, depurare ciascuna riga dagli “a capo” derivanti dalle operazioni di trasformazione. Salviamo infine i dati in formato Excel e testo delimitato da tabulazione.

Siamo pronti per passare alla fase di analisi dei dati, utilizziamo per comodità Excel, in particolare le tabelle pivot, ed otteniamo finalmente la tabella dell’andamento annuale delle percentuali di assenza, suddivise per struttura organizzativa.

Il tempo impiegato finora per ottenere il file .xls ed file .csv del 2010 a partire dai singoli file .pdf mensili è di 40 minuti e nonostante la difficoltà di queste operazioni sia bassa per chi si occupa di dati, è a mio avviso al di fuori della portata della maggioranza dei navigatori di Internet.

Volendo poi effettuare un minimo di data visualization su tali dati, e magari renderla disponibile su Internet, si può utilizzare ad esempio il notevolissimo servizio Tableau Public (al quale verrà dedicato un successivo post per spiegarne il funzionamento). Il risultato è visibile a questi indirizzi:

Tavola 1, Grafico 1, Grafico 2, Grafico 3

In alternativa è possibile utilizzare la modalità widget, che consente di incorporare i risultati ottenuti su qualunque sito Internet o blog. Ecco di seguito le tavole ed i grafici ottenuti.

—————————————

Tabulazione delle percentuali di assenza 2010 per mese e struttura organizzativa.

—————————————

Grafico delle percentuali di assenza 2010 per mese e struttura organizzativa (facendo click sul nome della struttura viene evidenziato il corrispondente grafico e la relativa serie di dati).

—————————————

Grafico dell’andamento delle percentuali di assenza 2010 per ciascuna struttura organizzativa (facendo click sul nome della struttura viene evidenziato il corrispondente grafico e la relativa serie di dati).

—————————————

Visualizzazione delle percentuali massime e minime di assenza per ciascun mese.

Questa seconda parte dedicata alla data visualization ha richiesto circa 60 minuti per essere completata, ma era la prima volta che utilizzavo Tableau Public.

Tramite l’apposita barra posta nella parte bassa di ciascuna visualizzazione è possibile esportare i dati in formato .csv, aderendo pienamente alla filosofia degli Open Data.

Ulteriormente, essendo Tableau Public un servizio offerto da uno stesso data center, ogni modifica ai dati e alle visualizzazioni fatta sul repository centrale viene immediatamente recepita dai vari widget sparsi per tutta Internet, senza ripubblicare manualmente alcunchè.

Facendo un po’ di conti, chi avesse voluto cimentarsi nel trasformare in Open Data dei dati disponibili in formato chiuso e rilasciati per singolo mese, avrebbe dovuto impiegare oltre 1h30′ del suo tempo e possedere un po’ di dimestichezza nel trattare i dati e nell’utilizzare qualche tool di visualizzazione. Questo tipo di risorse sono in genere largamente disponibili negli Istituti, Enti, Amministrazioni Centrali o Locali (es. Regioni, grandi Comuni) che producono quei dati ma difficilmente disponibili per le singole persone che accedono a quei dati.

Allora, pur avendo considerato un esempio limitato a dei dati gestionali-amministrativi, penso di essere riuscito a far capire come la strada per gli Open Data, in Italia, sia ancora lunga. Non manca a mio avviso l’impegno di Enti, Istituzioni e Amministrazioni italiane, sono infatti sicuro che il CNR impiegherebbe le stesse risorse per fornire i dati in formato aperto e cumulativo piuttosto che in formato .pdf  e mensile. Quello che forse manca è la cultura del servizio, il provare a mettersi nei panni di chi dovrebbe utilizzare quei dati e immaginare di cosa avrebbe bisogno e di quali dovrebbero essere le modalità di rilascio più utili per una vera disponibilità, accessibilità e riuso dei dati.

OpenPA 2011: Pubblica Amministrazione aperta e-inclusiva

L’11 marzo 2011 a Bologna, la Regione Emilia-Romagna organizza per il secondo anno consecutivo un doppio evento: convegno (in mattinata)+barcamp (nel pomeriggio). Il tema di questo anno sara’  focalizzato su “OpenPA 2011: Pubblica Amministrazione aperta e-inclusiva”.

Il Convegno in cui verranno illustrati i dati, le azioni e le nuove prospettive in Europa, Italia e in Emilia-Romagna su inclusione, opensource, opendata, si terra’  presso l’ Hotel UNAWAY, Piazza della Costituzione, 1 40128 Bologna secondo il programma seguente:

  • 9.00 apertura registrazioni/iscrizioni
  • 9.30 Apertura del convegnoDonatella Bortolazzi,   Assessore allo sviluppo delle risorse umane e organizzazione. Cooperazione allo sviluppo. Progetto giovani. Pari opportunità
  • 9.45 L’inclusione digitale nelle regioni italiane dal Rapporto sull’Innovazione -  Luca Rigoni, CISIS
  • 10.00 e-Inclusion nel nuovo piano telematico regionaleSandra Lotti, coordinatrice del piano telematico dell’Emilia-Romagna
  • 10.15 Dati sulla società dell’informazione in Emilia-Romagna e in Europa Chiara Mancini, Regione Emilia-Romagna
  • 10.30  Innovazione sull’e-InclusionAntonio De Vanna, FORMEZ
  • 11.00 break
  • 11.30 Open Emilia-Romagna stato dell’arte, tendenze e opportunitàDimitri Tartari, Gruppo coordinamento Piano Telematico Emilia-Romagna
  • 11.50  Open-data in Piemonte, un caso realeSilvia Bianco e Marta Garabuggio , Regione Piemonte
  • 12.10 Tecnologia e società nel Rapporto sulla situazione sociale del Paese 2010Andrea Toma, CENSIS
  • 12.30 Conclusioni - Teresa Marzocchi, Assessore alla promozione delle politiche sociali e di integrazione per l’immigrazione. Volontariato, associazionismo e terzo settore.
  • 13.00 Buffet

Per iscriversi si puo’ utilizzare il form di iscrizione on-line

Nel pomeriggio l’evento si trasformera’ in 3 barcamp paralleli (a cui e’ possibile partecipare e proporre un intervento collegandosi al link seguente)  focalizzati ciascuno su un tema specifico:

  • Open data, open standard e open source per una PA aperta e inclusiva
  • La società dell’informazione e della conoscenza: se inclusione fa rima con formazione
  • Banda larga, multimedia, mobile e social network: la tecnologia abilita o esclude?

Lo StatCamp alla Decima Conferenza di Statistica

Dopo qualche giorno di forzata inattività del blog dovuta allo StatCamp della Decima Conferenza Nazionale di Statistica, proviamo a raccontare come è andata e focalizzare i principali spunti di ogni intervento.

Nella sessione della mattina si è discusso di DataGov e condivisione dei dati. Vincenzo Patruno ha introdotto i lavori con una breve spiegazione sull’Open Government, una iniziativa essenzialmente legata al principio di trasparenza nell’azione di governo, avviata ufficialmente dal Presidente Obama nel 2009 attraverso il suo “Transparency and Open Government – Memorandum for the Heads of Executive Departments and Agencies” ed il sito data.gov.

Vincenza Spano della Regione Basilicata e Marco Velludo della società ETT solutions hanno parlato di BASIL, il nuovo sistema informativo del lavoro, interamente web-based, realizzato dalla Regione, che elabora circa 900.000 comunicazioni l’anno. Ciò ha messo in evidenza l’importanza e la necessità di una legislazione chiara e in qualche modo “coercitiva” per avere a disposizione dati elementari di fonte amministrativa affidabili, tramite i quali indagare statisticamente i fenomeni di interesse per l’intera collettività. Si è anche parlato della sperimentazione avviata dalla Regione con l’Istat e l’Isfol per quanto riguarda il sistema informativo delle professioni, mettendo ancor più in evidenza l’importanza di contaminare le esperienze fra soggetti pubblici del Sistema Statistico Nazionale e soggetti privati in possesso di adeguato know-how tecnologico.

Roberto Venturini, blogger ed esperto di Internet marketing, ha poi ragionato spannometricamente su alcuni numeri relativi agli utilizzatori di Internet in Italia e sul loro livello di istruzione medio, lanciando divertenti e numerose provocazioni, fra le quali: il 50% degli italiani è in rete solo per guardare le figure. Ha poi consigliato il libro di Darrell Huff, Mentire con le statistiche, per poi rinfrancare il disorientato uditorio dicendo che, piuttosto che contarli, sarà meglio che iniziamo a pesare gli utenti italiani di Internet e capire chi sono e di cosa hanno bisogno.

Francesca Romana Fuxa Sadurny, che all’Istat si occupa di affari giuridici, ci ha introdotti nel complesso mondo del diritto d’autore nel campo dei dati statistici, intesi come prodotto dell’ingegno umano. In particolare, si pone il problema se e come, al di fuori dalle ipotesi di studio e ricerca riconosciuti dalla legislazione (D.Lgs. 322/1989 e successive modifiche e integrazioni), sia possibile acquisire dati statistici e se tali dati possano costituire oggetto di attività che creino valore aggiunto. Infatti, mentre i diritti morali di un’opera sono inalienabili, i diritti di utilizzazione economica sono alienabili. Si apre così la strada alle Licenze d’uso, molto utilizzate in Internet (es. Creative Commons), ma specializzate per il particolare campo delle informazioni contenute in banche dati, come ad esempio la Italian Open Data Licence (IODL), sviluppata dal Formez.

Carlo Amati, del Ministero per lo Sviluppo Economico, Dipartimento per lo Sviluppo e la Coesione economica, ha portato alcuni esempi concreti di percorsi che una Amministrazione Centrale dello Stato sta compiendo verso l’Open Government. Il primo, VISTO, era relativo al sistema informativo di monitoraggio dei tempi necessari per la realizzazione di un’opera pubblica. Il secondo, relativo alla stima della spesa per investimenti, è un sistema che sfrutta le informazioni disponibili nella Banca Dati dei Bandi di Gara e dell’Autorità di Vigilanza dei Contratti Pubblici (AVCP). I Bandi di gara contengono infatti tutte le informazioni (ente attuatore, territorio, spesa) tramite le quali ricostruire a livello aggregato la spesa che si realizzerà in un dato territorio. I sistemi saranno, a breve, fruibili via Internet.

Eleonora Pieralice, dell’Isfort, ha posto l’accento sulla necessità di rispettare sempre il principio della trasparenza dei metodi di elaborazione, da parte di chi utilizza dati e microdati per elaborazioni statistiche, a garanzia di una informazione statistica di qualità e non strumentalizzabile.

Maurizio Firmani, che si occupa di sviluppo software presso l’Istat, ha parlato degli utilizzatori, suddividendoli in professionisti (istituzionali, business, ricercatori) e non (cittadini), proponendo alcune importanti questioni sull’uso dei dati. L’informazione statistica è certamente accessibile ai professionisti, ma si può dire lo stesso dei semplici cittadini? Essi sono in grado di trovare quello che cercano? Le informazioni statistiche messe a disposizione dagli Istituti Nazionali di Statistica, sono “user oriented”? Ha poi tentato di fornire una risposta a queste domande e di stabilire alcuni principi per la facile riusabilità dei dati da parte degli utenti: utilizzo di collezioni di file pubblicate su server accessibili, utilizzo massivo di webservice come modalità di interrogazione dei dati machine-to-machine, adozione di standard come SDMX che consentono lo scambio informatizzato di dati e metadati statistici. Il nodo centrale è quello di evitare di replicare le informazioni, rendendole invece fruibili in modalità diverse per soddisfare esigenze diverse. Le necessità degli utenti sono poi state così sintetizzate: nuove modalità di visualizzazione dei dati, nuove modalità di combinazione dei dati, nuove modalità di analisi dei dati.

Nicola Mattina, blogger e consulente di direzione nel settore della comunicazione d’impresa, ha ripreso i principi dominanti dell’Open Data, ponendo l’accento sulle difficili relazioni fra politica e Open Data. In particolare, sono scarsissime le informazioni che riguardano sia l’entità ed il fine delle spese pubbliche, sia l’entità e le modalità di raccolta dei finanziamenti che arrivano alla politica da entità rappresentanti di (legittimi) interessi. Riguardo a questi temi, gli Open Data “sono un piccolo semino che aumenta la felicità del sistema” e rafforza il senso civico collettivo.

La sessione è stata supportata da spunti e informazioni via Twitter, inseriti dai partecipanti alla conferenza e dagli “inviati speciali”, e si è conclusa con un breve dibattito, in particolare fra il prof. Jacopo di Cocco, della Facoltà di Economia di Bologna, Vincenzo Patruno e Cataldo Scarnera dell’Istat, nel quale è stata ribadita: la necessità di poter integrare dati prodotti da organismi diversi (es. Istat, Università, Regioni); l’importanza delle piattaforme di DataGov per questi fini; la necessità di rivedere le politiche e le modalità di rilascio dei dati statistici e -con tutta probabilità- anche quelle della privacy legate al rilascio dei microdati, uniformandole a quelle di altri paesi.

Nella sessione del pomeriggio si è discusso di Statistica, Information Technology e innovazione. Stefano De Francisci ha introdotto i lavori cedendo poi la parola ai relatori.

Davide Bennato, blogger e professore di Sociologia dei processi culturali e comunicativi alla Facoltà di Lettere e Filosofia dell’Università di Catania, ha parlato di nuovi settori della conoscenza che derivano dalla considerazione che il comportamento di ciascuno di noi, in quanto utente di social media, determina nuovi dati, nuovi comportamenti di gruppo, che possono essere analizzati e visualizzati graficamente. Ha quindi proposto una tassonomia delle forme di condivisione dei dati, portando degli esempi per ciascuna di esse: data sharing, data visualization, personal dataminig, data storytelling. Per il prossimo futuro Bennato vede una grande sviluppo della visual analytics, sopratutto nell’editoria (infografica e mappe interattive), nel marketing (social media monitoring) e nella gestione di processi (dashboarding).

Manuela Ciancilla, visual designer della società VISup, ha parlato della riduzione dell’information overload, attraverso la semplificazione dei processi d’uso delle informazioni. Sono moltissimi i campi nei quali l’information visualization può dare un contributo in termini di ausilio alla rappresentazione e comprensione di fenomeni, dalle piattaforme di social data visualization, alle business dashboard, al knowledge sharing . Il lavoro è tutt’altro che banale, richiede infatti team multidisciplinari che comprendono sviluppatori, visual designer ed esperti di data mining. Un grande passo in avanti in Italia si avrà quando l’editoria elettronica, in particolare i quotidiani online, investirà sul settore data visualization sulle orme del britannico The Guardian.

Carlo Amati, che era già intervenuto in mattinata, ha mostrato DPS eXplorer, uno strumento di esplorazione di dati statistici territoriali che propone alcuni percorsi di analisi predefiniti e una base dati precaricata ma consente anche di importare dei dati-utente e costruire percorsi di analisi personalizzati (storytelling). Il Dipartimento per lo Sviluppo e la Coesione economica ha inoltre lanciato una “Call for stories” allo scopo di promuovere un patrimonio comune di analisi di dati e indicatori su temi cruciali per le politiche regionali.

Paolo d’Errico, statistico e informatico, ha invece proposto una riflessione critica su statistica, innovazione e information technology. Ha poi evidenziato le qualità necessarie per raggiungere, o quantomeno aspirare al raggiungimento, del benessere economico e sociale: Risorse, Competenza, Cultura, Esperienza, Praticità, Condivisione, Umiltà, Sincerità, Oggettività, Conversione, Adattamento, Tenacia.

Antonino Virgillito, che si occupa di sviluppo software presso l’Istat, ha presentato un lavoro condotto insieme ai colleghi Michele Silvestri (sviluppatore) e Leonardo Tininini (esperto di database). Si tratta di una serie di widget per la visualizzazione dello stato della rilevazione del Censimento dell’Agricoltura. Vengono visualizzati il numero di questionari compilati tramite web, le aziende assegnate ai rilevatori e altre informazioni di sintesi sull’evoluzione del processo, con dettaglio nazionale e regionale e relative mappe geografiche. Tali widget possono essere integrati da chiunque nelle proprie pagine web, semplicemente facendo un copia-incolla della riga di codice messo a disposizione. Al di là dell’aspetto informatico, tali componenti web sono molto interessanti in quanto consentono di rendere visibile una parte del processo, consentono dunque il monitoraggio in tempo reale di ciò che sta avvenendo, in totale sintonia con la logica di trasparenza dell’Open Government.

Vincenzo Patruno ha infine mostrato un plugin ufficiale per WordPress che consente di visualizzare sul proprio sito (realizzato con WordPress) il numero di residenti di qualunque città italiana, collegandosi direttamente alla sito ufficiale Istat di diffusione dei dati della popolazione (demo.istat.it).

Anche in questo caso la sessione è stata supportata da spunti e informazioni via Twitter, inseriti dai partecipanti alla conferenza e dagli “inviati speciali”. Sono poi intervenuti Giulio Barcaroli, statistico metodologo dell’Istat, e Marco Scarnò, ideatore e sviluppatore di software statistici, che hanno riportato allo StatCamp alcune delle idee emerse in mattinata nel corso dell’Agorà “La Statistica ufficiale incontra… la comunità degli sviluppatori di software per la statistica”. In particolare hanno colpito e suscitato un vivo dibattito le idee di Marco Scarnò, che vede un futuro dove i software statistici omnicomprensivi avranno un sempre minore spazio a favore di Apps specializzate da scaricare da Internet all’occorrenza. La modalità d’uso dovrebbe essere estremamente semplificata (si è fatto un parallelo con Minority Report), immaginando che le Apps di analisi possano essere applicate trascinandole sopra degli oggetti dataset ed ottenendo dei nuovi oggetti dataset o immagini e animazioni grafiche.

Lo StatCamp si è chiuso con la premiazione dei migliori Tweet raccolti dagli utenti della Conferenza, sono stati selezionati:

  • Tweet vincitore n.1: “Statistica e IT: il matrimonio con i fichi freschi (gt)”
  • Tweet vincitore n.2: “I dati devono essere trasferiti con grande onestà intellettuale al mondo degli utilizzatori (carmelo fulco)”

I premi (portachiavi-memoria 8 GB Usb) non sono stati ritirati, ma i vincitori possono mettersi in contatto con noi all’ndirizzo statcamp@segnalazionit.org, provvederemo senz’altro a recapitarglieli.

Last but not least, un ringraziamento al Presidente Enrico Giovannini, Patrizia Cacioli e Giovanni A. Barbieri, che ci hanno dato l’opportunità di organizzare lo StatCamp, a Stefano De Francisci, commissario politico e garante dell’ortodossia statistica dello StatCamp, a Micaela Paciello e Anna Stoppa, sacerdotesse degli eventi Istat e garanti dell’ortodossia stilistica dello StatCamp, a Marina Turi, graphic designer dell’Istat, a Silvia Losco, master technician of StatCamp’s hardware, e ai nostri “inviati speciali” che hanno twittato a più non posso, Francesca Loporcaro, Concetta Ferruzzi, Paola Giacchè e Michele Silvestri.

Noi ci siamo divertiti molto e crediamo di essere riusciti ad “alleggerire” un po’ alcuni argomenti di solito piuttosto pesanti per i non addetti ai lavori. Tutti i materiali della giornata sono disponibili all’apposita pagina del blog.

StatCamp “Statistica e nuove tecnologie per la crescita del Paese”

In occasione della Decima Conferenza Nazionale di Statistica, che si terrà a Roma, al Palazzo dei Congressi, dal 15 al 16 Dicembre 2010, stiamo partecipando all’organizzazione di uno “StatCamp” sul tema della evoluzione dell’Information Technology nella produzione, comunicazione e condivisione dell’informazione statistica.

Lo StatCamp sarà uno spazio aperto di discussione e adotterà gli stessi princìpi cardine dei BarCamp:

  • specializzazione → viene individuato un tema specifico e alcuni sottotemi
  • uguaglianza → non esistono un pubblico e dei relatori, tutti sono allo stesso livello
  • condivisione → qualunque partecipante può “salire in cattedra” e proporre agli altri una riflessione

L’evento verrà inoltre arricchito dalle informazioni e riflessioni che tutti i partecipanti alla Conferenza potranno inviare tramite Twitter.

Lo StatCamp della Decima Conferenza si terrà il 16 Dicembre e si articolerà in due sessioni:

  • DataGov e condivisione dei dati, dalle 11.30 alle 13.30
  • Statistica, Information Technology e innovazione, dalle 14.00 alle 16.00

Entrambe le sessioni saranno condotte da un “animatore”, che si occuperà di dare la parola alle diverse persone che vorranno intervenire e mantenere le discussioni nei binari del tema stabilito.
Gli interventi dureranno al massimo 5 minuti, si terrà comunque conto della disponibilità di tutti i presenti ad intervenire e degli orari da rispettare. Si prevedono due tipologie di intervento:

  • interventi programmati, da parte di coloro che intendono presentare delle slide
  • interventi estemporanei, da parte dei presenti allo StatCamp

Lo StatCamp sarà aperto a tutti i presenti alla Conferenza, non sono previste registrazioni preventive, l’unico accredito necessario è quella alla Conferenza, che può avvenire tramite l’apposita pagina: http://decimaconferenza.istat.it

A coloro che intendono partecipare allo StatCamp presentando delle slide chiediamo di mettersi in comunicazione con noi tramite l’e-mail: statcamp@segnalazionit.org

L’account Twitter, che verrà utilizzato prima e durante l’evento per raccogliere e diffondere idee sui temi,  è: @statcamp

Vi aspettiamo!


Open Source nella Pubblica Amministrazione (OSPA)

Si terra’ il prossimo 11 Novembre presso la Sala delle Colonne dell’Universita’ LUISS Guido Carli il convegno “Open Source nella Pubblica Amministrazione” – OSPA 2010.

Giunto alla sua terza edizione e promosso dall’associazione Concreta-Mente  assieme ad alcuni partner accademici, sara’ quest’anno dedicata al tema del Riuso e al Total Cost of Ownership (TCO), due pratiche che vengono spesso presentate come virtuose per guidare l’innovazione nelle Amministrazioni alla ricerca di efficacia ed efficienza. La partecipazione e’ gratuita previa registrazione che puo’ essere effettuata attraverso il sito web di Concreta-Mente.

Fammi Sapere: Convegno sulla trasparenza della Pubblica Amministrazione

di Marco Scaloni

A Senigallia, il prossimo 20 novembre, si parlerà di Anagrafe Pubblica degli Eletti e Nominati, nell’ambito di un convegno dedicato agli “open data” della Pubblica Amministrazione. Il convegno, dal titolo “Fammi Sapere: la Trasparenza della Pubblica Amministrazione: Internet, Open Data, Anagrafe pubblica degli Eletti“, è organizzato dalla società InformaEtica e dal Comune di Senigallia.

Con l’espressione “dati aperti” o, in terminologia anglosassone, “Open Data” o “Open Government”, viene intesa una filosofia, che è al tempo stesso una pratica, che implica che alcune tipologie di dati in possesso di Enti ed Istituzioni pubbliche siano liberamente accessibili a tutti, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione e l’utilizzo. In più, i dati aperti dovrebbero essere pubblicati in formati anch’essi “aperti”, ovvero il cui uso sia svincolato da restrizioni legali e le modalità di utilizzo siano pubbliche.

Per una pubblica amministrazione, che opera con denaro pubblico e eroga servizi nell’interesse diretto della collettività, la fornitura di dati aperti e universalmente disponibili parrebbe un compito istituzionale. Più in generale, gli Open Data aumentano la conoscenza della propria comunità e agevolano l’esecuzione di comuni attività umane (si pensi ad esempio ai dati cartografici). La “liberazione” dei dati in formato aperto permette e incoraggia la realizzazione di servizi che ne valorizzino tutta la potenzialità, attraverso operazioni di analisi, confronto, elaborazione, forniti anche da soggetti esterni alla Pubblica Amministrazione.

Scopo principale del convegno di Senigallia è quello di promuovere il “trasferimento tecnologico” verso cittadini e amministratori, cioè di fare informazione e formazione intorno al tema degli Open Data: i concetti chiave, gli scenari possibili, le esperienze passate e presenti, i risvolti sociali, politici e legali, le tecnologie abilitanti.
Non di meno, l’evento vuol essere occasione di incontro tra “addetti ai lavori”, momenti di scambio e opportunità per cercare di coordinarsi e pensare a progetti comuni.

L’iniziativa vuole puntare i riflettori sulla proposta di istituzione dell’Anagrafe Pubblica degli Eletti e Nominati (APEN), che rientra a pieno titolo nell’ambito degli Open Data applicati alla Pubblica Amministrazione. L’obiettivo dell’APEN è pubblicare su Internet i dati riguardanti le presenze, lo svolgimento dei lavori, i risultati, gli stipendi, gli emolumenti, le consulenze, i pagamenti, di tutti i politici eletti e di tutte le persone che ricoprono un ruolo politico pubblico.
Il convegno vuole essere anche momento di confronto e progettazione condivisa tra i diversi soggetti che hanno istituito, o stanno istituendo, tale Anagrafe. Il Comune di Senigallia è uno di questi.

Per ulteriori informazioni:

Il successo del Barcamp

Ora possiamo dirlo. Il Barcamp “Sharing Data and Statistical Knowledge” e’ stato un successo. Tanta partecipazione, interventi di ottimo livello, tanto entusiasmo e, alla fine, una grande soddisfazione da parte di tutti per aver partecipato. Ovviamente grande soddisfazione anche da parte di SegnalazionIT, che cosi’ puo’ dire senza alcun dubbio di aver celebrato nel migliore dei modi la “Prima Giornata Mondiale della Statistica”.

Un primo grazie va al Dipartimento di Scienze Statistiche della Sapienza, Universita’ di Roma, alla Societa’ Italiana di Statistica (SIS) e all’Istat che hanno subito creduto in questa idea  e hanno speso il loro nome accanto a quello del nostro Blog.  Un grazie di cuore va a tutti coloro che hanno deciso di portare un intervento e di accettare le regole ferree del format  IGNITE (5 minuti per ogni presentazione, 20 slides che scorrono automaticamente ogni 15 secondi).

Un grazie va poi agli sponsor (Egeria, il catering La Perugina, IBM, SAS) e agli enti e organizzazioni che hanno creduto nel progetto e ci hanno concesso il loro prestigioso patrocinio (Commissione Italiana per l’UNESCO, Regione Lazio, Provincia di Roma, Comune di Roma, Gruppo valorizzazione statistiche pubblice SIS, Rante, UnaRete). Ancora grazie al CASPUR per aver curato la diretta streaming e a Uniroma.tv che ha documentato con le sue telecamere quanto avvenuto durante la giornata. (Qui di seguito il servizio)

Un grazie infine a tutti coloro che hanno partecipato a questa giornata e a tutti quelli che ci hanno aiutato e non si sono risparmiati  per l’organizzazione dell’evento.  Con tanti di loro continueremo a sentirci e siamo sicuri  che continueranno a seguirci attraverso le pagine del nostro Blog.

Tutti i materiali del Barcamp saranno via via inseriti nella apposita pagina.