Category: Statistica

Intervista a Sardinia Open Data

Ci sono persone che con le loro iniziative portano quell’innovazione che può cambiare (in meglio) un territorio. SegnalazionIT ha intervistato Andrea Zedda,  specialista nell’elaborazione dati e promotore del progetto Sardinia Open Data.

D. Come nasce Sardinia Open Data?

R. L’idea del progetto nasce essenzialmente nella rete e precisamente nel social network Statistica.ning del quale sono membro da diverso tempo. Agli inizi di settembre, un mio amico, Marco Calderisi, (con il quale stiamo fondando una piccola società molto interessante denominata [Kode], ma questa è un’altra storia…) pubblica un post riguardante Datawithoutborders, un’iniziativa nata negli USA, dove statistici volontari aiutano in maniera completamente gratuita le ONG presenti nel territorio per quanto riguarda l’elaborazione dei dati in loro possesso.  Avendo  continue esperienze di collaborazione con l’Osservatorio delle politiche sociali della provincia di Cagliari, ho iniziato a pensare che un’iniziativa del genere potesse essere rivolta al mondo delle associazionismo locale e che, con le opportune modifiche, fosse una cosa attuabile anche qui da noi.
Poi è successo che ho partecipato al corso “Web e statistica” a Pisa, organizzato dalla SIS dove ho avuto modo di approfondire, tra le altre cose, le tematiche dell’open data e quindi di prendere maggiore consapevolezza dell’enorme importanza che l’intelligenza collettiva e la condivisione della conoscenza hanno e avranno  sempre di più nel nostro mondo. Ho così deciso che l’open data sarebbe stato al centro del nuovo progetto che avevo in mente.
Il corso mi ha poi dato la possibilità di conoscere molte persone estremamente interessanti, sia tra i docenti che tra gli studenti, e ho potuto interagire con un ambiente aperto alle innovazioni e alla creatività. Tutti questi fattori hanno fatto si  che le idee che mi frullavano in testa si trasformassero in convinzioni. Così tornato in Sardegna ho iniziato a parlarne un po’ in giro e ho trovato subito l’appoggio e l’ entusiasmo di alcune persone, tutte donne, molto capaci e determinate (colgo l’occasione per citarle, sono Alessandra Murgia, Alessandra Peddis, Claudia Mocci e Cinzia Pusceddu) con le quali si è deciso di fondare l’associazione Sardinia Open Data, e grazie alle quali il progetto è diventato qualcosa di più concreto e molto ambizioso.

 

D. Quali sono le iniziative e i progetti che Sardinia Open Data sta supportando?

R. Attualmente portiamo avanti due progetti. Il primo è “OnData”, un progetto che ha tre finalità. La finalità primaria, che prende appunto ispirazione da Datawithoutborders, è il sostegno al mondo dell’associazionismo no-profit. Siamo partiti dalla considerazione che le associazioni, pur potendo spesso disporre di basi dati interessanti, non hanno di solito le risorse per sfruttarle, oppure non sono consapevoli del potenziale nella gestione di tali informazioni in termini di sviluppo organizzativo e strategico. Abbiamo così deciso di mettere a disposizione di queste associazioni la nostra esperienza nel campo della raccolta, dell’elaborazione e della presentazione dei dati, oltre che un supporto logistico, il tutto in maniera completamente gratuita.
Al contempo abbiamo intenzione di ricorrere all’aiuto di giovani volontari ai quali offriamo la possibilità di avere una prima esperienza pratica sul campo, quindi di sporcarsi le mani con dati reali e con esperienze concrete per quanto riguarda le varie fasi di un’indagine statistica.
La terza finalità del progetto consiste nel rendere il risultato di questo lavoro il più aperto possibile nel pieno rispetto della filosofia open data. L’obiettivo è in sostanza avviare un’apertura dei dati non calata dall’alto delle organizzazioni pubbliche ma un’informazione proveniente direttamente dal basso, e di incentivarne il riutilizzo in modo che questi dati acquistino un valore che vada oltre il contesto nel quale sono stati raccolti.
Un secondo progetto molto interessante è la partecipazione al concorso Appsforitaly. Intediamo partecipare sia nella categoria datasets che nella categoria applicazioni. Per quanto riguarda il dataset abbiamo già siglato un accordo di collaborazione con l’Ente parco di Molentargius, per cui contribuiremo all’apertura dei dati ambientali, di flora e forse anche fauna sotto licenza IODL.
Su quei dati abbiamo poi qualche idea su come svilupparci una app per smartphone o una webapp. Per ora stiamo ancora valutando se questa parte del progetto sia fattibile, c’è ancora da definire un modello, e per la parte dello sviluppo applicativo contiamo sull’aiuto di alcune aziende condotte da persone con le quali ho avuto modo di collaborare in passato, e che si sono rivelate estremamente disponibili ed interessate al nostro progetto.
Infine abbiamo intenzione di portare avanti una campagna continua di promozione dell’open data presso i vari enti e la società, attuata attraverso incontri diretti face to face o anche piccole presentazioni pubbliche.

 

D. La Pubblica Amministrazione Locale: gioie o dolori sulla questione Open Data?

R. Lavorando per diversi anni nella pubblica amministrazione (anche se solamente come collaboratore ultra-precario), ho preso parte alla progettazione e all’attuazione di diverse indagini e ricerche sociali, e posso dire che ho vissuto direttamente sulla mia pelle il problema della mancanza di consapevolezza per quanto riguarda l’importanza che dovrebbe avere il dato statistico presso le amministrazioni pubbliche. Le difficoltà purtroppo non si limitano alla sola apertura dei dati alla società, ma addirittura è la trasmissione di questi tra i diversi enti e tra i diversi dipartimenti che risulta essere una barriera difficile da superare. Manca l’idea dell’utilizzo di uno standard condiviso, e vige ancora una sorta di gelosia tra i vari uffici, i cui funzionari spesso si comportano come se fossero gli effettivi detentori del dato e per cui sono restii a condividere determinate informazioni addirittura con gli altri organismi pubblici che ne fanno richiesta. Per esperienza posso dire che nel momento in cui una struttura come un osservatorio avvia una raccolta dati rivolgendosi ad altre amministrazioni o ad altri uffici dell’ente a cui appartiene, quando va bene le informazioni vengono trasmesse tramite disordinati fogli di calcolo e la casistica più frequente sono dei file pdf blindati e file doc, per non parlare di chi preferisce ancora utilizzare il fax e il materiale cartaceo!
Per questo crediamo che la promozione e la sensibilizzazione presso la PA locale verso un approccio più aperto e consapevole riguardo l’importanza sociale ed economica che hanno le informazioni condivise, possa in un certo modo indicare la giusta via che porta ad una maggiore efficienza e ad una maggiore produttività nel settore pubblico.

 

D. Open data e trasparenza. E’ un binomio praticabile in Sardegna?

Oltre alle difficoltà che ho appena citato, posso dire che in Sardegna esistono anche realtà estremamente positive e in rapida ascesa. Un chiaro esempio di Open Data trasparente è il portale della Provincia di Carbonia Iglesias (e di recente quello del Comune di Sestu) che, primo in Italia, ha reso liberi i dati dei propri atti amministrativi in modalità semantica. In questo modo non ci sono intermediari tra la produzione del dato e i possibili fruitori esterni, sia che siano cittadini o aziende che vogliano sfruttarli per le loro applicazioni. L’iniziativa fa parte di un progetto Open Source più ampio che si chiama ontologiapa.it e che fa leva su una piattaforma Drupal 7 per la PA denominata “LinkedPA“. Questo è sicuramente il binomio perfetto tra Open Data e trasparenza e fa piacere dire che la nostra Regione faccia scuola per tutto il paese.

 

D. La Sardegna ha giovani brillanti e capaci. Può l’Open Data essere una opportunita’?

R.La Sardegna è una piccola isola nel contesto globale, oltre al turismo abbiamo poche risorse naturali da sfruttare, e ovviamente ormai è chiaro che non possiamo competere con la forza produttiva dei colossi mondiali nel settore manifatturiero. Per cui si tratta di investire tutto nel capitale umano. Sposare il concetto di Open data significherebbe poter disporre di una nuova risorsa praticamente a costo zero, perché si tratterebbe solo di aprire gli archivi già esistenti e di adottare nuovi standard per la loro diffusione. In questo modo, chiunque abbia idee e competenze avrebbe la possibilità di integrare i servizi offerti dal settore pubblico o inventarne di nuovi, il tutto senza che le amministrazioni debbano spendere ulteriori risorse. Quindi una grossa opportunità per i giovani che con l’open data avrebbero a disposizione un solido punto di partenza sul quale far fruttare le proprie idee e la propria creatività.

 

D. Come vedi il ruolo di Sardinia Open Data nelle due domande precedenti?

R. Per ora siamo solo una piccola associazione, certamente una delle prime realtà nell’Isola a portare avanti questo tipo di iniziative. Ci sentiamo delle specie di pionieri anche se bisogna dire che abbiamo diversi punti di riferimento nel territorio nazionale. Vedremo come si andrà avanti, quel che è certo è che l’entusiasmo e l’intraprendenza non ci mancano.
Per seguire le nostre iniziative o contattarci è possibile visitare il nostro sito web http://sardiniaopendata.org/ ma siamo presenti anche su Facebook, Twitter e Google+.

3, 2, 1… Al via AppsForItaly, il contest italiano sugli Open Data

Ha preso il via  ufficialmente AppsForItaly, la competizione tutta italiana sugli Open Data. Un concorso quindi, con tanto di premi in denaro, rivolto ai cittadini, alle communities di sviluppatori, alle aziende e alle associazioni che proporranno le migliori soluzioni per l’utilizzo del patrimonio informativo pubblico.  Il concorso si articola in quattro categorie: Idee e Progetti, Applicazioni, Dataset e Visualizzazioni e potranno essere presentate anche proposte che in passato abbiano già partecipato ad altre competizioni simili.

Il montepremi? Al momento è arrivato a ben 40.000 euro, di cui buona parte messi dal Ministero per la Pubblica Amministrazione  e Innovazione  che ha supportato il lancio dell’iniziativa assieme a ForumPA e Formez e a cui sta subentrando  il MIUR in conseguenza del recente cambio di Governo. Il contest è organizzato dal Comitato AppsForItaly ma va detto che sono partner dell’iniziativa  enti del calibro di Regione Piemonte, ISTAT, Regione Emilia Romagna, ENEL  che mettono a disposizione i propri dati.

C’è una sola regola da seguire: le proposte inviate devono esser basate sui dati pubblici, ma se volete dare una occhiata al regolamento completo potete farlo visitando l’apposita pagina. Il  contest si chiuderà il 10 Febbraio 2012.  A partire da quella data una apposita giuria selezionerà le proposte vincitrici che verranno premiate a fine Febbraio all’interno di un apposito evento. Per il momento buon lavoro a chi avrà intenzione di partecipare e …. vinca il migliore!!

Google Refine: trasformiamo un dataset disordinato in una base dati affidabile!

Google Refine è un software prodotto da Google finalizzato principalmente all’esplorazione e alla pulizia di dataset disordinati. Grazie ad un’interfaccia estremamente intuitiva e semplice da usare risulta essere uno strumento assai potente e particolarmente adatto all’analisi di basi dati ancora sconosciute, ed eventualmente alla disposizione dei necessari aggiustamenti in maniera immediata e veloce, senza dover fare troppi studi preliminari, senza dover utilizzare lunghe stringhe di astruso codice o progettare complessi schemi di trasformazione dei dati.

Google Refine è un software maturo, questo significa che è abbastanza affidabile e completo (è arrivato infatti alla versione 2.1) ed è rivolto in particolar modo a tutti coloro che hanno a che fare con fonti di dati eterogenee o decidono di raccogliere informazioni da formati differenti come siti web, file di testo, fogli di calcolo e quindi vogliono confezionare il tutto in un unica base dati coerente, standardizzata e chiaramente leggibile.

Il caso classico di necessità di pulizia del dato lo abbiamo quando si accodano diversi dataset che presentano i medesimi campi ma che provengono da fonti diverse. È quindi possibile che i valori dei vari campi vengano riportati in maniera diversa pur avendo il medesimo significato. Ad esempio, per definire il sesso di un individuo spesso si utilizzano le più disparate coppie di valori come M/F, maschio/femmina, 0/1 e così via. Google Refine permette in un attimo, attraverso l’utilizzo di strumenti come i “facet” o le “trasformazioni”, di decidere quale coppia utilizzare e quindi estendere questa scelta a tutti i valori del campo del dataset.

Attraverso i facet si individuano facilmente le incongruenze, siano esse ripetute o sporadici errori di battitura e conversione, ed è semplice apporre le dovute correzioni utilizzando le opzioni presenti negli stessi facet o avvalendosi delle “trasformazioni” che agiscono sull’intero campo.

Il software, infatti, offre una serie di trasformazioni preconfezionate dette “trasformazioni comuni”, che riguardano le operazioni più popolari che si effettuano sui campo. Volendo si possono però effettuare operazioni di trasformazione più sofisticate e su misura utilizzando il linguaggio GREL (Google Refine Expression Language).

Il software di Google, pur essendo un programma molto ben fatto, non è esente da aspetti negativi. Ad esempio, se si lavora in locale, non è possibile operare direttamente sul file, ma è necessario un caricamento dello stesso (come facciamo con gli allegati quando usiamo la nostra webmail) per cui non è possibile lavorare sul dataset utilizzando contemporaneamente software differenti.

Inoltre, alcune trasformazioni come quelle riguardanti il formato del campo (ad esempio la modifica del formato della data), sono abbastanza problematiche se non si ha dimestichezza con il linguaggio GREL. Questo video-tutorial esplora le principali funzionalità che Google Refine ci offre. Le funzionalità più importanti, core del programma, che hanno reso Google Refine uno strumento di successo.

Statisticamente Honky Tonk

Tutto è cominciato tempo fa proprio grazie (o per colpa) di SegnalazionIT quando nell’articolo “Lo Statistico su Youtube” si faceva riferimento al brano Statistician’s Blues del cantante americano Todd Snider.

Da bravo “mezzo” musicista quale sono, ho visto quel video come uno stimolo e un invito a fare anch’io qualcosa che parlasse in qualche modo di statistica. Cosa che ovviamente ho fatto  ma,  altrettanto  ovviamente, ho fatto a modo mio.
Da sempre seguo la Country music americana. Nei miei numerosi viaggi per concerti ho avuto non solo il modo di ascoltare dal vivo tantissimi artisti (Brad Paisley, Mark Chesnutt,  Marty Stuart, Terri Clark,  Randi Travis giusto per fare qualche nome), ma di incontrarli personalmente grazie al fatto che mi sono sempre mosso dotato di “press pass” in qualita’ di inviato free lance per questa o quella rivista di musica.
Sono pero’ anche un autore, scrivo principalmente musica e negli ultimi anni mi sono, per cosi’ dire, “specializzato” sulla musica ironica e surreale. Quella musica comunemente definita “demenziale” che in Italia  è stata portata al successo da grandi artisti come Cochi e Renato, Enzo Jannacci, Pippo Franco, Elio e le Storie Tese, Renzo Arbore. Quello che ne e’ uscito fuori  è stato innanzitutto un brano di musica “Country Demenziale” che fa della surreale ironia sulla Statistica mettendone in risalto i piu’ comuni paradossi, e successivamente un videoclip, che  è quello che vi presento oggi:

Ladies & Gentlemen 

ecco a voi 

“Statisticamente Honky Tonk”

 



Statisticamente Honky Tonk di vpatruno

La versione  sottotitolata in inglese e’ stata premiata lo scorso Agosto a Miami, Florida, durante la convention della piu’ importante associazione di statistici del mondo, la American Statistical Association. Ne ha parlato qui il Significance Magazine. Thank you so much, Guys! E visto che ho cominciato con i ringraziamenti, non posso dimenticare tutti coloro che hanno preso parte  alla realizzazione del videoclip. Mi riferisco ai miei colleghi e amministratori di SegnalazionIT Eric Sanna e Daniele Frongia, per l’occasione al violino e alla chitarra acustica,  a Bob Morelli al basso, a Edo Patruno alla batteria, a Piero Chiti al pianoforte e che ha accettato di buon grado di ricoprire il ruolo di protagonista. (qui il link della sua associazione)

Ringrazio ancora le Cowgirls Francesca Pelliccia e Silvia Comanducci e tutta la troupe diretta magistralmente dal regista Gianluigi Bartolini a dalla sua preziosa assistente Barbara Diego: Cristiano De Nicola, Salvatore Marino, Michele Saullo e, per finire in bellezza, il fotografo Giampaolo Vasselli. Grazie ragazzi per il vostro prezioso lavoro!

Infine, da oggi (14 Novembre) fino alla fine della settimana potete  votare il video al concorso PIVI visitando il link http://www.dailymotion.com/video/xlq7ge_statisticamente-honky-tonk_music e cliccando su “vota”.  Ringrazio in anticipo tutti quelli che lo faranno.  E che il grande Banjo vi accompagni.

Contest di statistical graphics della Scuola SIS “Web e Statistica”

pie

A settembre, a Pisa, si è svolta la prima Scuola della Società Italiana di Statistica “Web e Statistica”, conclusa con un contest di statistical graphics tra i partecipanti. Ha vinto, di misura, Marco Calderisi, un brillante chimico (e statistico) fondatore di Terradata.

Qui riportiamo tutti i lavori del contest, (più che) meritevoli di pubblicazione. Complimenti!

§

Imprese italiane per settore di attività (Dina Alessandro)

I 6 grafici illustrano la situazione a Genova e provincia degli imprenditori “stranieri” (nati all’estero) per paese di nascita, per settore economico, per carica sociale, partendo dalle sedi d’impresa operanti sul territorio italiano fino agli imprenditori italiani operanti a Genova e provincia.

L’intento è stato di evidenziare il diverso andamento dei cittadini nati all’estero in paesi extracomunitari, in particolare delle nazionalità più corposamente presenti sul territorio genovese (marocchina, senegalese, albanese ed ecuadoriana), rispetto ai cittadini comunitari (esclusi gli italiani, francesi, inglesi e tedeschi).

Emerge che gli imprenditori nati in paesi extracomunitari preferiscono operare in qualità di titolari di imprese individuali, in realtà dimensionalmente più contenute e prevalentemente nei settori delle costruzioni e del commercio mentre gli imprenditori nati in paesi comunitari sono maggiormente attivi nell’ambito di strutture societarie più complesse in qualità di socio o di amministratore.

Dina Alessandro: nell’ambito delle attività del Servizio Statistica e Prezzi della Camera di Commercio di Genova mi occupo di elaborazione, analisi dati demografici, economici e non solo, preferibilmente fino al dettaglio comunale e della loro rappresentazione grafica, sempre alla ricerca di tecnologie innovative e visualizzazioni accattivanti.

 §

Come è gestita l’acqua in Italia? (Marco Calderisi)

L’elaborazione prova a rispondere alla domanda: come è gestita l’acqua in Italia? I dati sono relativi al 2003 e sono stati estratti dalle banche dati dell’ISTAT e dei Comuni Italiani. Un primo grafico mostra la distribuzione sul territorio nazionale del consumo di acqua per uso domestico, espresso in m3 per abitante. Le regioni del Sud sono quelle che hanno un minor consumo di acqua, mentre la regione con il consumo superiore è la Valle d’Aosta. Il secondo grafico invece da una indicazione della percentuale di popolazione servita da impianti di depurazione di acque reflue urbane. In questo caso la situazione è molto più omogenea della precedente. La Val d’Aosta ha il 100% della popolazione servita da impianti di trattamento, mentre la Liguria si attesta al 59%.

La due successive treemap mostrano rispettivamente quantità e tipologie di depuratori presenti sul territorio nazionale in termini assoluti e rapportati al numero di abitanti di ciascuna regione.

Si tenga presente che i depuratori possono essere di tre tipi diversi: i depuratori più semplici sono quelli che danno un trattamento primario (T1), mentre quelli più importanti per la depurazione ed il riutilizzo delle acque sono quelli che forniscono un trattamento terziario (T3).

Salta subito all’occhio come siano la Toscana e l’Emilia Romagna le regioni maggiormente attrezzate, ma che solo la Toscana abbia un numero di depuratori di tipo T3 percentualmente maggiore rispetto a quelli di altro tipo. D’altro canto, rapportando questi dati alla popolazione delle regioni si vede che sono la Lombardia e la Campania ad avere più impianti per abitante. La Lombardia ha più impianti di tipo primario, la Campania più impianti di tipo terziario.

Marco Calderisi, chimico/chemiometra, mi occupo di analisi statistica multivariata applicata alla chimica, all’ambiente e alla R&S. Socio fondatore di Terradata, società dedita all’analisi di dati ambientali. Borsista post-doc presso il Centro NMR dell’Università di Siena. Interessi attuali: Open Data, infografica.

 §

Studio di tipo osservazionale longitudinale per raccogliere i dati utili (Barbara Romani)

Il primo gruppo di dati consiste in una lista di enunciati che il soggetto esaminato (io) vorrebbe che gli fossero rivolti nell’arco di una giornata rilevando anche la frequenza con cui dovrebbero essere emessi.

Il secondo gruppo di dati è stato raccolto durante una giornata tipo, registrando gli enunciati che sono stati effettivamente rivolti al soggetto e la loro frequenza.

Barbara Romani, Psicologa-Psicoterapeuta, svolgo attività clinica come libero professionista e mi occupo -come borsista- di ricerca nell’ambito dell’umanizzazione delle cure presso l’Azienda Ospedaliera Universitaria Integrata di Verona. Interessi attuali: metodologia e strumenti per la ricerca.

§

Pil pro capite e la percentuale di acquisti di beni e servizi via web (Andrea Zedda)

Lo scatterplot interattivo mostra il legame tra Pil pro capite e la percentuale di acquisti di beni e servizi via web nelle regioni di alcuni stati europei. La grandezza dei punti è relativa
ad un ulteriore indicatore che descrive la percentuale di persone che utilizzano abitualmente internet. Per non appesantirne la lettura sono stati distinti per colore solo alcuni stati considerati più rilevanti. Si nota come la correlazione tra i due indicatori sia abbastanza modesta, mentre, di contro, le varie regioni tendono a raggrupparsi quasi naturalmente per Stato di appartenenza. Si può ipotizzare che la tendenza all’uso del web dipenda più da fattori culturali e infrastrutturali che dalle risorse economiche effettivamente disponibili in un dato territorio.

Andrea Zedda, laureato in Scienze Politiche, esperto in ricerca demo-sociale, mi occupo principalmente di elaborazione, trattamento, analisi dei dati e reportistica. Ho collaborato con ISTAT,  Provincia di Cagliari, Ablativ scrl, Camera di Commercio di Cagliari, e l’Università di Cagliari. Sono socio fondatore dell’associazione Sardinia Open Data.

(Andrea tornerà presto su SegnalazionIT con alcuni articoli da non perdere, ndr)

Competizione multimediale della Società Italiana di Statistica, ecco i vincitori!

Ecco i vincitori della Competizione Multimediale “La statistica e la professione di statistico: idee per la promozione e la diffusione” della Società Italiana di Statistica:

1° classificato
“Il calendario statistico”
di: Daniele Durante, Davide Vidotto e Sabrina Vettori. Se avete uno smartphone o un tablet con Android, scaricatevi subito la app! (guarda il contributo)

2° classificato
“Lo Statistico e la Statistica: questi sconosciuti”
di: Giada Adelfio, Giovanni Boscaino, Marco Enea, Rossella Onorati e Mariangela Sciandra (guarda il contributo)

3° classificato
“Se la statistica non esistesse”
di: Daniela De Francesco. Daniela collabora con noi di SegnalazionIT, perdonateci se ci complimentiamo doppiamente con lei :-) e riportiamo anche il suo contributo (con la colonna sonora) su YouTube, ripreso oggi anche dal sito de la Repubblica  (guarda il contributo)

4° classificato
Roberto Matteotti (guarda il contributo)

5° classificato
Stefania Caporaso, Pasquale Dello Stritto, Alfonso D’Agnese, Graziano Fresiello, Danilo Fusco, Nadia Inglese, Antonietta Perrone e Mariagiovanna Zavallone (guarda il contributo)

Complimenti a tutti (anche ai componenti della commissione, Maria Gabriella Grassia, Davide Bennato e Fabio Crescenzi) e arrivederci alla prossima edizione del concorso.

Prima giornata italiana della Statistica

La Società Italiana di Statistica, insieme all’Istituto Nazionale di Statistica, alla Banca d’Italia, alle Facoltà di Scienze statistiche e ad alcuni Dipartimenti universitari italiani, hanno proposto di istituire, ogni 20 ottobre, la «Giornata italiana della Statistica», rivolta a docenti, studiosi, alunni e cultori della disciplina.

Il 20 ottobre 2011, sotto l’Alto Patronato del Presidente della Repubblica, sarà celebrata per la prima volta la Giornata Italiana della Statistica, sulla scia della Giornata mondiale della Statistica dello scorso 20.10.2010. In occasione delle celebrazioni, che si protrarranno fino al 21 ottobre, l’Istat, la SIS e il Dipartimento Scienze Statistiche della Sapienza, organizzano alcune iniziative a Roma.

20 Ottobre
Istat, Aula Magna, Via Cesare Balbo 14

11.30 – 13.30  Celebrazione della Giornata Italiana della Statistica
15.00 – 16.30  Workshop – Open Official Statistical Data
16.30 – 17.00  Tavola Rotonda

Scopo della manifestazione è rafforzare la visibilità della statistica in Italia, e la fiducia dei cittadini in una Scienza che possa rispondere alle esigenze tecniche di oggettività e trasparenza, di conoscenza e partecipazione democratica, come scritto dal Presidente della Repubblica Giorgio Napolitano, in occasione della Giornata mondiale della Statistica del 20.10.2010.

Per confermare l’adesione inviare una e-mail a: eventi@istat.it

21 Ottobre
Dipartimento Scienze Statistiche, Sapienza Università di Roma, P.le Aldo Moro 5

09.30 – 14.00  Incontro dei giovani statistici
15.00 – 16.30  Riunione per la costituzione del Gruppo Permanente dei giovani statistici
15.00 – 17.30  Workshop – Statistica per innovare: la storia e le prospettive

Scopo della manifestazione è valorizzare le professionalità dei giovani statistici italiani, ovvero di diplomati, laureandi o laureati che si stanno inserendo nel mercato del lavoro o operano in ambito statistico da meno di 10 anni. Inoltre la Società Italiana di Statistica insieme all’Istat intendono favorire la costituzione del Gruppo permanente dei Giovani Statistici al fine di permettere di parlare delle loro esperienze e delle loro ricerche in un clima amichevole. In questa manifestazione sarà anche analizzato il  mercato del lavoro degli statistici italiani.

Per confermare l’adesione inviare una e-mail a: eventi@sis-statistica.org

21 Ottobre
Sala Odeion – Museo dell’arte classica, Facoltà di Lettere e Filosofia, Sapienza Università di Roma, P.le Aldo Moro 5

9.00 – 12.00  Incontro - Statistica a Scuola

—[ E' possibile scaricare qui la brochure completa con tutti gli eventi in programma ]—

Open Official Statistical Data

Il prossimo 20 Ottobre,  sotto l’Alto Patronato del Presidente della Repubblica, verrà celebrata la Giornata Italiana della Statistica. Verranno dedicati alle celebrazioni ben due giorni fitti di iniziative, tra cui segnaliamo il Workshop “Open Official Statistical Data”, che si terrà nel pomeriggio della giornata del 20 presso l’Aula Magna dell’ISTAT. I movimenti, le associazioni, le fondazioni che da tempo stanno promuovendo le logiche dell’Open Data si incontreranno con le istituzioni e con la Statistica Ufficiale par parlare di dati aperti e di open government e per annunciare assieme importanti iniziative di carattere nazionale.

Poichè la capienza dell’Aula Magna ISTAT è limitata, si potrà accedere all’evento fino ad esaurimento dei  posti disponibili previa registrazione che potrà essere effettuata semplicemente mandando una email all’indirizzo eventi@istat.it  entro il 18 ottobre.  Qui il programma del Workshop.

Al via il Censimento Online

Da oggi è possibile compilare online il questionario del Censimento della Popolazione.

La statistica nel pallone

Parlare di calcio significa parlare di soldi, tanti, tantissimi soldi, di uno dei pochi settori che non conosce crisi (basti pensare che nel 2008/2009 il mercato europeo del calcio è cresciuto di 15.7 miliardi di euro) e la rilevanza economica è tale che i segnali del cambiamento prima ancora che dai giornali sportivi vengono commentati dai giornali economico-finanziari. Di recente,  anche alcuni prestigiosi quotidiani come il Financial Time e New York Times si sono occupati della relazione sempre più stabile tra calcio e statistica.

Il legame della statistica con il mondo del calcio è nato diversi anni fa, basti pensare che già nel 1984 venne istituita la International Federation of Football History & Statistics , un organismo riconosciuto dalla FIFA che si occupa di statistiche e storia del calcio.  E, da ormai molti anni, non c’è commentatore sportivo che non usi a supporto della cronaca moltitudini di dati statistici. Senza pensare al ruolo della statistica rispetto al mondo delle scommesse.

La recente, o quasi, novità è che ormai qualsiasi aspetto di una partita può essere, grazie all’ICT, registrato. Questo consente di avere a disposizione enormi quantità di dati da cui, attraverso tecniche di data mining è possibile estrarre  informazioni utili sulle performance, ma ancora di più sulle caratteristiche di ciascun giocatore.

Diversi gli strumenti disponibili sul mercato che forniscono questa tipologia di servizi.

Società specializzate nell’integrare datamining e riprese video delle partite di calcio per un pubblico di allenatori, giocatori, fantacalciatori e tifosi.  La Match Analysis, ad esempio, ha siglato lo scorso anno un accordo con il New York Times per fornire in tempo reale, statistiche ed analisi per tutti gli incontri del 2010 FIFA World Cup™ attraverso soluzioni innovative di info-grafica che forniscono un flusso diretto e continuo di dati .

Siti web , come ad esempio Footballdatabase , raccolgono i dati relativi alle carriere agonostiche dei calciatori e rendono disponibili gratuitamente i gol fatti, gli assist, la carriera nei club, le presenze, e tutti i dati personali (data di nascita, nome di battesimo, luogo di nascita , ecc).


APP per iPhone e iPad basate sull’analisi dei dati statistici delle partite di calcio e le performance dei calciatori. Una delle più utilizzate in Italia è Gazzetta Mobile , una vera e propria redazione sportiva che commenta gli eventi in tempo reale con la cronaca, i tabellini e le formazioni delle partite e fornisce classifiche, calendari, risultati delle principali competizioni Italiane ed Europee con il supporto delle immagini fornite da Gazzetta TV, gli approfondimenti degli speciali di Gazzetta, le prime pagine del quotidiano ed il motore di ricerca. Prevede, inoltre, di salvare i dati e le foto ricercate così avere le news, i video e le foto più interessanti e consultarli anche offline.


Al tempo stesso, diverse società sportive hanno costruito in casa basi dati proprietarie come ad es. il Chelsea, la cui banca dati secondo il Financial Times, ne contiene 32 milioni, tratti da 13.000 partite internazionali. Ma il Chelsea non si limita a raccogliere i dati, infatti, sul sito web un esperto, Paul Dutton, fornisce analisi statistiche ai lettori attraverso un blog dedicato con l’accattivante titolo “Ask Statman”.

 

Importante anche l’investimento in ICT e statistica da parte della stampa, non solo sportiva. Il Financial Times, ad es. ha incaricato un artista – Giles Revell – di creare una serie di immagini sulla base dei dati statistici registrati in occasione della finale di champions league 2011 – Barcellona – Manchester United.  Di seguito una  immagine che fissa la partita al 69′, al gol di David Villa per il Barcellona. Le azioni sono registrate in sequenza e rappresentate a spirale, dal basso verso l’alto per il primo tempo e viceversa per il secondo.

Ma, l’aspetto interessante, evidenziato dai commentatori economici, è che per effetto della disponibilità di tecnologie sempre più sofisticate – che rendono disponibili miliardi di dati analitici e consentono analisi statistiche approfondite -  sempre più spesso in panchina ed in tribuna ci sono tablet e pc. Questi vengono utilizzati per analizzare in tempo reale l’andamento delle partite e supportare gli “allenatori 2.0″ nella definizione delle strategie e tattiche di gioco e nella formulazione della squadra titolare in base alle caratteristiche dei giocatori della rosa e degli avversari in campo. Analogo fenomeno è in corso per quanto riguarda direttori sportivi e procuratori che prima di fare acquisti sul mercato consultano performance e caratteristiche per cercare il giocatore tecnicamente adatto alle esigenze della squadra.

Dal prossimo campionato, quindi, sciamani e professionisti del pallone potrebbero lasciare la scena ai nuovi fenomeni del calcio: gli statistici.