Category: Statistica

Competizione multimediale della Società Italiana di Statistica, ecco i vincitori!

Ecco i vincitori della Competizione Multimediale “La statistica e la professione di statistico: idee per la promozione e la diffusione” della Società Italiana di Statistica:

1° classificato
“Il calendario statistico”
di: Daniele Durante, Davide Vidotto e Sabrina Vettori. Se avete uno smartphone o un tablet con Android, scaricatevi subito la app! (guarda il contributo)

2° classificato
“Lo Statistico e la Statistica: questi sconosciuti”
di: Giada Adelfio, Giovanni Boscaino, Marco Enea, Rossella Onorati e Mariangela Sciandra (guarda il contributo)

3° classificato
“Se la statistica non esistesse”
di: Daniela De Francesco. Daniela collabora con noi di SegnalazionIT, perdonateci se ci complimentiamo doppiamente con lei :-) e riportiamo anche il suo contributo (con la colonna sonora) su YouTube, ripreso oggi anche dal sito de la Repubblica  (guarda il contributo)

4° classificato
Roberto Matteotti (guarda il contributo)

5° classificato
Stefania Caporaso, Pasquale Dello Stritto, Alfonso D’Agnese, Graziano Fresiello, Danilo Fusco, Nadia Inglese, Antonietta Perrone e Mariagiovanna Zavallone (guarda il contributo)

Complimenti a tutti (anche ai componenti della commissione, Maria Gabriella Grassia, Davide Bennato e Fabio Crescenzi) e arrivederci alla prossima edizione del concorso.

Prima giornata italiana della Statistica

La Società Italiana di Statistica, insieme all’Istituto Nazionale di Statistica, alla Banca d’Italia, alle Facoltà di Scienze statistiche e ad alcuni Dipartimenti universitari italiani, hanno proposto di istituire, ogni 20 ottobre, la «Giornata italiana della Statistica», rivolta a docenti, studiosi, alunni e cultori della disciplina.

Il 20 ottobre 2011, sotto l’Alto Patronato del Presidente della Repubblica, sarà celebrata per la prima volta la Giornata Italiana della Statistica, sulla scia della Giornata mondiale della Statistica dello scorso 20.10.2010. In occasione delle celebrazioni, che si protrarranno fino al 21 ottobre, l’Istat, la SIS e il Dipartimento Scienze Statistiche della Sapienza, organizzano alcune iniziative a Roma.

20 Ottobre
Istat, Aula Magna, Via Cesare Balbo 14

11.30 – 13.30  Celebrazione della Giornata Italiana della Statistica
15.00 – 16.30  Workshop – Open Official Statistical Data
16.30 – 17.00  Tavola Rotonda

Scopo della manifestazione è rafforzare la visibilità della statistica in Italia, e la fiducia dei cittadini in una Scienza che possa rispondere alle esigenze tecniche di oggettività e trasparenza, di conoscenza e partecipazione democratica, come scritto dal Presidente della Repubblica Giorgio Napolitano, in occasione della Giornata mondiale della Statistica del 20.10.2010.

Per confermare l’adesione inviare una e-mail a: eventi@istat.it

21 Ottobre
Dipartimento Scienze Statistiche, Sapienza Università di Roma, P.le Aldo Moro 5

09.30 – 14.00  Incontro dei giovani statistici
15.00 – 16.30  Riunione per la costituzione del Gruppo Permanente dei giovani statistici
15.00 – 17.30  Workshop – Statistica per innovare: la storia e le prospettive

Scopo della manifestazione è valorizzare le professionalità dei giovani statistici italiani, ovvero di diplomati, laureandi o laureati che si stanno inserendo nel mercato del lavoro o operano in ambito statistico da meno di 10 anni. Inoltre la Società Italiana di Statistica insieme all’Istat intendono favorire la costituzione del Gruppo permanente dei Giovani Statistici al fine di permettere di parlare delle loro esperienze e delle loro ricerche in un clima amichevole. In questa manifestazione sarà anche analizzato il  mercato del lavoro degli statistici italiani.

Per confermare l’adesione inviare una e-mail a: eventi@sis-statistica.org

21 Ottobre
Sala Odeion – Museo dell’arte classica, Facoltà di Lettere e Filosofia, Sapienza Università di Roma, P.le Aldo Moro 5

9.00 – 12.00  Incontro - Statistica a Scuola

—[ E' possibile scaricare qui la brochure completa con tutti gli eventi in programma ]—

Open Official Statistical Data

Il prossimo 20 Ottobre,  sotto l’Alto Patronato del Presidente della Repubblica, verrà celebrata la Giornata Italiana della Statistica. Verranno dedicati alle celebrazioni ben due giorni fitti di iniziative, tra cui segnaliamo il Workshop “Open Official Statistical Data”, che si terrà nel pomeriggio della giornata del 20 presso l’Aula Magna dell’ISTAT. I movimenti, le associazioni, le fondazioni che da tempo stanno promuovendo le logiche dell’Open Data si incontreranno con le istituzioni e con la Statistica Ufficiale par parlare di dati aperti e di open government e per annunciare assieme importanti iniziative di carattere nazionale.

Poichè la capienza dell’Aula Magna ISTAT è limitata, si potrà accedere all’evento fino ad esaurimento dei  posti disponibili previa registrazione che potrà essere effettuata semplicemente mandando una email all’indirizzo eventi@istat.it  entro il 18 ottobre.  Qui il programma del Workshop.

Al via il Censimento Online

Da oggi è possibile compilare online il questionario del Censimento della Popolazione.

La statistica nel pallone

Parlare di calcio significa parlare di soldi, tanti, tantissimi soldi, di uno dei pochi settori che non conosce crisi (basti pensare che nel 2008/2009 il mercato europeo del calcio è cresciuto di 15.7 miliardi di euro) e la rilevanza economica è tale che i segnali del cambiamento prima ancora che dai giornali sportivi vengono commentati dai giornali economico-finanziari. Di recente,  anche alcuni prestigiosi quotidiani come il Financial Time e New York Times si sono occupati della relazione sempre più stabile tra calcio e statistica.

Il legame della statistica con il mondo del calcio è nato diversi anni fa, basti pensare che già nel 1984 venne istituita la International Federation of Football History & Statistics , un organismo riconosciuto dalla FIFA che si occupa di statistiche e storia del calcio.  E, da ormai molti anni, non c’è commentatore sportivo che non usi a supporto della cronaca moltitudini di dati statistici. Senza pensare al ruolo della statistica rispetto al mondo delle scommesse.

La recente, o quasi, novità è che ormai qualsiasi aspetto di una partita può essere, grazie all’ICT, registrato. Questo consente di avere a disposizione enormi quantità di dati da cui, attraverso tecniche di data mining è possibile estrarre  informazioni utili sulle performance, ma ancora di più sulle caratteristiche di ciascun giocatore.

Diversi gli strumenti disponibili sul mercato che forniscono questa tipologia di servizi.

Società specializzate nell’integrare datamining e riprese video delle partite di calcio per un pubblico di allenatori, giocatori, fantacalciatori e tifosi.  La Match Analysis, ad esempio, ha siglato lo scorso anno un accordo con il New York Times per fornire in tempo reale, statistiche ed analisi per tutti gli incontri del 2010 FIFA World Cup™ attraverso soluzioni innovative di info-grafica che forniscono un flusso diretto e continuo di dati .

Siti web , come ad esempio Footballdatabase , raccolgono i dati relativi alle carriere agonostiche dei calciatori e rendono disponibili gratuitamente i gol fatti, gli assist, la carriera nei club, le presenze, e tutti i dati personali (data di nascita, nome di battesimo, luogo di nascita , ecc).


APP per iPhone e iPad basate sull’analisi dei dati statistici delle partite di calcio e le performance dei calciatori. Una delle più utilizzate in Italia è Gazzetta Mobile , una vera e propria redazione sportiva che commenta gli eventi in tempo reale con la cronaca, i tabellini e le formazioni delle partite e fornisce classifiche, calendari, risultati delle principali competizioni Italiane ed Europee con il supporto delle immagini fornite da Gazzetta TV, gli approfondimenti degli speciali di Gazzetta, le prime pagine del quotidiano ed il motore di ricerca. Prevede, inoltre, di salvare i dati e le foto ricercate così avere le news, i video e le foto più interessanti e consultarli anche offline.


Al tempo stesso, diverse società sportive hanno costruito in casa basi dati proprietarie come ad es. il Chelsea, la cui banca dati secondo il Financial Times, ne contiene 32 milioni, tratti da 13.000 partite internazionali. Ma il Chelsea non si limita a raccogliere i dati, infatti, sul sito web un esperto, Paul Dutton, fornisce analisi statistiche ai lettori attraverso un blog dedicato con l’accattivante titolo “Ask Statman”.

 

Importante anche l’investimento in ICT e statistica da parte della stampa, non solo sportiva. Il Financial Times, ad es. ha incaricato un artista – Giles Revell – di creare una serie di immagini sulla base dei dati statistici registrati in occasione della finale di champions league 2011 – Barcellona – Manchester United.  Di seguito una  immagine che fissa la partita al 69′, al gol di David Villa per il Barcellona. Le azioni sono registrate in sequenza e rappresentate a spirale, dal basso verso l’alto per il primo tempo e viceversa per il secondo.

Ma, l’aspetto interessante, evidenziato dai commentatori economici, è che per effetto della disponibilità di tecnologie sempre più sofisticate – che rendono disponibili miliardi di dati analitici e consentono analisi statistiche approfondite -  sempre più spesso in panchina ed in tribuna ci sono tablet e pc. Questi vengono utilizzati per analizzare in tempo reale l’andamento delle partite e supportare gli “allenatori 2.0″ nella definizione delle strategie e tattiche di gioco e nella formulazione della squadra titolare in base alle caratteristiche dei giocatori della rosa e degli avversari in campo. Analogo fenomeno è in corso per quanto riguarda direttori sportivi e procuratori che prima di fare acquisti sul mercato consultano performance e caratteristiche per cercare il giocatore tecnicamente adatto alle esigenze della squadra.

Dal prossimo campionato, quindi, sciamani e professionisti del pallone potrebbero lasciare la scena ai nuovi fenomeni del calcio: gli statistici.

 

Concorso della Società Italiana di Statistica

Giornata Italiana della Statistica – 20 Ottobre 2011

Concorso della Società Italiana di Statistica

La statistica e la professione di statistico: idee per la promozione e la diffusione. Competizione multimediale: testi, immagini, suoni e video

La Società Italiana di Statistica (SIS), al fine di aumentare l’utilizzazione della Statistica in Italia e la sua diffusione e valorizzare la figura dello statistico nel mercato del lavoro italiano, organizza e promuove la competizione multimediale “La statistica e la professione di statistico: idee per la promozione e la diffusione“.

Informazioni su regolamento, iscrizione e premi su http://contest.sis-statistica.org/

13 tool di visualizzazione dati

SegnalazionIT si è più volte occupato di tool di visualizzazione dati. Quella che segue è la traduzione di un post di Steve Doig sul blog businessjournalism.org.

Steve Doig è “Knight Chair” alla Walter Cronkite, Scuola di Giornalismo e Comunicazione di Massa presso l’Arizona State University. È specializzato in computer-assisted reporting, l’uso del computer e delle tecniche delle scienze sociali per aiutare i giornalisti a fare meglio il proprio lavoro.

———————-

Steve Doig’s best of CAR Conference: 13 free tools to analyze, display data

di Steve Doig

L’annuale conferenza Computer-Assisted Reporting Conference, che si è tenuta a Raleigh, Carolina del Nord, è stata straordinariamente ricca di tool utili e gratuiti per tutti i tipi di analisi e visualizzazione dei dati, grazie anche alla presenza degli informatici di Google, MIT, Stanford e simili.

Ecco i link a 13 di questi tool gratuiti che ho trovato essere particolarmente utili per l’analisi dei dati nel giornalismo:

Exhibit: Questo link porta ad una pagina con una raccolta di link del progetto Simile del MIT. Exhibit è un programma JavaScript che vi permetterà di partire dai dati in forma tabellare (righe e colonne) e vederli in una varietà di formati: tabella ordinabile e filtrabile, mappa, linea del tempo, ecc. Per avere un’idea di cosa si può ottenere si può vedere la sezione Examples. Nella sezione DataPress è presente un add-in di WordPress che vi permette di esporre le visualizzazioni di Exhibit sul proprio blog. L’uso di Exhibit richiede qualche conoscenza di html, basta semplicemente copiare il suo codice sorgente e modificarlo. Dido è un prototipo di interfaccia utente che permette di configurare Exhibit, senza dover entrare nel codice.

TimeFlow: Questo programma JavaScript consente di utilizzare tabelle che hanno un elemento temporale e creare linee di tempo interattive che possono essere filtrate e colorate tramite più variabili. È uno strumento puramente di analisi, non progettato per la presentazione web, può essere utile per progetti di indagine dei dati.

ManyEyes: Questo sito consente di caricare e visualizzare i dati utilizzando una vasta gamma di interessanti viste: mappe, alberi di parole, tag clouds, strutture ad albero, diagrammi a bolle, grafici, matrici, diagrammi di rete, ecc. Si possono vedere le oltre 84.000 visualizzazioni che gli utenti hanno creato con i propri dati, in modo da avere una idea di cosa è possibile ottenere.

Gapminder: Questo sito è stato creato da scienziato svedese Hans Rosling, che voleva rendere più facile per le persone esplorare gli effetti di centinaia di variabili relative alle diverse nazioni del mondo. Fondamentalmente, questi sono grafici a dispersione multivariati x-y che si animano attraverso il tempo. Ciò che è cool, oltre a giocare con le variabili già collegate al sito, è che Google ha recentemente comprato e aggiunto tali funzionalità ai fogli di calcolo di Google Docs in modo che gli utenti possano caricare i propri dati con variabili temporali.

Tableau Public (solo Windows): La versione completa di Tableau Public è commerciale, ma l’azienda ha creato questa versione pubblica disponibile a chiunque. Fa molte delle stesse cose che fa Exhibit, cliccare su Gallery per vedere alcuni esempi. La versione gratuita è limitata, può contenere fino a 100.000 record.

Protovis: Questo programma, scaricabile dal laboratorio di visualizzazione di Stanford, è simile a ManyEyes ma con una varietà ancora più ampia di tabelle e grafici che possono essere creati, cliccare su Examples per visualizzarli. L’uso di Protovis richiede però notevoli capacità di scrittura di codice software.

Google Refine: Google definisce questo “uno strumento per lavorare con dati disordinati”. I data journalist lo usano per pulire le incongruenze database “campaign-contributions”, per esempio. Rende semplice standardizzare nomi come “Steve Doig” e “Stephen Doig” e “Steven Doig” in uno di questi. Inoltre aiuta con alcune analisi di base, come l’equivalente delle tabelle pivot di Excel.

Google Fusion Tables: Questo è un altro strumento Exhibit- like e rende possibile associare i dati come le mappe, le linee di tempo e/o grafici. A differenza di Exhibit non c’è bisogno di sporcarsi le mani con il codice HTML e JavaScript.

DataWrangler: Un altro buono strumento di Stanford, è simile a Google Refine. È buono per la trasformazione di dati in formati scomodi in qualcosa che può essere analizzato più facilmente.

TwitInfo: Un altro strumento del MIT, questo è progettato per prendere una grande quantità di tweet su Twitter in tempo reale e mostrare loro come una timeline grafica con picchi di attività. Esso comprende un “sentiment algorithm” che classifica i tweets negativi o positivi. Viene descritto come potrebbe essere usato per raccogliere le notizie, come la localizzazione terremoti in anticipo rispetto ai geologi.

NodeXL: Questo è un componente aggiuntivo di Excel che effettua una visualizzazione grafica dei social network. Le visualizzazioni mostrano come le persone sono interconnesse. Un esempio potrebbero essere i collegamenti tra i membri dei vari consigli di amministrazione. Un altro esempio è quello che mio figlio Matt creato per il Sarasota Herald-Tribune dello scorso anno che coinvolgono gruppi di acquirenti e venditori che sono stati coinvolti in massa dai mutui con meccanismi di frode. Queste visualizzazioni si possono ottenere rapidamente ma possono essere molto sgraziate, il nome usato dai giornalisti per i più complicati è “palla di pelo”.

Jigsaw: Non ho visto questa offerta di Georgia Tech, ma si suppone che sia utile per dare un senso alle grandi collezioni di documenti. Non è un programma scaricabile o una applicazione sulla quale caricare i propri dati, ma lo staff di Tech invitare le persone con i dati ad entrare in contatto con loro riguardo al suo utilizzo.

DocumentCloud: Questo è un servizio creato dagli sviluppatori di news-app di The New York Times e ProPublica.org. È progettato per mettere i documenti originali (anche quelli scritti a mano) sul Web e annotarli. L’idea è di permettere ai consumatori di notizie vedere questi documenti – documentazione processuale, legislazione, trascrizioni, dati sugli arresti, controlli, e-mail, ecc – con annotazioni dettagliate e le spiegazioni aggiunte dai giornalisti che seguono la notizia o altri esperti. Ecco un esempio da Arizona Republic in materia di immigrazione, di applicazione della legge sull’immigrazione, SB 1070.

Dove osano le farfalle 2








“della statistica e dei nuovi paradigmi di complessità”







Steve Sarsfield ha recentemente pubblicato il saggio “The Butterfly Effect and Data Quality” proponendo l’effetto farfalla per indagare sulle contaminazioni generate da dati di cattiva qualità.

Ma la novità odierna che chiama pesantemente in campo la statistica è l´enorme quantità di dati e la possibilità di elaborarli in modo sempre più sofisticato. Dati che permettono di tracciare le nostre ricerche sul web, le nostre telefonate, i nostri spostamenti in modo sempre più ubiquo. Questa quantità di informazioni può nascondere davvero tanti e insidiosissimi effetti farfalla.

Massimo Bucchi in un articolo apparso su “La Repubblica” trattando dell’ultimo libro di Albert-László Barabási ha evidenziato come la quantità di dati disponibili stia modificando radicalmente persino i paradigmi di prevedibilità degli eventi.

Ciò che l´articolo originale di Edward Lorenz sottolineava è la sensibilità di un sistema che, nel lungo periodo, può subire pesantemente gli effetti di assai complesse propagazioni originate da piccole variazioni delle condizioni iniziali.

La statistica da sempre si propone come strumento per comprendere e trattare la complessità.



Oggi la complessità, spiccando il volo verso forme più evolute, sembra quasi voler rispondere sfidando a sua volta la statistica.

Come si possono analizzare tanti piccoli battiti d’ala che si verificano e generano continuamente la propagazione di nuovi effetti e contro effetti nel data deluge? Quali sono gli strumenti per distinguere fra tutti questi movimenti, apparentemente insignificanti, quelli in grado avere conseguenze dirompenti sui sistemi?

Possiamo, noi statistici, rispondere a tutte queste sfide? Forse sì, ma certo bisognerà volare molto in alto. Lassù, dove solo le farfalle osano volare.


Dove osano le farfalle

 

 

 

“Può il batter d’ali di una farfalla in Brasile

provocare un tornado in Texas?”

 

 

 

 

 

Nel web l’effetto farfalla dilaga: da un lato si moltiplicano recensioni e post con riferimenti più o meno espliciti a questo effetto, dall’altro sono numerose le pubblicità che ad esso si ispirano.

Sliding doors e The Butterfly Effect sono divenuti “cult movie” e in Mr Nobody troviamo rappresentato addirittura un raro esempio di effetto e contro effetto farfalla.

Ma di cosa si tratta? L’espressione “Effetto farfalla” si ritiene abbia origine da uno dei più celebri racconti fantascientifici di Ray Bradbury: Rumore di tuono, in cui si immagina che nel futuro, grazie ad una macchina del tempo, vengano organizzati dei safari temporali per turisti. In una remota epoca preistorica un escursionista del futuro calpesta una farfalla e questo fatto provoca una catena di allucinanti conseguenze per la storia umana.

Edward Lorenz fu il primo ad analizzare l’effetto farfalla in uno scritto del 1963 preparato per la New York Academy of Sciences. Secondo tale documento, “Un meteorologo fece notare che, se le teorie erano corrette, un battito delle ali di un gabbiano sarebbe stato sufficiente ad alterare il corso del clima per sempre.” In discorsi e scritti successivi, Lorenz usò la più poetica farfalla, forse ispirato dal diagramma generato dagli attrattori di Lorenz, che somigliano proprio a tale insetto, o forse influenzato dai precedenti letterari (anche se mancano prove a supporto). “Può il batter d’ali di una farfalla in Brasile provocare un tornado in Texas?” fu il titolo di una conferenza tenuta da Lorenz nel 1972.

L’effetto farfalla riguarda anche la statistica? Certamente sì, anzi riguarda soprattutto la statistica, le sue trasformazioni, il suo rapporto con la complessità.

Di recente è stato usato nell’analisi geopolitica per indagare sulle recenti rivoluzioni dell’Africa settentrionale, soprattutto alla luce delle numerose interrelazioni esistenti tra i diversi attori nazionali che agiscono nel mondo. Ci si è chiesti se una politica monetaria negli Stati Uniti potesse essere in grado di rovesciare un governo nel Nordafrica. La teoria dell’Effetto Farfalla non presuppone limiti. Pertanto, se il battito d’ali di una farfalla in Brasile può provocare un tornado in Texas, appare logico prevedere che lo stesso tornado in Texas possa provocare altri effetti in Europa, in Asia, o addirittura nello stesso Brasile, magari travolgendo proprio la farfalla da cui era stato originato.

Nella seconda parte tratteremo proprio dei legami fra effetto farfalla e statistica (continua).


Numerus

Il panorama italiano della “data driven information” è, nel 2011, molto attivo su diversi fronti:

  • open data, con diverse iniziative spontanee di enti territoriali e associazioni, di cui abbiamo dato notizia più volte in questo blog;
  • data journalism, come abbiamo letto nell’intervista a Guido Romeo ed Elisabetta Tola;
  • licensing, per operare sui dati tenendo conto delle implicazioni di  tipo giuridico, di cui abbiamo parlato anche alla Decima Conferenza Nazionale di Statistica.

A queste tre categorie, tra loro differenti ma che richiedono un non banale grado di competenza informatica o giuridica, si è ormai aggiunta quella dell’aiuto alla lettura critica dei dati, che è uscita dalla ristretta cerchia degli statistici per offrirsi al grande pubblico dei fruitori dell’informazione giornalistica, cartacea ed elettronica.

In questo caso sono necessarie notevoli capacità di operare su dati provenienti da fonti differenti, al fine di derivarne riflessioni e interpretazioni su fenomeni complessi. Gli esempi in Italia sono veramente pochi, fra questi c’è il blog Numerus, ospitato dal sito del Corriere della Sera, che ha l’intento dichiarato di “aiutare a comprendere quali sono i dati attendibili, come vengono prodotti, come vengono usati nel bene e nel male, in quale modo il miglioramento della statistica può incidere anche sulla qualità della vita”.

Numerus è tenuto da Donato Speroni, giornalista economico che ha lavorato al Mondo e al Corriere della Sera, è stato responsabile della comunicazione dell’Istat, si è successivamente occupato di statistiche nei Paesi in via di sviluppo per conto della Banca Mondiale e di altre organizzazioni. Attualmente insegna all’Istituto per la formazione al giornalismo di Urbino.