Dove osano le farfalle 2








“della statistica e dei nuovi paradigmi di complessità”







Steve Sarsfield ha recentemente pubblicato il saggio “The Butterfly Effect and Data Quality” proponendo l’effetto farfalla per indagare sulle contaminazioni generate da dati di cattiva qualità.

Ma la novità odierna che chiama pesantemente in campo la statistica è l´enorme quantità di dati e la possibilità di elaborarli in modo sempre più sofisticato. Dati che permettono di tracciare le nostre ricerche sul web, le nostre telefonate, i nostri spostamenti in modo sempre più ubiquo. Questa quantità di informazioni può nascondere davvero tanti e insidiosissimi effetti farfalla.

Massimo Bucchi in un articolo apparso su “La Repubblica” trattando dell’ultimo libro di Albert-László Barabási ha evidenziato come la quantità di dati disponibili stia modificando radicalmente persino i paradigmi di prevedibilità degli eventi.

Ciò che l´articolo originale di Edward Lorenz sottolineava è la sensibilità di un sistema che, nel lungo periodo, può subire pesantemente gli effetti di assai complesse propagazioni originate da piccole variazioni delle condizioni iniziali.

La statistica da sempre si propone come strumento per comprendere e trattare la complessità.



Oggi la complessità, spiccando il volo verso forme più evolute, sembra quasi voler rispondere sfidando a sua volta la statistica.

Come si possono analizzare tanti piccoli battiti d’ala che si verificano e generano continuamente la propagazione di nuovi effetti e contro effetti nel data deluge? Quali sono gli strumenti per distinguere fra tutti questi movimenti, apparentemente insignificanti, quelli in grado avere conseguenze dirompenti sui sistemi?

Possiamo, noi statistici, rispondere a tutte queste sfide? Forse sì, ma certo bisognerà volare molto in alto. Lassù, dove solo le farfalle osano volare.


Dove osano le farfalle

 

 

 

“Può il batter d’ali di una farfalla in Brasile

provocare un tornado in Texas?”

 

 

 

 

 

Nel web l’effetto farfalla dilaga: da un lato si moltiplicano recensioni e post con riferimenti più o meno espliciti a questo effetto, dall’altro sono numerose le pubblicità che ad esso si ispirano.

Sliding doors e The Butterfly Effect sono divenuti “cult movie” e in Mr Nobody troviamo rappresentato addirittura un raro esempio di effetto e contro effetto farfalla.

Ma di cosa si tratta? L’espressione “Effetto farfalla” si ritiene abbia origine da uno dei più celebri racconti fantascientifici di Ray Bradbury: Rumore di tuono, in cui si immagina che nel futuro, grazie ad una macchina del tempo, vengano organizzati dei safari temporali per turisti. In una remota epoca preistorica un escursionista del futuro calpesta una farfalla e questo fatto provoca una catena di allucinanti conseguenze per la storia umana.

Edward Lorenz fu il primo ad analizzare l’effetto farfalla in uno scritto del 1963 preparato per la New York Academy of Sciences. Secondo tale documento, “Un meteorologo fece notare che, se le teorie erano corrette, un battito delle ali di un gabbiano sarebbe stato sufficiente ad alterare il corso del clima per sempre.” In discorsi e scritti successivi, Lorenz usò la più poetica farfalla, forse ispirato dal diagramma generato dagli attrattori di Lorenz, che somigliano proprio a tale insetto, o forse influenzato dai precedenti letterari (anche se mancano prove a supporto). “Può il batter d’ali di una farfalla in Brasile provocare un tornado in Texas?” fu il titolo di una conferenza tenuta da Lorenz nel 1972.

L’effetto farfalla riguarda anche la statistica? Certamente sì, anzi riguarda soprattutto la statistica, le sue trasformazioni, il suo rapporto con la complessità.

Di recente è stato usato nell’analisi geopolitica per indagare sulle recenti rivoluzioni dell’Africa settentrionale, soprattutto alla luce delle numerose interrelazioni esistenti tra i diversi attori nazionali che agiscono nel mondo. Ci si è chiesti se una politica monetaria negli Stati Uniti potesse essere in grado di rovesciare un governo nel Nordafrica. La teoria dell’Effetto Farfalla non presuppone limiti. Pertanto, se il battito d’ali di una farfalla in Brasile può provocare un tornado in Texas, appare logico prevedere che lo stesso tornado in Texas possa provocare altri effetti in Europa, in Asia, o addirittura nello stesso Brasile, magari travolgendo proprio la farfalla da cui era stato originato.

Nella seconda parte tratteremo proprio dei legami fra effetto farfalla e statistica (continua).


Leggere la statistica attraverso la storia

Un gioco di parole evidenzia la particolare e stretta relazione fra dato e sua “collocazione storica” o “datazione”. Non è di minore importanza però anche l’influenza che il contesto storico esercita su metodi, tecniche e strumenti di produzione e di analisi dei dati.

La statistica nella definizione di Wikipedia è la scienza che ha come fine lo studio quantitativo o qualitativo di un qualsivoglia “collettivo”. Studia i modi in cui le informazioni e i loro legami possano essere prodotte, sintetizzate e quindi comprese in un processo che renda di fatto la conoscenza “digeribile” e comunicabile da individuo a individuo ed è inevitabile che trasformazioni sia del contesto tecnologico sia del contesto culturale producano una forte e continua spinta all’innovazione ed al cambiamento.

Proprio alla luce di queste considerazioni Società Italiana di Statistica, Istat e Banca dItalia hanno deciso di organizzare insieme il Convegno “La Statistica nei 150 anni dallUnità di Italia”, che si inserisce tra le celebrazioni dei 150 anni dallUnità dItalia,  che si terrà a  Bologna dall’8 al 10 giugno, dedicandolo ai molteplici legami esistenti fra statistica e storia. Da un lato il convegno tratterà lo studio attraverso la statistica dei fenomeni economici, demografici e sociali che hanno interessato il nostro Paese dalla sua Unità, dall’altro metodologie e applicazioni statistiche saranno esaminate sia nell’ambito di un’analisi storica comparativa sia con riferimento agli sviluppi attuali e alle prospettive future. Una lista degli argomenti di interesse del Convegno è riportata nell’annuncio preliminare.

Gli Autori interessati a presentare un lavoro in una sessione spontanea sono invitati ad inviare:

■    entro il 31 gennaio 2011 il titolo e un riassunto di non oltre 500 parole

■    entro il 28 febbraio 2011 il lavoro definitivo di 4 pagine

Entro il 30 aprile 2011 sarà data notifica di accettazione.

Sarà possibile anche inviare un poster entro il 15 maggio 2011 .

Informazioni dettagliate sulla procedura di sottomissione dei contributi saranno disponibili sul sito web del convegno

http://www.sis-statistica.it/meetings/index.php/sis2011/

Statistically I love you

La prima Giornata mondiale della statistica del 20 ottobre si avvicina in tempi che sono davvero speciali e di grande fermento. Un nuovo interesse verso la statistica si unisce a vecchi pregiudizi con qualche risvolto che assume connotazioni talvolta un po’ surreali.

Infatti, se nei social media e su YouTube la statistica impazza, e il censimento degli Stati Uniti fa il pieno di contatti, è vero anche che, “statistically speaking”, i toni il più delle volte non sono così lusinghieri. Se in Italia ottanta statistici della Società Italiana di Statistica hanno deciso di impegnarsi in un progetto dedicato alla valorizzazione delle statistiche pubbliche e molta attesa desta il primo BarCamp “Sharing Data & Statistical Knowledge” che si terrà proprio il 20 ottobre, la presentazione del dato in quanto tale stenta a ritrovare quel suo antico appeal e rischia di apparire noiosa non solo sulla base di considerazioni sulla sua affidabilità.

In Canada, uno dei Paesi in cui la tradizione statistica ufficiale è fra le più avanzate si è giunti sull’orlo di una crisi di nervi proprio sul censimento della popolazione. In Germania in un campo in cui la statistica è tradizionalmente di casa, quello delle scommesse calcistiche, si preferiscono metodi decisamente meno costosi e un po’ sbrigativi a strumenti predittivi scientificamente validi.

Insomma pare proprio che senza ulteriori ingredienti il dato non vada più di moda, in una progressiva deriva verso la polpificazione.  Ma quali sono questi nuovi ingredienti? Può sembrare buffo, ma da quando, nel 2008, Hal Varian, Chief Economist di Google, ha affermato che il mestiere dello statistico si apprestava a divenire il lavoro più sexy del nuovo decennio, si è assistito anche ad un improvviso virare delle aspettative, in una specie di fio da pagare al cambiamento. Ora alla statistica e agli statistici si chiede tanto di più, meno fredde elencazioni di numeri, tanta nuova forza espressiva e tante prove di cuore. Ma anche su questo ci stiamo attrezzando e, possiamo forse già da ora gridare, con Helen Arney, “Statistically I love you”, ma soprattutto che “…on average you’ll be mine”.

[youtube]http://www.youtube.com/watch?v=uggtGH0d97k[/youtube]

La policromica convertibilità della conoscenza statistica in petabyte

Dal giorno del suo ritrovamento la stele policromica continua a catalizzare l’attenzione dei media e a destare l’interesse di studiosi e commentatori che trovano via via nuovi spunti e nuovi percorsi interpretativi.

Intanto ci propone un paradigma di commensurabilità fra enti che fino a poco tempo prima erano, nel nostro immaginario, così distanti: da un lato la conoscenza statistica, così immateriale e impalpabile, e dall’altro la capacità di storage, così pesantemente fisica e materiale.

La prima convinzione che è posta in discussione da questa scoperta è quella dell’inarrestabilità del progresso informatico, capace sempre e solo di superare se stesso in un progredire senza fine. La seconda è quella della capacità del sapere di essere comunque capace di fluire, aumentare ed adeguarsi ai via via più ampi spazi offerti dalla crescita della rete.

Hal Varian nel 2008 sorprese tutti quando affermò con convinzione che il mestiere dello statistico stava per divenire il lavoro più sexy del nuovo decennio, soppiantando di fatto la grande supremazia degli ingegneri informatici del decennio precedente. Oggi ci è del tutto evidente come lui dovesse essere a conoscenza di fatti dei quali noi tutti allora eravamo tenuti all’oscuro.

Con Daniele Frongia ed Eric Sanna abbiamo sostenuto, in Statistics and Web: Who needs Who?,  lavoro presentato alla XLV Riunione Scientifica della Società Italiana di Statistica 2010 di Padova, la necessità di un maggiore cointeressamento reciproco fra statistici e informatici, pur se ancora ignari di quello che si celava.

Ma allora noi tutti ritenevamo, consapevolmente o inconsapevolmente, che il contributo degli statistici fosse certo importante, ma non a tal punto determinante.

A volte sono eventi apparentemente insignificanti a determinare stravolgimenti che assumono portata storica. Questo è certamente il caso della banale disattenzione, nel quartier generale di Google, che ha portato a conoscenza di tutti la stele policromica con scolpito l’accordo fra le grandi compagnie informatiche. Desta molta sorpresa che proprio l’IT establishment abbia affidato alla pietra il compito di sancire e tramandare il loro fondamentale accordo. Non deve sfuggire però il forte contenuto simbolico di questa scelta, il conteggio e il calcolo sono da sempre una questione strettamente fisica e il termine calcolo deriva proprio dal latino calculus, quindi pietra. Le prime conte della storia furono fatte dai pastori che rappresentavano le pecore con pietre.

A tanti anni di distanza dal Gold standard piombiamo, di fatto, in una Statistical Data epoque. Qualcosa che è capace di sconvolgere dalle fondamenta tutto quello che abbiamo conosciuto fino ad ora, per come lo abbiamo conosciuto.

La stele policromica contiene le tabelle di decodifica e di conversione da petabyte a SKU, l’unità cognitiva statistica standard, definita in base a rigidi criteri, insieme al patto che vincola le grandi compagnie informatiche a detenere in corrispondenza dello storage misurato in petabyte, corrispondenti assets in SKU.

In base a questo accordo le compagnie informatiche non potranno più crescere se non saranno in grado di acquisire o produrre sapere e conoscenza statistica. Pone anche un vincolo allo sviluppo tecnologico complessivo che sarà anch’esso rigidamente legato ad una pari crescita del sapere statistico. Lo stesso messaggio di Hal Varian ben si comprende se si guardano gli alti fattori di conversione da dato statistico a petabyte.

Il dato statistico rappresenta ora la chiave di volta per poter assicurare alla nostra società alti tassi di crescita tecnologica anche nel futuro e, alla luce di queste scoperte, l’impegno congiunto di statistici e informatici per produrre e far fluire dati nella rete è divenuto un obbligo cui nessuno può più esimersi.

…a proposito, giunge ora la notizia che Steve Jobs, per scongiurare una possibile crisi sistemica, sosterrà la crescita tecnologica dei prossimi anni immettendo quantità imponenti di SKU nel sistema. Lancerà il nuovo CensPad già nei prossimi giorni e lo distribuirà ad ogni essere vivente dando così vita al primo censimento continuo planetario

Il Censimento nell’era di YouTube

L’avvio di Census2010, primo censimento statunitense dell’era YouTube, ci proietta inevitabilmente nel vivo di questa nuova tornata censuaria che interesserà via via quasi la totalità dei paesi.

La prima cosa che ci colpisce è il massiccio impiego di nuovi strumenti di comunicazione e di condivisione via web che sembra davvero voler caratterizzare questa tornata. Questa sensazione emerge già da una prima consultazione del sito istituzionale del Census Bureau, ma diventa certezza quando si consulta la pagina che consente di seguire online su mappa i tassi di risposta dei diversi Stati , the Director’s blog, l’ampia sezione informativa, la raccolta di ritratti individuali ricompresi nello storywall.

Lo stesso Presidente Obama ha voluto enfatizzare in un video quanto sia importante partecipare al censimento.

Su YouTube la community gli fa eco rimbalzando video che suggeriscono ai censiti improbabili tattiche di smarcamento dai rilevatori per fronteggiare e sfuggire alla loro invadenza, ma al dunque testimoniano un interesse insolito per il nuovo censimento. E’ possibile ad esempio imbattersi in uno sketch di Saturday Night Live, divenuto un cult, nel quale Tim Meadows e Christopher Walken nel ruolo rispettivamente di rilevatore e intervistato, danno il meglio di loro stessi in un esilarante duetto. Stigmatizzando alcuni dei passaggi più pregnanti “Don’t push your politics on me, pal” “Well, what do most people say?”, ne consiglio vivamente la visione a chi già non lo conosce

Significativa anche la volontà di essere contati che emerge da più parti. In una sezione multimedia dello stesso sito sono ospitati video autogestiti dalle comunità per sottolineare e spingere gli appartenenti a rispondere al censimento e a dichiarare correttamente la loro appartenenza, come nel caso delle comunità LGBT.

Sempre su YouTube le diverse comunità sono presenti con molti spot che sottolineano l’importanza di partecipare per essere adeguatamente rappresentati nel censimento. Questo è, ad esempio, il caso del video della comunità taiwanese, ma anche improbabili e irriverenti video di appartenenti alla comunità iraniana che prefigurano scenari davvero inquietanti.

[youtube]http://www.youtube.com/watch?v=TN5TcRGHuZ4&NR=1[/youtube]