Category: Interviste, Recensioni, Riflessioni

Facebook e i buoni sentimenti

Può emergere la felicità di una nazione nelle pagine di facebook? Pare proprio di si.

Questo almeno è il tentativo portato avanti da alcuni studiosi. Il progetto è ambizioso e fa parte di un più grande e strutturato movimento denominato Gross National Happiness Movement (tradotto suona come Movimento della Felicità Interna Lorda).

Le frasi/emozioni condivise dagli utenti di facebook ogni giorno sulla loro homepage o su quella degli amici sono “piccole finestre sulle attività eseguite quotidianamente” e sono indicatori di come la comunità si sente collettivamente”. La metodologia per cercare la felicità di una nazione è allora molto semplice. I giorni in cui le persone usano molte parole positive (o meno parole negative) nei loro aggiornamenti di stato sono considerati come giorni “più felici” degli altri: tutto ciò è calcolato attraverso un indice, il Gross National Happiness Index (GNH, in italiano FIL, indice della Felicità Interna Lorda).

Il calcolo dell’indice è iniziato già nel settembre 2008 attraverso la raccolta delle parole positive e negative degli utenti di lingua inglese degli Stati Uniti. Ben presto sono stati calcolati anche gli indici per l’UK, l’Australia e il Canada.. La privacy è, come è giusto, tutelata: i calcoli sono affidati unicamente ai calcolatori e le informazioni personali vengono rimosse precedentemente.

Il GNH, a tutt’oggi, è calcolato per 22 nazioni. Le lingue supportate sono l’inglese (9 nazioni), l’olandese (2 nazioni), il tedesco (2 nazioni), l’italiano (solo per l’Italia) e lo spagnolo (8 nazioni). Sono state scelte queste lingue per l’ampio numero di frasi salvate in modo da poter costruire un indice corretto e non affetto da errori sistematici. Alla base dell’indice è presente un dizionario (validato per ogni lingua che riconosce e distingue le parole positive e quelle negative) e un software che esegue la scansione (il software è disponibile a pagamento alla pagina http://www.liwc.net/ dove è anche possibile analizzare gratuitamente un testo in lingua inglese; mentre attraverso il sito http://analyzewords.com/ si può fare una scansione delle parole usate in un profilo Twitter).

Il valore del GNH viene riportato attraverso un grafico nella pagina dell’applicazione di facebook (http://apps.facebook.com/gnh_index/). Sono presenti diversi parametri: l’indice di positività, l’indice di negatività e il GNH. L’indice di positività rappresenta la componente di parole positive usate e l’indice di negatività rappresenta la componente di parole negative usate. Il GNH è calcolato come differenza tra i punteggi positivi e quelli negativi.

Emergono alcune caratteristiche interessanti, forse ovvie ma a cui non si pensa se non stimolati da uno studio di questa portata. Il GNH segue un ciclo più o meno settimanale in tutte le nazioni con picchi positivi o negativi in coincidenza di particolari eventi o festività. Ciclicamente, i giorni con più sentimenti positivi sono il sabato e la domenica. In una analisi di lungo periodo i giorni maggiormente “felici” sono Natale, Capodanno e San Valentino. In Italia risultano particolarmente felici anche il giorno della festa della donna e il periodo di Pasqua. In Spagna il giorno di San Jordi (23 aprile). Negli Stati uniti il giorno del Ringraziamento e il giorno del Super Bowl. La politica, il terrorismo, le catastrofi naturali scuotono i cittadini che manifestano la loro paura anche su facebook. Così sono emersi sentimenti negativi in India in occasione dell’attacco terroristico del novembre 2008, e in Cile dopo il terremoto del febbraio 2010. Anche lo sport influisce in maniera importante sulla “felicità” del giorno: eventi come l’eliminazione dell’Irlanda dai mondiali di calcio o il suicidio di Robert Enke in Germania hanno portato un aumento di sentimenti negativi.

Come avranno reagito gli italiani il 24 giugno dopo l’eliminazione dell’Italia dai mondiali?

Per saperne di più:

http://blog.facebook.com/blog.php?post=387623222130

http://www.nytimes.com/2009/10/12/technology/internet/12link.html?_r=2

Adam D. I. Kramer, An unobtrusive behavioral model of “gross national happiness”, Proc. CHI, 2010, ACM Press

La componente tecnologica nei progetti di dematerializzazione

La dematerializzazione di documenti, flussi documentali ed archivi rappresenta un asset strategico nella prospettiva dell’innovazione della Pubblica Amministrazione italiana, nell’ambito del più ampio obiettivo dello sviluppo complessivo del “Sistema Paese” perseguito dal Piano E-GOV 2012.

In coerenza con la logica GOV 2.0 (l’applicazione delle tecnologie del Web 2.0 alle procedure amministrative) la dematerializzazione supporta l’interoperabilità tra P.A., imprese e cittadini, e contribuisce inoltre alla realizzazione di ingenti risparmi di risorse e di tempo.

Sul fronte normativo il legislatore ha già da anni regolamentato l’utilizzo di sistemi documentali dematerializzati. Eppure, allo stato attuale, nell’ambito della Pubblica Amministrazione, solo in casi rari sono stati realizzati sistemi in grado di sostanziare le normali procedure amministrative, razionalizzare la gestione dell’informazione, gestire i sistemi documentali e gli archivi digitali, garantire le interazioni tra le diverse componenti della P.A. e tra questa e i cittadini.

È, spesso, mancata la governance di questi progetti, determinata anche da un diffuso errore concettuale in fase di progettazione che può essere definito come l’effetto distorsivo della componente tecnologica. In altri termini, l’introduzione di un sistema documentale dematerializzato è stata gestita, in troppe occasioni, come progetto informatico e non di innovazione organizzativa, con riferimento sia ai componenti del team di progetto sia al piano delle attività.

L’effetto distorsivo è ingenerato dalla rilevanza e complessità della componente tecnologica nella realizzazione di tali progetti. Essi richiedono infatti: solide architetture infrastrutturali per la gestione dei flussi documentali; applicazioni certificate per la conservazione della documentazione digitale; rispetto dei requisiti tecnici per la garanzia della produzione, validazione, trasmissione e conservazione di documenti giuridicamente validi; garanzia dell’identificazione e classificazione dei documenti gestiti; accessibilità nel tempo, leggibilità ed intelligibilità della documentazione gestita; garanzia di inalterabilità dei contenuti informativi e metatestuali nella trasformazione del sistema documentario da cartaceo in digitale; automazione delle attività di acquisizione, organizzazione e scambio dei documenti in archivio; integrazione tra flussi amministrativi e documentali; tracciabilità e trasparenza dell’attività amministrativa.

Alcune conseguenze di questo effetto distorsivo sono di seguito sinteticamente rappresentate.

L’obiettivo, ambizioso, di tali tipologie progettuali, nell’ambito della P.A., non è la mera digitalizzazione dei documenti bensì, il più complesso intervento di semplificazione dei processi e di diminuzione delle fasi e dei passaggi del processo decisionale per supportare la corretta gestione del sistema documentario – in tutte le fasi del ciclo di formazione, gestione e conservazione permanente – con la funzione di garantire l’affidabilità dei documenti e conseguentemente la certezza del diritto. L’oggetto della dematerializzazione deve quindi necessariamente coprire: il contenuto dei documenti amministrativi, prevedendo soluzioni in grado di gestire sia i documenti (nativi informatici e cartacei) sia i flussi documentali; la gestione dei contenuti, mediante strumenti in grado di supportare i processi di condivisione della conoscenza e conservazione della memoria [Figura I].

Fig. I – Il contenuto e la gestione del contenuto

In molti casi però l’attenzione è focalizzata sullo sviluppo di singole componenti non integrate del sistema: protocollo elettronico, flussi documentali automatizzati, posta elettronica certificata. Ne consegue la parziale copertura del sistema di gestione documentale che, finisce per essere circoscritto a specifici ambiti settoriali a valenza interna (protocollo elettronico, ordinativo informatico, automazione di alcune fasi di processo, firma digitale, ecc.) o limitatamente con rilevanza esterna (es. domande di concorso). Viene a mancare, pertanto, la visione sistematica che lo renderebbe in grado di supportare le ordinarie procedure amministrative, razionalizzare la gestione dell’informazione, le interazioni tra le diverse componenti della P.A. e tra questa e i cittadini [Figura II], determinando così una vera e propria modificazione degli effetti finali.

Fig. II – Livelli di copertura della gestione documentale

Fonte: E. Massella Ducci Teri [2009] – Cnipa

L’attenzione alla componente tecnologica distoglie, inoltre, l’attenzione all’impatto organizzativo di tali sistemi. Disattenzione che produce effetti sull’efficacia dei progetti, la funzionalità dei sistemi realizzati e la corretta definizione dei rischi di progetto.

Dal punto di vista dell’efficacia dei progetti, la mancata previsione di adeguate iniziative di formazione, comunicazione, di forte leadership e sponsorizzazione, in altri termini di iniziative di gestione dell’innovazione, possono contribuire ad alimentare i naturali meccanismi di resistenza all’innovazione.

Con riferimento alle funzionalità, i sistemi documentali dematerializzati richiedono come presupposto imprescindibile la chiara definizione delle attribuzioni alle strutture organizzative (competenze e responsabilità); la quantificazione dei volumi documentali; l’analisi e la rappresentazione dei flussi documentali interni ed esterni; il ridisegno dei processi organizzativi; la definizione delle procedure di archiviazione e conservazione, individuazione del responsabile della conservazione sostitutiva.

Inoltre, tali carenze producono un ulteriore effetto in termini di errata definizione dei rischi specifici di progetto a causa della sottovalutazione di componenti quali la resistenza al cambiamento e la mancanza di leadership che viceversa, come evidenziato nella Figura III, rappresentano i fattori di rischio con maggiore impatto.

Fig. III – Individuazione del livello del rischio

Fonte: Accenture [2008]

Appare evidente, quindi, come solo una grande attenzione alla componente organizzativa – già a partire dalla fase progettuale – possa influire positivamente sulle probabilità di successo dei progetti di dematerializzazione e sulla efficacia ed efficienza dei sistemi, una volta adottati.

La policromica convertibilità della conoscenza statistica in petabyte

Dal giorno del suo ritrovamento la stele policromica continua a catalizzare l’attenzione dei media e a destare l’interesse di studiosi e commentatori che trovano via via nuovi spunti e nuovi percorsi interpretativi.

Intanto ci propone un paradigma di commensurabilità fra enti che fino a poco tempo prima erano, nel nostro immaginario, così distanti: da un lato la conoscenza statistica, così immateriale e impalpabile, e dall’altro la capacità di storage, così pesantemente fisica e materiale.

La prima convinzione che è posta in discussione da questa scoperta è quella dell’inarrestabilità del progresso informatico, capace sempre e solo di superare se stesso in un progredire senza fine. La seconda è quella della capacità del sapere di essere comunque capace di fluire, aumentare ed adeguarsi ai via via più ampi spazi offerti dalla crescita della rete.

Hal Varian nel 2008 sorprese tutti quando affermò con convinzione che il mestiere dello statistico stava per divenire il lavoro più sexy del nuovo decennio, soppiantando di fatto la grande supremazia degli ingegneri informatici del decennio precedente. Oggi ci è del tutto evidente come lui dovesse essere a conoscenza di fatti dei quali noi tutti allora eravamo tenuti all’oscuro.

Con Daniele Frongia ed Eric Sanna abbiamo sostenuto, in Statistics and Web: Who needs Who?,  lavoro presentato alla XLV Riunione Scientifica della Società Italiana di Statistica 2010 di Padova, la necessità di un maggiore cointeressamento reciproco fra statistici e informatici, pur se ancora ignari di quello che si celava.

Ma allora noi tutti ritenevamo, consapevolmente o inconsapevolmente, che il contributo degli statistici fosse certo importante, ma non a tal punto determinante.

A volte sono eventi apparentemente insignificanti a determinare stravolgimenti che assumono portata storica. Questo è certamente il caso della banale disattenzione, nel quartier generale di Google, che ha portato a conoscenza di tutti la stele policromica con scolpito l’accordo fra le grandi compagnie informatiche. Desta molta sorpresa che proprio l’IT establishment abbia affidato alla pietra il compito di sancire e tramandare il loro fondamentale accordo. Non deve sfuggire però il forte contenuto simbolico di questa scelta, il conteggio e il calcolo sono da sempre una questione strettamente fisica e il termine calcolo deriva proprio dal latino calculus, quindi pietra. Le prime conte della storia furono fatte dai pastori che rappresentavano le pecore con pietre.

A tanti anni di distanza dal Gold standard piombiamo, di fatto, in una Statistical Data epoque. Qualcosa che è capace di sconvolgere dalle fondamenta tutto quello che abbiamo conosciuto fino ad ora, per come lo abbiamo conosciuto.

La stele policromica contiene le tabelle di decodifica e di conversione da petabyte a SKU, l’unità cognitiva statistica standard, definita in base a rigidi criteri, insieme al patto che vincola le grandi compagnie informatiche a detenere in corrispondenza dello storage misurato in petabyte, corrispondenti assets in SKU.

In base a questo accordo le compagnie informatiche non potranno più crescere se non saranno in grado di acquisire o produrre sapere e conoscenza statistica. Pone anche un vincolo allo sviluppo tecnologico complessivo che sarà anch’esso rigidamente legato ad una pari crescita del sapere statistico. Lo stesso messaggio di Hal Varian ben si comprende se si guardano gli alti fattori di conversione da dato statistico a petabyte.

Il dato statistico rappresenta ora la chiave di volta per poter assicurare alla nostra società alti tassi di crescita tecnologica anche nel futuro e, alla luce di queste scoperte, l’impegno congiunto di statistici e informatici per produrre e far fluire dati nella rete è divenuto un obbligo cui nessuno può più esimersi.

…a proposito, giunge ora la notizia che Steve Jobs, per scongiurare una possibile crisi sistemica, sosterrà la crescita tecnologica dei prossimi anni immettendo quantità imponenti di SKU nel sistema. Lancerà il nuovo CensPad già nei prossimi giorni e lo distribuirà ad ogni essere vivente dando così vita al primo censimento continuo planetario

One Book, One Twitter

Jeff Howe, collaboratore di Wired, in un articolo del 2006, conia il termine crowdsourcing e nel 2008 pubblica il libro Crowdsourcing. How the Power of the Crowd Is Driving the Future of Business (la copertina dell’edizione 2008 è il risultato di una gara che Howe ha lanciato su internet per trovare l’idea che meglio rappresentasse il suo libro). Nel 2010 – crowdsourcing è una delle parole chiave del web, è presente in tutte le tag cloud – Howe ha lanciato One Book, One Twitter: un invito alla popolazione mondiale del web a leggere, in contemporanea, un romanzo e a commentarlo su Twitter a colpi di 140 caratteri. Ci sono state le nomination, poi le votazioni e, alla fine, American Gods di Neil Gaiman è diventato l’one book del 2010. L’idea di Jeff Howe non è originale. One Book, One City si svolge a Seattle e a Chicago fin dagli anni Novanta e la Library of Congress – che ospita nelle sue pagine la storia dell’iniziativa – ha censito più di 400 programmi nel 2007. Dal 2001 anche Dublino organizza l’iniziativa che, quest’anno, ha scelto Il ritratto di Dorian Gray come il libro da leggere tutti insieme, contemporaneamente. Originale, dunque, no, ma nuova e divertente si: invece dei cittadini di Chicago ci sono i cittadini del web e invece delle recensioni sui blog, sui siti, su Anobii c’è l’invito a rilasciare impressioni immediate e veloci, da condividere strada facendo – con la preghiera di non rivelare i risvolti e l’andamento della storia, anche se American Gods non è un giallo, ma un romanzo fantastico, dove, come dice Gaiman, nell’Avvertenza per i viaggiatori “…Va da sé che tutte le persone, vive o morte, nominate nel libro, sono frutto della mia immaginazione, oppure usate in modo immaginario. Soltanto gli dèi sono reali”.  E gli dèi, insieme agli uomini, sono protagonisti di una storia avvincente, ricca di colpi di scena, dai risvolti imprevedibili e appassionanti. Insomma, abbinare un libro a Twitter sarà pure una trovata pubblicitaria per vendere più copie – difficile sottrarsi alla tentazione di leggere il libro per partecipare a un esperimento collettivo, mondiale – ma è anche la conferma, se ancora ce ne fosse bisogno, che internet fa leggere più libri, su carta o su ipad non importa, e non ruba tempo alla lettura. Per commentare il libro bisogna avere un account su Twitter e utilizzare la chiave #b1t1

Il futuro è mobile

Prendete nota e segnatevi da qualche parte l’anno 2013. E’ ormai considerato da tutti i maggiori osservatori e protagonisti degli scenari IT un anno chiave per il Web. In quell’anno si stima infatti che il numero di PC nel mondo raggiungerà gli 1,78 miliardi mentre gli smartphone e gli altri dispositivi mobili saranno qualcosa come 1 miliardo e 820 milioni (fonte Gartner). In altre parole, il 2013 viene ormai indicato come l’anno del “sorpasso”. L’anno cioè in cui il numero di dispositivi “mobili”  supererà il numero dei PC “tradizionali”. Da quel momento in poi, il loro numero continuerà a crescere inesorabilmente. Una buona  parte di questi saranno smartphone. A questo proposito,  sempre Gartner evidenzia come solo nel primo trimestre del 2010 la vendita di questo tipo di dispositivi sia cresciuta di ben il 17% rispetto allo stesso periodo dell’anno precedente.

Lo stesso Google, per bocca di John Herlihy, (Vice Presidente, Global Ad Operations) ha in più occasioni sottolineato che “Tra tre anni, i PC desktop saranno irrilevanti. In Giappone, la maggior parte delle ricerche su Web è fatta utilizzando gli smartphone, non i PC”.

In ogni caso, la tendenza è ormai chiara. I dispositivi mobili saranno sempre più il mezzo attraverso il quale il mondo intero consumerà l’informazione e l’intrattenimento. E questo ci porta a fare alcune considerazioni.

La prima è che ormai non ha più senso pensare ai siti Web soltanto in chiave Desktop. I nuovi siti Web devono necessariamente essere progettati in modo tale da essere “multichannel”, in modo che servizi e contenuti possano essere accessibili indifferentemente sia da PC che da dispositivi mobili. Questo ovviamente vale anche per i siti Web esistenti che dovranno in qualche modo convergere inevitabilmente anche verso soluzioni “mobile”. Per fare ciò bisognerà tenere conto di alcune caratteristiche intrinseche di questi dispositivi, come ad esempio le dimensioni ridotte dello schermo, il fatto che non è previsto il mouse e il fatto che l’interazione con l’utente avviene sempre più attraverso i display “touch screen”. Non ultima la questione, ancora aperta, che riguarda le diverse posizioni dei vari produttori sul fatto di supportare o meno le applicazioni Flash.

I dispositivi mobili “aprono” poi ad una interessante categoria di applicazioni. Buona parte degli smartphone sono infatti dotati di antenna GPS. Sono pertanto dispositivi che possono rilevare la loro posizione e sulla base di questa agire in modo adeguato con l’utente (Location Sensing). L’applicazione per Iphone “AroundMe” consente di cercare alberghi, ristoranti, ospedali, taxi o altri servizi che si trovano nelle vicinanze del luogo in cui ci troviamo in quel momento. Ma possiamo andare oltre e immaginare, perchè no, applicazioni che ci fanno conoscere ad esempio la popolazione o alcuni indicatori economici del posto dove ci troviamo. L’informazione statistica che così viene “spezzata” per diventare informazione “di massa” ed essere resa facilmente fruibile da tutti. La questione è piuttosto interessante e articolata. Mi riprometto di ritornare su questo punto con un articolo ad hoc.

Nel frattempo, se avete con voi un iPhone o un BlackBerry, provate a collegarvi a SegnalazionIT.

I Censimenti e la nascita dell’Information Technology 2

I progettisti dello UNIVAC, due professori dell’Università di Pennsylvania di nome J. Presper Eckert e John Mauchly,   . . .   si resero conto che affinchè un calcolatore elettronico fosse in grado di memorizzare le istruzioni per l’uso nella propria memoria, lo si sarebbe dovuto programmare per eseguire molte funzioni. Non sarebbe stato semplicemente un calcolatore, limitato a svolgere procedure matematiche predefinite. Sarebbe diventata una tecnologia di uso generale, una macchina per tutti i mestieri, che le aziende avrebbero applicato non solo per lavori di contabilità di tutti i giorni, ma per innumerevoli compiti gestionali e di analisi. In una nota del 1948, Mauchly elencò quasi due dozzine di aziende, agenzie governative e università che pensavano di essere in grado di fare un buon uso dello UNIVAC. Come si è scoperto, il mercato provò che si trattava di un affare molto più grande di quanto ci si sarebbe aspettato.

Ad aprire la strada nell’adottare le nuove e potenti macchine fu, ancora una volta, lo U.S. Census Bureau. Il 31 marzo 1951, acquistò il primo UNIVAC e lo installò un anno dopo, nel suo quartier generale di Washington DC. Entro la fine del 1954, i computer di Eckert e Mauchly erano in funzione negli uffici di dieci società private, tra cui General Electric, US Steel, Du Pont, Metropolitan Life, Westinghouse, e Consolidated Edison, che derivava dalla Thomas Edison Edison Electric Illuminating Company. UNIVAC eseguiva tutti i lavori che prima erano realizzati con i tabulatori a schede perforate -fatturazione, gestione delle buste paga, contabilità- ma furono anche utilizzati per attività molto complesse quali le previsioni di vendita, le programmazioni di produzione, le gestioni degli inventari. In breve tempo, lo scetticismo sul ruolo dei computer nel mondo degli affari si trasformò in entusiasmo dilagante. “L’utopia della produzione automatica è di per sé plausibile” proclamò la Harvard Business Review nell’estate del 1954.

E questo, dopo il primo, era un ulteriore estratto dal capitolo 3, Digital Millwork, dell’imperdibile libro di Nicholas Carr, The Big Switch. La traduzione approssimativa è del sottoscritto, nella foto un modellino dello UNIVAC del 1951.

I Censimenti e la nascita dell’Information Technology

All’inizio del XX secolo le grandi compagnie avevano iniziato la riconversione delle loro macchine industriali funzionanti con la corrente elettrica fornita dalle centrali (anziché prodotta in proprio, ndt). Avevano anche iniziato ad installare una macchina elettrica di tipo molto differente, che processava informazioni anzichè materiali e veniva fatta funzionare da impiegati anziché dalla manodopera. La macchina era la tabulatrice a schede perforate, inventata nei primi anni dopo il 1880 dall’ing. Hermann Hollerit allo scopo di automatizzare il Censimento americano. Lavorava secondo un semplice principio: facendo dei fori in certe posizioni di una scheda cartacea, si potevano memorizzare informazioni. Una singola scheda censimento, ad esempio, poteva contenere tutti i dati di una famiglia. Un foro in un certo settore della scheda indicava che la famiglia aveva tre figli, mentre un foro in un altro settore indicava che la famiglia viveva in appartamento. Ponendo la scheda sopra una piastra carica elettricamente nella macchina di Hollerit e abbassando una griglia di sottili aghi metallici su di essa, in corrispondenza del foro la corrente fluiva fra l’ago e la piastra, chiudeva un circuito e faceva sì che l’informazione memorizzata nella scheda venisse registrata da un contatore. Era un sistema binario -poteva esserci un foro in una data posizione della scheda oppure no- che anticipava le operazioni binarie degli odierni computer. Il tabulatore a schede perforate fu venduto, si diffuse e avrebbe poi rappresentato un modello per tutta la storia moderna dei computer aziendali.

Lo U.S. Census Bureau utilizzò la macchina di Hollerith per il Censimento del 1890, con grande successo. Il conteggio procedette molto più rapidamente di quanto non fosse avvenuto nel 1880, anche se la popolazione del paese era cresciuta di circa un quarto nel frattempo. Il costo del Censimento fu ridotto di 5 milioni di dollari, un risparmio di quasi dieci volte superiore a quello che il Bureau aveva previsto. Dopo aver dimostrato il suo valore per accelerare i calcoli, il tabulatore attirò l’attenzione dei proprietari di aziende di grandi dimensioni come le ferrovie, le agenzie di assicurazioni, banche e produttori del mercato di massa e rivenditori. Poiché queste imprese avevano aumentato la loro attività in seguito alla rivoluzione industriale, lo avevano ritenuto necessario per raccogliere, memorizzare e analizzare quantità sempre maggiore di dati sui loro clienti, le loro finanze, i dipendenti, i loro inventari, e così via. L’elettrificazione permise alle società di crescere ancora, aumentando ulteriormente le informazioni da processare. Questo lavoro intellettuale diventò così importante, e spesso così arduo come il lavoro fisico di fabbricazione di prodotti e servizi di consegna. Il tabulatore di Hollerith permise alle grandi aziende di elaborare le informazioni molto più rapidamente, con meno personale e maggiore precisione di quanto fosse possibile in precedenza.

Vedendo il potenziale commerciale della sua invenzione, Hollerith fondò la Tabulating Machine Company per vendere le sue tabulatrici alle grandi imprese. L’azienda crebbe rapidamente, introducendo una serie di prodotti correlati come tabulatrici alfabetiche, ordinatori di schede, duplicatori di schede e stampanti e vendendo questi ad una clientela sempre più ampia. Nel 1911 la società di Hollerith si fuse con la Computer-Tabulating-Recording Company, una società ancora più grande di fornitura di macchine aziendali. Un giovane manager di talento di nome Thomas J. Watson fu assunto per gestire l’attività. Tredici anni più tardi, l’ambizioso Watson cambiò nome alla società utilizzando la più accattivante denominazione di International Business Machines Corporation. Altre società, come la Remington Rand e Burroughs negli Stati Uniti e Bull in Europa, si lanciarono nel fiorente mercato dei tabulatori, in concorrenza con l’IBM di Watson.

L’industria delle tecnologie dell’informazione era nata.

Questo che avete letto era un estratto dal capitolo 3, Digital Millwork, dell’imperdibile libro di Nicholas Carr, The Big Switch. La traduzione approssimativa è del sottoscritto, nella foto una scheda del Censimento americano del 1890.

Oggi mi sento bene (o male) e lo scrivo sul blog

Yes, I feel fine! Vi sentite bene, così bene da scriverlo sul vostro blog? Attenzione, sarete contati, copiati e postati negli indicatori del benessere. Proprio così. Esistono più siti che navigando nei blog cercano di cogliere la felicità (happiness) istante per istante delle popolazione di utenti di internet. È il caso del sito www.wefeelfine.org, an exploration of human emotion, in six movements creato da Jonathan Harris e Sep Kamvar. Gli autori lo definiscono “un artwork di tutti, che cresce e cambia come cresciamo e cambiamo noi tutti, mostrando cosa c’è nei nostri blog, nei nostri cuori, nelle nostre menti.”

Fin dall’agosto del 2005 questo sito scandaglia le emozioni umane in un grande numero di blog sul web. Come funziona? Un motore automatico ogni 10 minuti controlla i “sentimenti umani” (feelings) cercando le occorrenze delle frasi “I feel” e “I am feeling”. Se il segmento viene trovato, il sistema cerca l’inizio e la fine della frase e inserisce l’intera frase nel database. Una volta salvata, all’interno della frase, vengono riconosciute quelle parole  che manifestano i sentimenti grazie ad un vocabolario di 5.000 “feelings”. Sul sito è possibile scaricare l’intera lista di feelings con i colori associati. Ad ogni feeling/frase catalogata corrisponde un profilo del blogger che ha scritto la frase: da questo profilo vengono estratte le informazioni strutturali come il sesso, l’età, la nazione, lo stato, la città, il clima. Le fonti dal web sono varie e includono LiveJournal, MSN Spaces, MySpace, Blogger, Flickr, Technorati, Feedster, Ice Rocket, e Google. Il processo di raccolta e catalogazione si ripete ogni 10 minuti e assembla dai 15.000 ai 20.000 feelings al giorno. Wefeelfine colleziona soltanto i post liberamente pubblicati e visibili sul web. L’anonimato della frase è sempre garantito, ma se qualcuno, per eccesso di riservatezza, non vuole far comparire i propri sentimenti può inserire nel suo post <script>nofeelings</script>.

Nessuna pretesa di significatività statistica, però l’approccio statistico è, in qualche modo, salvaguardato dall’accortezza di contare i feelings (identici) di un blogger una volta sola (e non tutte le volte che riscrive la stessa frase) e dalla presenza di una soglia di almeno 4 occorrenze per definire saliente un sentimento per una popolazione. Gli autori distinguono, infatti, tra i feelings “most Common”, ossia i sentimenti più diffusi in base alle occorrenze calcolate su qualsiasi popolazione, e i feelings “most Salient”, ossia quei sentimenti calcolati su una particolare popolazione e definiti più significativi rispetto al loro scarto dalla media globale.

Fin qui la parte statistico-informatica: la disseminazione delle informazioni avviene, invece, attraverso varie e affascinanti piattaforme artistiche. L’approccio è quello del Listening Post di Ben Rubin and Mark Hansen (http://www.earstudio.com/projects/listeningpost.html – il Listening Post è una installazione artistica che raccoglie in tempo reale frammenti di frasi scritte in chat e in forum su internet. Il testo viene letto da un sintetizzatore vocale e simultaneamente videato su 200 piccoli schermi).

Sei sono i movimenti con i quali è possibile esplorare il database: Madness, Murmurs, Montage, Mobs, Metrics, and Mounds. È possibile muoversi da un movimento all’altro e metterli in connessione. Il mouse, inoltre, è sempre uno strumento interattivo con i grafici e le figure sullo schermo in tutti e 6 i movimenti.

Il più interessante è sicuramente  Madness: una massa di 1.500 particelle colorate che ruotano e si muovono sullo schermo, sensibile al passaggio e al click del mouse. Ogni particella rappresenta un feeling postato, di forma rotonda per le frasi, di forma quadrata per le immagini. Ogni colore indica una tonalità di feeling (la felicità è gialla brillante, la tristezza è blu scura, la rabbia è rossa, la serenità è verde….); la grandezza rappresenta la lunghezza della frase. Basta un click per leggere la frase nella sua interezza, o vedere l’immagine associata.

Un altro movimento da esplorare è Mounds. Mounds mostra tutti I feelings registrati nel database. Ogni feeling è rappresentato da una montagna colorata. La grandezza della montagna rappresenta la forza di questo sentimento. Così scopriamo che, fino a questo istante, il sentimento più diffuso è “better”, mi sento bene, mi sento meglio, postato da 128.155 persone, seguito da “bad”, mi sento male, mi sento triste, postato da 93.390 persone. Poi seguono “good”, “right”, “guilty”, “sick”, “same”, “shit”, “sorry”, “well” e così via.

Gli Europei sono più felici degli Americani? Tra gli uomini e le donne chi manifesta di più i propri sentimenti? Come si sentono in questo istante i newyorkesi? Chi è triste e chi è allegro? Questo è wefellfine. È anche però un modo innovativo e creativo, certamente non esaustivo e convenzionale, per guardare alla felicità e al benessere degli individui.

Il futuro della statistica ufficiale: il ruolo dell’ICT

Istat – Indagine multiscopo – Cittadini e nuove tecnologie – Persone di 6 anni e più che hanno utilizzato Internet negli ultimi 3 mesi per attività svolta. Anni 2008 e 2009 (per 100 persone di 6 anni e più che hanno utilizzato Internet negli ultimi 3 mesi).

Venerdì 19 Marzo si è tenuto il Comitato Informatico dell’Istituto Nazionale di Statistica, del quale fanno parte i referenti informatici di tutte le strutture organizzative dell’Istat. Pur essendo il Comitato un organo consultivo interno ritengo che siano emersi numerosi ed interessantissimi spunti di riflessione, che vale la pena di condividere con una platea più ampia, anche a testimoniare lo sforzo che l’intero Istituto sta compiendo verso una Information & Communication Technology a supporto dei processi di produzione statistica e di messa a disposizione dei dati per la comunità nazionale ed internazionale.

Riassumo sinteticamente alcuni dei principali temi trattati.

È stata appena avviata una fase di forte investimento e rilancio delle Strutture Territoriali dell’Istat mirata anche a favorire una maggiore integrazione con le strutture del Sistema Statistico Nazionale e superare definitivamente la dicotomia centro-periferia. Su questa base andrà consolidato l’attuale modello organizzativo di informatica a rete presente in Istituto, immaginando di creare nel tempo una analoga rete di esperti informatici del Sistan.

L’ICT sarà di fondamentale importanza nel prossimo futuro, costituirà la base sulla quale si fonderà tutta l’attività dell’Istituto. Anche per questo motivo sono stati avviati degli incontri con i principali Presidenti delle grandi aziende che controllano le infrastrutture telematiche italiane; si prevede di organizzare con essi dei seminari in Istituto, al fine di confrontarsi e ragionare insieme sui futuri possibili.

Riguardo alla comunicazione istituzionale è in corso di attivazione una importante iniziativa, la creazione di una newsletter Istat tramite la quale apprendere via email le notizie che riguardano le iniziative e le attività dell’Istituto.

È in corso di completamento la prima fase del progetto I.Stat, il nuovo data warehouse di Istituto nel quale stanno convergendo i dati provenienti da tutti i settori di produzione statistica. Si tratta di un progetto molto complesso, al quale stanno lavorando oltre 60 persone, di fondamentale importanza per gli utenti esterni dell’Istat, che potranno disporre di un unico punto di accesso ai dati, con la possibilità di creare tavole tematiche ad hoc. I.Stat consentirà inoltre l’interrogazione machine-to-machine in maniera tale da fornire una sorgente dati in Internet, capace di alimentare nello stesso modo il sito Istat o altri sistemi di soggetti terzi che vogliano utilizzare i dati Istat nei propri siti Internet.

La prossima Conferenza Nazionale di Statistica si terrà a Roma il 15 e 16 Dicembre. Si sta quindi affrontando il tema della sua organizzazione e delle tematiche da approfondire: in tale ambito si è ribadita l’importanza dell’evento e la necessità di darle un nuovo impulso. Una idea forte, di fondo, è senz’altro quella di riportare la Conferenza ad essere una due giorni del Sistan, di tutta la statistica nazionale, magari anche attivando iniziative locali con i nodi territoriali del Sistan che hanno difficoltà ad essere presenti a Roma. In quella sede sarà importante il coinvolgimento di soggetti esterni al mondo della statistica, che però hanno sviluppato metodi, tecniche, strumenti informatici che possono essere impiegati nella statistica. Altrettanto importante sarà l’aprire la Conferenza al contesto internazionale, ad esempio mostrando iniziative nel campo ICT come l’utilizzo di PDA (Personal Digital Assistant) nell’ambito delle rilevazioni statistiche.

Sui temi da portare alla prossima Conferenza Nazionale di Statistica si è avviata in Istat una riflessione ampia e aperta ad iniziative innovative. Il nostro blog può essere un utile supporto per proporre nuove idee che abbiano un legame col settore ICT.

Il Censimento nell’era di YouTube

L’avvio di Census2010, primo censimento statunitense dell’era YouTube, ci proietta inevitabilmente nel vivo di questa nuova tornata censuaria che interesserà via via quasi la totalità dei paesi.

La prima cosa che ci colpisce è il massiccio impiego di nuovi strumenti di comunicazione e di condivisione via web che sembra davvero voler caratterizzare questa tornata. Questa sensazione emerge già da una prima consultazione del sito istituzionale del Census Bureau, ma diventa certezza quando si consulta la pagina che consente di seguire online su mappa i tassi di risposta dei diversi Stati , the Director’s blog, l’ampia sezione informativa, la raccolta di ritratti individuali ricompresi nello storywall.

Lo stesso Presidente Obama ha voluto enfatizzare in un video quanto sia importante partecipare al censimento.

Su YouTube la community gli fa eco rimbalzando video che suggeriscono ai censiti improbabili tattiche di smarcamento dai rilevatori per fronteggiare e sfuggire alla loro invadenza, ma al dunque testimoniano un interesse insolito per il nuovo censimento. E’ possibile ad esempio imbattersi in uno sketch di Saturday Night Live, divenuto un cult, nel quale Tim Meadows e Christopher Walken nel ruolo rispettivamente di rilevatore e intervistato, danno il meglio di loro stessi in un esilarante duetto. Stigmatizzando alcuni dei passaggi più pregnanti “Don’t push your politics on me, pal” “Well, what do most people say?”, ne consiglio vivamente la visione a chi già non lo conosce

Significativa anche la volontà di essere contati che emerge da più parti. In una sezione multimedia dello stesso sito sono ospitati video autogestiti dalle comunità per sottolineare e spingere gli appartenenti a rispondere al censimento e a dichiarare correttamente la loro appartenenza, come nel caso delle comunità LGBT.

Sempre su YouTube le diverse comunità sono presenti con molti spot che sottolineano l’importanza di partecipare per essere adeguatamente rappresentati nel censimento. Questo è, ad esempio, il caso del video della comunità taiwanese, ma anche improbabili e irriverenti video di appartenenti alla comunità iraniana che prefigurano scenari davvero inquietanti.

YouTube Preview Image