Visualizzazione degli algoritmi online

Stanchi del solito Web 2.0? Stufi degli ormai triti e ritriti strumenti di data visualization? E’ ora di mettere online qualcosa di serio: gli  algoritmi.  In questo articolo (scritto con Fabio Crescenzi, Aleksey Ioannovich ed Eric Sanna) partiamo dalle origini, dalla macchina di von Neumann, per arrivare fino ad un risultato a nostro avviso importante, o quanto meno interessante. Enjoy it!

A Visualization of Online Algorithms

Aleksey Ioannovich, Eric Sanna, Fabio Crescenzi and Daniele Frongia

Abstract

Researchers agree that extensible configurations are an interesting new topic in the field of parallel random mutually exclusive disjoint theory, and experts concur. In this paper, we prove the construction of von Neumann machines. We describe new ambimorphic symmetries, which we call Glead.

Table of Contents

1) Introduction

2) Related Work

2.1) Extreme Programming2.2) Local-Area Networks

3) Methodology
4) Implementation
5) Results and Analysis

5.1) Hardware and Software Configuration5.2) Dogfooding Glead

6) Conclusion

A Visualization of Online Algorithms

Aleksey Konstantinovich Ioannovich, Eric Sanna, Fabio Crescenzi and Daniele Frongia

Abstract

Researchers agree that extensible configurations are an interesting new topic in the field of parallel random mutually exclusive disjoint theory, and experts concur. In this paper, we prove the construction of von Neumann machines. We describe new ambimorphic symmetries, which we call Glead.

Table of Contents

1) Introduction
2) Related Work

3) Methodology
4) Implementation
5) Results and Analysis

6) Conclusion

Il successo di un sito web? Non solo una questione di traffico

Qualche giorno fa SIS Magazine (la rivista online della Società Italiana di Statistica) ha pubblicato il mio articolo Il successo di un sito web? Non solo una questione di traffico: i casi Istat, SIS e Sistan (*) sui nuovi metodi e strumenti per misurare il successo di un sito.

Nell’articolo studio il caso di tre siti che si occupano di statistiche ufficiali e di promozione delle scienze statistiche: l’Istituto Nazionale di Statistica, il Sistema Statistico Nazionale e la Società Italiana di Statistica, siti che nel medio periodo verranno profondamente rinnovati. Come? Certamente si arricchiranno di nuovi servizi (in salsa Web 2.0 – lo so, il termine è un po’ inflazionato ma almeno ci capiamo), come ad esempio quelli di cui abbiamo parlato in questo blog e che sono da tempo in produzione in altri paesi: nuove tecnologie per la diffusione e la condivisione di dati, tool di visualizzazione interattiva (anche esterni al sito, come nel caso di Google Public data) e altro ancora su cui torneremo nelle prossime settimane.

Ma come misurare e dunque valutare l’introduzione di un nuovo servizio? Semplicente registrando le variazioni del traffico sul sito? Anche se prodotti per il monitoraggio del traffico come AWStats e Google Analytics offrono informazioni molto importanti (indispensabili), oggi esiste una nuova generazione di strumenti per misurare il successo di un sito che tengono meglio conto della sua natura multidimensionale. In particolare possiamo vedere il successo di un sito in funzione, oltre che del traffico, anche del suo posizionamento nella rete ovvero della sua solidità di carattere “infrastrutturale”. Il posizionamento è dunque uno dei presupposti per un successo solido e duraturo del sito e quindi anche per valutare l’eventuale miglioramento dopo l’introduzione di nuovi servizi online.

Per misurare il posizionamento e dunque l’efficacia di un sito, di pagine specifiche, di campagne di comunicazione e anche per l’analisi della reputazione sul Web, sono disponibili diversi strumenti. Io ho provato ad utilizzare CONDOR (il software del MIT mostrato nell’articolo) nel 2008, con Francesca Grippa, per monitorare il comportamento dei media durante le elezioni statunitensi, e i risultati sono stati soddisfacenti.  CONDOR consente inoltre di identificare la blogosfera di riferimento di un sito, cioè l’insieme dei blog che citano un determinato sito attraverso un collegamento ipertestuale. La figura seguente mostra la blogosfera del sito Istat.it nel periodo 1-20 settembre 2009.

Blogosfera Istat.it

Per l’analisi di un sito occorre quindi tenere in considerazione due fattori: il traffico e il posizionamento nella rete. In questi ultimi anni gli studi di fisici, matematici e sociologi stanno contribuendo a definire nuovi metodi e strumenti per l’analisi del posizionamento. Le potenzialità e le prospettive sono estremamente interessanti, anche per chi produce statistiche ufficiali e diffonde cultura statistica.

Per il successo di un sito non esiste una regola aurea ma,  specialmente in organizzazioni complesse, risultati soddisfacenti possono essere raggiunti solo con lo sforzo congiunto di esperti di comunicazione, informatici e produttori di contenuti, supportati da adeguati strumenti software. Con uno lavoro coordinato tra questi attori è possibile valutare se vengono intercettate correttamente le aspettative degli utenti, aumentare la propria rilevanza online e costruire la propria reputazione di opinion leader del settore di appartenenza.

(*) = Ne approfitto per ringraziare i ricercatori che hanno contribuito all’articolo del SIS Magazine: Matteo Mazziotta, Davide Bennato, Francesca Grippa, Daniela Cocchi e Fabio Crescenzi.

Lo statistico su YouTube

(Attenzione: questo articolo contiene pubblicità occulta alla Società Italiana di Statistica)

Lo scorso anno Duccio Schiavon ha riportato su Stat Project un’intervista ad Hal Varian (Google) che è subito diventata un cult per gli statistici; ecco cosa dice il guru di Google:

Continuo a sostenere che il lavoro più “sexy” nei prossimi dieci anni sarà quello dello statistico. Le persone credono che io scherzi, ma chi avrebbe mai immaginato che il lavoro dell’ingegnere informatico si sarebbe rivelato il lavoro più “sexy” degli anni 90? La capacità di acquisire i dati – essere in grado di comprenderli, di elaborarli, di estrarre un valore da essi, di visualizzarli, di comunicarli – queste sono le capacità più importanti che verranno richieste nei prossimi decenni, non solo a livello professionale ma anche a livello scolastico, alle elementari, alle superiori, all’università. In quanto adesso abbiamo davvero libero accesso a dati di ogni tipo. Quindi il fattore vincente risulterà la capacità di comprenderli e di estrarre del valore da essi. Credo che gli statistici saranno parte integrante di questo processo, sempre che non lo siano già.

Michael Driscoll aggiunge:

Il mondo sta assistendo a quella che Joe Hellerstein ha chiamato “La Rivoluzione Industriale dei Dati” dove le macchine, e non gli uomini, sono i primi generatori di dati. Abbiamo dunque bisogno di strumenti per dare un senso a questa enorme mole di dati, e di persone che sappiano utilizzarli. Come ha osservato Hal Varian, gli statistici rappresentano la guida per queste persone.

Ma se siete statistici e volete eccitarvi sin da subito, senza aspettare i prossimi anni, vi consiglio la lettura del discorso di insediamento di D. J. Hand alla Royal Statistical Society (2008), un testo che offre decine di spunti interessanti, tra i quali una riflessione sulla vera information technology, una semplice e strabiliante definizione di data mining e  l’elogio dell’ubiquità della statistica.

Se invece siete statistici più moderati e tradizionalisti, una rilettura della sempre verde Filosofia della Statistica di Melchiorre Gioia (1838) non potrà che irrobustire la vostra autostima.

Ma torniamo a YouTube. Qui trovate il video di Hal Varian e i divertentissimi commenti degli utenti (questo però non mi convince molto: “la parte sexy del lavoro dello statistico è l’ottimo stipendio. Se sei un uomo, i soldi ti faranno diventare subito sexy”).

Ma su YouTube la figura dello statistico viene presentata anche maniera meno lusinghiera: è questo il caso del cantante Todd Snider e del suo strepitoso Statistician’s Blues.

Il testo della canzone è indicativo della percezione che parte dell’opinione pubblica ha della statistica, ma soprattutto mi ha dato un paio di  buone idee sulla BNL sotto casa…

84 percent of all statisticians truly hate their jobs
They say the average bank robber lives within say about 20 miles of the bank that he robs
There’s this little bank not far from here I’ve been watching now for a while
Lately all I can think about’s how bad I wanna go out in style…

Ma YouTube non parla solo inglese: prossimamente pubblicheremo una canzone sugli statistici scritta e interpretata da un artista nostrano…

(Nel frattempo ringrazio Fabio Crescenzi per le segnalazioni e l’artista nostrano per la dedizione alla causa)

ubiquità

La storia di Internet

History of the Internet from Melih Bilgil on Vimeo.

“History of the Internet” è un documentario sulle invenzioni web dal time-sharing al filesharing, da Arpanet a Internet. Questa storia viene raccontata con le icone PICOL (picol.org). Altre informazioni su questo film su lonja.de/motion/mo_history_internet.html

Google Public data e i dati italiani

Google Public data, di cui abbiamo parlato sei mesi fa al ForumPA e su questo blog, torna con interessanti novità per i dati italiani.

Lo scopo del servizio Public data è così presentato da Google:

I dati statistici pubblici, come ad esempio il tasso di disoccupazione o i numeri della popolazione, non devono essere né difficili da trovare né, cosa ancora più importante, difficili da comprendere. Google sta rendendo più facile trovare e utilizzare i dati statistici prodotti  da governi e da istituzioni ufficiali. Questi dati vengono poi inclusi nei risultati di ricerca di Google.com e visualizzati sotto forma di grafici interattivi che è possibile personalizzare e condividere con gli altri.

I dati quindi vengono mostrati non sul sito di chi produce i dati, ma direttamente nella pagina dei risultati della ricerca, al primo posto, così:

google public data

google public data

[the worlds life expectancy]

Come dicono gli sviluppatori del servizio, anche le persone che normalmente rifuggono dalle statistiche dovrebbero trovare questi grafici dinamici facili da usare e capire.

E ci sono novità anche i per i dati italiani, inseriti dalla Banca Mondiale.  I risultati sono molto interessanti, anche se limitati a Google.com (se inseriamo le stesse parole su Google.it non otteniamo nulla):


Cosa aspettiamo ad inserire dati Istat a livello regionale o comunale su Google.it Public data?

La rivoluzione del Data Warehouse open source

b1-events-datawarehouse.en

Milano, 18 novembre 2009

Segnaliamo un evento della Sun Microsystems in cui ci sarà anche un intervento su Talend:

Circa dieci anni fa i data warehouse hanno fatto il loro ingresso nel mercato enterprise. Da allora queste piattaforme hanno suscitato molto interesse grazie alla promessa di raccogliere e centralizzare le informazioni in un unico punto offrendo, ai manager di ogni livello, la possibilità di prendere decisioni basate sui fatti concreti e misurabili e non più su intuizioni e supposizioni.

Purtroppo questa promessa non si è ancora realizzata per la maggior parte delle aziende. Il motivo non dipende certo dalla debolezza dell’idea, che anzi ha fornito sofisticati modelli di analisi dei dati provenienti da più sorgenti. Più semplicemente, per molte imprese, i data warehouse sono ancora troppo costosi da acquistare, implementare e gestire. Un lusso consentito solo a chi dispone di ingenti risorse finanziare.

Fortunatamente il software open source sta rivoluzionando anche il data warehousing, offrendo alternative valide ai costosi prodotti proprietari. Alternative in grado di soddisfare anche le esigenze più complesse a costi contenuti. Database,  sistemi di ETL,  strumenti di reporting e analisi diventano finalmente accessibili alle imprese di ogni dimensione e capacità di spesa.

Il mondo tra dieci anni? Scoprilo a Roma il 10 settembre

L’Institute For The Future si occupa da oltre quarant’anni di previsioni. L’ultimo brainstorming tra poeti e scienziati di tutto il mondo per capire cosa ci aspetta nei prossimi anni è stato tradotto su Wired.it. E se siete interessati a come sarà il mondo tra dieci anni vi consiglio questo evento promosso da Wired.it, Telecom Italia e Fondazione Romaeuropa:

Futuro, il mondo tra dieci anni?
Mappa del futuro del Politecnico di Milano

Estensioni: Firefox è meglio di Chrome

Che Mozilla Firefox fosse migliore, in tutto e per tutto, di Internet Explorer, è ormai un dato di fatto da anni.

Ma tra Firefox e Chrome, il giovane broswer di casa Google? La solfa non cambia and the winner is Firefox.

I motivi sono diversi: prima di tutto, la nuova versione 3.5. Poi, a differenza di Chrome, con Firefox è possibile personalizzare la propria navigazione aggiungendo i componenti aggiuntivi (chiamati anche estensioni, in inglese add-ons) al browser, ad esempio per risparmiare tempo, ottimizzare delle operazioni, per scaricare video o anche solo per divertimento. I componenti sono raggruppati per categorie e ora anche per raccolte, e cioè “gruppi di componenti aggiuntivi, aggregati per renderne più semplice la condivisione”.

L’Add-on Collector, poi, consente agli utenti di creare la propria collezione di estensioni e condividerla con i propri amici o con l’intera comunità, un po’ come si fa con le playlist di YouTube.

Per aggiungere un’estensione è molto semplice: è sufficiente andare sul sito degli add-ons di Mozilla, cercare il componente e installarlo direttamente sul proprio Firefox.

Insomma Firefox è il compagno ideale per vivere pienamente il Web 2.0.

Ecco un po’ di suggerimenti per mettere alla prova i componenti di Firefox:

iMacros

Se amate il browser Firefox, ma siete stanchi ed annoiati di ripetere sempre le stesse cose come visitare gli stessi siti tutti i giorni, riempire i form e ricordarvi le password, allora iMacros per Firefox è la soluzione per voi! iMacros è stato concepito per automatizzare le attività più ripetitive presenti sul web. Se esiste un’attività che dovete fare ripetitivamente, dovete solo registrarla su iMacros. La prossima volta che dovrete farla, la macro lo farà per voi, basterà cliccare su un tasto!

Xmarks

Se si utilizza Firefox su più computer potrebbe essere utile Foxmarks. Installare Foxmarks su ogni computer permetterà di mantenere i propri segnalibri e opzionalmente le proprie password sincronizzate automaticamente in maniera silenziosa, al sicuro da perdite di dati accidentali.

FoxTab

Effetti 3D e funzionalità davvero imperdibili. Provare per credere.


Video DownloadHelper

Per scaricare e convertire video su YouTube, Google Video, MySpace, iFilm ecc con un paio di clic.

AutoCopy

Consente di evidenziare del testo e automaticamente copiarlo sulla clipboard; in questo modo copia e incollare porzioni di testo diventa molto più semplice e rapido.

Adblock Plus

Volete eliminare annunci pubblicitari e banner dalla vostra navigazione (e renderla quindi più veloce)? Con Adblock Plus ve ne libererete subito.

DownloadThemAll!

Ottimo gestore e acceleratore di scaricamento incorporato in Firefox.


Attenzione però, alcuni di questi componenti non sono compatibili con la 3.5.

Buon divertimento (e soprattutto, buona estate)

BarCamp Condividere X (fare) Cultura


Condividere X (fare) Cultura – Sharing to enhance Knowledge
Dove tuona un fatto, siatene certi, ha lampeggiato un’idea.
(Ippolito Nievo)
Tra gli interventi:
La condivisione da Giulio Cesare ai giorni nostri (Vincenzo Patruno)
Web 2.0 e politica (Flavia Marzano) (Lele Rozza)
Sussidiarietà, web 2.0 e Pubblica Amministrazione (Giorgia Iazzetta – ComunicatoriPubblici)
La mia breve storia su come la condivisione mi abbia permesso di costruirmi una nuova carriera che mi offre tante più soddisfazioni ed indipendenza (Robin Good)
Condivisione di software tra gli Istituti di Statistica europei (Carlo Vaccari)
Web 2.0 e cultura statistica (Daniele Frongia)
http://barcamp.org/CXC

E’ possibile seguire il BarCamp in streaming

http://cxc.devise.it/

Il catalogo di Don Giovanni non è Web 2.0

Madamina, il catalogo è questo…”. Così Leporello, servitore di Don Giovanni, racconta a donna Elvira le conquiste del padrone: “In Italia seicento e quaranta / in Almagna duecento e trentuna / cento in Francia, in Turchia novantuna / ma in Ispagna son già mille e tre”. Buon per Don Giovanni. Ma la domanda è: il catalogo è Web 2.0? Le opere liriche sono 2.0?
Un ricercatore della Sapienza mi ha invitato a tenere “un seminario su Web 2.0 e opere liriche”. All’inizio ho pensato ad uno scherzo, ma poi LinkedIn mi ha fatto ricredere: il contatto è più che serio.
Certamente il Web 2.0 è diventato (anche) una moda, e come tale inseguita e spesso abusata. E’ il caso degli allevamenti 2.0 descritti nel terzo numero di Wired.it o dei tanti casi dove 2.0 viene usato come sinonimo di innovazione. Al Barcamp del ForumPA ho anche sentito parlare di Flavia Marzano come “donna Web 2.0″ (ne sono certo: è un complimento).
Io ce l’ho messa tutta ma proprio non ce l’ho fatta: in un Don Giovanni, in una Traviata, nel Barbiere di Siviglia, troviamo molte cose ma no, nessuna traccia del Web 2.0.
Quale deve essere il limite? Il Web 2.0, come aggettivo, non dovrebbe essere utilizzato un sinonimo di innovazione in senso lato: ha necessariamente a che fare con un servizio web con alcune caratteristiche. Certo, i metodi che ne sono alla base, per esempio la collaborazione, sono nati molto tempo prima, ed è questo che genera l’errore: confondere metodi e strumenti.
Quindi, per tornare all’aria di Leporello sul catalogo, questo non può essere in alcun modo Web 2.0. Lo sarebbe se il documento fosse condiviso su Google Docs o meglio ancora Zoho Docs, che però 400 anni fa non era disponibile…
Ovviamente sarei ben felice di essere smentito: se qualcuno se la sentisse di parlare di Web 2.0 e Lirica può scrivermi e con piacere lo metterò in contatto con il ricercatore della Sapienza.
“Don Giovanni 2.0? Direi di no” (Foto di J. K. Graham)