SegnalazionIT si è più volte occupato di tool di visualizzazione dati. Quella che segue è la traduzione di un post di Steve Doig sul blog businessjournalism.org.
Steve Doig è “Knight Chair” alla Walter Cronkite, Scuola di Giornalismo e Comunicazione di Massa presso l’Arizona State University. È specializzato in computer-assisted reporting, l’uso del computer e delle tecniche delle scienze sociali per aiutare i giornalisti a fare meglio il proprio lavoro.

———————-
Steve Doig’s best of CAR Conference: 13 free tools to analyze, display data
di Steve Doig
L’annuale conferenza Computer-Assisted Reporting Conference, che si è tenuta a Raleigh, Carolina del Nord, è stata straordinariamente ricca di tool utili e gratuiti per tutti i tipi di analisi e visualizzazione dei dati, grazie anche alla presenza degli informatici di Google, MIT, Stanford e simili.
Ecco i link a 13 di questi tool gratuiti che ho trovato essere particolarmente utili per l’analisi dei dati nel giornalismo:
Exhibit: Questo link porta ad una pagina con una raccolta di link del progetto Simile del MIT. Exhibit è un programma JavaScript che vi permetterà di partire dai dati in forma tabellare (righe e colonne) e vederli in una varietà di formati: tabella ordinabile e filtrabile, mappa, linea del tempo, ecc. Per avere un’idea di cosa si può ottenere si può vedere la sezione Examples. Nella sezione DataPress è presente un add-in di WordPress che vi permette di esporre le visualizzazioni di Exhibit sul proprio blog. L’uso di Exhibit richiede qualche conoscenza di html, basta semplicemente copiare il suo codice sorgente e modificarlo. Dido è un prototipo di interfaccia utente che permette di configurare Exhibit, senza dover entrare nel codice.
TimeFlow: Questo programma JavaScript consente di utilizzare tabelle che hanno un elemento temporale e creare linee di tempo interattive che possono essere filtrate e colorate tramite più variabili. È uno strumento puramente di analisi, non progettato per la presentazione web, può essere utile per progetti di indagine dei dati.
ManyEyes: Questo sito consente di caricare e visualizzare i dati utilizzando una vasta gamma di interessanti viste: mappe, alberi di parole, tag clouds, strutture ad albero, diagrammi a bolle, grafici, matrici, diagrammi di rete, ecc. Si possono vedere le oltre 84.000 visualizzazioni che gli utenti hanno creato con i propri dati, in modo da avere una idea di cosa è possibile ottenere.
Gapminder: Questo sito è stato creato da scienziato svedese Hans Rosling, che voleva rendere più facile per le persone esplorare gli effetti di centinaia di variabili relative alle diverse nazioni del mondo. Fondamentalmente, questi sono grafici a dispersione multivariati x-y che si animano attraverso il tempo. Ciò che è cool, oltre a giocare con le variabili già collegate al sito, è che Google ha recentemente comprato e aggiunto tali funzionalità ai fogli di calcolo di Google Docs in modo che gli utenti possano caricare i propri dati con variabili temporali.
Tableau Public (solo Windows): La versione completa di Tableau Public è commerciale, ma l’azienda ha creato questa versione pubblica disponibile a chiunque. Fa molte delle stesse cose che fa Exhibit, cliccare su Gallery per vedere alcuni esempi. La versione gratuita è limitata, può contenere fino a 100.000 record.
Protovis: Questo programma, scaricabile dal laboratorio di visualizzazione di Stanford, è simile a ManyEyes ma con una varietà ancora più ampia di tabelle e grafici che possono essere creati, cliccare su Examples per visualizzarli. L’uso di Protovis richiede però notevoli capacità di scrittura di codice software.
Google Refine: Google definisce questo “uno strumento per lavorare con dati disordinati”. I data journalist lo usano per pulire le incongruenze database “campaign-contributions”, per esempio. Rende semplice standardizzare nomi come “Steve Doig” e “Stephen Doig” e “Steven Doig” in uno di questi. Inoltre aiuta con alcune analisi di base, come l’equivalente delle tabelle pivot di Excel.
Google Fusion Tables: Questo è un altro strumento Exhibit- like e rende possibile associare i dati come le mappe, le linee di tempo e/o grafici. A differenza di Exhibit non c’è bisogno di sporcarsi le mani con il codice HTML e JavaScript.
DataWrangler: Un altro buono strumento di Stanford, è simile a Google Refine. È buono per la trasformazione di dati in formati scomodi in qualcosa che può essere analizzato più facilmente.
TwitInfo: Un altro strumento del MIT, questo è progettato per prendere una grande quantità di tweet su Twitter in tempo reale e mostrare loro come una timeline grafica con picchi di attività. Esso comprende un “sentiment algorithm” che classifica i tweets negativi o positivi. Viene descritto come potrebbe essere usato per raccogliere le notizie, come la localizzazione terremoti in anticipo rispetto ai geologi.
NodeXL: Questo è un componente aggiuntivo di Excel che effettua una visualizzazione grafica dei social network. Le visualizzazioni mostrano come le persone sono interconnesse. Un esempio potrebbero essere i collegamenti tra i membri dei vari consigli di amministrazione. Un altro esempio è quello che mio figlio Matt creato per il Sarasota Herald-Tribune dello scorso anno che coinvolgono gruppi di acquirenti e venditori che sono stati coinvolti in massa dai mutui con meccanismi di frode. Queste visualizzazioni si possono ottenere rapidamente ma possono essere molto sgraziate, il nome usato dai giornalisti per i più complicati è “palla di pelo”.
Jigsaw: Non ho visto questa offerta di Georgia Tech, ma si suppone che sia utile per dare un senso alle grandi collezioni di documenti. Non è un programma scaricabile o una applicazione sulla quale caricare i propri dati, ma lo staff di Tech invitare le persone con i dati ad entrare in contatto con loro riguardo al suo utilizzo.
DocumentCloud: Questo è un servizio creato dagli sviluppatori di news-app di The New York Times e ProPublica.org. È progettato per mettere i documenti originali (anche quelli scritti a mano) sul Web e annotarli. L’idea è di permettere ai consumatori di notizie vedere questi documenti – documentazione processuale, legislazione, trascrizioni, dati sugli arresti, controlli, e-mail, ecc – con annotazioni dettagliate e le spiegazioni aggiunte dai giornalisti che seguono la notizia o altri esperti. Ecco un esempio da Arizona Republic in materia di immigrazione, di applicazione della legge sull’immigrazione, SB 1070.