Category: Web application

Pubblicare con Lulu: come stampare i vostri libri

Abbiamo già parlato di Lulu, un servizio che consente di pubblicare online oppure in maniera cartacea qualunque documento vogliate.

Ho fatto un piccolo esperimento: volevo acquistare il libro “The elements of statistical learning” di Hastie, Tibshirani, Friedman, sono andato su Amazon ed il libro costava intorno ai 70$, idem su Springer, poi cercando su Google ho scoperto che l’Università di Stanford metteva a disposizione, gratuitamente, l’ebook in formato .pdf del libro.

A questo punto mi è venuto in mente un possibile utilizzo di Lulu per scopi strettamente personali: mandare in stampa cartacea il file .pdf messo a disposizione da Stanford. Ecco cosa ho fatto.

Per prima cosa ho registrato una mia utenza su Lulu.com ed avviato un nuovo progetto “Libro a copertina morbida”; come potete vedere sono disponibili da subito varie opzioni, tra cui anche quella di richiesta del codice ISBN, la qual cosa mi farebbe diventare -a tutti gli effetti- editore del libro.

A seguire sono andato alle opzioni di stampa: tipo di carta, formato, tipo di rilegatura, colori della stampa. Per ragioni di budget ho scelto la carta “Professionale economico” e sono andato avanti.

Ho poi scaricato da Stanford il file .pdf del libro che volevo stampare, l’ho caricato in Lulu ed associato al progetto.

A questo punto mi si è aperto il wizard per la creazione della copertina, ho scelto un tema, un layout, sono andato all’anteprima, ho generato la copertina ed ottenuto quindi due file .pdf (libro + copertina) pronti per la stampa.

Infine mi è apparso un riquadro riassuntivo del progetto, ho salvato e concluso la procedura.

Sono tornato alla pagina principale dei miei progetti ed ho ordinato una copia cartacea del libro tramite il pulsante “aggiungi al carrello”. Il prezzo previsto è di 10,49 Euro, che è salito a 20,48 Euro comprese le spese di spedizione dagli Stati Uniti.

In totale mi sono arrivate tre email di conferma, la prima riguardava l’avvenuta pubblicazione, la seconda la ricezione dell’ordine, la terza l’avvenuta spedizione.

Dopo circa 20gg dall’ordine (che ho fatto però poco prima di Natale) il libro mi è stato recapitato a casa. Eccolo qui sotto.

Il risparmio netto a seguito dell’operazione è stato il seguente: (70$ valgono oggi 51,4 Euro) 51,4 Euro – 10,5 Euro = 40,9 Euro, ipotizzando che le spese di spedizione di Amazon o Springer equivalgano a quelle di Lulu.

Il servizio di stampa di Lulu funziona molto bene, scegliendo le opzioni di stampa a qualità inferiore i costi sono contenuti ed il prodotto finale è più che accettabile. Se avete idee, appunti, monografie, libri autoprodotti o di cui avete disponibile il file .pdf, stamparli con Lulu è facile ed economico e poi -diciamolo- un libro stampato è sempre un’altra cosa rispetto ad un ebook.

Posterous, una piattaforma di instant blogging

Supponiamo che abbiate delle comunicazioni o dei materiali da rendere disponibili su Internet in tempi rapidissimi e con minimo dispendio di energie.

Se non avete tempo o voglia di impelagarvi nella creazione e relativa gestione di un blog su piattaforme complesse, se avete un account qualunque di posta elettronica, se avete comunque la necessità di caratteristiche avanzate come la possibilità di configurare l’aspetto grafico, di far commentare i vostri post, di aggiornare con il post i vostri social network, di inoltrare via email la notizia ai vostri affezionati lettori, di allegare video e foto, posterous.com è ciò che fa per voi.

Posterous è, in sostanza, una piattaforma di instant blogging. Basta semplicemente mandare una email all’indirizzo post@posteur.com e il contenuto dell’email, senza ulteriori passaggi come registrazioni o login, viene immediatamente pubblicato su Internet ad un indirizzo di comodo del dominio posterous.com.

Come potete vedere dall’immagine, nel mio caso ho provato a mandare due email ed il risultato è stata la pubblicazione di due post all’indirizzo eric-if6rd.posterous.com.

Pur continuando a non effettuare alcuna registrazione presso il sito, la presenza del nuovo blog e dei relativi post viene notificata tramite una email di risposta da parte di posterous.com, che contiene svariati link tramite i quali è possibile visualizzare il blog, modificare o cancellare i post, scegliere un nome più amichevole in luogo di “eric-if6rd” e settare una password.

Supponendo di aver seguito il link “Click here to set a password for this site”, di aver impostato il nome del nuovo blog, vi verrà inviata una email per la conferma dei dati inseriti, rispondendo alla quale avrete completato la registrazione del vostro nuovo blog su Posterous.

A questo punto, dopo aver speso solo 5 minuti dall’inizio delle operazioni (post compresi), potrete configurare a piacimento la vostra piattaforma di instant blogging, aggiungendo ad esempio qualche servizio di re-posting su altri siti o applicazioni.

Come potete vedere non manca niente: twitter, wordpress, flickr, facebook, ecc.

Oppure potete modificare il tema ed i colori del sito, aggiungere dei “contributors” al vostro blog, o degli affezionati “subscribers” ai quali inoltrare via email i vostri post.

Posterous è una piattaforma molto avanzata, molto semplice da utilizzare anche se forse un po’ troppo spartana, ma consente un livello tale di interazione con altre applicazioni e servizi oggi presenti in Internet che piattaforme ben più blasonate si sognano oppure ottengono a prezzo di installazioni di appositi plugin.

Questo è il sito d’esempio che ho creato: http://ericstat.posterous.com

Saldo migratorio nei comuni italiani – parte II

In questo post abbiamo copiato/incollato l’”embed code” di cui abbiamo parlato nell’articolo precedente. In realta’ il codice e’ un po’ diverso in quanto nel frattempo ho realizzato una versione parziale in italiano dell’applicazione per la visualizzazione del saldo migratorio. Il codice utilizzato e’ pertanto il seguente:




Ovviamente se gestite un Blog o un Sito Web, potete anche voi copiare/incollare il codice all’interno della pagina. Quello che apparira’ lo potete vedere qui di seguito:

Saldo migratorio nei comuni italiani – parte I

Questo  e’ un esempio di come e’ possibile, con un semplice Copia/Incolla, condividere sul Web una intera applicazione. In questo caso, i dati visualizzati provengono in tempo reale dal sito Istat per la diffusione dei dati sulla popolazione (demo.istat.it)

Istruzioni:

1) Aprire “WordPad” o “Blocco Note” sul vostro PC.  (No Windows? Ovviamente qualunque Editor di  testo va bene)

2) Copiareincollare il seguente “embed code”

3) Salvare sul Desktop il documento con estensione .html (es. saldo.html)

4) Doppio Click  sull’icona “saldo.html” che sara’  apparsa sul Desktop

Ovviamente potete incollare il codice anche su qualunque pagina Web o su qualunque Blog.

SPARQL – Simple Protocol And RDF Query Language

Nel post precedente ho parlato di RDF (Resource Description Framework) ed illustrato i risultati della visita della sezione musica del sito della BBC. La figura seguente mostra il risultato del progetto Linking Open Data, una iniziativa che ha l’obiettivo di raccogliere e rendere fruibili i dati che sono stati pubblicati finora. Nel complesso essi consistono di oltre 4.7 miliardi di triple RDF (costituite da soggetto, predicato, oggetto) connesse da circa 142 milioni di link RDF (dati aggiornati a maggio 2009).

Post_DFonte Wikipedia

La disponibilità di dati in formato RDF sarebbe però poco utile se non fosse possibile accedervi  in maniera semplice. SPARQL – Simple Protocol And RDF Query Language, è un linguaggio di query dal sapore SQL per interrogare sorgenti di dati RDF. Seguendo questo standard è possibile creare dei punti di accesso ai dati  (endpoints) che sono in grado di ricevere query via http e di restituire i risultati in vari formati RDF/XML, JSON ecc. Cercando in rete ho trovato svariati esempi di questo tipo che espongono dati anche molto eterogenei: dai dati biologici di bio2rdf.org all’importante  sito inglese data.gov.uk che espone moltissimi dataset statistici con quasi 3000 dataset (ecco  la lista completa) e più di tre milioni di triple. Per fare un esempio concreto, qui è possibile interrogare il dataset <http://www.w3.org/People/Berners-Lee/card>. La seguente query produce il nome e l’email delle persone contenute nel file FOAF di Berners Lee.

PREFIX foaf:  <http://xmlns.com/foaf/0.1/>
SELECT *
FROM <http://www.w3.org/People/Berners-Lee/card>
WHERE {
    ?person foaf:name ?name .
    ?person foaf:mbox ?email .
}

Ricordo che FOAF (acronimo di Friend of a Friend) è una ontologia “machine-readable” che descrive le persone, le loro attività e le loro relazioni con altre persone ed oggetti. L’accoppiata RDF-SPARQL va diffondendosi in Internet: Dbpedia è un progetto per estrarre informazione in forma strutturata da Wikipedia e renderla disponibile sul web (ovviamente è disponibile un endpoint SPARQL con cui interrogare la base dati);  DBTune fornisce un servizio SPARQL di accesso a dati strutturati (più di 14 milioni di triple) relativi al mondo della musica. Questo endpoint SPARQL contiene dati sui lanci dei vettori spaziali. Seguendo il link, oltre ai riferimenti per sottoporre interrogazioni, è possibile trovare numerosi esempi di codice ed una presentazione molto interessante.

Per interrogare contemporaneamente più dataset di dati si possono seguire diverse strategie,  ciascuna con i suoi vantaggi e svantaggi:

  1. Interrogare uno per uno i dataset
  2. Interrogare un repository centralizzato costituito da una collezione di dataset
  3. Creare delle copie locali di dataset
  4. Utilizzare un sistema intermedio

Il primo caso ha il vantaggio di avere i dati sorgente sempre aggiornati ma è necessario costruire una logica applicativa di supporto. Il secondo ha il vantaggio di non dover costruire una logica applicativa ma i dataset potrebbero essere non aggiornati. Il terzo caso lascia ampio margine di manovra come la disponibilità di scaricare interi dataset con cui popolare il database ed il mantenimento dei dati sincronizzati con la fonte originale. L’ultimo caso ha il grande vantaggio di avere un sistema ponte tra i vari endpoint SPARQL, che nasconde i problemi di aggiornamento e di costruzione della logica applicativa, ma necessita della costruzione di un sistema di “aggancio” dei vari endpoint SPARQL.

In definitiva la tecnologia promette bene ma probabilmente non è ancora perfettamente matura. Ai lettori interessati segnalo questo video di Tim Berners Lee e la prima e la seconda parte di questo video tutorial. Per finire segnalo un buon tutorial su SPARQL.

 

Ecosia: il motore di ricerca ecologico

È attivo dallo scorso dicembre il motore di ricerca online ecosostenibile Ecosia. Eocosia lavora come tutti gli altri motori di ricerca, ma a differenza di loro dona il ricavato dei link sponsorizzati per proteggere le foreste pluviali il cui progetto di protezione della foresta è curato dal WWF (e localizzato nella fattispecie nel Juruena National Park in Amazzonia). Gli utenti di Ecosia possono salvare fino a 2 m² di foresta pluviale per ogni ricerca effettuata.

Navigate e fate le vostre valutazioni!

Sito ufficiale

Canale YouTube

motore di ricerca ecologico

Resource Description Framework

ll web semantico vuole rendere disponibili tecnologie e protocolli per modellare e classificare le informazioni così che esse possano essere “comprese” da agenti software automatici. E’ un vero salto in avanti: da un web sintattico di documenti costruito dalle persone ad uso delle persone ad un web semantico costruito dalle macchine ad uso delle macchine. In questo post vi parlerò di RDF (Resource Description Framework), un modello basato sul concetto di grafo orientato etichettato. La tecnologia basata su XML è utile per scambiare dati ed integrare applicazioni che utilizzano il web come canale di comunicazione. Tuttavia XML non si presta bene ad essere utilizzato come modello generale per rappresentare sul web le relazioni tra i dati.  In RDF le relazioni sono  trattate  come enunciati (statements) composti da soggetto, predicato ed oggetto. Ad esempio per esprimere il concetto che Mario Rossi è autore di una certa pagina web si potrebbe produrre la tripletta: Mario Rossi – Autore – URL della pagina web.  Affinchè le relazioni possano essere elaborate in modo automatico è fondamentale che i singoli termini siano rappresentati ed individuati in modo univoco in tutto il web mediante un URI. In proposito può  essere utile rileggere questo post.

post2

Lo stack del Web Semantico – Fonte Wikipedia

Tra i vocabolari più diffusi ed utilizzati per rappresentare schemi concettuali ci sono:

Dublin Core (dal nome della città americana nell’Ohio) – Un sistema di metadati costituito da un nucleo di elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile in rete. Per esempio, tra gli elementi del vocabolario si trova http://purl.org/dc/elements/1.1/creator che si riferisce ad una persona, una organizzazione o un servizio responsabile della costruzione della risorsa.

FOAF – Un vocabolario nato per rappresentare le relazioni sociali. Qui c’è il sito di riferimento del progetto. Nella sezione docs potrete trovare documentazione ed anche il riferimento ad una utility (foaf-a-matic) che utilizzerò in seguito.

SIOC Semantically Interlinked Online Communities – Una iniziativa nata dalla volontà di integrare le informazioni della comunità online.

Non è complicato produrre manualmente un file in formato RDF a patto di conoscerne la sintassi. Per quanto riguarda FOAF esiste un servizio automatico che è possibile utilizzare per creare facilmente un file RDF attraverso il quale esprimere una relazione di conoscenza tra persone, ad esempio  il fatto che Mario Rossi (di cui è possibile riportare anche informazioni personali) conosce Giorgio Bianchi. Per pubblicare dati RDF non si deve fare altro che memorizzarli all’interno di un file di testo contenuto nella document root del proprio web server. Analogamente a come gli utenti trattano  le pagine web ordinarie, adeguati strumenti software possono seguire autonomamente i link ad altri file RDF e costruire così il grafo orientato etichettato che rappresenta le relazioni trovate. In alternativa è possibile navigare manualmente i documenti trovati mediante appositi browser come, per esempio Tabulator (disponibile come estensione di Firefox).

Post_D

Fonte Progetto Linking Open Data

Uno degli strumenti software che ho esaminato è rdflib, una libreria python con cui si può costruire, leggere, manipolare e cambiare il contenuto ed anche il formato di un file RDF. Il suo utilizzo è abbastanza semplice: si crea un grafo, si fa il parsing dei file RDF leggendoli sia da disco che mediante protocollo HTTP e poi si applicano al grafo generato le operazioni desiderate. Un altro strumento utile è la libreria Triplify, scritta in PHP, con cui è possibile esporre dati RDF prendendoli da un database relazionale e che dispone di file di configurazione già predisposti per l’integrazione con i più diffusi strumenti come: OpenConf, Drupal, WackoWiki, WordPress, OpenJournalSystems, Joomla!, osCommerce, OMDB, phpBB, Gallery.

Sul web ci sono molti insiemi di dati interessanti  e le connessioni RDF permettono di passare da un elemento all’interno di una fonte di dati agli elementi di altre fonti.  Un esempio illuminante e molto avanzato che riprenderemo nel seguito è rappresentato dal sito della BBC.  Il risultato della visita della sezione musica e della quick search sull’artista Sting è una normale pagina web. Tuttavia se si visualizza il codice sorgente della pagina web si troveranno i seguenti valori: type=”application/rdf+xml” href=”/music/artists/7944ed53-2a58-4035-9b93-140a71e41c34.rdf“. Cliccandoci sopra si otterrà il caricamento del file in formato RDF.

Se si aggiunge all’url nella barra degli indirizzi l’estensione .rdf e se è stata già installata l’estensione Tabulator, si potrà navigare lo stesso file come una normale pagina web. La chiave 7944ed53-2a58-4035-9b93-140a71e41c34 nella parte finale dell’url è l’identificatore URI della “risorsa” Sting. Navigando il contenuto del file RDF possiamo scoprire che, sempre mediante questo identificatore univoco, esistono connessioni ad altri siti tra Musicbrainz, Muscimoz, Myspace e Wikipedia.

Su Musicbrainz la scheda di dettaglio di Sting riporta tra gli altri dati il valore MBID = 7944ed53-2a58-4035-9b93-140a71e41c34. MBID è un identificatore univoco per l’intero  database di Musicbrainz. Come riporta la documentazione tecnica reperibile sul wiki di Musicbrainz, conoscendo il valore MBID è possibile richiedere direttamente la risorsa sia utilizzando RDF che XML web service. Anche il sito Musicmoz riporta una pagina dedicata Sting in cui, visualizzandone il contenuto il XML, è possibile riscontrare un link con lo stesso ID  <resource name=”musicbrainz” link=”http://musicbrainz.org/artist/7944ed53-2a58-4035-9b93-140a71e41c34.html“/>

Ecco allora che i nodi colorati in blu del grafo riportato prima assumono un significato nuovo.

Ai lettori interessati segnalo questo video di Tim Berners Lee. A quelli molto interessati segnalo anche la prima e la seconda parte di questo video tutorial. Molte organizzazioni generano i contenuti dei propri siti web attraverso pagine composte dinamicamente. E’  lecito quindi chiedersi se come si possano generare dinamicamente file RDF dai contenuti limitati senza dover pubblicare un grande unico file RDF che potrebbe portare ad inefficienze e problemi di elaborazione. Nel prossimo post vi parlerò di SPARQL, un linguaggio simile ad SQL per l’interrogazione di dati RDF.

Data Dissemination e Data Sharing

Innanzitutto Buon Anno a tutti. Parliamo ancora una volta di dati statistici. In particolare, questa volta parleremo di come si sia evoluto nel tempo il concetto di “diffusione dati” negli Enti e nelle Organizzazioni che questi dati li producono.

Cercare di comprendere, studiare, conoscere fenomeni sociali ed economici anche complessi di un Paese o di un territorio è possibile grazie al lavoro quotidiano di Enti che fanno indagini, rilevano dati e li elaborano, diffondendone i risultati. La “diffusione” è il momento in cui tali Enti e Organizzazioni consegnano dati alla Comunità Scientifica, ai Governi, agli Enti Locali, alle Aziende, ai Professionisti, alla Politica e ai Cittadini. Che utilizzano questi dati per analizzare e capire cosa sta accadendo, per prendere coscienza della realtà del territorio, per prendere provvedimenti legislativi, per decidere i contenuti della prossima manovra Finanziaria.

L’avvento di Internet è stato “devastante” in tantissimi campi e settori della vita moderna. Con Internet nulla è più stato come prima, e questo è stato particolarmente vero per chi fa informazione, per chi produce dati, per i produttori di software. Ossia di tutto ciò che può essere consegnato a destinazione mediante la Rete stessa. Posso gestire attraverso Internet un ordine per, chessò, un monitor per PC o quello per l’acquisto di una cassa di vini pregiati. Ma resta comunque il problema di come farli arrivare a destinazione. Internet infatti non risolve questo tipo di problema, che invece può essere risolto affidandosi a ditte specializzate in spedizioni. Non è ovviamente così per i dati, la conoscenza, per il software, a cui la Rete ha dato una straordinaria opportunità: quella di poter circolare liberamente e di arrivare in modo istantaneo a destinazione senza intermediari e senza oneri o costi aggiuntivi.

Con Internet e con il Web, quelle che erano pubblicazioni “tradizionali” fatte di carta e inchiostro e che erano la modalità con cui venivano resi pubblici i dati e le tavole di dati statistici, si sono via via trasformate in “elettroniche”. Un link sul sito Web dell’Ente, un click da parte dell’utente e la pubblicazione veniva scaricata (a pagamento o meno) dal sito Web sul PC dell’utente. Che così ne poteva utilizzare a suo piacimento il contenuto, in genere tavole di dati. I dati venivano diffusi principalmente all’interno di documenti HTML, file Word e tavole Excel (con buona pace dei formati aperti). Ma anche mediante file di testo e file PDF. Un approccio di questo tipo delega all’Ente produttore tutte le decisioni a riguardo di che tipo di dati diffondere. Un certo numero di tavole vengono decise “a priori” a tavolino e l’utente quando andrà a scaricare il relativo file, si troverà “quelle” tavole e non altre. Questo è un approccio sicuramente molto facile da implementare da parte dell’Ente produttore di dati, ma ha un forte limite nel fatto che la pubblicazione va comunque fatta e le tavole di dati vanno comunque preparate, oltre al fatto che l’utente non può intervenire in nessun modo per ottenere i dati a cui è realmente interessato. E’ costretto a scaricarli e poi vedere se tra questi ci sono quelli desiderati.

Queste (e altre) ragioni hanno costituito la base per il successo nella diffusione dati (o “Data Dissemination”) dei cosiddetti “Data Warehouse” statistici. Organizzare cioè i dati in modo adeguato all’interno di Data Base per consentire all’utente di generare tavole in tempo reale. Non più dunque tavole predefinite ma tavole di dati generate a “run-time” sulla base di scelte fatte dall’utente. In questo caso è l’utente che decide, selezionando gli opportuni parametri, il tipo di dato a cui è interessato, l’anno di riferimento, il livello territoriale (ad esempio se vuole dati provinciali, regionali, comunali, …) e così via. In questo caso non ci sarà alcun limite al numero di tavole pubblicabili in quanto ognuna sarà generata in tempo reale sulla base dei parametri di input decisi dall’utente. Capite bene come i Data Warehouse su Web hanno generato una abbondanza di informazione inimmaginabile fino a qualche anno prima. E infatti, se fino a poco prima realizzare una pubblicazione (anche elettronica) contenente ad esempio i dati sulla popolazione o su qualunque altra cosa a livello comunale avrebbe richiesto 8100 pagine (il numero di Comuni in Italia) riducibili a 4050 pagine (supponendo di scrivere piccolo e di mettere due tavole per pagina), realizzare un Web Warehouse con i dati demografici di tutti i comuni italiani significa di fatto implementare un data base di piccole dimensioni.

Ora tutti gli Enti e le Organizzazioni più importanti diffondono i propri dati per mezzo di un ”Data Warehouse” più o meno sofisticato. Lo scrivo tra virgolette e in corsivo in quanto il termina viene utilizzato molto spesso in maniera impropria per indicare un qualunque data base per la diffusione dati, indipendentemente da come è stato progettato. (Diciamocela tutta: “Data Warehouse” è un termine più “figo”!)

Ma chi è l’utente dei dati? Sia che si tratti di pubblicazioni o di file contenenti tavole di dati, sia che si tratti di sistemi di Warehouse per la generazione a run-time di tavole l’utente è sempre stato visto come il punto finale del processo di diffusione. Questa è però una idea “storica” di utente che trova una collocazione sempre più marginale all’interno del Web. L’utente ha infatti cessato da tempo di essere un “lettore” o un “utilizzatore” del Web per diventarne invece protagonista. Un protagonista che a sua volta veicola l’informazione, la contestualizza, la condivide, la discute, la promuove, la valorizza. In questo nuovo contesto l’idea stessa di “diffusione dati” descritta fino ad ora diventa improvvisamente inadeguata. Questi nuovi scenari sono infatti il terreno ideale per quella che va sotto il nome di “condivisione dei dati” (Data Sharing) . E non è ovviamente un dettaglio lessicale, in quanto il “Data Sharing” ha delle forti implicazioni sia a livello tecnologico che a quello relativo ai comportamenti dell’”utente protagonista”.

In questo caso i dati non vengono più scaricati (e quindi replicati) sul PC dell’utente per poter essere utilizzati, ma vengono rilasciati attraverso modalità tali da consentire di essere facilmente “incorporati” in altri Blog e in altri siti Web oppure visualizzati on line attraverso sistemi di visualizzazione avanzati o ancora utilizzati direttamente da applicazioni e sistemi Web.

DEMO, il sistema che ISTAT utilizza per la diffusione dei dati demografici. Dal 1999, anno del suo rilascio ad oggi è diventato quello che a me piace chiamare un “sistema interconnesso”.

Fin dal suo esordio, sono stati “diffusi” dati in modo che ora definiremmo “tradizionale” attraverso il download di tavole predefinite, di file di dati o mediante i semplici Web Warehouse implementati. (es. Bilancio Demografico)

Ora mi scuso in anticipo con chi da tempo segue SegnalazionIT visto che gli esempi che seguono sono già comparsi in passato in altri articoli. Ma credo che raggrupparli ora tutti assieme possa servire a spigare meglio quanto detto fin’ora.

Nella figura seguente un output “classico” (con layout e stile di dieci anni fa :-) ) di quelli che si possono ottenere connettendosi a DEMO e interrogando il sistema. I dati in tabella sono quelli che riguardano il Bilancio Demografico per l’anno 2008 del comune di Roma.

demo.istat.it - Bilancio Demografico

Supponiamo poi di connetterci con il nostro BlackBerry o con il nostro Nokia N70 a istat.mobi (o mobile.istat.it). Seguendo i link riguardanti il Bilancio Demografico e selezionando il comune di Roma, troveremmo che

mobile.istat.it -  Bilancio Demografico

Ancora, dal sito ufficiale dell’Istat, inserendo il comune di Roma nell’apposito box in Home Page avremmo che

www.istat.it -  Home Page

www.istat.it - Bilancio Demografico

E se volessimo vedere come come questi dati possono essere utilizzati per la realizzazione di una applicazione mash-up con i dati di Google Maps, possiamo connetterci a http://cheapguru.org/comuni,  e ottenere il risultato in figura.

Google Maps e Bilancio Demografico

Oppure possiamo semplicemente copiareincollare il seguente codice su un qualunque blog/sito web

per incorporare all’interno del blog/sito la seguente tabella

Ovviamente gli esempi fatti non sono casuali. I dati infatti sono esattamente gli stessi. E provengono tutti dalle API pubbliche di DEMO. In nessun caso c’è stata una replicazione di dati. I dati sono stati semplicemente condivisi con altre applicazioni, su altri sistemi e attraverso l’utilizzo del codice di “embedding”. DEMO pertanto è stato “agganciato” tramite API agli altri siti web, diventandone parte integrante e condividendo con questi ultimi la parte dati.

In realtà i sistemi e i siti Web che condividono i dati di DEMO secondo queste logiche sono molti di più. Quando a Giugno 2010 saranno disponibili i dati del Bilancio 2009, DEMO e tutti i sistemi interconnessi di cui abbiamo parlato prima nonchè tutti i blog/siti che già hanno e quelli che nel frattempo avranno incorporato l’”embedded code” per la chart o la tabella del comune desiderato presenteranno istantaneamente i nuovi dati. Istantaneamente e senza intermediari. Dal “Data Dissemination” al “Data Sharing”.

La storia di Internet

History of the Internet from Melih Bilgil on Vimeo.

“History of the Internet” è un documentario sulle invenzioni web dal time-sharing al filesharing, da Arpanet a Internet. Questa storia viene raccontata con le icone PICOL (picol.org). Altre informazioni su questo film su lonja.de/motion/mo_history_internet.html

Business Intelligence con Good Data

Good Data è una piattaforma di business intelligence disponibile sul web.

gooddata1

Good Data è in grado di memorizzare i dati online, permette di costruire e gestire un modello di dati multi-dimensionale utilizzando diverse fonti di dati, fornisce gli strumenti per analizzare i dati in un ambiente collaborativo, ed i mezzi per condividere i risultati con gli altri. Tutto ciò senza alcun software da installare, alcuna licenza per l’acquisto e alcuna necessità di supporto informatico.

Il sito di Good Data promette una “Agile BI”, ovvero gli analisti di dati possono sfruttare la potenza di una piattaforma di modellazione altamente flessibile, mentre gli utenti business hanno a disposizione degli strumenti di analisi e di reporting estremamente intuitivi. Questa combinazione consente ai team di analisti di creare e iterare rapidamente sulla proprie analisi.

Dal punto di vista delle tecnologie, Good Data utilizza lo stato dell’arte in materia, è costruita infatti utilizzando  AWS – Amazon Web Service, una delle più estese ed avanzate soluzioni di cloud computing esistenti al mondo. Ciò consente di ottenere diversi vantaggi:

  • Potenza elaborativa a basso prezzo. La parallelizzazione ottenuta dal cloud-computing consente di distribuire contemporaneamente su molte CPU le query ROLAP.
  • Elevata scalabilità. Le elaborazioni di business intelligence risentono spesso di imprevedibili ed elevati picchi di carico, il cloud-computing consente di rispondere in maniera elastica alla domanda, quando ciò accade.
  • Massivo numero di utenti. Good Data esegue una singola istanza della piattaforma di business intelligence per migliaia di utenti, consentendo di tenere molto bassi i costi marginali di mantenimento, servizio e aggiornamento per ciascun utente.
  • Orientamento al servizio. Dato che i nodi hardware sono allocati “in the cloud” e quindi sono transienti, nel senso che posso aggiungerne e toglierne quando ne ho bisogno, al fine di bilanciare il carico e massimizzare il throughput Good Data si basa su una serie di servizi stateless, orientati a garantire il servizio piuttosto che chi lo eroghi e dove.

Per effettuare qualche prova consiglio di registrarsi, effettuare il login, andare su “Switch Project” e scegliere “Create new”.

gooddata2

A questo punto si possono utilizzare le freccette laterali finchè non viene mostrato “New Zealand Census project template”, poi si da un nome al progetto e, dopo aver premuto il tasto “Create”, alcuni dati del Censimento 2006 della Nuova Zelanda saranno disponibili per essere visualizzati, combinati, manipolati tramite Good Data

gooddata3

Sarà inoltre possibile visualizzare o modificare i report predefiniti o crearne degli altri, nonchè esportarli in formato Excel, condividerli, “taggarli”.

gooddata4

Insomma, Good Data è un’applicazione complessa, potente, ben progettata, che utilizza praticamente tutti i paradigmi 2.0: possibilità di upload e condivisione di dati ed esperienze, rich internet application, creazione di comunità, tagging, export degli output generati, possibilità di generare widget da incapsulare nelle proprie pagine Internet.

Il modello di business è il “Freemium”, piuttosto usuale per questo tipo di applicazioni: gratuito fino a 50 utenti, 10 progetti, 10 MB per upload e 100 MB max per progetto. Non sono riportati i costi a seguito del superamento dei limiti.

Io credo che la complessità intrinseca dell’argomento Business Intelligence, prima che dello strumento, renderà Good Data un servizio di nicchia o comunque non adatto alla maggioranza dei navigatori…
però è un gran bello strumento!