Category: ICT Management

The IT Crowd: i nerd riemergono dal seminterrato

E’ cominciato tutto qualche anno fa con “Camera cafè”: i nuovi uffici fatti di consulenti e segretarie, manager e informatici hanno iniziato ad appropriarsi della commedia televisiva, che usciva (finalmente!) dagli ambiti familiari e anche dai classici nonluoghi di lavoro della serie tv (l’ospedale e la stazione di polizia).
Gli sketch davanti alla macchinetta però stavano stretti agli sceneggiatori americani e inglesi. E soprattutto lasciavano in un angolo i dominatori della scena, quelli veramente spassosi: i nerd (sfigati dell’informatica), o più affettuosamente geek.
I nerd sono così diventati protagonisti, ultimamente, di alcune delle migliori serie tv in stile commedia degli ultimi anni.
Forse la più divertente è The Big Bang Theory: quattro supernerd (fisici a Pasadena) si ritrovano come vicina di casa Penny, una biondina aspirante attrice e (per ora) cameriera alla “Cheesecake factory”. Attualmente alla terza stagione, The Big Bang Theory non ha ancora stancato il suo pubblico.
Ma ora arriva la prima serie tv dedicata a una categoria speciale di nerd: gli “IT”. La serie tv si chiama The IT Crowd, è arrivata alla terza serie in Inghilterra e ha finalmente cominciato in questi giorni le sue trasmissioni in Italia, sul canale Bonsai di Alice Home TV (canale peraltro visibile interamente sul web, previa registrazione).
In una grande azienda inglese (non si capisce bene cosa produca), il settore IT è confinato nel seminterrato. A dividersi la stanza sono Roy e Moss.
Roy utilizza il suo ingegno soprattutto per cercare di lavorare meno; ad esempio ha inventato una macchina automatica che ad ogni chiamata risponde: “Ha provato a spegnere e riaccendere?”, e poi “La spina è attaccata al muro?” e in quel modo risolve quasi tutto il lavoro quotidiano.
Moss è più preciso. Incapace di mentire e di rendersi malleabile all’esterno, utilizza continuamente termini tecnici incomprensibili ai “non IT”.
A vivacizzare la situazione, come in “Big Bang Theory”, è una donna: Jen.
Jen, imbranata e adoratrice di scarpe più di Bridget Jones, non ha dimestichezza con i computer, ma è messa a capo del settore IT e diventa in breve tempo il punto di contatto fra i due nerd e il mondo reale.
Seguire “The IT Crowd” sarà uno spasso per tutti, ma è obbligatorio vederlo per chi lavora con hardware e software.

L’inizio della prima puntata di “The IT Crowd” sottotitolata in italiano (Youtube)

Windows Sysinternals

In questo post vorrei segnalarvi il sito web Sysinternals, creato nel 1996 da Mark Russinovich e  Bryce Cogswell e successivamente acquisito da Microsoft nel luglio del 2006. Questo sito è una vera miniera di informazioni e di strumenti preziosi per la gestione dei sistemi Microsoft Windows. Scorrendo l’indice delle utilities alla ricerca di qualcosa che mi potesse tornare immediatamente utile sono stato incuriosito da Disk2vhd.

windows_sysinternals

Fonte:http://www.microsoft.com

Disk2vhd è una utility che crea un VHD (Virtual Hard Disk – Microsoft’s Virtual Machine disk format) da un disco fisico in modo che possa essere utilizzato all’interno di macchine virtuali Microsoft Virtual PC o Microsoft Hyper-V. A differenza di altri strumenti simili,  Disk2vhd può essere lanciato su un sistema online in quanto utilizza la funzionalità Windows’ Volume Snapshot , introdotta in Windows XP, per creare degli snapshot dei volumi che si desidera includere nella conversione. 

Disk2vhd

Fonte:http://www.microsoft.com

Su YouTube ho trovato un ottimo video tutorial in tre parti.

Vi consiglio anche la  lettura del Sysinternals Forum.

Alcune idee sulla virtualizzazione – parte prima

In questo post vi parlerò di virtualizzazione di server. Davvero sulla virtualizzazione si può ancora dire qualcosa che non sia già stato ampiamente detto e ridetto? Per quanto mi riguarda, più che avere la presunzione di dire qualcosa di nuovo e di interessante, cosa che lascio giudicare a voi, vi parlerò di una mia personale interpretazione e di alcune prove che ho condotto per verificare la fattibilità delle mie idee. Per Wikipedia la  virtualizzazione è la tecnologia che permette ad un server di gestire diversi sistemi operativi andando ad emulare le istanze dei sistemi operativi “ospiti”; questo agevola il mantenimento di un insieme di applicazioni su un singolo server e con un maggior livello di affidabilità. L’hypervisor è il componente chiave per un sistema basato appunto sulla virtualizzazione.

Nelle moderne architetture i dischi interni dei server contengono il sistema operativo e poco altro. Generalmente i dati risiedono su un disk array esterno, ad esempio organizzati in architettura DAS (Direct Attached Storage) o, ancora meglio, in SAN (Storage Area Network).

NAS_DAS_SAN

Fonte http://en.wikipedia.org

In questo post farò riferimento ad una architettura SAN, rappresentata in maggior dettaglio nella figura seguente.

san1

Fonte: http://www.allsan.com

Lo zoning ed il LUN masking sono meccanismi che consentono di controllare quali server hanno accesso a quali dispositivi e, per esempio, limitare un singolo server ad un gruppo di dispositivi di storage (anche un singolo storage) oppure associare un raggruppamento di server ad uno o più dispositivi di storage. Mi riferirò ad uno spazio di storage SAN visibile da un host con il termine LUN. Gli amministratori di sistema più scaltri, una volta che un server “vede” una LUN, preferiscono formattarla come partizione LVM perchè la gestione a livello sistemistico degli spazi fisici risulta molto semplificata e versatile. Le tipiche operazioni da compiere sono: formattazione della partizione, creazione del volume group, creazione dei volumi logici, creazione e formattazione dei filesystem, montaggio dei filesystem.

lvgFonte http://www.redhat.com

L’utilizzo di LVM presenta anche un altro grande vantaggio: il volume group è autodescrittivo, nel senso che una parte riservata del disco chiamata VGDA (Volume Group Descriptor Area), contiene i metadati di composizione del volume group e dei vari logical volumes. In caso di problemi ad un server fisico, “pubblicando” una LUN verso un altro server, possiamo tirarci dietro tutti i dati ed i filesystems già definiti. Se il driver della scheda in fibra HBA lo supporta (verificate con il costruttore della scheda come fare, se no è necessario fare reboot) , basta fare un rescan a caldo del bus SCSI ed il giuoco è fatto: la LUN diventa visibile al server. I comandi Linux vgscan, che esegue una scansione dinamica dei dischi e dei volume group,  vgchange, per attivare il volume group, e mount per il  montaggio dei filesystem, completeranno la sequenza delle operazioni.

Attraverso i moderni software di virtualizzazione si possono costruire architetture  dotate di caratteristiche sofisticate come Live Migration e Cluster High Availability. Come   amministratore dei sistemi, però, ho il timore che adottando uno strumento di virtualizzazione sarò  costretto ad eseguire operazioni di migrazione/riconversione degli spazi fisici già definiti,  certamente dispendiose e critiche anche per le implicazioni sulla continuità del servizio. E forse, in fin dei conti, di acquistare un biglietto di sola andata verso un software ed un formato proprietari.

Fatta questa lunga premessa, la mia domanda è la seguente:  supponiamo di avere un server che monta una serie di filesystem della dimensione di centinaia e centinaia di gigabyte, contenuti in uno o più volume group costituiti da dischi fisici appartenenti ad uno storage array raggiungibile in SAN.

lvolsFonte http://www.redhat.com

E’ possibile creare un server virtuale equipollente (magari facendo una conversione P2V – Physical to Virtual del solo disco interno) senza dover ricopiare o convertire i dati già registrati e conservando nel contempo funzionalità, codifica, formato dei dati e dei filesystem originali?

Sarebbe interessante sentire il parere dei vari produttori di tecnologia di virtualizzazione presenti sul mercato.  Per quanto mi riguarda  ho condotto alcune prove con RedHat KVM (vedi il mio post precedente su RedHat KVM) e la prossima volta  vi darò tutti i dettagli del caso.

High Availability e Disaster Recovery con Hyper-V + Double-Take e Linux + DRBD

In un mio post precedente vi avevo dato notizia di Microsoft Hyper-V e del supporto di Linux RedHat. Il consolidamento di server fisici mediante l’applicazione della tecnologia della virtualizzazione consente di ottenere numerosi vantaggi sia in termini di continuità operativa e velocità di rilascio in produzione di nuovi server che di sfruttamento ottimale delle risorse hardware e valorizzazione degli investimenti ICT. Ho attivato pertanto un server con sistema operativo Microsoft 2008 + Hyper-V e creato  una decina di server virtuali con sistema operativo Microsoft Windows 2003, Linux RedHat, Fedora e Ubuntu. La tecnologia della virtualizzazione è molto apprezzata anche per la flessibilità che offre dal punto di vista della gestione. Per esempio dovendo aggiungere una scheda di memoria al server fisico ho salvato lo stato delle macchine virtuali, spento il server fisico, aggiunto la scheda e riavviato le macchine virtuali, il cui funzionamento è ripreso esattamente da dove era stato interrotto al momento del salvataggio senza alcuna perdita di dati, proprio come se nulla fosse accaduto. Per fare una verifica ho volutamente lasciato aperta e parzialmente compilata la finestra grafica di Ubuntu con cui si crea un nuovo utente linux. Al successivo riavvio l’ho trovata esattamente come l’avevo lasciata. Il tempo impiegato per completare l’intera operazione è stato inferiore ai 10 minuti. Tuttavia il modo  più efficace di operare sfrutta la funzionalità di live migration tra più nodi fisici offerta da Hyper-V R2 che consente di spostare a caldo una macchina virtuale dal server che deve essere messo in manutenzione verso uno dei nodi attivi così da evitare qualunque tipo di disservizio.

double-take

fonte http://www.doubletake.com

Tempo fa, affrontando i temi del backup, data replication e disaster recovery, avevo fatto riferimento a double-take, un software veramente interessante per le sue funzioni di replica in tempo reale su rete IP. La versione per Microsoft Hyper-V  lo è ancora di più e consente di realizzare facilmente soluzioni di continuità operativa e disaster recovery per le macchine virtuali in esecuzione sul server fisico. Il prodotto è ovviamente personalizzabile e consente anche di  limitare la banda di rete impegnata dal processo di replica durante il funzionamento normale. La cosa intrigante è che le macchine virtuali possono essere sia macchine Microsoft Windows che Linux. Sul sito del produttore è disponibile un video webinar molto istruttivo che illustra i dettagli del prodotto. Double-take, infine, offre nel proprio portafoglio anche prodotti per Linux.

DBRD

fonte http://www.drbd.org

Un altro software degno di nota e destinato agli amanti del Pinguino  e dell’open source è DRBD, di cui esiste anche una versione commerciale completa di supporto. Curiosando sul sito del produttore, nella sezione news, tra i tanti ho trovato un annuncio davvero molto interessante: Linus Torvalds ha accettato DRBD. La release 2.6.33 del kernel Linux, attesa per febbraio 2010, conterrà quindi DRBD. Nella figura seguente è riportata la schrmata grafica della DRBD Management Console, una applicazione Java con cui è possibile configurare i dettagli della propria installazione.

DRBD-MC

fonte http://www.doubletake.com

 

Gratis – Chris Anderson

“Free – The future of a radical price” è il nuovo libro di Chris Anderson, direttore di Wired USA e già autore del famosissimo “The Long Tail”. Il libro è edito in Italia da Rizzoli con il titolo “Gratis”, vale certamente la pena di acquistarlo (19,50 €).

È un libro ricco di spunti e come tale difficile da recensire, semplificando potremmo dire che tratta di economia, tecnologia, sociologia e psicologia comportamentale dei frequentatori di Internet. Riprende e approfondisce concetti chiave della tecnologia moderna, come il cloud computing, ed i modelli di business per Internet, come il “Freemium”.

Riporto di seguito la prima parte del capitolo 8. “La demonetizzazione – Google e la nascita di un modello economico per il Duemila”.

Ormai è diventata un’attrazione turistica: sorge al numeo 1600 di Amphitheatre Parkway, a Mountain View, California. È la roccaforte del Gratis: il Googleplex, il quartier generale dell’azienda più grande mai costruita su prodotti gratuiti. Fuori dal palazzo, ingegneri sorprendentemente atletici giocano a beach volley e vanno in mountain bike. Poi rientrano, si infilano la camicia ed escogitano nuovi modi per usare gli straordinari vantaggi di costo marginale dei loro enormi datacenter per esplorare nuovi settori ed espandere la portata del gigante della ricerca. Oggi Google offre quasi cento prodotti, dal software di elaborazione immagini a word processor e fogli di calcolo, e quasi tutti sono gratuiti. davvero gratuiti, non c’è trucco. Google ci riesce come dovrebbe riuscirci  ogni moderna azienda del digitale: offrendo molti prodotti per guadagnare su pochi di essi.

Google guadagna talmente tanto con la pubblicità su una manciata di prodotti chiave (sopratutto sui risultati di ricerca e sulle inserzioni pubblicate su siti di terze parti) che riesce a rendere gratuito tutto il resto. I nuovi servizi, anzi, nascono con domande da veri geek, come: «Sarebbe cool?», «La gente lo vuole?», «Sfrutta bene la nostra tecnologia?». Non si parte mai da un prosaico: «Ci farà guadagnare?».

Vi sembra folle? Lo sarebbe, forse, se provenisse dalla General Motors o dalla Generel Electric; ma per le aziende che operano nel regno del digitale puro, questo approccio può essere perfettamente sensato. Decidere di costituirsi un pubblico enorme prima di avere un modello di business non è sciocco come lo era all’epoca del dot-com, nei tardi anni Novanta, quando per ottenere lo stesso risultato serviva una vagonata di soldi dal venture capital e molti rack di server Sun. Oggi qualsiasi startup sul web ha un accesso condiviso allo stesso tipo di enormi server farm che usa Google, il che rende estremamente conveniente l’offerta di servizi online. Grazie alla disponibilità di servizi di hosting come l’EC2 di Amazon, che consentono alle aziende di avviare il lavoro senza alcuna infrastruttura fisica, è possibile fornire un servizio a milioni di utenti usando poco più di una carta di credito.

Di conseguenza, le aziende possono iniziare in piccolo e puntare in alto senza assumersi enormi rischi finanziari e senza sapere come guadagneranno. Paul Graham, fondatore di Y Combinator, una società di venture capital specializzata in piccole startup, dà un consiglio semplice agli aspiranti imprenditori: «Costruite qualcosa che la gente vuole». Graham finanzia aziende con cifre ridotte, anche nell’ordine dei cinquemila dollari, e le incoraggia ad usare strumenti open source e servizi di hosting, e a lavorare da casa.

Quasi tutti usano il gratis per mettere alla prova le idee, per scoprire se funzionano o suscitano l’interesse dei consumatori. Se sì, allora la domanda successiva è: quanto sarebbero disposti a pagare i clienti, o in quale altro modo ci si può guadagnare. Possono passare anni prima che arrivi quel giorno (e a volte non arriva mai), ma poiché i costi per lanciare il servizio sono così bassi, raramente è a rischio un capitale enorme.

Oggi esistono innumerevoli aziende web di questo tipo, grandi e piccole. Ma Google è di gran lunga la maggiore e, poiché ha tanto successo nel generare ricavi in una parte del suo business, il Gratis non è solo una tappa intermedia sulla strada di un modello di business: è al cuore della filosofia produttiva.

Per comprendere come Google sia diventato l’araldo del gratis, è utile ripercorrerne l’evoluzione: Possiamo riassumere la storia di Google in tre fasi:

1. (1999-2001) Inventa un motore di ricerca che migliori, anziché peggiorare, a mano a mano che il web cresce (a differenza di tutti i precedenti);

2. (2001-2003) Adotta un sistema self-service con cui gli inserzionisti possano creare annunci pubblicitari che corrispondano a certe parole chiave o contenuti, e poi fa in modo che possano contendersi le posizioni più in vista per quelle pubblicità;

3. (2003-oggi) Crea innumerevoli altri servizi e prodotti per estendere la sfera di attività di Google, fidelizzando i consumatori. Dove serve, estende la pubblicità a quegli altri prodotti, ma non a scapito della user experience.

Questo sistema ha funzionato benissimo. Oggi, a dieci anni dalla fondazione, Google è un’azienda da 20 milioni di dollari, che fa più profitti (oltre 4 milioni di dollari nel 2008) di tutte le compagnie aeree e le aziende automobilistiche americane messe insieme (d’accordo, di questi tempi non ci vuole molto!). Non solo ha introdotto un modello di business basato sul gratis, ma sta inventando un nuovo modo di fare informatica, spostando sempre più funzioni dai nostri desktop alla cloud (nuvola), ovvero ospitandole in data center remoti e facendoci accedere online attraverso i browser (e possibilmente attraverso il browser di Google, Chrome).

Questi data center sono l’incarnazione della tripletta della tecnologia: potenza di calcolo, banda e spazio su disco. Queste fabbriche di informazione, a mano a mano che Google ne costruisce altre in tutto il mondo, non diventano meno costose ma più potenti. I computer di ciascun nuovo data center sono più veloci dei precedenti e gli hard disk possono contenere più informazioni. Di conseguenza quei data center hanno bisogno di collegamenti migliori con il mondo esterno. Sommando tutta questa capienza possiamo capire perchè ogni data factory che Google costruisce può fare il doppio allo stesso prezzo di quella costruita un anno e mezzo prima.

Google continua a costruire questi data center al costo di centinaia di milioni di dollari, ma poiché il traffico gestito da ciascuno cresce ancora più rapidamente della spesa per le infrastrutture, a livello del singolo byte il costo sostenuto dall’azienda per rispondere alle vostre esigenze diminuisce ogni giorno.

Perchè Google adotta il Gratis «di default»? Perché è il modo migliore per raggiungere il mercato più vasto possibile. Schmidt la chiama «Strategia max» di Google, nel senso di tendenza alla massimizzazione; e prevede che diventerà tipica dei mercati dell’informazione. È molto semplice: «Prendi qualsiasi cosa tu stia facendo e massimizzane la distribuzione. Ovvero: poichè il costo marginale della distribuzione è zero, tanto vale che tu distribuisca i tuoi prodotti il più possibile».

.

Red Hat lancia la piattaforma di virtualizzazione per server e cloud eterogenei

Chi segue questo blog sa che abbiamo spesso trattato il tema della virtualizzazione, una tecnologia tornata prepotentemente alla ribalta negli ultimi anni e che ha visto nuovi ed importanti attori contendersi con forza il mercato. Da anni il sistema operativo Linux non è più considerato un fenomeno da smanettoni e si è imposto in moltissime realtà aziendali avanzate e mission critical. Il 4 novembre 2009 Red Hat, leader mondiale nella fornitura di soluzioni open source, ha annunciato a Milano la disponibilità di Red Hat Enterprise Virtualization for Servers, la più recente aggiunta alla gamma Red Hat Enterprise Virtualization.

RH01http://www.redhat.com

Questa soluzione è pensata per consentire un’adozione pervasiva della virtualizzazione con un prodotto completo che associa un hypervisor standalone ad avanzate funzionalità di gestione. Secondo Wikipedia la  virtualizzazione è  la tecnologia emergente che sembra raccogliere interesse soprattutto da parte delle aziende, che permette ad un server di gestire diversi sistemi operativi andando ad emulare le istanze dei sistemi operativi “ospiti”; questo agevola il mantenimento di un insieme di applicazioni su un singolo server e con un maggior livello di affidabilità. L’hypervisor è il componente chiave per un sistema basato appunto sulla virtualizzazione.

hypervisor

Già nel febbraio 2009, Red Hat aveva annunciato l’intenzione di presentare Red Hat Enterprise Virtualization che, basato sulla nota piattaforma Red Hat Enterprise Linux, aveva l’obiettivo di offrire la sicurezza, scalabilità, prestazioni e vantaggi in termini di costi che caratterizzano la tecnologia di virtualizzazione open source. Nel settembre 2009, Red Hat ha presentato la base di Red Hat Enterprise Virtualization con Red Hat Enterprise Linux 5.4 che offre la tecnologia di virtualizzazione di nuova generazione Kernel-based Virtual Machine (KVM).

Adesso Red Hat presenta un altro elemento della strategia con Red Hat Enterprise Virtualization for Servers che comprende i seguenti componenti:

• Red Hat Enterprise Virtualization Hypervisor – un hypervisor leggero, standalone ad alte prestazioni progettato per ospitare server e desktop virtuali Linux e Microsoft. Offre una solida base di virtualizzazione per implementazioni cloud e altri ambienti IT altamente dinamici. Con la tecnologia KVM, l’hypervisor offre prestazioni e sicurezza associate alla tecnologia di condivisione della memoria che permette un consolidamento più efficiente del guest e funzionalità enterprise quali la migrazione ‘live’.

• Red Hat Enterprise Virtualization Manager for Servers – una piattaforma per configurare, gestire e organizzare server virtuali Linux e Microsoft Windows. E’ pensata per i clienti che desiderano ridurre i costi, la complessità e il tempo necessario per gestire implementazioni virtuali su larga scala. Con una ricca gamma di funzionalità di gestione e potenti strumenti di ricerca e grouping, Virtualization Manager offre ai clienti la possibilità di controllare in maniera efficace gli ambienti virtuali.

RH02

Per ulteriori informazioni vi rimando al comunicato stampa ed alla nutrita serie di ottimi documenti e presentazioni disponibili sul sito RedHat. Potrete trovarvi anche analisi tecniche, comparazioni con i prodotti della concorrenza e la guida ai prezzi ed alle licenze. Sul sito è disponibile anche uno strumento per il calcolo del TCO comparato con alcuni prodotti famosi. La lettura del post di Eric Sanna sul tema del cloud computing e di questo mio post sulla valutazione economica degli investimenti ICT può contribuire a chiarire i concetti fin qui espressi.

Se state valutando la possibilità di consolidare la vostra infrastruttura attraverso l’adozione di una piattaforma di virtualizzazione, allora sul sito RedHat trovate abbastanza materiale per fare confronti tra le diverse soluzioni di mercato e per stressare ben bene i funzionari commerciali delle aziende che bussano alla vostra porta.

 

Business Intelligence con Good Data

Good Data è una piattaforma di business intelligence disponibile sul web.

gooddata1

Good Data è in grado di memorizzare i dati online, permette di costruire e gestire un modello di dati multi-dimensionale utilizzando diverse fonti di dati, fornisce gli strumenti per analizzare i dati in un ambiente collaborativo, ed i mezzi per condividere i risultati con gli altri. Tutto ciò senza alcun software da installare, alcuna licenza per l’acquisto e alcuna necessità di supporto informatico.

Il sito di Good Data promette una “Agile BI”, ovvero gli analisti di dati possono sfruttare la potenza di una piattaforma di modellazione altamente flessibile, mentre gli utenti business hanno a disposizione degli strumenti di analisi e di reporting estremamente intuitivi. Questa combinazione consente ai team di analisti di creare e iterare rapidamente sulla proprie analisi.

Dal punto di vista delle tecnologie, Good Data utilizza lo stato dell’arte in materia, è costruita infatti utilizzando  AWS – Amazon Web Service, una delle più estese ed avanzate soluzioni di cloud computing esistenti al mondo. Ciò consente di ottenere diversi vantaggi:

  • Potenza elaborativa a basso prezzo. La parallelizzazione ottenuta dal cloud-computing consente di distribuire contemporaneamente su molte CPU le query ROLAP.
  • Elevata scalabilità. Le elaborazioni di business intelligence risentono spesso di imprevedibili ed elevati picchi di carico, il cloud-computing consente di rispondere in maniera elastica alla domanda, quando ciò accade.
  • Massivo numero di utenti. Good Data esegue una singola istanza della piattaforma di business intelligence per migliaia di utenti, consentendo di tenere molto bassi i costi marginali di mantenimento, servizio e aggiornamento per ciascun utente.
  • Orientamento al servizio. Dato che i nodi hardware sono allocati “in the cloud” e quindi sono transienti, nel senso che posso aggiungerne e toglierne quando ne ho bisogno, al fine di bilanciare il carico e massimizzare il throughput Good Data si basa su una serie di servizi stateless, orientati a garantire il servizio piuttosto che chi lo eroghi e dove.

Per effettuare qualche prova consiglio di registrarsi, effettuare il login, andare su “Switch Project” e scegliere “Create new”.

gooddata2

A questo punto si possono utilizzare le freccette laterali finchè non viene mostrato “New Zealand Census project template”, poi si da un nome al progetto e, dopo aver premuto il tasto “Create”, alcuni dati del Censimento 2006 della Nuova Zelanda saranno disponibili per essere visualizzati, combinati, manipolati tramite Good Data

gooddata3

Sarà inoltre possibile visualizzare o modificare i report predefiniti o crearne degli altri, nonchè esportarli in formato Excel, condividerli, “taggarli”.

gooddata4

Insomma, Good Data è un’applicazione complessa, potente, ben progettata, che utilizza praticamente tutti i paradigmi 2.0: possibilità di upload e condivisione di dati ed esperienze, rich internet application, creazione di comunità, tagging, export degli output generati, possibilità di generare widget da incapsulare nelle proprie pagine Internet.

Il modello di business è il “Freemium”, piuttosto usuale per questo tipo di applicazioni: gratuito fino a 50 utenti, 10 progetti, 10 MB per upload e 100 MB max per progetto. Non sono riportati i costi a seguito del superamento dei limiti.

Io credo che la complessità intrinseca dell’argomento Business Intelligence, prima che dello strumento, renderà Good Data un servizio di nicchia o comunque non adatto alla maggioranza dei navigatori…
però è un gran bello strumento!

Il cloud computing di Amazon Web Services

Amazon Web Services (AWS) è una piattaforma di servizi web interamente basata su una infrastruttura di cloud computing. Per una definizione esaustiva di cloud computing rimando alla definizione di Wikipedia ed al mio precedente post sull’argomento.

Con AWS si può avere a disposizione, in sintesi, potenza di elaborazione, memoria di massa per archiviazione, servizi di database, attraverso una infrastruttura IT “elastica”, variabile in base alle esigenze di business.

Per quanto riguarda la fatturazione dei servizi si paga solo per quello che si usa, senza la necessità di effettuare ingenti spese di avvio o prendere impegni a lungo termine.

AWS usufruisce di una infrastruttura informatica che è la spina dorsale di Amazon.com, un’impresa che fattura circa 15 miliardi dollari l’anno in attività di vendita e distribuzione al dettaglio, eseguendo milioni di transazioni finanziarie ogni mese per i propri clienti.

Dal punto di vista tecnologico AWS poggia su una complessa infrastruttura di cloud computing ed offre diversi servizi:

* Amazon EC2 – Amazon Elastic Compute Cloud – Un servizio web che offre capacità di elaborazione ridimensionabile “in the cloud”, ovvero consente di configurare una Amazon Machine Instance (AMI) e caricarla in servizio Amazon EC2, aumentando o diminuendo la capacità di calcolo al variare dei requisiti di elaborazione.

* Amazon S3 – Amazon Simple Storage Service – Un servizio dotato di una semplice interfaccia web che può essere utilizzato per archiviare e recuperare grandi quantità di dati, in qualsiasi momento, da qualsiasi punto della rete. Fornisce agli sviluppatori un accesso alla stessa infrastruttura di archiviazione datii, scalabile, affidabile, veloce, che Amazon utilizza per gestire la propria rete globale di siti web. > Per saperne di più su

* Amazon CloudFront – Un servizio web per la distribuzione di contenuti. Si integra con gli altri servizi Amazon per fornire agli sviluppatori e alle imprese un modo facile per distribuire contenuti agli utenti finali, con bassa latenza e alta velocità di trasferimento dati.

* Amazon SimpleDB – Un servizio web per l’esecuzione di query in tempo reale su dati strutturati. Il servizio opera in stretto collegamento con Amazon S3 e Amazon EC2, collettivamente, fornendo la capacità di immagazzinare, elaborare e interrogare insiemi di dati “in the cloud”. > Per saperne di più su

* Amazon SQS – Amazon Simple Queue Service – Un servizio affidabile, altamente scalabile, che ospita le code per la memorizzazione dei messaggi mentre questi viaggiano tra i computer. Utilizzando Amazon SQS, gli sviluppatori possono semplicemente spostare i dati tra componenti distribuiti delle loro applicazioni che svolgono compiti diversi, senza perdere messaggi o richiedere ad ogni componente di essere sempre disponibile. Ciò rende semplice la costruzione di workflow, in quanto ogni computer su Internet può aggiungere o leggere messaggi senza aver installato alcun software o aver configurato particolari regole nei firewall. > Per saperne di più su

* Amazon RDSAmazon Relational Database Service – Un servizio che rende facile configurare, operare e modificare un database relazionale “in the cloud”. Amazon RDS fornisce le stesse caratteristiche di un database  MySQL.

* Amazon Elastic MapReduce – Un servizio che mette in grado ricercatori, analisti di dati, sviluppatori, di processare grandi quantità di dati. E’ basato su Hadoop framework, del quale abbiamo parlato in un precedente post, ed è pensato tipicamente per applicazioni di web indexing, data mining, log file analysis, machine learning, financial analysis, scientific simulation.

Il tutto gestito attraverso la AWS Management Console, che consente di avere visivamente sotto controllo l’ambiente di cloud computing, in maniera tale da verificare quali risorse si stanno utilizzando e poter decidere  come sfruttarle più convenientemente.

Infine, casomai non bastasse, c’è anche Amazon VPC – Amazon Virtual Private Cloud – un servizio che consente di collegare una infrastruttura IT esistente ad una nuvola di risorse e servizi AWS. Ciò avviene tramite una VPN (Virtual Private Network) e consente di estendere le caratteristiche dell’infrastruttura IT esistente (es. sicurezza, firewall, intrusion detection, ecc.) alla nuvola di risorse AWS, che pertanto viene isolata dal rimanente mondo AWS.

—-

Si potrebbero fare varie considerazioni rispetto a questo genere di servizi, mi soffermo in particolare sulle seguenti.

Per un informatico è un sogno diventato realtà: lo stato dell’arte della tecnologia moderna, un’estasi di astrazione e virtualizzazione di server, applicazioni e filesystem, distribuiti fisicamente in tutto il mondo e disponibili in tempo reale senza grandi difficoltà.

Per una organizzazione di medio-grandi dimensioni, penso valga la pena di porsi il problema se sia economicamente conveniente continuare a sostenere alti costi di hardware, software, energia elettrica e personale addetto ad un datacenter proprietario, oppure affidarsi -parzialmente o completamente- a servizi professionali del genere AWS. Certo è che nella valutazione economica (cfr. anche post di Donato Moscara sull’argomento) non si può non considerare e monetizzare il valore del patrimonio di dati e di conoscenza diffuso all’interno dell’organizzazione, nonchè valutare attentamente l’opportunità che i propri dati e sistemi siano esterni al perimetro dell’organizzazione.

Le origini del cloud computing

Il cloud computing è lo stato dell’arte della tecnologia informatica.

Ma cos’è, come è nato, a cosa serve, a chi serve, come funziona il cloud computing?

Risponde in maniera chiara a queste domande un video di Simone Brunozzi, Technology Evangelist per gli Amazon Web Services in Europa, intervenuto al XX congresso AIP (Associazione Informatici Professionisti).

Vi consiglio la visione integrale del video, ma se proprio non avete tempo, questa di seguito è una rapida trascrizione*  dell’intervento.

————————–

Il cloud computing ha origine da un problema, ovviamente. Si tratta di una soluzione, ed il problema originale è: l’IT, l’information technology oggigiorno è un costo, non è più un valore come poteva essere considerato una volta. Qualsiasi azienda di medie o grandi dimensioni, oltre che aziende di piccole dimensioni, ha quasi sempre a che fare, prima o poi, con una infrastruttura informatica.

L’informatica ormai pervade ogni attività economica, in Italia ma anche in tutto il mondo, quindi tutti noi, prima o poi, nel lavoro, abbiamo a che fare con una infrastruttura informatica. Oggigiorno, gestire una infrastruttura informatica, comporta dei problemi che sono diventati costosi e difficili da risolvere

Quello che ci interessa della nostra infrastruttura informatica è il servizio, non ci interessa divertirci a spostare cavi… mi interessa che il mio lavoro abbia un risultato, non che sia una attività per la quale non c’è una specializzazione, non c’è un valore aggiunto. E uno dei problemi principali, spesso sottovalutato, è quello della previsione delle necessità informatiche, e ve lo mostro con un grafico molto semplice.

it_costs

Se pensiamo alla capacità informatica, alla capacità di calcolo di una infrastruttura -qui abbiamo in ascisse il tempo ed in ordinate la capacità-, in una infrastruttura tradizionale la nostra capacità rimane costante nel tempo; è quella linea blu che vedete a sinistra.

Noi abbiamo acquistato, tempo fa, una quantità di server, di storage, e questa infrastruttura ovviamente la utilizziamo nel corso degli anni. Poi, cosa succede? Che facciamo una previsione, la previsione è rappresentata dalla linea grigia che vedete tratteggiata. La previsione dice: tra tre mesi la tua capacità non sarà più sufficiente per le tue esigenze, quindi avrai bisogno di incrementare questa capacità, cosa fai? Acquisti i server, i server arrivano, li spacchetti, li cominci a mettere nei rack, a collegare alla corrente elettrica, ti assicuri che la tua potenza elettrica sia sufficiente per questi tuoi nuovi server, che il sistema di raffreddamento sia sufficiente, fai tutte queste attività –se vogliamo anche noiose e ripetitive- per far sì che dopo qualche settimana, a volte anche dopo qualche mese, questa capacità sia finalmente pronta ad essere utilizzata, e quindi la capacità dopo qualche tempo, raddoppia, triplica, aumenta.

Nel mondo reale però le cose non vanno così, non è facile prevedere quali siano le capacità di calcolo che noi abbiamo, per due motivi.

  • Il primo: se noi forniamo servizi informatici, tecnologici, ad altre aziende, quindi a clienti, non sappiamo se domani perdiamo uno di questi clienti oppure se domani ne guadagniamo due di nuovi. Quindi la capacità necessaria fluttua, anche da un giorno all’altro, da una settimana all’altra.
  • Il secondo motivo è che alcune attività hanno peculiarmente una necessità di calcolo variabile: se io calcolo le buste paga per una grande azienda e fornisco questo servizio, il 25 del mese avrò bisogno di molta capacità di calcolo, per gli altri 29 giorni quella capacità di calcolo non mi serve, rimane inutilizzata. Se devo fare backup, se devo salvare i miei dati per sicurezza, il backup di solito non viene fatto a tutte le ore di tutti i giorni, viene fatto più spesso di notte, perché c’è meno attività nella rete interna, oppure nel fine settimana.

Per questi due motivi, messi insieme, nel mondo reale, la capacità di calcolo richiesta è molto più simile alla linea rossa che vedete lì, quindi varia, di giorno in giorno, di ora in ora, a volte.

Il problema di questa situazione qual è? È che l’area tra la linea blu e la linea rossa è capacità che voi avete pagato ma che non state utilizzando, è uno spreco di denaro, di tempo, di investimenti e di iniziative.

Il secondo problema di previsione è che, se avete un successo inaspettato, per qualsiasi motivo -un cliente grandissimo che si affaccia alla vostra porta, oppure il vostro sito web che improvvisamente diventa popolare perché un grande giornale ne parla- la vostra capacità non è in grado di scalare, ovvero di aumentare in maniera rapida quanto richiederebbe la situazione, e quindi perdete delle opportunità, perdete dei clienti. Il vostro successo non riesce ad esprimersi in tutta la vostra gloria perché la vostra infrastruttura non riesce a reggere i ritmi di espansione, di incremento di queste capacità.

Questi due problemi di previsione si risolvono se la vostra infrastruttura, quella che voi utilizzate alla base, riesce ad essere molto flessibile, e quindi, come la linea gialla che vedete lì, seguire la vostra necessità di calcolo ora per ora, giorno per giorno.

Questo è il motivo per cui il cloud computing oggi è così interessante, è così importante.

Tuttavia non voglio darvi una definizione di cloud computing, vi voglio dire, nella pratica, cos’è che rende il cloud computing così importante; tre cose.

  • La prima cosa: il cloud computing è on demand, significa che quando ho bisogno di una capacità di calcolo, di una capacità infrastrutturale, la posso chiedere al volo, senza bisogno di fare previsioni.
  • La seconda è: essere flessibile, ovvero essere capace di scalare in alto, aumentare le risorse, ma anche di scalare in basso, ovvero rilasciarle quando non ne ho più bisogno. E il fatto di rilasciare risorse significa che io smetto di pagare quelle risorse e quindi gli sprechi che vedevamo prima non ci sono più.
  • La terza cosa, importante: le API. Ovvero una interfaccia, un modo di comunicare, generico, che permette a qualsiasi parte, a qualsiasi pezzo della mia infrastruttura, di dialogare, oppure ad esterni di dialogare con la mia infrastruttura, senza dover necessariamente sapere i dettagli di come è implementato quel singolo componente. E questo ovviamente non è stato inventato col cloud computing ma è un vantaggio riconosciuto ormai da tempo.

Queste sono le tre caratteristiche che rendono il cloud computing così importante.

[* non verificata dall'autore]

Semplici strumenti di backup

Come tutti gli utenti ho la necessità di fare i backup in modo sicuro e quanto più possibile automatizzato. Capita sovente, infatti, che presi dalla necessità del momento si utilizzi una delle innumerevoli schede USB che generalmente affollano la scrivania finendo così per perdere il conto di cosa ci sia registrato e quali siano le versioni dei file sparse qua e là . Su Linux c’è il mitico RSync; esiste per il mondo Microsoft uno strumento altrettanto versatile e soprattutto di libero utilizzo? La risposta è sì, esiste e si chiama Synctoy

post_01

Funziona bene ed è molto semplice da usare. Utilizzando le tipiche modalità di interazione a cui ci ha abituati Microsoft, basta configurare una origine ed una destinazione dati e registrarne il nome in modo da poterla poi richiamare manualmente o in maniera automatica.

post_02
In figura ho volutamente evidenziato le opzioni di utilizzo (Synchronize, Echo e Contribute) nonché le possibilità di filtraggio dei file sottoposti a backup. Insomma, a mio parere un prodotto davvero utile.