Share via


Gestione IT: Alla ricerca di dati

Gli elevati volumi di dati sono prossimi a superare le capacità di analisi e gestione dell'azienda moderna, ma esistono sia problematiche che opportunità.

Rob Sobers

Il fenomeno dei Big Data generati dagli utenti comprende i petabyte e gli esabyte dei dati strutturati e non strutturati generati dalle imprese moderne. Rimane tuttavia un grande dubbio in merito ai Big Data: si tratterà anche in questo caso di un privilegio ad appannaggio di pochi o riguarderà tutti noi?

I contenuti generati dagli utenti includono tutti i file e i messaggi di posta elettronica creati quotidianamente: presentazioni, documenti di elaborazione di testo, fogli di calcolo, file audio e altri documenti generati ogni ora, file che utilizzano quasi tutto lo spazio di archiviazione digitale nella maggior parte delle organizzazioni. È necessario conservarli per grandi quantità di tempo e a essi sono associati numerosissimi metadati.

La quantità di contenuti generati dagli utenti è immensa e quella dei relativi metadati ancora di più. Si tratta delle informazioni su un file: l'autore, il tipo, la cartella in cui è archiviato, gli utenti che lo hanno letto e quelli che vi hanno eseguito l'accesso. I contenuti e i metadati rappresentano l'universo dei Big Data generati dagli utenti.

Valanghe di dati

Il problema: la maggior parte delle organizzazioni non è dotata degli strumenti necessari per sfruttare i Big Data generati dagli utenti. In un recente sondaggio svolto su oltre 1.000 esperti di Internet e altri utenti generici e pubblicato dal Pew Research Center e dall'Imagining the Internet Center presso la Elon University, è emerso che il mondo potrebbe non essere ancora pronto a gestire e comprendere correttamente i Big Data.

Questi esperti sono giunti alla conclusione che la grande quantità di dati (da loro soprannominata "scorie digitali") che verrà generata entro il 2020 potrebbe ottimizzare enormemente la produttività, migliorare il livello di trasparenza delle organizzazioni ed espandere le frontiere del "futuro conoscibile", ma esprimono dubbi in merito a chi possa accedere a queste informazioni, a chi ne controlli l'accesso e all'eventualità che tali informazioni vengano utilizzate in modo appropriato dagli enti governativi o dalle organizzazioni.

In base al sondaggio: "Le analisi di Big Data eseguite dagli utenti e dai computer potrebbero migliorare i servizi di intelligence sociali, politici ed economici entro il 2020. L'avvento di quelli che comunemente chiamiamo Big Data agevolerà operazioni quali le previsioni in tempo reale degli eventi, lo sviluppo di "software deduttivo" per la valutazione di modelli di dati per gli esiti dei progetti e la creazione di algoritmi per correlazioni avanzate che favoriscono una comprensione più chiara del mondo".

Il 39% degli esperti di Internet intervistati si trova d'accordo con la controtesi sui vantaggi relativi ai Big Data, in base alla quale: "Le analisi di Big Data eseguite dagli utenti e dai computer potrebbero determinare più problemi che vantaggi entro il 2020. L'esistenza di grandi aggregazioni di dati da analizzare determinerà un livello di confidenza ingannevole nelle nostre capacità di previsione e molti arriveranno a commettere errori significativi e particolarmente pericolosi. Inoltre, l'analisi di Big Data verrà sfruttata dai potenti e dalle istituzioni con fini opportunistici che manipoleranno i risultati a proprio piacimento".

Bryan Trogdon è un imprenditore che ha preso parte al sondaggio. "I Big Data sono il nuovo petrolio", dichiara. "Le società, i governi e le organizzazioni che saranno in grado di sfruttare a fondo questa risorsa potranno ricavarne molti più vantaggi. In una società in cui velocità, agilità e innovazione determinano vincitori e vinti, anziché assumere un atteggiamento prudenziale, con i Big Data dovremo sempre accettare una minima percentuale di rischio".

Jeff Jarvis, professore e blogger, ha affermato nel sondaggio: "I media e gli enti regolatori tendono a demonizzare i Big Data e la presunta minaccia alla privacy che rappresentano. Questo atteggiamento di panico morale è sempre più frequente per via dei numerosi cambiamenti che si verificano nelle tecnologie, ma la morale della favola non cambia: ci sono aspetti positivi in questi dati e nella nostra nuova capacità di condivisione.

"I fondatori di Google hanno sollecitato gli enti regolatori pubblici a non imporre loro di eliminare rapidamente le ricerche poiché, con i loro modelli e le loro anomalie, sono comunque riusciti a monitorare l'epidemia di influenza prima delle autorità sanitarie e, adottando lo stesso approccio per una pandemia, potrebbero salvare milioni di vite", prosegue Jarvis. "Demonizzare i dati, inclusi in piccole o grandi aggregazioni, significa demonizzare la conoscenza, il che non è mai saggio".

Sean Mead è direttore di analisi presso Mead, Mead & Clark, Interbrand. "Set di dati pubblicamente disponibili, strumenti più semplici, una distribuzione più estesa delle competenze analitiche e l'adozione preliminare di software di intelligenza artificiale determineranno un'impennata nelle attività economiche e nella produttività pari a quella generata da Internet e dalla rivoluzione dei PC verso la fine degli anni '90", afferma Mead. "Nasceranno movimenti sociali per liberare l'accesso a repository di grandi aggregazioni di dati al fine di limitare lo sviluppo e l'utilizzo di intelligenza artificiale e di renderla finalmente più accessibile".

Al di là dell'analisi

Si tratta di argomenti alquanto interessanti, che iniziano a raggiungere il nocciolo della questione. I nostri set di dati sono cresciuti ben oltre la nostra capacità di analisi ed elaborazione senza dover ricorrere a sofisticati sistemi di automazione. Dobbiamo affidarci alle tecnologie per analizzare e far fronte a questa ondata incontrollata di contenuti e metadati.

L'analisi di Big Data generati dagli utenti cela un potenziale enorme. Inoltre, la capacità di sfruttare la potenza dei metadati è ormai essenziale per gestire e tutelare contenuti generati dagli utenti. Le condivisioni di file, i messaggi di posta elettronica e le Intranet hanno notevolmente semplificato per gli utenti aziendali le operazioni di salvataggio e condivisione di file, al punto che la maggior parte delle organizzazioni dispone oggi di una quantità di contenuti generati dagli utenti di gran lunga superiore a quella che sono in grado di gestire e tutelare in modo sostenibile con aggregazioni di dati ridotte.

Molte imprese si trovano di fronte a una serie di problematiche reali, in quanto non sono più in grado di rispondere alle domande come accadeva invece 15 anni fa in merito a set di dati statici di dimensioni ridotte. Alcune di queste domande includono: dove si trovano i dati critici? Chi può accedervi? Chi dovrebbe accedervi? Di conseguenza, IDC, azienda di ricerca del settore, stima che solo la metà dei dati che dovrebbero essere protetti lo sia effettivamente.

Il problema va ad aggiungersi a quello delle condivisioni di file basate su cloud. Questi servizi creano infatti un'ulteriore moltitudine di contenuti generati dagli utenti che necessitano di processi di gestione e tutela. E i contenuti nel cloud si trovano all'esterno delle infrastrutture aziendali, con controlli e processi di gestione diversi, che determinano ulteriori livelli di complessità.

Secondo David Weinberger del Berkman Center presso la Harvard University, "Iniziamo solo ora a capire la portata dei problemi risolvibili tramite Big Data, sebbene dovremo riconoscere di essere persone meno imprevedibili, libere e avventate di quanto ci piacerebbe pensare. Se la capacità di sfruttare la potenza dei Big Data generati dagli utenti potrà rendere la protezione e la gestione dei dati meno imprevedibili, libere e avventate, le organizzazioni non potranno che esserne grate".

Il concetto di Big Data generati dagli utenti porrà le imprese di fronte a un numero uguale di problematiche e opportunità nei prossimi anni.

Rob Sobers

Rob Sobers* è un progettista, sviluppatore Web responsabile di strategie tecniche per Varonis Systems. È autore di un popolare blog sulla sicurezza e sullo sviluppo di prodotti software, all'indirizzo accidentalhacker.com, e ha collaborato all'e-book "Learn Ruby the Hard Way" (ruby.learncodethehardway.org, 2011). Esperto di tecnologie da 12 anni, prima di collaborare con Varonis si è occupato di progettazione tecnica e servizi professionali.*

Contenuto correlato