I big data stanno diventando troppo grandi? Un enorme 90% di tutti i dati esistenti nel mondo è stato prodotto negli ultimi due anni - e solo il 20% di esso viene utilizzato. Con l'analisi dei big data incapace di tenere il passo, questa crescita esponenziale si sta dimostrando impossibile da gestire, e c'è un risultato molto ovvio: la maggior parte dei dati raccolti dai sensori aziendali, individuali e di Internet of Things non viene utilizzata.

Dati non strutturati, inutilizzati e non amati in agguato su computer, server e archivi di organizzazioni di tutto il mondo è una chiara dimostrazione del fatto che le aziende, pur diventando sempre più digitalizzate e incentrate sui dati, vivono ancora nel buio.

I dati scuri possono essere metadati prodotti da altri sistemi (Image Credit: NASA)

Che cosa sono i dati scuri?

Dati inutilizzati o "oscuri" sono la storia del mondo degli affari che non riesce a soddisfare le aspettative su larga scala. I dati oscuri sono definiti da Gartner come "le risorse informative che le organizzazioni raccolgono, elaborano e archiviano durante le normali attività commerciali, ma generalmente non riescono ad utilizzarle per altri scopi".

“Principalmente stiamo parlando di informazioni transazionali, file di log, metadati che non sono stati utilizzati, piccole parti di informazioni non analizzate che sembrano non avere alcun valore e potrebbero essere viste come il prodotto di scarto di altri sistemi e processi,” afferma John Culkin, direttore della gestione delle informazioni presso Crown Records Management, che fornisce consulenza alle aziende sulle politiche relative ai dati. Aggiunge anche a quella bozza di lista, email temporanee e vecchie e file ZIP.

Dati oscuri possono nascondersi su laptop aziendali inutilizzati

Da dove vengono i dati oscuri?

“I dati scuri rappresentano circa l'80% del totale dei contenuti di qualsiasi organizzazione,” afferma Stephen Mackey, Senior IM Consultant presso la società di gestione delle informazioni Kefron, che insiste sul fatto che è il risultato di processi aziendali standard di tutti i giorni.. “I dati scuri sono tutto il contenuto che viene lasciato nascosto, nascosto nei sistemi e nei server, sottoutilizzato o dimenticato,” Aggiunge.

Secondo IDC, il 90% dei dati non strutturati non viene mai analizzato, il che è spesso il risultato di un pericoloso atteggiamento antieliminazione, alimentato sia dalla regolamentazione della conformità che dalla disponibilità di uno storage di dati a basso costo nel cloud e altrove.

“Per una società di vendita al dettaglio o di produzione, ad esempio, le informazioni finanziarie possono essere correttamente conservate come un record,” dice Culkin, aggiungendo, “ma sebbene i dati generati da molti sistemi di vendita e consegna non siano richiesti, sono raramente cancellati.” Tuttavia, un atteggiamento conservatore nei confronti dei dati crea rischi.

Entro il 2020 potrebbero esserci 21 miliardi di dispositivi IoT

Perché i dati oscuri sono dannosi?

Esistono due modi principali in cui i dati scuri possono danneggiare un'azienda. In primo luogo, c'è un rischio per la sicurezza nel non cancellare i dati. “È importante che i file non vengano dimenticati,” dice Mackey. “Se non vengono monitorati e conservati al sicuro, le informazioni business-critical che contengono potrebbero essere estratte senza conoscenza e utilizzate per motivi nefandi.”

I dati che non verranno utilizzati dovrebbero essere eliminati o protetti da accessi non autorizzati, poiché le informazioni riservate, sensibili e non strutturate potrebbero includere i dettagli dell'account cliente, il che produce problemi di conformità.

Il secondo modo in cui i dati oscuri possono danneggiare un'azienda è il costo indiretto dei soldi. “Molte aziende non sono consapevoli di che tipo di dati esista nemmeno, e sono questi dati nascosti che ostacolano le revisioni interne e i controlli esterni,” dice Mackey. “Che cosa succede se un problema viene sollevato su un account di due anni fa e il pagamento viene chiamato in causa, ma non è possibile trovare fatture e record?” lui chiede. La risposta è semplice; i dati oscuri costano denaro alle aziende.