Big Data SourcesBig Data è un termine utilizzato per identificare una raccolta di dataset così grande e complessa da richiedere l’utilizzo, per una loro corretta gestione, di strumenti di memorizzazione ed analisi differenti da quelli tradizionali; questo vale per tutte le fasi del processo di gestione dei Big Data: dall'acquisizione, alla curation, passando per la condivisione, l’analisi e la visualizzazione.

I Big Data, pur essendo un tema ad alta complessità intrinseca, rappresentano, per tutte le organizzazioni, una importante fonte di conoscenza collettiva, dalle grandi potenzialità in termini di diagnostica predittiva multidisciplinare e di monitoraggio di fenomeni sociali, economici, competitivi e tecnologici.

Nell’universo di fonti che possono alimentare dataset Big Data, per “Open Data” vengono considerate tutte le fonti di tipo aperto, ovvero quell’insieme di informazioni di libero accesso normalmente distribuite attraverso i canali internet “emersi” (Surface Web).

I “Private Data” rappresentano invece tutti quei dati disponibili all’interno delle organizzazioni, sia di tipo strutturato che destrutturato, che possono riguardare, ad esempio, tematiche infrastrutturali, operative, commerciali o di security.

Per ultimi, ma non in ordine di importanza, abbiamo le fonti del Deep Web e Dark Web che pur classificate come "Open Data" risultanto non indicizzate dai principali motori di ricerca e presentano dati “nascosti”, accessibili esclusivamente attraverso canali particolari, come ad esempio la rete TOR o le chat IRC.

Web Sources ClassificationNelle logiche ValueCore/DeepView di macro-classificazione delle Fonti, in generale possiamo quindi suddividere il web in tre grandi categorie:

Surface Web, questo livello comprende tutti i siti, i contenuti o in generale tutti gli indirizzi indicizzati dai maggiori motori di ricerca (Google, Bing, Wikipedia, etc.).

Deep Web, comprende tutti quei contenuti, non indicizzati dai motori di ricerca, il cui accesso è consentito esclusivamente attraverso l’indirizzo web di quella particolare pagina, magari utilizzando sistemi di autorizzazione o autenticazione.

Dark Web, definito come insieme di dati e contenuti resi intenzionalmente invisibili e non accessibili se non attraverso particolari canali, autorizzazioni e sistemi di anonimizzazione.  bigData2

Approcciando questi argomenti, è molto importante comprendere l'ordine di grandezza che caratterizza le informazioni disponibili sul web. Dalle ultime stime risulta che il World Wide Web è costituito da oltre 550 miliardi di documenti, di cui solo 2 miliardi sono indicizzati dai motori di ricerca come Google.

Da questa considerazione se ne deduce che meno dell'uno per cento di tutte le informazioni disponibili su internet possono essere considerate Fonti del Surface Web, mentre il restante 99% è raggiungibile solo attraverso canali meno "usuali" (Deep o Dark Web).

Ma non è solo la loro dimensione a caratterizzare i Big Data.  I cluster di informazioni nel mondo ValueCore e DeepView, che siano strutturati o destrutturati, sono definiti “Big Data” solo se rispettano le caratteristiche descritte nella seguente figura:

Big Data FeaturesTali caratteristiche conferiscono ai BigData delle peculiarità tali per cui per la loro gestione e analisi è necessario implementare processi complessi, dispendiosi e altamente strutturati.

ValueCore ha quindi sviluppato la piattaforma DeepView, dedicata alla gestione multi-disciplinare di tali temi, che consente di configurare e gestire efficaciemente tutte le fasi di recupero, gestione e analisi di cluster di informazioni "Big Data", consentendo alle organizzazioni nostre clienti di sfruttarne a pieno le caratteristiche innovative, l'elevato valore competitivo e il fattore altamente abilitante che queste rappresentano.

Scegli il Tuo Modello di Business

On-Premise

Gestisci la piattaforma DeepView in piena autonomia installandola direttamente sulla tua infrastruttura hardware!

Scopri di più

Hybrid

Decidi come dislocare i moduli della piattaforma DeepView sulla base delle tue disponibilità hardware o delle tue necessità!

Scopri di più

Saas

Svicolati dalla gestione Hardware utilizzando DeepView, interamente o in parte, attraverso il modello Software as a Service.

Scopri di più

IaaS

Scegliendo il modello Infrastructure as a Service, potrai utilizzare DeepView su una infrastruttura esterna completamente dedicata.

Scopri di più

PaaS

Utilizzando il modello Platform as a Service, potrai utilizzare DeepView come servizio attraverso un Cloud dedicato!

Scopri di più