Każdego dnia duże organizacje aktualizują się o technologie, które ułatwiają i najlepiej pasują każdej firmie, stając przed ogromnymi wyzwaniami, które pozwalają im odkrywać i analizować poza narzędziami, które są używane na co dzień, to dla nich została stworzona tak zwane Big Data lub w Hiszpanii ogromne dane, które są wielkoskalowymi systemami przechowywania danych.
To zjawisko przechowywania jest ujęte w nowe technologie informacyjne i komunikacyjne. Big Data zajmuje się wszystkimi czynnościami związanymi z systemami przechowującymi duży zestaw danych. Jedną z głównych cech jest to, że manipuluje dużą ilością informacji, gromadząc je, klasyfikując, a następnie przechowując. Celem tego zbioru jest tworzenie raportów statystycznych na użytek organizacji, m.in. do analizy biznesplanów, reklamy, szpiegostwa.
Margines przechowywania wzrósł z biegiem lat, od 2008 r. Poziom przechowywania był mierzony w petabajtach do zettabajtów danych. Eksperci okresowo poszukują nowych metod przechowywania, ponieważ istnieją pewne obszary, w których trzeba przechowywać duże ilości danych, a istniejące programy nie są zbyt optymalne.
Istnieją tysiące narzędzi do przeprowadzania i zarządzania Big Data, jednak nie wszystkie są takie same, istnieją trzy typy danych, którymi są:
- Dane strukturalne: te, w których dane mają bardzo specyficzną strukturę, taką jak między innymi daty, liczby. Przykładem są arkusze kalkulacyjne.
- Dane nieustrukturyzowane: zwykle są to dane, które mają określony format i nie mogą być przechowywane w arkuszu kalkulacyjnym, a tym bardziej manipulować informacjami, przykład dokumentów PDF.
- Dane częściowo ustrukturyzowane: ten typ danych nie ma określonego formatu, ponieważ ma własne metadane częściowo ustrukturyzowane, przykładem są kody HTML.