Big data – definicje
Termin big data sam w sobie jest definiowany na różne sposoby. Włącza on generalnie woluminy danych o dużej objętości – stąd też wynika to znaczenie, ponieważ big data to duże dane. Zwyczajowo jednak termin ten odnoszony jest do działań analitycznych oraz systematyzujących oraz technologii służących do składowania danych.
W kontekście big data najczęściej stosuje się model 3V, czyli volume (objętość), variety (różnorodność), velocity (szybkość przetwarzania), który pochodzi z 2001 roku. Za dekadę, a mianowicie w 2011 roku, pojawiły się też dwa dodatkowe wymiary w ramach big data, a mianowicie zmienność (variability) i złożoność (complexity).
Gdzie stosuje się big data?
„Duże dane” spotykane są przede wszystkim w różnych bazach danych, które używane są w niemalże każdej dziedzinie naszego współczesnego życia. Spotykane są między innymi w medycynie, telekomunikacji, branży IT, aby wspomnieć tylko o niektórych przykładach, ponieważ jest ich o wiele więcej.
Dane te są gromadzone w dużych ilościach każdego dnia. Wiele produkowanych obecnie danych to tak zwane dark data, czyli dane, które nie są usystematyzowane, czyli nie możemy łatwo wyszukiwać wśród nich różnych, potrzebnych nam informacji. Jednak aktualnie liczba tych danych maleje, co wynika również z zaawansowanych technologii wykorzystanych w ich analizie i strukturyzowaniu.
Sztuczna inteligencja a big data
W kontekście big data duże znaczenie ma też sztuczna inteligencja i jej rozwój. Chodzi tutaj dokładnie o samouczenie maszynowe, które odnosi się do maszyn potrafiących uczyć się samodzielnie i łatwiej zarządzać dużymi danymi – bez potrzeby ingerencji człowieka.
Zatem big data to obecnie rzeczywistości – duże dane są produkowane i przetwarzane przez wiele firm. Ze względu na ich rosnącą ilość każdego dnia konieczne jest również stosowanie odpowiednich technologii dla ich łatwiejszego analizowania i systematyzowania – tutaj do gry wchodzi właśnie sztuczna inteligencja.