Pesquisadores estimam que o mundo produziu cerca de 1.5 bilhão de gigabytes de informação em 1999 e em três anos a quantidade dobrou. Os dados já estavam aumentando consideravelmente naquela época, e na ocasião, foi-se criado os “3Vs” para descrever os desafios do gerenciamento de dados em empresas – volume, variedade e velocidade.
Em 2008, um número proeminente de cientistas de computadores popularizou o termo “Big Data”, prevendo que a computação de Big Data iria transformar as atividades das empresas, pesquisadores científicos, práticas médicas e operações de inteligência e defesa. No entanto, o termo, “Big Data”, ainda está em aberto.
De acordo com o dicionário de inglês da Oxford, o termo é definido da seguinte forma:
(1) Dados com grandes quantidades, e que tornam a sua manipulação e gerenciamento, desafios logísticos significantes.
Porém estamos em 2014 e talvez o primeiro lugar que devíamos olhar é a Wikipédia, que definiu o termo dessa forma (antes do dicionário da Oxford):
(2) Um termo que abrange qualquer conjunto de dados que sejam tão largos e complexos que se torna difícil para processar usando ferramentas de gerenciamento manual ou processamento de aplicações tradicionais.
O estudo globalmente divulgado em 2011 pela McKinsey, auxiliou nesse desafio em definir o termo:
(3) Dados cujo tamanho está além da capacidade de ferramentas comuns de software para capturar, armazenar, gerenciar e analisar.
Os pesquisadores da McKinsey reconheceram que “essa definição é intencionalmente subjetiva e incorpora uma definição maleável do quão grande devem ser os dados para se tornarem Big Data”.
Outra fonte proeminente de Big Data veio do livro de Viktor Mayer-Schönberger e Kenneth Cukier’s. Eles ofereceram um ponto para o que pode ser feito com os dados:
(4) “A habilidade da sociedade para atrelar informação em novas maneiras para produzir insights úteis e bons, e serviços de valor significante”.
Entre tantas outras definições de Big Data, confira mais algumas que podem ser possíveis de utilizar:
(5) “O amplo alcance de novos e massivos tipos de dados que apareceram desde a última década”.
(6) “As novas ferramentas que ajudaram a encontrar dados relevantes para realizar análises”.
(7) “A convergência de empresas e consumidores de TI”.
(8) “O deslocamento (para empresas) para processar dados internos e filtrar dados externos”.
(9) “O deslocamento (para indivíduos) para consumir e criar dados”.
(10) “A crença de que quanto mais dados você tiver, mais perspectivas e respostas vão surgir automaticamente”.
(11) “Uma nova atitude nos negócios, agências governamentais e indivíduos que combinam dados de múltiplas fontes para levar a melhores decisões”.
Com Forbes