Introdução Abigdatae Internet Das Coisas (Iot) : Izabelly Soares de Morais
Introdução Abigdatae Internet Das Coisas (Iot) : Izabelly Soares de Morais
Introdução Abigdatae Internet Das Coisas (Iot) : Izabelly Soares de Morais
A BIG DATA E
INTERNET DAS
COISAS (IOT)
Introdução
As informações e os dados nunca foram tão acessíveis quanto o são
hoje em dia. Por meio da internet, conseguimos saber basicamente de
tudo que ocorre na nossa localidade e no mundo. A cada ação nossa,
provavelmente, muitos dados estão sendo gerados para as empresas
responsáveis pelos artefatos e serviços tecnológicos de que fazemos uso.
Neste capítulo, você vai compreender melhor sobre os conceitos de
dados e datasets, assim como vai conseguir visualizar a ação conjunta que
pode haver entre a ciência de dados e as tecnologias Big Data, tanto por
meio de contextualizações quanto de práticas.
Dados e datasets
Você já parou para pensar na quantidade de observações que estamos sempre
fazendo em tudo que está ao nosso redor? O ser humano, devido à sua racio-
nalidade, consegue lidar com, interpretar e associar diversos acontecimentos
quase que simultaneamente. E essa não é uma característica desenvolvida
apenas quando somos adultos. Se você entrar em uma loja de brinquedos
com uma criança, você compreenderá melhor o que estamos falando, já que
as primeiras reações quase sempre serão as de as escolhas serem realizadas
com base em alguns padrões já preestabelecidos pela criança. Mas você pode
estar se questionando sobre o que isso tem a ver com dados e datasets, não é?
Basicamente tudo, pois, quando fazemos observações sobre algo, no decor-
rer do tempo, vamos formando padrões, até mesmo definindo preferências, e
2 Ciência de dados e Big Data
agimos dessa forma durante toda a nossa vida. Além disso, geralmente, nossas
escolhas são baseadas nessas experiências. Se fizermos uma analogia com essa
situação comum do cotidiano com o mundo dos negócios, em que decisões
são tomadas a todo instante, não seria muito diferente, tendo em vista que
todo negócio constrói um conhecimento sobre si mesmo e sobre seus clientes
e produtos no decorrer do tempo.
Hoje, ao acompanharmos pesquisas e noticiários, deparamo-nos com um
protagonista que já existe há muito tempo, mas que só dos últimos tempos
para cá virou o foco de todos: os dados. Mas como podemos defini-los?
A definição mais básica de um dado é sabermos que, se estiver só, ele não
faz sentido, de modo deve haver informações sobre ele, ou seja, complementos
informacionais e até mesmo contextos, para que ele tenha sentido e possa
gerar algum conhecimento.
Ao analisarmos a fundamentação do conceito de dados, vemos claramente
que ele é um ativo importante dentro de um negócio, e podemos afirmar que
nas nossas atividades cotidianas também! Você conseguiu perceber como
somos geradores de dados e informações constantes?
Mas e dataset, o que seria? Em sua tradução livre, o termo significa
conjunto de dados. Mencionamos que as informações são um coleção de
dados e, dentro desse contexto, é relevante notar que o contexto científico
exige que visualizemos níveis mais profundos dos processos dedutivos
e intuitivos de observação para que possamos registrá-los com precisão.
Uma maneira de fazer isso é construir um conjunto de dados, os quais são
apresentados de várias formas. Em sua grande maioria, os dados são repre-
sentados por meio de planilhas, podendo conter diversas linhas ou colunas,
e não necessariamente precisam assumir aquela ideia que temos de planilhas
desenvolvidas em alguns softwares específicos.
Um conjunto de dados possui algumas características relevantes, como a
estruturação dos dados, já que, como citado anteriormente, lidar com dados é
um trabalho extremamente minucioso, tendo em vista que o dado é o recurso
chave de todo processo. Deve haver, também, a possibilidade de recuperação,
acesso e identificação dos dados diante de todo o conjunto, ação que geralmente
ocorre por meio de comandos ou disponibilização de links de acesso, além de
certa frequência nas atualizações dos dados.
Do ponto de vista de Ramakrishnan e Gehrke (2013, p. 784), existem muitos
motivos para que os dados sejam semiestruturados. A estrutura dos dados pode
ser implícita, oculta, desconhecida ou o usuário pode optar por ignorá- la. Além
disso, ao se integrar dados de várias fontes heterogêneas, a troca e a transformação
de dados são problemas importantes. Dessa forma, é necessário que haja um
Ciência de dados e Big Data 3
Os dados não estruturados são aqueles dados cujo contexto total nem sempre a
tecnologia consegue visualizar, como, por exemplo, em arquivos textuais.
Já os dados estruturados conseguem ser totalmente classificados e identificados
com o uso das tecnologias.
O que não podemos deixar de comentar é que existem vários profissionais que
lidam com os dados e que, muitas vezes, com a ajuda da tecnologia, nem sempre
estão totalmente ligados ao setor de tecnologia da empresa, já que, na maioria das
vezes, as tomadas de decisões são realizadas por profissionais administrativos.
A análise de dados pode ser realizada com o uso de algumas tecnologias, como NoSQL,
Hadoop, Sisence, TIBCO Spotfire, dentre outras.
8 Ciência de dados e Big Data
Leituras recomendadas
AMARAL, F. Introdução à ciência de dados: mineração de dados e big data. Rio de
Janeiro: Alta Books, 2016.
ANTONELLI, R. A.; NEITZKE, A. C. A.; VOESE, S. B. Relação entre a qualidade da informação
recebida e o nível de tomada de decisão dos profissionais da área de negócios. Revista
Ambiente Contábil, v. 10, n. 2, jul./dez. 2018. Disponível em: <https://periodicos.ufrn.br/
ambiente/article/view/12739/9538>. Acesso em: 23 dez. 2018.
CAVIQUE, L. Big Data e Data science. Boletim APDIO, v. 51, p. 11-14, dez. 2014. Disponível
em: <https://repositorioaberto.uab.pt/bitstream/10400.2/3918/1/2%20Boletim_51.11-14.
pdf>. Acesso em: 23 dez. 2018.
FOREMAN, J. W. Data Smart: usando data science para transformar informação em
insight. Rio de Janeiro: Alta Books, 2018.
PROVOST, F.; FAWCETT, T. Data Science para negócios: o que você precisa saber sobre
mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta Books, 2016.
Conteúdo: