Pratica BD - Capitulo 3
Pratica BD - Capitulo 3
Pratica BD - Capitulo 3
br
1.00
INICIAR
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 1/44
29/05/2023, 13:52 Ead.br
introdução
Introdução
Seja bem-vindo(a) à disciplina de Prática de Banco de Dados! A proposta
principal desta unidade é definir conhecimentos sobre Big Data. Em um
mundo competitivo e digital, empresas buscam por informações que possam
garantir liderança de mercado, tomadas de decisões mais assertivas,
conhecimento sobre cliente e soluções inovadoras, a informação se torna um
bem precioso. Quem detém a informação está à frente do mercado, consegue
entender tendências, abrir novos mercados etc. Nesse ponto, tecnologias
como Big Data e Mineração de Dados, permitem que empresas possam
compreender toda essa ebulição de informações existente, principalmente na
internet.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 2/44
29/05/2023, 13:52 Ead.br
Big Data
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 3/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 4/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 5/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 6/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 7/44
29/05/2023, 13:52 Ead.br
reflita
Reflita
A agência nacional de segurança
americana consegue analisar 1,6% do
tráfego global de dados, cerca de 30
milhões (30 peta bytes) todos os dias.
Você consegue imaginar o volume de
dados a 100%?
A Figura 3.2 apresenta uma explicação macro dos cinco pilares do Big Data.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 8/44
29/05/2023, 13:52 Ead.br
Tipos de Dados
Tempos atrás, dados eram geralmente carregados em estruturas tradicionais
de banco de dados e possuíam uma estrutura compreensível. Por exemplo,
dados de um usuário como nome, CPF, e-mail etc., ou dados da venda de uma
certa quantidade de produto, preço da venda, data da venda etc. Esses dados
eram chamados de dados estruturais, porque tinham uma estrutura definida
e fixa. Um exemplo de uma tabela é demonstrado na Figura 3.3.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=LP… 9/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 10/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 11/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 12/44
29/05/2023, 13:52 Ead.br
(código aberto), o que significa que seu código-fonte está disponível de graça,
e qualquer empresa pode editá-lo sob a licença General Public License (GPL).
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 13/44
29/05/2023, 13:52 Ead.br
praticar
Vamos Praticar
O Big Data é um conceito novo e emergente que está sendo muito utilizado pelas
empresas para diversos fins. Esse conceito é baseado em cinco pilares que
representam o porquê do uso dessa tecnologia em comparação a um sistema de
banco de dados tradicionais.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 14/44
29/05/2023, 13:52 Ead.br
Mineração de
Dados
Para torná-la mais eficiente, o DW deve ter uma coleção de dados agregada
ou resumida. Barbieri (2011) aponta que os conceitos de garimpagem ou
mineração de dados estão relacionados à tendência (para aplicações
comerciais) de buscar correlações escondidas em altos volumes de dados
nem sempre evidentes, principalmente no tratamento cotidiano dos sistemas
de informações. Já para Santos e Ramos (2009), a mineração de dados é uma
fase do processo de DCBD (Descoberta e Conhecimento em Base de Dados) e
consiste na procura de relacionamentos, padrões ou modelos que estão
implícitos nos dados armazenados sem grandes bases de dados.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 15/44
29/05/2023, 13:52 Ead.br
De acordo com Bery e Linoff (2000 apud SANTOS; RAMOS, 2009), existe uma
diferença entre descrição e previsão que depende do objetivo da tarefa da
mineração de dados, possibilitando um aumento do conhecimento a respeito
dos dados e suporte ao processo de tomada de decisão.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 16/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 17/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 18/44
29/05/2023, 13:52 Ead.br
preditiva que, por sua vez, usa dados históricos como princípio essencial
para decisões. A Figura 3.6 apresenta um resumo das técnicas.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 19/44
29/05/2023, 13:52 Ead.br
reflita
Reflita
O Brasil é o país do futebol. Será que a
mineração de dados ajudaria a
encontrar novos Pelés?
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 20/44
29/05/2023, 13:52 Ead.br
saiba
mais
Saiba mais
A ferramenta de planilha eletrônica da
empresa Microsoft chamada Microsoft Excel
pode ser usada para mineração de dados.
Você pode compreender mais sobre como
usar o MS Excel para minerar dados
integrados a um banco de dados relacional
SQL.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 21/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 22/44
29/05/2023, 13:52 Ead.br
Árvores de
decisão,
Windows Microsoft
AcknoSoft Kate raciocínio
UNIX Access
baseado em
caso
Árvores de
Knowledge
Angoss decisão, Windows ODBC
SEEKER
estatística
Redes
Business Business neurais,
Windows ODBC
Objects Miner aprendizado
de máquina
Análise
estatística, Windows
CrossZ QueryObject ODBC
algoritmo de MVS UNIX
otimização
Abrangente,
pode misturar ODBC
Data Data diferentes compatível
Unix
Distilleries Surveyor tipos de com
mineração de ODMG
dados
Análise OLAP,
DBMiner associações,
Microsoft
Technology DBMiner classificação Windows
7.0 OLAP
Inc. algoritmos de
agrupamento
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 23/44
29/05/2023, 13:52 Ead.br
Classificação,
regras de
Intelligent
IBM associação, UNIX (AIX) IBM DB2
Miner
modelos de
previsão
Aquisição de
conhecimento ODBC
Megaputer Windows
PolyAnalyst simbólico, Oracle
intelligence OS/2
programação DB2
evolucionária
Management
Regras de
NCR Discovery Windows ODBC
associação
Tool (MDT)
Árvores de
Oracle
Purple decisão,
MineSet UNIX (irix) Sybase
Insight regras de
Informix
associação
Árvores de
UNIX
decisão, ODBC
Enterprise (solaris)
SAS redes neurais, Oracle
Miner Windows
regressão, AS/400
Macintosh
agrupamento
Quadro 3.1 - Lista de ferramentas
Fonte: Adaptado de Elmasri e Navathe (2011, p. 717).
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 24/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 25/44
29/05/2023, 13:52 Ead.br
praticar
Vamos Praticar
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 26/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 27/44
29/05/2023, 13:52 Ead.br
Data Lake
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 28/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 29/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 30/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 31/44
29/05/2023, 13:52 Ead.br
Tecnologias como Big Data, Mineração de Dados e Data Lake são novas,
resultado de uma evolução natural do mundo de Tecnologia da Informação e
Comunicação agregada ao negócio. No próximo tópico, veremos exemplos de
como organizações de diferentes áreas utilizam a mineração de dados para
alcançarem seus objetivos estratégicos.
praticar
Vamos Praticar
O volume de informações que trafega diariamente na internet extrapola a
capacidade de gerenciadores de banco tradicionais. Essas informações são dados
dos mais variados tipos, como arquivos textuais, imagens, registro de banco de
dados, arquivos de transferência de dados etc. Algumas tecnologias emergentes
conseguem manipular esses dados.
Com base no texto, assinale a alternativa que apresenta uma tecnologia que agrupa
dados brutos em um único repositório.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 32/44
29/05/2023, 13:52 Ead.br
a) Hadoop.
b) Data Lake.
c) MapReduce.
d) Data mining.
e) Yarn.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 33/44
29/05/2023, 13:52 Ead.br
Na Prática
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 34/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 35/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 36/44
29/05/2023, 13:52 Ead.br
praticar
Vamos Praticar
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 37/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 38/44
29/05/2023, 13:52 Ead.br
indicações
Material
Complementar
LIVRO
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 39/44
29/05/2023, 13:52 Ead.br
FILME
Transcendence – A Revolução
Ano: 2014
Comentário: Esse filme tem ingredientes de
Inteligência Artificial (IA), física quântica, nanotecnologia
e Big Data. O ator Johnny Depp interpreta Dr. Will
Caster, reconhecido e famoso pesquisador na área de
IA, que sofre tentativa de morte quando está
analisando milhares de dados sobre o cérebro, com o
intuito de desenvolver uma máquina com a capacidade
de lidar com informações de todos os tipos e fontes
(Big Data) com as emoções humanas.
Para conhecer mais sobre o filme, acesse o vídeo a
seguir.
TRAILER
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 40/44
29/05/2023, 13:52 Ead.br
conclusão
Conclusão
Nesta unidade, você compreendeu que a tecnologia Big Data é um conceito
que se refere a uma imensa quantidade de dados e informações
armazenados e representa um grande desafio às empresas contemporâneas,
que precisam saber como lidar com esse excesso de dados e transformá-los
em informações úteis e relevantes para auxiliar na tomada de decisão.
referências
Referências
Bibliográficas
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 41/44
29/05/2023, 13:52 Ead.br
GUPTA, S.; GIRI, V. Practical Enterprise Data Lake Insights: Handle Data-
Driven Challenges in an Enterprise Big Data Lake. Apress, 2018.
JOHN, T.; MISRA, P. Data Lake for Enterprises . Packt Publishing Ltd, 2017.
PASUPULETI, P.; PURRA, B. S. Data lake development with big data . Packt
Publishing Ltd, 2015.
WITTEN, I. H.; FRANK, E.; HALL, M. A. Data Mining: Practical Machine Learning
Tools and Techniques. 3. ed. Santos: Morgan Kaufmann, 2011.
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 42/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 43/44
29/05/2023, 13:52 Ead.br
https://student.ulife.com.br/ContentPlayer/Index?lc=c8HVygcWE3DcS6tBTvrIkg%3d%3d&l=8DC6%2f15XMQ7A4vJoORGVRA%3d%3d&cd=L… 44/44