BI A Inteligência de Negócios
BI A Inteligência de Negócios
BI A Inteligência de Negócios
1
BI: A inteligência de negócios
Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro
meio, eletrônico ou mecânico, incluindo fotocópia, gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação,
Vice-Presidente de Pós-Graduação
Paulo de Tarso Pires de Moraes
e Educação Continuada
Carlos Roberto Pagani Junior
Camila Braga de Oliveira Higa
Carolina Yaly
Conselho Acadêmico Danielle Leite de Lemos Oliveira
Juliana Caramigo Gennarini
Mariana Ricken Barbosa
Priscila Pereira Silva
ISBN 978-85-522-0646-0
CDD 330
2018
Editora e Distribuidora Educacional S.A.
Avenida Paris, 675 – Parque Residencial João Piza
CEP: 86041-100 — Londrina — PR
e-mail: editora.educacional@kroton.com.br
Homepage: http://www.kroton.com.br/
SUMÁRIO
Bons estudos!
1
Introdução ao
BI
Objetivos Específicos
• Analisar como a alteração do ambiente de negócios implicou na criação de sistema de BI (Business
Intelligence).
Introdução
Desde o fim da década de 90, o ambiente de negócios se modificou radicalmente, com efeito
LAUDON, 2011). Com isso, houve um maior nível de competição para a empresa e ela teve de tomar
decisões mais rapidamente. Para isso e para ter uma maior assertividade nas decisões retirando sub-
Neste contexto, surgiram sistemas computadorizados de apoio à decisão que ficaram conhecidos
como Business Intelligence (BI) ou Inteligência de Negócios. BI contempla uma série de ferramentas,
resultados, seja de uma área ou da empresa como um todo. Para cada componente, existem diversas
Adicionalmente, serão analisados quais os benefícios gerados pelos BI. Um dos benefícios principais
mento. Tal fato irá auxiliar a empresa na tomada de decisões mais assertiva, que é considerada como
uma vantagem competitiva em função das decisões mais rápidas, também pode ocorrer reduções de
Para uma correta implementação de sistemas de BI, devem ser avaliadas as condições necessárias
para propiciar esse fato, pois a implantação de BI costuma ser lenta e custosa (CECI, 2012). Deve ser
ação.
7
1. Ambiente de negócios, BI e seus
componentes
O termo Business Intelligence (BI) ou inteligência de negócios foi patenteado por Gartner Group em
meados da década de 1990. Entretanto, já existiam sistemas computadorizados desde os anos 1970,
que ainda não possuíam opções de análise e tinham baixa capacidade de customização. Tais sistemas
Informações Executivas que simplificavam o uso dos DSS e traziam informações estratégicas para os
década de 1990, surgiram soluções por meio das quais era possível inserir análises, tendências e gerar
al., 2009). Contudo, por outro lado, diversos concorrentes de outros países surgiram em seu mercado
nacional. Tal fato aumentou o nível de concorrência em diversos mercados e, com isso, muitas empre-
Além disso, a evolução da Tecnologia da Informação e Comunicação (TIC), possibilitou tanto mudan-
ças na empresa quanto no público consumidor. Antes da proliferação da Internet e de mídias sociais,
os consumidores tinham um pequeno poder frente às empresas (CARVALHO, 2015). Com essas fer-
ramentas, o consumidor irá pesquisar as informações do produto antes de comprar, comparar com
concorrentes e ler opiniões de usuários do produto. Caso compre o produto e não esteja satisfeito,
certamente irá utilizar suas mídias sociais para reclamar desse fornecedor. Com isso, há significativo
aumento das demandas do consumidor que desejam produtos, bem como uma ampla gama de pro-
dutos que podem, ainda, ser customizados, ter qualidade excelente e entrega o mais breve possí-
vel. Além de deterem mais poder na relação com as empresas, os consumidores estão menos fiéis,
8
Considerando o cenário ilustrado na Figura 1, a seguir, e com base nas análises, informações e pre-
visões que normalmente são obtidas por meio de sistemas computadorizados de suporte para decisão,
9
1.1 Definição de BI
Para saber mais
Segundo Silva (2011, p.32), Business A análise SWOT é um dos métodos mais tradicionais
para definir a estratégia de um negócio. Essa técnica
Intelligence (BI) ou inteligência de negócios permite revelar os pontos fortes e fracos da empre-
sa, e as oportunidades e ameaças do mercado. Para
pode ser definida como a transformação ter uma visão bem didática e aplicada dessa matriz,
consulte o material elaborado por Paulillo (s.d). Mais
metódicos dos dados oriundos de quaisquer
detalhes em: <https://www.agendor.com.br/blog/
fontes de dados, sejam eles estruturados e analise-swot-de-uma-empresa/>. Acesso em: 7 de
maio de 2018.
não estruturados, em novas formas de propi-
1.2 Arquitetura
e componentes de BI
Sistemas de BI podem ser divididos em quatro componentes principais: um data warehouse (DW)
com seus dados-fonte, a análise de negócios, uma coleção de ferramentas para manipular e anali-
sar os dados no data warehouse, inclui-se ainda o data mining e business performance management
(BPM), para monitoria e análise do desempenho e uma interface de usuário, por exemplo: o dashbo-
ard. Já existem ferramentas de inteligência artificial que estão dentro do escopo de BI.
10
O Data Warehouse é um banco de dados ou repositório de dados especial-
mente preparado para dar suporte a aplicações de tomada de decisão. Para
a análise de negócios dos data warehouse,
existem ferramentas que realizam consultas
e relatórios customizados. Adicionalmente,
o processamento analítico online (OLAP) Para saber mais
O objetivo da Inteligência Artificial (IA) é o desen-
é uma das formas de modelagem do Data volvimento de sistemas que realizem tarefas que, no
Warehouse. momento, são melhor realizadas por seres humanos
do que por máquinas, ou não possuem uma solução
Em um data mining, há o processo de de algoritmo que seja implementável e viável pela
computação tradicional (RUSSEL; NORVIR, 1995).
identificação de padrões úteis, previamente
1.3 Benefícios do BI
Pode-se definir Dado como uma representação de atributos que podem representar transações e
operações de um determinado produto (CECI, 2012). Por sua vez, informação é um conjunto de dados
11
que cria um padrão e apresenta um significado. Para Fialho et al. (2006), pode-se definir conhecimento
1.4 Implantação
de sistemas de BI
A implantação de uma iniciativa de BI não é uma atividade simples, rápida, nem de baixo custo. E
caso não seja considerada uma série de demandas, a implementação pode resultar em falha (TURBAN,
cios da empresa. O BI deve ser utilizado para melhoria dos processos da empresa (GARTNER, 2004).
para implantar o BI, a empresa pode preparar um plano de ação detalhado. Isso deve ocorrer devido
ao fato que um sistema de BI pode possuir três dimensões: a primeira dimensão é a tecnológica; a
12
pessoas; por fim, a terceira dimensão é a gerencial, para a resolução de conflitos.
A comunidade de usuários de BI dentro de uma mesma organização pode ser de diferentes áreas
e de diferente nível de conhecimento, acerca das ferramentas, e nível hierárquico (LAUDON, 2011).
Um fator que dificulta a implantação é o tamanho e diversidade da comunidade de usuários, pois o
sucesso do BI será maior quanto mais usuários estiverem utilizando as informações vindas dele.
Atualmente, muitas empresas fornecedoras de software disponibilizam ferramentas diversificadas,
algumas delas são totalmente pré-programadas (chamadas shells).
Considerações finais
• O ambiente externo das empresas está cada vez mais competitivo. Por um lado, as empresas
têm novos mercados para explorar e fornecedores de todo o mundo, contudo possuem novos
concorrentes internacionais, os consumidores são mais exigentes, menos fiéis e a tecnologia está
evoluindo mais rápido.
• Para uma tomada de decisões melhor e mais rápida, os executivos precisam das informações
certas na hora certa e no lugar certo. Sistemas de BI possibilitam o envio dessas informações,
contribuindo para um diferencial competitivo da empresa.
• BI contempla diversos componentes, metodologias, interfaces, tais como o Dashboard, e ferra-
mentas de análise, como o Data Mining e os bancos de dados ou Data Warehouse.
• Informação é um conjunto de dados com um padrão, criando um significado. Sistemas de BI
conseguem obter informações de um grande conjunto de dados. Um conjunto de informações
forma conhecimento.
• O BI deve estar alinhado com a estratégia da empresa e deve ser utilizado para melhorar os pro-
cessos nas diversas áreas.
13
Glossário
Business Intelligence (BI): Inteligência de negócios, um “guarda-chuva” que contempla arquitetu-
Data Warehouse (DW): repositório de dados especial, preparado para dar suporte a aplicações de
tomada de decisão.
Dashboard: um painel para exibição visual das informações mais importantes e necessárias para
alcançar um ou mais objetivos, consolidados e organizados em uma única tela, para que a informação
Verificação de leitura
b) Dashboard.
c) DSS.
d) DW.
e) BPM.
14
QUESTÃO 2- Sobre a relação entre fatores do ambiente de negócios, reação das empresas
e sistemas computadorizados de apoio à decisão, assinale a alternativa correta.
a) A Internet e as mídias sociais levaram mais informações aos consumidores, mas isso não
mudou a relação deles com as empresas, na qual os consumidores são o elo mais fraco.
b) As empresas líderes de seus respectivos setores não precisam implantar sistemas de BI.
c) A necessidade de uma maior agilidade na tomada de decisão é uma das motivações para
implementação de sistemas de BI.
d) Marcos regulatórios não interferem no ambiente das empresas e nem em seus sistemas
de informação.
QUESTÃO 3- Sobre a implementação de BI, um fator que colabora para o seu sucesso é:
a) a compra de todas as ferramentas comerciais.
b) a realização uma avaliação inicial da organização dos sistemas de informação, dos usuários
do sistema e da cultura da empresa.
15
Referencias bibliográficas
CARVALHO, Cristina. O consumidor está no poder. Harvard Business Review, 23 mar. 2015.
CECI, Flávio. Business intelligence. Palhoça: UnisulVirtual, 2012. Disponível em: <http://www.
maio de 2018.
CIO INSIGHT. Toyota’s Business Intelligence: Oh! What a Feeling. 2004. Disponível em: <https://
www.cioinsight.com/c/a/Case-Studies/Toyotas-Business-Intelligence-Oh-What-a-Feeling>. Acesso
FEW, Stephen. Common pitfalls in Dashboard Design. Perceptual Edge. 2006. Disponível em: <https://
GARTNER Inc. Using Business Intelligence to Gain a Competitive Edge. A special report. Gartner:
LAUDON, Jane P.; LAUDON, Kenneth C. Sistema de Informações Gerenciais. 11ª ed. São Paulo: Pearson, 2011.
OLIVEIRA, Marco César de. Efeitos da Globalização. O Economista, Joinville, 31 maio 2010. Disponível
PAULILLO, Gustavo. Tudo o que você tem que saber sobre análise SWOT de uma empresa. Blog
RUSSELL, S. J.; NORVIG, P. Artificial Intelligence: A modern approach. Prentice Hall, 1995.
SILVA, Dhiogo Cardoso da. Uma arquitetura de business intelligence para processamento analítico
TURBAN, Efraim et al. Business intelligence: um enfoque gerencial para a inteligência do negócio.
16
Gabarito
17
2
Data
warehouse
Objetivos Específicos
• Entender as definições básicas, conceitos e arquiteturas de data warehouse.
Introdução
Devido ao aumento de pontos de contato entre a empresa e o cliente, como lojas físicas, site, ter-
a transações. Com isso, existe uma tendência de os dados serem armazenados em bases de dados
independentes. Apesar de funcionar bem para o contexto operacional, do ponto de vista gerencial,
ter muitas bases de dados independentes e dispersas é um problema, posto que não traz uma visão
sistêmica da empresa.
Neste texto, serão definidos conceitos relacionados ao data warehouse e banco de dados como de
bit, byte, campo, registro, arquivo, banco de texto. Um data warehouse pode ser definido como um
banco de dados que armazena dados, atuais e históricos, de interesse potencial para os tomadores
de decisão dentro de uma empresa. Após esses conceitos iniciais, as principais arquiteturas de data
componentes (TURBAN et al., 2009). Adicionalmente, as arquiteturas serão comparadas para verifi-
de integração de dados com foco no processo que realiza a extração, transformação e carregamento
dos dados. Por fim, serão analisados os passos para o desenvolvimento de um data warehouse, bem
19
1. Data warehouse
No item 1.1, serão abordados conceitos introdutórios ao armazenamento de dados, como banco de
dados e registro. No item 1.2, é definido o conceito de Data Warehouse e são listadas as suas princi-
pais características. No item 1.3, são definidos os conceitos de Data Mart. O item 1.4 mostra as arqui-
teturas principais de Data Warehouse. Os itens 1.5 e 1.6 analisam os processos de obtenção, transfor-
warehouse.
O computador organiza os dados em uma hierarquia que inicia com bit e bytes, evoluindo para
campos, registros, arquivos e banco de dados. A palavra BIT é uma abreviação para BInary DigiT e
mento de oito bits que representa um caractere, por exemplo, uma letra. Um grupo de caracteres ou
um grupo de palavras pode formar um campo como no caso de o nome de uma pessoa ou no caso
de um endereço.
produto. Um grupo de campos relacionados forma um registro e um grupo de registro, por sua vez,
forma um arquivo. Um banco de dados pode ser definido como um conjunto de arquivos relaciona-
dos entre si com registros que descreve uma entidade, a qual pode ser uma pessoa, lugar, produto ou
evento, sobre a qual de se armazenar informações. Cada característica descrita por uma entidade é
20
FIGURA 1: A HIERARQUIA DE DADOS
FONTE: o autor.
Adicionalmente, apenas existiam estruturas de banco de dados primitivas e entradas de dados sim-
ples. Uma empresa de destaque foi fundada em julho de 1979, nos Estados Unidos, com o nome de
21
1.2 Definição e características do Data Warehouse
Na década de 1990, houve uma nova abordagem para a solução do problema de ilhas de dados.
no mercado.
22
1.3 Data Mart
Um Data Mart é normalmente menor e Exemplificando
As áreas de finanças, operações, vendas e marketing
foca em um departamento ou assunto espe- podem ter Data Warehouse customizado para elas,
sendo denominado Data Mart. Assim, cada área pode
cífico. Sendo assim, é um subconjunto de ter visões diferentes dos dados centralizados.
Data Warehouse, consistindo de apenas uma
Um Data Mart pode ser tanto dependente quanto independente. Um Data Mart dependente é um
subconjunto, que é criado diretamente para o Data Warehouse. A vantagem é o uso de um modelo
Por sua vez, um Data Mart independente é um pequeno Warehouse projetado para uma unidade
de negócios ou um departamento, e não para uma empresa como um todo, pois o custo de um Data
memória de curto prazo. Um Enterprise Data Warehouse (EDW) é um Warehouse de grande escala
as arquiteturas de duas e três camadas mais comuns. Existem três partes em um Data Warehouse: o
conjunto de dados e o software associado aos dados; o software de aquisição de dados ou back-end,
responsável pela extração dos dados dos sistemas legados e fontes externas, pela consolidação e totali-
zação desses registros e pelo seu carregamento no Data Warehouse; e o software cliente, chamado de
front-end, que permite aos usuários acessarem e analisarem os dados do Data Warehouse.
Em uma arquitetura de duas camadas, como ilustrado na figura 2 a seguir, a primeira camada é
formada pela estação de trabalho. Já a segunda, contempla tanto os servidores de aplicação quanto
23
FIGURA 2: ARQUITETURA DE DATA WAREHOUSE DE DUAS CAMADAS
Em uma arquitetura de três camadas, como ilustrado na figura 3 a seguir, a primeira camada é
24
FIGURA 3: ARQUITETURA DE DATA WAREHOUSE DE TRÊS CAMADAS
25
arquitetura o baixo custo e o fácil acesso para os usuários, uma vez que é realizado por meio
poderiam ser incompatíveis com computador do usuário final. A figura 4 mostra essa arquitetura
26
1.5 Processo de Integração, Extração, Transformação
e Carregamento de Dados
Por um lado, trabalhar com múltiplas bases de dados, sejam elas integradas a um Data Warehouse
ou não, é um desafio muito complexo que requer muita expertise. Por outro lado, os benefícios podem
ser de grandes proporções, excedendo em muitas vezes o custo dessa tarefa. O processo para Data
Warehouse inclui fontes de dados, extração e transformação de dados, carregamento de dados, banco
de dados, metadados e ferramentas de middleware. A figura 5, a seguir, ilustra as relações existentes
entre os componentes, a partir da obtenção dos dados para a visualização das informações.
27
As fontes de dados são originadas de múltiplos independentes sistemas “legados” e, provavel-
mente, de provedores de dados externos como o Instituto Brasileiro de Geografia e Estatística – IBGE.
planejamento de recursos, isto é, Enterprise Resource Planning (ERP). Dados da Web, em forma de
Os dados são carregados em uma área de teste, na qual são transformados e limpos. A partir disso,
os dados estão prontos para serem carregados em um Data Warehouse ou em um Data Marts.
Os bancos de dados devem ser compreensíveis, pois, essencialmente, o data warehouse da orga-
nização é utilizado para dar suporte a análises de decisões, com o fornecimento de informações deta-
Os Metadados são mantidos para que possam ser acessados pelos responsáveis de TI e usuários.
Tal estrutura tem objetivo de facilitar a recuperação e organização e representa informações sobre os
permissões, como analistas de sistemas, podem escrever suas consultas em SQL. Usuários com per-
missões mais restritivas, como analistas de negócios, podem somente acessar dados. Existem diver-
sas aplicações front-end, isto é, processos que interagem diretamente com o usuário de negócios
por meio de interfaces. E por meio dessas interações, os dados são armazenados em repositórios,
A integração compreende três processos principais: acessos aos dados, serviços de federação de
dados e captura de mudanças. Quando os três processos são corretamente implementados, os dados
podem ser acessados e ser acessíveis para um conjunto de ETL e ferramentas de análises e ambientes
de Data Warehousing. Os serviços de federação de dados possibilitam, por meio de técnicas e softwa-
res, a coleta de dados de fontes distintas e a agregação de todos os dados coletados em um reposi-
28
Alguns fornecedores de software se nota-
bilizaram por oferecer ferramentas de inte-
gração de dados. O SAS Institute, por exem- Link
O SAS Institute está presente em 140 países do
plo, possui ferramentas de integração de
mundo e tem mais de 70 mil empresas, governos
dados de clientes que melhoram a qualidade ou universidades como clientes. O endereço para a
página do SAS Institute no Brasil é: <https://www.
dos dados no processo de integração. sas.com/pt_br/home.html>. Acesso em: 8 de maio
de 2018.
Várias tecnologias de integração possibili-
promete uma integração de dados em tempo real e de diversas fontes, tais como: bancos de dados
mento, ou seja, extraction, transformation, and load (ETL). O processo ETL é tipicamente um projeto
centrado em dados. O processo ETL consiste na extração, leitura dos dados de uma ou mais base
de dados, e na transformação, isto é, na conversão dos dados extraídos de sua forma anterior para a
forma necessária, para que ele possa ser colocado no Data Warehouse, e no carregamento, ou seja,
29
influencia em muitas áreas da empresa,
que terão interfaces de entradas e saídas,
assim como pode ser parte da estratégia
Para saber mais
de negócios. Existem questões que afetam se uma organização
comprará uma ferramenta de transformação de dados
Um Data Warehouse proporciona uma ou se ela mesma construirá um processo de transfor-
mação, tais como: preço das ferramentas de trans-
série de benefícios diretos e indiretos. Entre formação de dados; ferramentas de transformações
de dados podem ter uma curva de aprendizado lon-
os benefícios diretos, pode-se destacar que ga; há a dificuldade de mensurar como a empresa de
TI está desempenhando até que ela tenha aprendido
os usuários finais terão capacidade de realizar
a usar as ferramentas de transformações de dados
(LAUDON; LAUDON, 2011).
análises extensivas de diversas formas. Além
disso, é possível uma visão consolidada dos
samento da informação passe de sistemas operacionais de alto desempenho e custo para servidores de
características da empresa que devem ser consideradas para o projeto de um Data Warehouse? Quais
Considerações finais
• Data Warehouse é um repositório de dados atuais e históricos de potencial interesse para
• Existem três partes em um Data Warehouse: o conjunto de dados e o software associado aos
-end que permite aos usuários acessar e analisar os dados do data warehouse.
30
• O processo mais comum de Data Warehousing é baseado na extração, transformação e carre-
Glossário
Data Warehouse: conjunto de dados produzidos para dar suporte ao processo de decisão.
Data Mart: subconjunto de data warehouse, consistindo em apenas uma única área de interesse.
Enterprise Data Warehouse (EDW) : warehouse de grande escala que é utilizado por meio da
Verificação de leitura
QUESTÃO 1- Um subconjunto de um Data Warehouse, com uma única área da empresa, é
conhecido como:
a) metadados;
b) base de dados;
c) Data Mart;
e) SAS.
31
QUESTÃO 3- Assinale a alternativa em que existe benefício em relação ao Data Warehouse.
a) Sistemas de Data Warehouse são sempre de baixo custo de hardware.
b) Com um Data Warehouse eficiente, é possível ter um bom balizamento para decisões.
c) Se um concorrente usa um Data Warehouse, a empresa também deve fazer um, mesmo
que não o utilize.
Referências bibliográficas
CECI, Flávio. Business intelligence. Palhoça: UnisulVirtual, 2012. Disponível em: <http://www.
de maio de 2018.
LAUDON, Jane P.; LAUDON, Kenneth C. Sistema de Informações Gerenciais. 11ª ed. São Paulo:
Pearson, 2011.
TURBAN, Efraim et al. Business intelligence: um enfoque gerencial para a inteligência do negócio.
32
Gabarito
33
3 Mineração
de dados e
inteligência
artificial
Objetivos Específicos
• Descrever a mineração dos dados ou Data Mining e listar seus objetivos e benefícios.
os modelos de agrupamento.
• Conhecer conceitos e aplicações de Inteligência Artificial (IA), do inglês Artificial Intelligence (AI),
em sistema de BI.
Introdução
Com o aumento da quantidade de dados gerados para uma empresa nas suas operações, é neces-
sário que exista capacidade para analisar a base de dados originada. Dificilmente seria possível iden-
tificar padrões de comportamento dos dados somente com capacidade humana. As ferramentas de
clusterização da base de dados e nas previsões de comportamento futuro. Esses resultados podem ser
aplicados a diversos setores de atuação, desde bancos, varejo a governos. Além disso, é possível rea-
lizar descoberta de conhecimento em banco de dados, quando são realizadas etapas adicionais, tais
como Seleção de dados, Pré-processamento, Transformação, Data mining e, por fim, deve-se avaliar
35
1. Mineração de dados e inteligência
artificial
No item 1.1, serão elaboradas definições sobre Mineração de dados e serão verificadas algumas das
principais aplicações. No item 1.1.1, serão analisadas as principais características de Data Mining e seus
objetivos. Já o item 1.1.2, explora as classificações de Data Mining e as diferentes técnicas existentes.
A seção 1.2, por sua vez, aborda sobre a descoberta do conhecimento em banco de dados. Por fim,
empresas dos diversos setores, contudo a capacidade de análise de dados, sem ferramentas especí-
cios ou Business Intelligence (BI) que, a partir dos dados coletados, realiza
dados a fim de encontrar relacionamentos inesperados e de resumir os dados de uma forma que eles
Como o custo de armazenar dados e de processá-los diminuiu de forma drástica desde os anos
36
2000, a resultante desses fatos foi que a quantidade de dados armazenados em formatos digitais
cresceu em uma velocidade exponencial (TURBAN et. al, 2009). Com a geração de grandes bancos
de dados, existe um maior foco na análise desses dados coletados pela empresa.
baseada na Web. O miner é um usuário final, capacitado com ferramentas poderosas de consulta para
informações escondidas tanto em arquivos corporativos quanto aquelas arquivadas em registros públi-
cos. Ferramentas de Data Mining são facilmente combinadas com planilhas e com outras ferramentas
Sem ferramentas de Data Mining, seria necessário tirar a sorte grande, o que, muitas vezes,
37
envolve descobrir um resultado inesperado e exige que os usuários finais pensem de forma criativa.
Com as ferramentas, as informações são descobertas por meio da junção e da sincronização de dados
sário usar processamento paralelo para Data Mining. Assim, o Data Mining inclui tarefas como: extra-
almente, a dedução das regras desses padrões, a partir dos dados. Existem três tipos de métodos que
É possível acelerar o desempenho da análise ao focar nas variáveis mais relevantes. Habitualmente,
os algoritmos de Data Mining são divididos em quatro categorias amplas: classificação, agrupamento,
associação e descoberta de sequência. Existem outras ferramentas de análise de dados, como visu-
alização, regressão de dados e análise de séries temporais que encontram ampla aplicação prática.
38
comuns e um determinado conjunto de objetos de um banco de dados, classificá-los em diferentes
classes, de acordo com um modelo de classificação, e gerar um modelo que pode, automaticamente,
gerar uma previsão do comportamento futuro. As ferramentas mais comuns de classificação são redes
neurais, regras se-então-senão e árvores de decisão, que são definidas como uma raiz seguida de
nós internos, em que cada nó é nomeado com uma questão e arcos associados, com cada nó cobrem
Outra categoria é conhecida como Agrupamento ou Clusterização, que consiste na divisão do banco
de dados em segmentos que possuem características semelhantes. Uma diferença entre a categoria
A Associação é uma categoria de algoritmo de Data Mining, a qual estabelece relações entre os
itens que ocorrem conjuntamente em um mesmo registro. Uma das aplicações primárias dessa técnica
A descoberta de sequência, por sua vez, trata-se de uma identificação de associações ao longo do
cliente na loja, ocorre uma análise temporal para identificar o comportamento ao longo do tempo.
39
Há diversos métodos para elaboração de Data Mining. Um software de Data Mining, por exemplo,
pode implementar uma ou mais dessas técnicas.
Com os dados organizados e armazenados no Data Warehouse, o próximo passo para a desco-
berta de conhecimento é aplicar métodos de análises estatísticas e de Inteligência Artificial (IA). Dessa
mulado que, frequentemente, é deixado de lado, contido em seus próprios bancos de dados.
O Data Mining pode ser tanto baseado em hipótese quanto baseado em descoberta. Se base-
ado em hipótese, inicia-se com uma proposição do usuário que, então. busca validar a veracidade
Dessa forma, pode revelar fatos que uma empresa desconhecia ou ignorava no passado (CARVALHO,
2005).
Outro conceito importante é Text Mining que pode ser definido como a aplicação de Data Mining
em arquivos de texto não estruturados ou menos estruturados. Também existe Web Mining, que pode
ser definida como a descoberta e análise de informações úteis e interessantes provenientes da Web,
sobre a Web e, geralmente, por meio de ferramentas baseadas na Web (TURBAN et al., 2009).
Outra classificação das ferramentas e técnicas é baseada na estrutura dos dados e nos algoritmos
utilizados. Assim, pode-se dividir em computação neural, algoritmos genéticos, agentes inteligentes,
razões baseadas em casos e outras ferramentas, como indução das regras e visualização dos dados.
Ferramentas de Data Mining são aplicadas aos mais diversos setores, desde seguros, bancos, elei-
toral, telemarketing, segurança, policial, recursos humanos, companhias aéreas, sistemas de saúde e
40
pode ser definida como um processo que usa os métodos de Data Mining para encontrar informações
e padrões úteis nos dados (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1998). A figura 1, a seguir, mos-
tra cada uma das etapas desse processo que se inicia com a seleção dos dados do Data Warehouse e
que, a partir disso, são pré-processados e posteriormente transformados. Com os dados transforma-
dos, é realizada a etapa de mineração dos dados. Assim, são detectados padrões de comportamento
dos dados e, com base na avaliação e no entendimento desses padrões, pode-se construir um conhe-
41
Intelligence (AI), cujo objetivo era o desenvolvimento de sistemas para realizar tarefas que, no
momento, são melhor realizadas por seres humanos do que por máquinas, ou não possuem solução
algorítmica viável pela computação convencional. Assim, Inteligência Artificial é o estudo dos sistemas
que agem de um modo que, para um observador qualquer, parece ser inteligente e envolve utilizar
métodos baseados no comportamento inteligente de humanos e outros animais para solucionar pro-
A IA tem interface com diversas ciências, tais como: computação, engenharia, matemática, socio-
logia, neurofisiologia, linguística, filosofia, psicologia, entre outras. Possui diversas aplicações, como
robôs autônomos.
lução da Inteligência Artificial e utilização de redes neurais, quais atividades domésticas poderão ser
Considerações finais
• Mineração de Dados é a análise de grandes conjuntos de dados, a fim de encontrar relaciona-
mentos inesperados e de resumir os dados de uma forma que eles sejam tanto úteis quanto
• Três tipos de métodos são usados para identificar padrões em dados: Modelos simples, como
42
SQL ou raciocínio humano; Modelos intermediários, como árvores de decisão, regressão; e
• Inteligência Artificial é o estudo dos sistemas que agem de modo que, para um observador qual-
Glossário
Mineração de Dados ou Data Mining: processo que utiliza técnicas matemáticas, estatísticas, de
inteligência artificial e de aprendizado de máquina para extrair e identificar informações úteis e, con-
Inteligência artificial (IA) ou Artificial Intellingence (AI): Estudo dos sistemas que agem de modo
Rede Neural Artificial (RNA): conjunto de neurônios artificiais interconectados, que são um cons-
Verificação de leitura
QUESTÃO 1- Uma ferramenta de Data Mining possui nós e ligações entre os nós. Cada nó
indica um teste feito sobre um valor e as ligações entre nós representam os valores possíveis
do teste do nó superior. Qual o nome dessa ferramenta?
a) Redes Neurais.
b) Árvores de Decisão.
c) Clusterização.
d) Análise Temporal.
e) Regressão.
43
QUESTÃO 2- Assinale a alternativa correta em relação à Mineração de Dados.
a) Mesmo sem ferramentas, é muito fácil descobrir padrões nos dados para bases de dados
muito grandes.
c) Data Mining só tem aplicação teórica e não foi aplicada com sucesso na prática.
e) A Mineração de Dados pode ser aplicada com sucesso em diversos setores de negócio.
e) foram desenvolvidos sistemas para realizar tarefas que antes eram melhor realizadas por
seres humanos do que por máquinas.
Referências bibliográficas
CAMILO, Cássio Oliveira; SILVA, João Carlos. Mineração de Dados: Conceitos, Tarefas, Métodos e
CARVALHO, Luís Alfredo Vidal de. Data Mining: A Mineração de Dados no Marketing, Medicina,
COPPIN, Ben. Inteligência artificial. Trad. Jorge Duarte Pires Valério. Rio de Janeiro: LTC, 2017.
FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From Data Mining to Knowledge
44
HAND, David; MANNILA, Heikki; SMYTH, Padhraic. Principles of Data Mining. Cambridge: MIT
Press, 2001.
SAS INSTITUTE. Data Mining From A to Z: How to Discover Insights and Drive Better Opportunities.
TURBAN, Efraim et al. Business intelligence: um enfoque gerencial para a inteligência do negócio.
Gabarito
QUESTÃO 1-Resposta B: Árvore de Decisão. As árvores de decisão são definidas como uma
raiz seguida de nós internos. Cada nó é nomeado com uma questão e arcos associados, com
cada nó cobrem todas as possíveis respostas associadas ao nó.
QUESTÃO 2-Resposta E: Ferramentas de Data Mining são aplicadas nos mais diversos seto-
res: seguros, bancos, eleitoral, telemarketing, segurança, policial, recursos humanos, com-
panhias aéreas, sistemas de saúde e medicina, empresas de software e hardware, produção
e manufatura, vendas, marketing etc.
45
4
Modelos
descritivos
Objetivos Específicos
• Identificar a necessidade de modelos descritivos.
Introdução
Uma classe importante de métodos de mineração de dados são os modelos descritivos ou mode-
los de aprendizado não supervisionado. São utilizados apenas dados históricos, com suas respecti-
vas variáveis, para a construção de um modelo, e inexiste uma figura externa para guiar o aprendi-
zado. Assim, para obter informações, são verificados se os dados passados possuem um padrão de
comportamento.
Esse tipo de modelo possui aplicação em diversas áreas de conhecimento, nas quais exista abun-
dância de dados experimentais, como Física, Medicina, Marketing e Engenharia. Existem diversas téc-
padrões frequentes de associações entre os atributos de um conjunto de dados. Por sua vez, o agru-
pamento trata de identificar grupos de dados com base na semelhança entre os objetos.
ados em erro quadrático, baseados em densidade, baseados em grafo, baseados em redes neurais e,
também, baseados em grid. É possível comparar o desempenho dos modelos por meio de indicadores
pré-definidos.
1. Modelos descritivos
Na modelagem de modelagem de um processo de Data Mining, uma classe importante de métodos
Nesse tipo de modelo, são utilizados apenas dados históricos, com suas respectivas variáveis, para a
47
construção de um modelo. Além disso, inexiste uma figura externa para guiar o aprendizado.
Assim, para obter informações, são verificados se os dados passados possuem padrões de compor-
junto de dados, um algoritmo de aprendizado de máquina não supervisionado busca como representar
com base na semelhança entre os objetos e suas técnicas são valiosas para explorar dados, tendo apli-
cação em áreas diversas, tais como: Engenharia, Marketing, Medicina, Biologia e Física.
Na análise de agrupamento, o aprendizado está focado nos dados e não são necessários conheci-
mentos anteriores sobre as classes ou as categorias que formarão os agrupamentos (MITCHELL, 1997).
As regras de associações, por sua vez, são utilizadas para descobrir o relacionamento entre variá-
veis em grandes bases de dados, por exemplo: pesquisas em supermercados detectaram que existe
uma forte correlação entre quem são os clientes que compram fraldas e os
48
1.1 Definições sobre clusters
Existem definições sobre características de cluster. Segundo Barbara (2000), um cluster bem sepa-
rado é um conjunto de pontos de modo que qualquer ponto em um determinado cluster está próximo,
ou é mais similar, a cada ponto nesse cluster do que qualquer ponto não pertencente a ele.
Já um cluster baseado em centro considera um conjunto de pontos, de forma que qualquer ponto,
em um dado cluster, está mais próximo ao centro desse cluster do que ao centro de qualquer outro.
Também existe o cluster contínuo ou encadeado, no qual um conjunto de pontos assim como qual-
quer ponto, em um dado cluster, está mais próximo a um ou mais pontos nesse cluster do que a qual-
descritivas possuem diferentes fases, tai como: sumarização, associação e agrupamento. Nessas eta-
pas, podem ser aplicadas desde medidas estatísticas mais rudimentares, como média e desvio padrão,
até complexas técnicas de visualização dos relacionamentos existentes entre atributos (FACELLI et al.,
2011).
frequentes, o que se trata de uma área de pesquisa com muitos estudos e descobertas de conheci-
mento para bases de dados, podendo descrever o comportamento de compra de clientes. O objetivo
dessa mineração de um conjunto de itens frequentes é a descoberta de grupos de produtos que são
comprados conjuntamente com uma frequência maior do que outras combinações de produtos e tam-
bém descobrir a inferência dos produtos que são adquiridos, considerando os que foram comprados
anteriores.
49
Os algoritmos de agrupamento são classificados com base em modelos. Assim é necessário ter
para identificar esses elementos com rótulos, tendo como objetivo descrever a natureza do cluster.
Nessa etapa, busca-se mais que simplesmente descrever, mas também um modo de confirmação da
cluster com um significado. Para fornecer subsídios ao especialista, existem ferramentas para visuali-
densidade, baseados em grafo, baseados em redes neurais e baseados em grid. É possível que os algo-
50
1.4.1 Algoritmo de agrupamento o hierárquico
Em um algoritmo de agrupamento hierárquico, cria-se uma hierarquia de relacionamentos entre os
elementos e, assim, é gerada uma sequência de partições aninhadas. Existe a abordagem divisiva, na
qual um cluster inicia com todos os objetivos, e a sequência é formada a partir da divisão sucessiva
desse cluster. Na abordagem aglomerativa, no início, existe vários clusters, ou n clusters, com um único
objeto. A sequência de partições é formada por meio do agrupamento de clusters. A seguir, a Figura 1
51
1.4.2 Algoritmos participais baseados em erro quadrático
Essa categoria consiste de um algoritmo de partição que otimiza o critério de agrupamento utilizando
uma técnica iterativa. O passo inicial consiste na elaboração de uma partição inicial. Posteriormente, os
objetos são movidos de um cluster para outro, com o objetivo de melhorar o valor do critério de agru-
pamento. Esses algoritmos são computacionalmente eficientes, porém podem convergir para um ótimo
O objetivo desse tipo de agrupamento é encontrar uma partição contendo k clusters, o que minimiza
variância mínima. Por sua vez, minimizar essa função é um problema NP-hard
ões com baixa densidade, no espaço de objetos. Um cluster definido como um componente denso conec-
tado, cresce em qualquer direção dada pela densidade (BERKHIN, 2002), de modo que esses algoritmos
52
algoritmo é que a função de densidade global resultante tem picos locais, os quais podem ser utiliza-
dos para definir clusters.
Além dos DENCLUE, também podem ser mencionados os algoritmos DBSCAN (do inglês, Density-
Based Spatial Clustering of Applications with Noise) (ESTER et al., 1996) e Wave-cluster (que também
é baseado em grid) (SHEIKHOLESMANI; CHATTERJEE; ZHANG, 1998) como baseados em densidade.
em grid
Esse grupo de algoritmos define um grid (reticulado) para o espaço de dados e realiza todas as
operações nesse espaço reticulado. Em termos gerais, essa abordagem é muito eficiente para gran-
des conjuntos de dados, é capaz de encontrar clusters de formas arbitrárias e lida bem com outliers
(FACELI, 2011).
53
tentativa de superar as limitações discutidas, várias abordagens que combinam diferentes agrupamen-
tos, ou consideram distintos critérios de forma combinada, foram propostas na literatura. Essas abor-
dagens se mostram robustas perante a diferentes conformações dos dados.
Os ensembles, por exemplo, são direcionados à obtenção de uma única estrutura que melhor se
ajuste aos dados, além disso, necessitam de ajustes de parâmetros.
de clientes, separando os clientes pela receita do último ano. Como saber qual o melhor modelo para
representar esses dados? Quais métricas podem ser utilizadas para comparar os modelos?
Considerações finais
• Para obter informações do modelo, são verificados se os dados passados possuem padrões de
54
comportamento e se as representações dos dados auxiliam na tomada de decisões.
Glossário
Cluster bem separado: conjunto de pontos de modo que qualquer ponto em um determinado
cluster está próximo, ou é mais similar, a cada ponto nesse cluster do que qualquer ponto não per-
tencente a ele.
Erro quadrático médio: média da diferença entre o valor do estimador e do parâmetro ao quadrado.
observações.
Verificação de leitura
55
( ) Cluster é baseado em densidade, em que o cluster será uma região densa de pontos,
separada de outras regiões pela similaridade dos dados.
b) V – V – F – F – F
c) V – F – V – F – V
d) F – F – V – F – V
e) V – V – F – V – F .
56
QUESTÃO 3- Uma classe importante de métodos de mineração de dados são os modelos
descritivos ou modelos de aprendizado não supervisionado. Com relação aos modelos des-
critivos, analise as afirmativas a seguir:
I. São utilizados apenas dados históricos, com suas respectivas variáveis, para a cons-
trução de um modelo, e exige-se uma figura externa para guiar o aprendizado.
III. Na análise de agrupamento, o aprendizado está focado nos dados e não são neces-
sários conhecimentos anteriores sobre as classes ou as categorias que formarão os agrupa-
mentos.
IV. É possível mensurar os atributos apenas de forma quantitativa, usando, por exemplo,
medidas estatísticas, como média e desvio padrão.
b) Apenas I, II e V.
c) Apenas III e V.
d) Apenas III, IV e V.
57
Referencias bibliográficas
BARBARA, D. An introduction to cluster analysis for data mining. 2000. Disponível em: <http://
BERKHIN, Pavel. Survey Of Clustering Data Mining Techniques. São Jose: Accrue Software, 2002.
DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification. 2ª ed. Nova Jersey: Wiley-
Interscience, 2001.
ESTER, M.; KRIEGEL, H. P.; SANDER, J.; XU, X. A density-based algorithm for discovering clusters
in large spatial databases with noise. In: SIMOUDIS, E.; HAN, J.; FAYYAD, U. Proceedings of 2nd Int.
Conf. on Knowledge Discovery and Data Mining. Palo Alto: AAAI Organization, 1996, p. 226–231.
FACELI, Katti et al. Inteligência Artificial: Uma abordagem de aprendizagem de máquina. Rio de
HINNEBURG, A.; KEIM, D. A. An efficient approach to clustering in large multimedia databases with
noise. In: AGRAWAL, R.; STOLORZ, P.; PIATETSKY, G. (Org.) Proceedings of 4rd Int. Conference on
Knowledge Discovery and Data Mining. Barcelona: AAAI Press, 1998, p. 58-65.
JAIN, A. K., DUBES, R. C. e CHEN, C.-C. Bootstrap techniques for error estimation. IEEE –
approach for very large spatial databases. In: GUPTA, A.; SHMUELI, O.; WIDOM, J. Proceedings of the
24th International Conference on Very Large Data Bases. New York: ACM Press, 1998, p. 428-439.
TURBAN, Efraim et al. Business intelligence: um enfoque gerencial para a inteligência do negócio.
58
GABARITO
QUESTÃO 1- Resposta C: A segunda e a quarta afirmativa são falsas, pois um cluster ba-
seado em centro considera um conjunto de pontos, de forma que qualquer ponto, em um
dado cluster, está mais próximo ao centro desse cluster do que ao centro de qualquer outro;
um cluster baseado em densidade, considera que o cluster será uma região densa de pontos,
separada de outras regiões de alta densidade e por regiões de baixa densidade.
59
5
Modelos
preditivos
Objetivos Específicos
• Apresentar o conceito de modelos preditivos e as classes de classificação e regressão.
Introdução
As duas classes de métodos de mineração de dados são os modelos descritivos e os modelos pre-
ditivos (FACELI et al., 2011). Um modelo preditivo, também conhecido como aprendizado supervisio-
nado, utiliza dados de histórico, chamados de conjunto de treinamento, para criar uma função que
estima o valor de f(x) dado um valor de x que não estava no conjunto original. Os modelos preditivos
podem ser divididos em classes de classificadores e regressores, dependendo do domínio dos valores
Um dos métodos preditivos é baseado na distância, que pode considerar apenas o vizinho mais
próximo ou k vizinhos mais próximos. Adicionalmente, existem métodos probabilísticos que conside-
ram a probabilidade condicional, o Teorema de Bayes. A forma gráfica para representação de modelos
ado em Busca, no qual existe árvore de decisão, árvore de regressão e modelos baseados em regras
Uma árvore de decisão utiliza a estratégia de dividir para conquistar, e os nós representam, nesse
caso, elementos e os ramos os critérios de decisão. Por sua vez, uma regra de decisão representa uma
implicação. Para métodos de otimização, as técnicas mais difundidas são as Redes Neurais Artificiais
61
1. métodos preditivos e classes
Existem duas classes de métodos de mineração de dados: os modelos descritivos e os mode-
los preditivos. Nos modelos descritivos, são utilizados apenas dados históricos, com suas respecti-
vas variáveis, para a construção de um modelo. Além disso, inexiste uma figura externa para guiar o
aprendizado.
Por sua vez, um algoritmo de aprendizado de máquina preditivo, também conhecido como apren-
dizado supervisionado, é representado por uma função que constrói um estimador com base em um
Uma definição formal de modelo preditivo é dado a um conjunto de observações de pares orde-
nados (xi, f(xi)) para os diversos pontos em que f(x) é a função dada pelo
62
FIGURA 1. EXEMPLOS DE CLASSES DE MODELOS PREDITIVOS: (A) CLASSE DE CLASSIFICAÇÃO E (B)
CLASSE DE REGRESSÃO
Os dados podem estar representados em forma de tabela ou em forma gráfico. A função f pode ser
de variadas formas, por exemplo, pode ser representada por combinações lineares, ou seja, somas de
atributos de entradas multiplicados por constantes; combinações não lineares, quando os multiplica-
de probabilidade (fpd). É possível dividir em duas classes e elaborar fpd para cada classe. O melhor
63
classificador possível é aquele que divide
distância
Uma das técnicas de aprendizado de
chamado de algoritmo dos vizinhos mais próximos, que classifica um novo ponto, baseado no con-
junto de dados próximos a ele, utilizados no treinamento. Esse algoritmo apenas memoriza os objetos
de treinamento, não aprende um modelo compacto para os dados. Sendo assim, é considerado um
algoritmo preguiçoso (lazy). Um benefício é que ele pode ser aplicado tanto em questões de regressão
como em questões de classificação, com apenas pequenos ajustes (FACELI et al., 2011).
64
Dependendo do número de vizinhos, o algoritmo dos vizinhos mais próximos possui variações. No
algoritmo mais simples, é considerado apenas um elemento da vizinhança, esse algoritmo é chamado
Inicialmente, existe uma fase de treinamento, na qual o algoritmo armazenará os resultados obtidos,
que fazem parte do conjunto de treinamento. Para classificar um elemento que ainda não esteja rotulado,
calcula-se a distância entre esse ponto e o vetor de valores. O ponto de treinamento que estiver com a
menor distância, em relação ao elemento não rotulado, será o vizinho mais próximo, e a classificação do
elemento não rotulado será dada pela classificação do vizinho mais próximo (FACELI et al., 2011).
Verifica-se que é um algoritmo bastante simples, entretanto as superfícies de decisão desenhadas pelo
algoritmo 1-NN não são elementares e são representadas por poliedros convexos, com centro em cada
Esse algoritmo é aplicável mesmo em problemas de alta complexidade e, ao passo que novos pon-
tos de treinamento são inseridos, o modelo considerará esse novo conjunto, funcionando de forma
incremental. Para um número infinito de objetos, o erro do 1-NN é majorado pelo dobro do erro do
O algoritmo de vizinhos mais próximos possui, entretanto, desvantagens em relação a não obter
uma representação compacta dos objetos. Adicionalmente, a fase de treinamento só inclui a memo-
rização dos dados e pouco processamento. Para classificar um objeto, é necessário calcular a distância
do objeto em relação a todos os elementos do conjunto de treinamento, que já pode ter armazenado
muitas informações. Dessa forma, computacionalmente, a predição pode ser custosa, e para um con-
A, dado um evento B, não depende apenas da relação entre A e B, mas também da probabilidade de
observar A, independentemente de observar B. O evento A pode ser uma classe, por exemplo, um
aluno aprovado, e o evento B pode ser um atributo de entrada, por exemplo, as notas obtidas por
esse aluno.
66
O modelo probabilístico quantitativo é
popular é o naive Bayes. O termo naive é Assim, é possível chegar no teorema de Bayes, que
é dado por:
derivado da hipótese de que os valores dos
O modelo naive Bayes possui bom desempenho em diversos domínios, mesmo quando existe
dependência entre os atributos. Além disso, não é sensível a características irrelevantes e lida bem
com dados reais, contínuos e discretos. Um ponto negativo para esse modelo é que se assume uma
a Z, se P(X|Y,Z) = P(X|Z).
entre as entradas.
Pode ser apresentado como um modelo qualitativo, denominado como grafo acíclico direcionado,
cujos nós representam as variáveis e um modelo quantitativo, com tabelas de distribuição da variável
67
Um arco entre dois nós denota influência ou correlação. O conjunto de variáveis aleatórias, nós do
grafo, que influenciam uma variável resposta yi é conhecimento, como Pais de yi.
A dificuldade na escolha da estrutura para uma determinada questão está ligada à seleção de
modelos, verificando entre diversos modelos possíveis que “melhor se ajustam” em relação ao con-
junto de dados de treinamento. De certa forma, existe um problema de busca, no qual as propostas
de modelos são avaliadas por meio de uma função de pontuação, a qual mede a qualidade de cada
hipótese candidata.
No extremo mais geral, temos classificadores que assumem que todos os atributos interagem entre
si. Entre os dois extremos, temos modelos de granularidade crescente. É possível utilizar os modelos
gráficos probabilísticos em diferentes tarefas de aprendizado, desde previsão, em que se deseja obter
o resultado mais provável para os dados de entrada, até o diagnóstico, em que se pretende encontrar
ções possíveis. Por esse raciocínio, é possível construir modelos baseados em árvores, tanto uma
em árvores de decisão.
68
Um nó folha é rotulado com uma função. Um nó de divisão contém um teste condicional baseado
nos valores do atributo. Cada nó da árvore corresponde a uma região nesse espaço. As regiões defi-
nidas pelas folhas da árvore são mutuamente excludentes, e a reunião dessas regiões cobre todo o
O espaço de hipóteses das árvores de decisão é enquadrado no formalismo: Forma Normal Disjuntiva
(FND). Uma fórmula estará na forma normal disjuntiva quando for: A V A ou apenas A. Para cada FND,
as condições ao longo de um ramo são conjunções de condições, já os ramos individuais são disjunções.
As árvores de decisão possuem diversas vantagens e são aplicadas tanto no meio acadêmico como
no meio empresarial. Uma vantagem é que não é necessário assumir nenhuma distribuição dos dados,
sendo o modelo muito flexível. Adicionalmente, as árvores de decisão são muito robustas e selecionam
os atributos que farão parte do modelo de decisão. Além disso, possuem fácil interpretação e, por ser
um algoritmo guloso, é construído de cima para baixo e utiliza a estratégia de dividir para conquistar.
Se um dos atributos não for conhecido, no entanto, podem surgir problemas decisão. Também pode
ocorrer uma duplicação de testes em diferentes ramos da árvore. Dependendo dos dados de entrada,
nal pode ser uma junção de condições. Em uma condição, existe uma relação
Cada regra cobre certa região do espaço das instâncias. As regras de deci-
69
medidas para enfatizar a disparidade dos subconjuntos e medidas estatísticas de independência.
Entropia mede a aleatoriedade de uma variável aleatória. A poda de uma árvore é a troca de nós
profundos por folhas. Também pode ser entendida quando serão removidos os sub-nós de um nó
de decisão. Poda é considerada a parte mais importante do processo de construção da árvore, pelo
menos em domínios com ruídos. Holte (1993) implementou o algoritmo OneR, do inglês OneRule, o
duas técnicas mais difundidas em aprendizado de máquina, que utilizam otimização de uma função
em seu treinamento, são: as Redes Neurais Artificiais (RNA) e as máquinas de vetores de suporte, do
interconectadas, com alta densidade e simples. Essas unidades são denominadas neurônios artificiais
ligadas por numerosas conexões. Essas conexões simulam as sinapses biológicas e têm pesos asso-
ciados, que ponderam a entrada recebida por cada neurônio da rede. Esses pesos podem ter valores
positivos ou negativos, dependendo do comportamento da conexão, e seus valores são ajustados pelo
(TAE). A TAE determina condições matemáticas que auxiliam na escolha de um classificador particular,
método preditivo aplicar para obter o menor erro na predição para as vendas nos próximos dois meses?
70
Considerações Finais
• Para um modelo preditivo, é dado um conjunto de observações de pares ordenados (xi, f(xi))
para os diversos pontos em que f(x) é a função dada pelo algoritmo preditivo, o qual aprende
uma aproximação de f(x), estima-se os valores de f(x) para outros valores de x que não estavam
• Os principais tipos de modelos preditivos são: métodos baseados em distância, métodos proba-
• Um dos métodos preditivos é baseado na distância, que pode considerar apenas o vizinho mais
• Outros tipos de modelos são os baseados em Busca, no qual existem árvore de decisão, árvore
de regressão e modelos baseados em regras. Uma árvore de decisão utiliza a estratégia de divi-
• Para métodos de otimização, as técnicas mais difundidas são as Redes Neurais Artificiais (RNA)
Glossário
Redes Neurais Artificiais (RNA): técnicas computacionais que apresentam um modelo matemá-
tico inspirado na estrutura neural de organismos inteligentes e que adquirem conhecimento por meio
da experiência.
com um vizinho.
71
Verificação de leitura
QUESTÃO 2- A técnica de árvores de decisão utiliza uma abordagem de cima para baixo, ou
seja, top-down e possui uma estratégia computacional. Qual é essa estratégia?
a) Explorar todos os casos.
72
Referências Bibliográficas
DIETTERICH, T. G. Approximate statistical tests for comparing supervised classification learning
FACELI, Katti et al. Inteligência Artificial: Uma abordagem de aprendizagem de máquina. Rio de
HOLTE, R. C. Very simple classification rules perform well on most commonly used datasets.
MARTIN, J. An exact probability metric for decision tree spliting and stopping. Machine Learning,
73
Gabarito
QUESTÃO 1- Resposta C.
Redes Neurais Artificiais são uma técnica de métodos de otimização. Árvores de decisão são téc-
nicas de modelos de busca.
QUESTÃO 2- Resposta B.
É utilizada a Estratégia de Dividir para conquistar, o que consiste em dividir um problema complexo
QUESTÃO 3- Resposta A.
O algoritmo é bem simples e está em diversos livros.
74
6 Análise de
negócios e
visualização
de dados I
Objetivos Específicos
• Descrever a análise de negócios ou Business Analisys (BA) e a sua importância para as
organizações.
de decisões.
Introdução
O volume de informações que as empresas possuem aumentou exponencialmente nos últimos
anos, mas ter os dados não é suficiente. É necessário analisá-los de forma automatizada para que
Negócios ou Business Analisys (BA) compreende uma ampla gama de aplicações e técnicas para reu-
nir, armazenar, analisar e fornecer acesso aos dados, com o objetivo de ajudar os usuários da empresa
de atividades normalmente executadas por usuários finais no ambiente online. Inclui como suas ati-
deles. Os tipos de sistemas OLAP são: ROLAP, MOLAP, HOLAP, DOLAP e WOLAP.
Uma característica fundamental de sistemas OLAP é ser capaz de filtrar os dados por diversas for-
mas e modos customizados pelo usuário. Podem, ainda, sumarizar o conteúdo em uma estrutura cha-
mada de cubo OLAP. Existem algumas funcionalidades em um sistema OLAP para manipulação dos
76
1. Análise de negócios e visualização
de dados
Conforme já visto anteriormente, a inteligência de negócios ou Business Intelligence (BI) implica em
Por sua vez, a Análise de Negócios ou Business Analisys (BA) compreende uma ampla gama de
aplicações e técnicas para reunir, armazenar, analisar e fornecer acesso aos dados, com o objetivo de
(TURBAN et al., 2009). A BA é conhecida, ainda, como processamento analítico, ferramentas de BI,
A BA oferece os modelos e procedimentos de análise para a BI. Existem muitos métodos e cente-
de um ser humano;
As soluções de Business Intelligence são compostas por uma série de componentes tecnológicos
que possibilitam um ambiente propício para tomada de decisão. Essas soluções podem combinar os
componentes para cada situação. Para a camada de apresentação dos dados e das informações, utili-
zam-se as soluções OLAP (OnLine Analitical Processing), isto é, processamento analítico online.
As soluções OLAP apresentam uma alternativa para a publicação dos dados e informações vindas
dos modelos dimensionais. A apresentação dessas informações pode ser de maneira tabular ou gráfica,
tanto dos dados históricos, armazenados nos repositórios Data Warehouse, quanto dos dados reais
77
Ao usar software para BA, o usuário pode fazer consultas, requisitar relatórios ad hoc ou realizar
análises. É possível, por exemplo, fazer análises executando consultas em várias camadas.
As aplicações mais sofisticadas de BA, que estão no chamado estado-da-arte, incluem atividades
como modelagem financeira, orçamentos, alocação de recursos e inteligência competitiva. Tais siste-
mas avançados de BA envolvem componentes como modelos de decisão, análise do desempenho dos
negócios, perfis de dados, métricas, ferramentas de reengenharia e podem ser usados em tempo real.
Ao identificar o cliente, por meio de uma aplicação analítica, com enfoque na parte comercial, pode
surgir uma tela que, além das informações de cadastrado, pode conter as últimas compras e visitas
desse cliente, bem como os produtos que ele tem maior propensão de compra.
três grandes categorias, conforme apresentado na Figura 1 a seguir. A primeira categoria é a desco-
berta de informações e conhecimento, que contempla as ferramentas OLAP, a ser detalhada posterior-
mente: consultas e relatórios ad hoc, data mining, web mining, text mining e mecanismos de busca. A
segunda categoria é o suporte à decisão e sistemas inteligentes, como exemplo: inteligência artificial,
análise estatística, análises preditivas, suporte executivo e corporativo. A última categoria é visualiza-
ção, que contempla análise visual, dashboards, scorecards e realidade virtual 3D.
78
FIGURA 1: CATEGORIAS DE ANÁLISE DE NEGÓCIOS
Diversas empresas de diferentes segmentos de negócios e espalhadas por todo o mundo utilizam
ferramentas de Business Analytics. O elemento Exemplificando abaixo mostra como a Nestlé utilizada
79
1.2 OLAP
Uma arquitetura de Business Intelligence é Link
Existem vários fornecedores de ferramentas de BA
composta por vários componentes, os quais como:
Microstrategy: <https://www.microstrategy.com/
podem ser combinados para que se obtenha br>. Acesso em: 10 maio 2018.
SAP, empresa líder em software empresarial:
a melhor solução para o problema em ques- <https://www.sap.com/brazil/products/analytics/
business-intelligence-bi.html>. Acesso em: 10 maio
tão da organização. 2018.
O SAS, empresa líder global de solução de Ana-
Após finalizar a concepção dos repositó- lytics: <https://www.sas.com/pt_br/home.html>.
Acesso em: 10 maio 2018.
rios de dados, o próximo passo é identificar
qual a melhor abordagem para consumir os
e conhecimentos descobertos.
80
se referem a uma grande quantidade de ati-
al., 2009).
(THOMSEN, 2002).
Existem funções e algoritmos utilizados pelos sistemas OLAP que podem ser classificados em:
81
• OLAP multidimensional (MOLAP): quando o OLAP é implementado por meio de um banco de
que resume transações em visões multidimensionais com antecedência. Os dados são organizados
em uma estrutura de cubos que o usuário pode girar, o que é adequado principalmente a resumos
financeiros. Com o MOLAP, as consultas são mais rápidas, pois a consolidação já foi feita.
• OLAP relacional (ROLAP): quando um banco de dados OLAP é implementado sobre um banco
OLAP relacional extraem dados de bancos de dados relacionais. Ao usar declarações de SQL
complexas em relação a tabelas relacionais, o ROLAP pode também criar visões multidimensio-
nais dinamicamente. O ROLAP tende a ser usado em dados que apresentam um grande número
de atributos, em que não possam ser colocados facilmente em uma estrutura de cubos. Os
dados do cliente com diversos campos descritivos, por exemplo, ao contrário dos dados finan-
• Database OLAP e Web OLAP (DOLAP e WOLAP): o database OLAP se refere a um sistema
executar cálculos de OLAP. O Web OLAP se refere aos dados de OLAP acessíveis de um nave-
gador da Web.
• Desktop OLAP. o desktop OLAP envolve ferramentas OLAP simples e baratas, que executam
• Hybrid OLAP (HOLAP): o Híbrido OLAP combina as formas ROLAP e MOLAP, ou seja, as formas
relacional e multidimensional.
82
Uma principal característica que está presente em todas as abordagens é o cubo multidimensional,
capaz de filtrar os dados por diversas formas e modos customizados pelo usuário e podem sumarizar
o conteúdo em uma estrutura denominado também cubo OLAP ou hipercubo (CECI, 2012). A Figura 2
ilustra uma representação de um cubo tridimensional. Essa estrutura estabelece um formato em que
perspectivas de visualização de informações podem ser facilmente criadas conforme a interação com
o usuário.
Além da visão multidimensional dos dados e dos Cubos OLAP, é possível a realização de suma-
rização e agregação de dados. Existe capacidade de consultas e análises interativas sobre o retorno
83
dos dados, bem como suporte para que os analistas de negócio customizem suas próprias consultas,
relatórios e cálculos.
Por muito tempo, o foco dos sistemas de TI era, principalmente, o processamento de transações
corporativas. O processamento de transações online (OLTP) ofereceu uma solução eficaz, para tarefas
repetitivas e rotina, usando um ambiente de banco de dados relacional distribuído. Tanto as aplicações
de OLTP quanto de sistemas de suporte à gerência (MSS) necessitam de acesso aos dados constan-
temente. Infelizmente, tentar servir os dois tipos de solicitação pode ser uma tarefa problemática, por-
tanto algumas empresas escolhem separar os sistemas de informações em tipos OLTP e tipos OLAP.
pulações simples. O OLAP envolve o exame de muitos itens de dados, entre alguns milhares até
milhões, em relacionamentos complexos. Além de responder às consultas dos usuários, o OLAP con-
1. A análise categórica é uma análise estática baseada em dados históricos. Ela se vale da premissa
de que o desempenho passado é um indicador do futuro. Essa é a análise básica suportada por
2. A análise exegética também toma como base os dados históricos e acrescenta a capacidade de
84
análise drilldown. Por sua vez, a análise drilldown é a capacidade de consultar os dados mais a
fundo para determinar os dados detalhados usados para definir um valor derivado.
3. A análise contemplativa permite que um usuário altere um único valor, a fim de determinar seu impacto.
superior (mais granular) a partir de uma dimensão. Normalmente, associado à ação de remo-
ver um cabeçalho de linha ou uma coluna para resumir um conjunto de dados (INMON, 1997;
• Drill-down: ao contrário de roll-up, refere-se à ação de percorrer uma hierarquia de nível supe-
• Drill-across: possibilita a combinação de dados entre duas ou mais tabelas de fatos em uma
única análise, quase sempre envolvendo consultas separadas que são posteriormente unidas
• Drill-through: ocorre quando o usuário faz análises de distintas visões proporcionadas por troca
de informações entre dimensões, por exemplo: o usuário realiza análises de indicadores pela
dimensão geografia e, posteriormente, passa a analisar sobre a dimensão tempo (SELL, 2006).
seus resultados de vendas por meio de relatórios. Como os benefícios de ferramentas OLAP podem
85
gerar resultado em uma empresa?
Considerações Finais
• Business Analisys (BA): compreende uma ampla gama de aplicações e técnicas para reu-
nir, armazenar, analisar e fornecer acesso aos dados, com o objetivo de ajudar os usuários da
por usuários finais no ambiente on-line, tais como a geração e a resposta de consultas, solicita-
• Característica fundamental de sistemas OLAP: é ser capaz de filtrar os dados por diversas for-
mas e modos customizados pelo usuário, bem como pode sumarizar o conteúdo em uma estru-
Glossário
OLAP: processamento analítico online ou OnLine Analytical Processing.
Verificação de leitura
86
b) o relatório ad hoc;
c) gráficos;
d) cubos multidimensionais;
e) redes neurais.
QUESTÃO 3- Em uma OLAP, a ação de percorrer uma hierarquia de nível superior de agre-
gação para níveis inferiores de detalhamento é chamada de:
a) Slice-dice;
b) Drill-down;
c) Drill-across;
d) Drill-up;
e) Drill-through.
Referências Bibliográficas
CECI, Flávio. Business intelligence. Palhoça: UnisulVirtual, 2012.
COOD, E. F.; CODD, S. B.; SALLEY, C. T. Providing OLAP to User-Analysts: An IT Mandate. White Paper,
87
pdf>. Acesso em: 10 maio 2018.
GOUVEIA, Luís Borges; RANITO, João. Sistemas de informação de apoio à gestão. Porto: Sociedade
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: The Complete Guide to Dimensional
SAS – The power to know. Nestlé aprimora previsão de demanda com soluções de análise do
SELL, Denilson. Uma arquitetura para business intelligence baseada em tecnologias semânticas
para suporte a aplicações analíticas. 2006. 265 f. Tese (Doutorado) - Universidade Federal de Santa
2006.
THOMSEN, Erik. OLAP Solutions: building multidimensional information systems. 2ª ed. New
TURBAN, Efraim. et al. Business intelligence: um enfoque gerencial para a inteligência do negó-
88
QUESTÃO 2- Resposta certa: A.
Um sistema OLTP verifica as transações correntes. Já um sistema OLAP, além das transações atu-
ais, verifica as transações passadas e realiza projeções de dados futuros, por meio de ferramentas
preditivas.
inferiores de detalhamento.
89
7 Análise de
negócios e
visualização
de dados II
Objetivos Específicos
• Apresentar tipos e aplicações de consultas e relatórios em Business Intelligence (BI).
Introdução
Após a realização de processamento analítico online (OLAP), visto anteriormente, é possível a
geração de relatórios e consultas para exibição de resultados. Existe uma correlação entre consultas e
relatórios, posto que o resultado de consultas pode gerar um relatório, assim como o desenho de um
Os relatórios podem ser de rotina ou ad hoc. Relatórios de rotina são gerados automaticamente e
distribuídos com periodicidade aos interessados em uma lista de discussão. Por exemplo, relatórios de
vendas semanais são fundamentais para o gerenciamento de uma loja de qualquer segmento, pois,
com posse desse relatório, o gerente pode determinar um plano de ação e verificar os problemas que
ocorreram no período anterior. Um relatório ad hoc possui um objetivo específico, sendo realizado
pelo determinado usuário com um subconjunto dos dados e períodos de referência, diferentes do rela-
tório de rotina.
dados. Para bancos de dados, a linguagem SQL é uma linguagem padronizada para realização de ope-
rações. A visualização é referente à forma de apresentação dos dados presentes no banco de dados,
que pode auxiliar na identificação de explicações para alguns resultados presentes nos relatórios.
Adicionalmente, existem sistemas que além dos dados, também gravam as informações de posi-
ções geográficas. Os sistemas de informações geográficas (GIS) são muito utilizados para determinação
91
de local para estabelecimentos, alterações de rotas logísticas e análise de público potencial em uma
é uma tecnologia designada para obter novas informações de negócios por meio de um conjunto de
OLAP. Em muitos casos, existe uma correlação entre o relatório e a consulta, pois um relatório
pode designar uma consulta e a consulta, por sua vez, resulta em um relatório. A geração de
relatórios OLAP deve ser flexível e ajustável, visando facilitar a criação de relatórios pelo usuário,
É possível classificar os relatórios em dois tipos: rotina e ad hoc. Os relatórios de rotina são
camente. Por sua vez, relatórios ad hoc são criados para um usuário específico, quando houver
92
Um exemplo muito frequente de relatório de rotina são os relatórios de desempenho recebidos
semanalmente para uma loja, que pode ser uma farmácia, uma loja de roupas e calçados, uma
loja de eletrônicos, entre outras. Com base no histórico de volume, quantidade de vendas e na
períodos. Já um exemplo de relatório ad hoc são listagens de clientes que se interessaram por
Softwares de BI são utilizados para produzir relatórios em diversas áreas funcionais. Na área
93
FIGURA 1: EXEMPLOS DE RELATÓRIO EM DIFERENTES PLATAFORMAS
Consulta ad hoc é o tipo de consulta que não pode ser determinada antes de ser realizada. Ao fim da
consulta, o usuário poderá receber um relatório. A vantagem desse tipo de consulta é a flexibilidade de con-
teúdo, estrutura e avaliações, os quais podem incluir informações não disponíveis em relatórios periódicos.
za-se a Linguagem de Consulta Estruturada (SQL), que é padronizada e usada em diversos softwares
94
de bancos de dados, como Microsoft Access
de forma rápida. Outro software da IBM é o IBM Cognos Analytics on Cloud, que além de análises de séries
A SAS é líder em Análise Preditiva e Data Mining. Uma de suas ferramentas é a SAS Enterprise Miner. Ela
fornece ferramentas financeiras, estatísticas e de previsão para a solução de problemas. Uma área de des-
taque é a de avaliação e gerenciamento de risco, usando modelos de pontuação de crédito (credit scoring).
Outros fornecedores nesse grupo são Tableau, Microsoft, Oracle, Totvs, SAP,Insightful Corp.,
95
1.3 Visualização de
dados
Para saber mais
O Credit Scoring é uma espécie de pontuação de
Em muitos casos, os dados fornecidos crédito, usada por bancos e financeiras para medir
o risco ao qual se submeteriam caso concedes-
pelos relatórios exigem ações adicionais. sem crédito a uma determinada cliente. Tal pontu-
ação representa o histórico financeiro de quem solic-
Uma das ações consistem na Visualização ita crédito no mercado e na instituição em que está
solicitando o crédito.
dos Dados, que são tecnologias para dar
suporte à exibição e, eventualmente, à inter-
Essas tecnologias visuais podem condensar milhares de números em uma única imagem e permitir
que as aplicações de suporte à decisão sejam mais atraentes e compreensíveis aos usuários.
Essa etapa inclui imagens digitais, sistemas geográficos, interfaces gráficas de usuário, gráficos,
ajudar a identificar relações, tais como: tendências. A visualização de dados se torna de mais fácil
implementação quando os dados necessários estão em um Data Warehouse, ou, melhor ainda, em um
Uma das aplicações frequentes da visualização de dados de BI é na área financeira. Para evitar
que sistemas identifiquem automaticamente padrões inexpressivos nos dados, os diretores financeiros
(CFOs) querem ter certeza de que a capacidade de processamento de um computador sempre será
96
Os principais fornecedores de OLAP oferecem ferramentas de visualização tridimensional, junto
com suas ferramentas de suporte à decisão. Existem ferramentas de desenvolvimento que têm uma
versão para visualização tridimensional, permitindo aos usuários ver e gerenciar facilmente múltiplas
dimensões de dados em uma única vista. Novas ferramentas visuais são desenvolvidas continuamente
97
espacialmente, denominados de geocodificação, a outros bancos de dados, os usuários podem gerar
informações para planejamento, resolução de problemas e tomada de decisão, aumentando, com isso,
sua produtividade e a qualidade de suas decisões. Diversas áreas aplicam o GIS com êxito desde o iní-
cio dos anos 70, tais como: varejo, bancos, transportes, agricultura, gestão de recursos naturais, admi-
nistração pública, controle do espaço aéreo, militar, serviço de emergência e planejamento urbano
(URSERY, 2004).
É frequente a utilização de GIS em instituições financeiras para suporte de atividades como deter-
minação da localização de agências e caixas eletrônicos, análise dos padrões de volume e tráfego das
atividades comerciais, análise da área geográfica atendida pela agência e avaliação dos pontos fortes
e fracos em relação aos pontos da concorrência. Em varejistas, é comum o uso do GIS para planeja-
mento das rotas rodoviárias. Tanto a Toyota quanto outros fabricantes automotivos utilizam GIS e o
sistema de posicionamento global (GPS), ou Global Positioning System, como ferramenta para orientar
O GIS oferece uma grande quantidade de informações extremamente úteis que podem ser anali-
sadas e utilizadas na tomada de decisão. O formato gráfico de um GIS facilita a visualização de dados
pelos gerentes.
Segundo Janet M. Hamilton, gerente de pesquisa de mercado da Dow Elanco, fabricante de defen-
sivos agrícolas de US$ 2 bilhões, com sede em Indianápolis: “Posso colocar planilhas de 80 páginas
com milhares de linhas em um único mapa. Levaria algumas semanas para compreender todas as
informações da planilha, mas, em um mapa, a história pode ser contada em segundos” (HAMILTON,
1996, p. 5).
alimentam sistemas de posicionamento global (GPS). Os dispositivos GPS são wireless e usam satéli-
tes para permitir que os usuários detectem a posição na Terra dos itens nos quais os dispositivos estão
anexados, por exemplo: carros e pessoas, com precisão razoável. Se desejar mais informações sobre
98
GPS, consulte: <trimble.com/gps>. O GPS, em conjunto com o GIS, está trazendo grandes progres-
sos nas aplicações de BI. São inúmeros os usos comerciais e governamentais, pois os dispositivos de
os dispositivos vendidos estão: placas de circuitos de vídeo de última geração, processadores de alto
desempenho, memórias de alta capacidade e baixo tempo de acesso. Como é possível aplicar as fer-
Considerações Finais
• Existem relatórios de rotina e ad hoc e podem ser aplicados a diversas áreas. Também existem
• Uma das ações consistem na Visualização dos Dados, que são tecnologias para dar suporte
processamento.
99
Glossário
GIS: sistema constituído por um conjunto de “ferramentas” especializadas em adquirir, armazenar,
recuperar, transformar e emitir informações espaciais.
GPS: Sistema de Posicionamento Global.
Ad hoc: específico.
SQL: Linguagem de Consulta Estruturada.
Verificação de leitura
e) Text mining.
100
a) construção de sites de Internet;
Referências Bibliográficas
CÂMARA, Gilberto; ORTIZ, Manoel Jimenez. Sistemas de Informação Geográfica para Aplicações
Ambientais e Cadastrais: Uma Visão Geral. In: SOUZA E SILVA, M. Cartografia, Sensoriamento e
FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From Data Mining to Knowledge
Discovery: An Overview. In: FAYYAD, Usama et al. Advances in Knowledge Discovery and Data
URSERY, S. GIS more prevalent in big cities. The American City and County, fevereiro, 2004.
TRIMBLE. GPS Tutorial. Disponível em: <trimble.com/gps>. Acesso em: 11 maio 2018.
TURBAN, Efraim; SHARDA, Ramesh; ARONSON, E.; KING, David. Business Intelligence: Um
Gabarito
101
QUESTÃO 1- Resposta certa: D.
O sistema definido no enunciado é um Sistema de Informações Geográficas (GIS).
QUESTÃO 3- Resposta E.
A linguagem SQL é utilizada para realizar operações em bancos de dados relacionais.
102
8 Business
performance
management
(BPM)
Objetivos Específicos
• Compreender o conceito do Business Performance Management (BPM).
Introdução
Desde a década de 1970, os métodos de avaliação de processo evoluíram muito, partindo da
Gestão da Qualidade Total, Total Quality Management (TQM) em inglês, passando pelas metodologias
Lean e Six Sigma e, por fim, resultando na abordagem de Gerenciamento de processos de negócio,
putadores da década de 1960. Essa evolução passou por sistemas suporte à decisão (DSS), ferramen-
tas de BI até BPM. É possível entender o Business Process Management (BPM), ou gerenciamento de
processos de negócios, como uma estrutura para organizar, automatizar e analisar as metodologias de
tindo desde a estratégia até a execução, com objetivo de otimizar o desempenho dos negócios. O pri-
meiro passo é fazer a estratégia, respondendo ao questionamento “Aonde a empresa quer ir?”. Depois
será definido como implementar essa estratégia por meio de um plano que procura detalhar “Como a
empresa irá chegar lá?”. Posteriormente, a empresa irá monitorar os resultados dos indicadores frente
às metas estabelecidas que é análogo à pergunta “Como a empresa está fazendo?”. Por fim, a empresa
deve realizar ações e ajustes, que representa “O que a empresa deve fazer de forma diferente?”.
Uma metodologia para gerenciar e medir o desempenho é o Balanced Scorecard. Além da perspec-
tiva financeira, são incluídas as perspectivas Clientes, Processos Internos de Negócio e Aprendizado e
104
Visando uma interface mais fácil para análise do resultado, são elaborados dashboards e scorecards.
Por fim, é apresentado o monitoramento de atividades de negócios (BAM), que alerta os gerentes em
metodologia inicial foi a Gestão da Qualidade Total, em inglês, Total Quality Management (TQM), pas-
sando pelas metodologias Lean e Six Sigma. Como resultado desses esforços realizados, surgiu a abor-
métricas e aplicações projetadas para impelir o desempenho geral financeiro e operacional de uma
empresa.
105
no BPM podem trazer ideias para melhoria do desempenho financeiro e operacional.
Na literatura de negócios, a gestão de desempenho possui diversos nomes, como BPM, gestão
e técnicas de BI, entretanto existem diferenças consideráveis entre BI tradicional e BI para BPM, uma
tais. A visualização dos indicadores de desempenho de BPM ocorre em painéis ou placares. As métri-
cas de BI, por sua vez, são exibidas em tabelas ou diagramas. Enquanto o BPM procura gerar alertas
sistemas.
desde a estratégia até a execução, com objetivo de otimizar o desempenho dos negócios. A seguir, a
106
FIGURA 1: PROCESSO DE CICLO FECHADO DE BPM
Analisando o ciclo, é possível verificar que o desempenho perfeito é alcançado pela definição de
metas e objetivo, isto é, por elaborar estratégias para depois propor e iniciar planos para chegar às
metas, ou seja, planejar. Posteriormente, o desempenho será monitorado e comparado com as metas
e objetivos, deve-se, portanto, monitorar os resultados e, por fim, ações corretivas devem ser toma-
107
1.3.1 Estratégia
Uma estratégia possui elementos como metas, objetivos, prioridades, pensamento crítico e planos.
Uma questão-chave para definir a estratégia é “Aonde queremos ir no futuro?”. As respostas para essa
operacional.
108
e aplicações. Segundo Niven (2005), existem quatro fontes para a lacuna entre a execução e a estra-
tégia: visão, pessoas, gerenciamento e recursos.
gica da empresa.
1.3.2 Plano
A elaboração do Plano busca responder a pergunta “Como chegaremos lá?”. Quando os gerentes
operacionais sabem e entendem o que (i.e., os objetivos e metas organizacionais), eles podem vir
com o como (i.e., planos detalhados operacionais e financeiros). Um plano operacional converte uma
cia de recursos e resultados esperados para o próximo período, normalmente um ano. O planejamento
aplicar recursos financeiros e humanos onde suas estratégias e táticas estejam vinculadas. É necessá-
rio alinhar o orçamento e os objetivos táticos e estratégicos, para isso o plano financeiro deve estar
1.3.3 Monitoração
A maior dificuldade da estrutura de monitoramento é ter o conhecimento de: “O que monitorar?”
e “Como monitorar?”. Depois da escolha dos indicadores, é necessário definir uma estratégia para
109
Por sua vez, um sistema de controle de diagnóstico é um sistema computacional, o que significa
que tem entradas, um processo para transformar as entradas em saídas, um padrão ou marca com-
parativa, com a qual se pode comparar as saídas, e um canal de retorno, a fim de permitir que infor-
e gerando relatórios de gerenciamento, que são desperdiçados, a não ser que a empresa tome uma
atitude em relação aos dados de desempenho coletados. As empresas que possuem as melhores prá-
ticas usam “previsões contínuas” para fazer esses ajustes, e não somente o orçamento do fim do ano
anterior.
estratégicas e objetivos. Tal sistema geralmente engloba métodos sistemáticos de união de metas de
negócios com relatórios de retorno periódicos, os quais indicam progresso contra metas.
O sistema mais popular em uso é uma variante do indicador balanceado, do inglês, Balanced
Scorecard (BSC), de acordo com Kaplan e Norton (1996). Segundo Britto (2012), o principal tópico
da metodologia BSC é uma visão holística de um sistema de medidas ligado à direção estratégica da
empresa, baseado em quatro perspectivas do mundo, com a medida financeira suportada por cliente,
Ao medir e gerenciar o negócio usando esse conjunto de métricas, uma empresa pode assegurar
Os Relatórios financeiros mensais, trimestrais e anuais são importantes componentes da maior parte
dos sistemas de medida de desempenho. Esse fato pode ser explicado, pois a maioria desses sistemas
110
está sob a competência do departamento financeiro. Adicionalmente, a maior parte dos executivos não
A sobrecarga de medida e a obliquidade de medida são também problemas que confrontam a atual
safra de sistemas. Para muitas das medidas, sendo rastreadas, o gerenciamento tem falta de controle
direto. Michael Hammer (2003) denominou tal fato de princípio de obliquidade. Por um lado, medidas
como rendimentos por ação, retorno sobre patrimônio, lucratividade, participação no mercado e satis-
1.4.1 BSC
As medidas devem se concentrar em fatores cruciais, tais como: as medidas devem ser uma mis-
tura de passado, presente e futuro. Adicionalmente, elas devem equilibrar as necessidades dos acio-
nistas, colaboradores, parceiros, fornecedores e stakeholders. Também o fluxo das medições deve ser
do topo para baixo. Por fim, as medidas precisam ter metas que se baseiam em pesquisa e realidade,
que ajuda a traduzir os objetivos e metas financeiras, de clientes, de processos internos e de apren-
111
satisfazer seus clientes e acionistas. Por fim, em relação ao Aprendizado e crescimento, os objetivos indi-
cam como uma empresa pode melhorar sua capacidade de mudar e melhorar para alcançar sua visão.
um fluxo de etapas inter-relacionadas. A primeira etapa é identificar objetivos estratégicos para cada
perspectiva. Depois, deve-se associar medidas com cada um dos objetivos estratégicos. Além disso,
uma composição de quantitativo e qualitativo deve ser utilizada. Então, é necessário atribuir metas
para as medidas. A próxima etapa é listar iniciativas estratégicas para realizar cada um dos objetivos.
Por fim, associa-se aos vários objetivos estratégicos por meio de um diagrama de causa e efeito cha-
redor do mundo. Empresas o utilizam como uma metodologia de melhoria de processos, que permite
analisar esses processos, apontar problemas e aplicar soluções. Esta metodologia aplica um processo
de melhoria de negócios chamada DMAIC, que representa as etapas: Definir, Medir, Analisar, Melhorar
e Controlar.
112
Como o BPM, o DMAIC é um modelo de melhoria de negócios de circuito fechado que engloba as
tiva, o BPM Standards Group (bpmstandardsgroup.org) propôs uma arquitetura da tecnologia de BPM,
que destaca as tecnologias capacitadoras e algumas das aplicações cruciais necessárias para oferecer
suporte aos processos de BPM de ciclo fechado, os quais conectam a estratégia à execução.
Um sistema de BPM necessita de três componentes a fim de contribuir para a implementação bem-
interface de usuário.
medidas, atribuições de conta, métodos de conversão de moedas, entre outros. A maioria dos siste-
mas de BPM usa Datamarts ou um Data Warehouse, que normalmente armazenam os dados em um
No BPM, é necessária uma grande variedade de aplicações para abranger os processos de ciclo
113
1.6 Aplicações de Scorecards
Scorecards são um recurso genérico de BI que também podem vincular indicadores de desempenho
a um mapa estratégico, a partir de uma relação hierárquica de causa e efeito entre os KPIs.
A interface de usuário é o ponto de contato entre as aplicações de BPM e o usuário final. A inter-
face particular fornecida depende da aplicação específica que está sendo acessada, bem como do
que são consolidadas e organizadas em uma tela única, para que sejam absorvidas rapidamente e
exploradas facilmente.
Um Dashboard exibe vários dados de KPI e pipeline para uma empresa de software, que produz
os vende diretamente pela Web. Enquanto um Scorecard mapeia o progresso, o Dashboard mede o
de consultoria fundada em 1979 por Gideon Gartner. O termo reflete o interesse da empresa e de
outras consultorias nos conceitos estratégicos da empresa de latência zero e de processamento direto
Uma empresa de latência zero é aquela na qual os dados estão imediatamente disponíveis, permi-
tindo a uma empresa ser proativa ao invés de reativa. Processamento direto se refere ao processo no
114
Essencialmente, os dois benefícios mais importantes são acesso em tempo real aos dados, em um
Situação problema
Em 1946, foi fundada na Austrália a transportadora TNT com apenas um caminhão. Em 1958, a
empresa atendia toda a Austrália. E em 1978, mudou sua sede para a Inglaterra. Em 2015, essa cor-
poração era uma das maiores transportadoras de carga expressa do mundo e tinha mais de 56.000
funcionários em 61 países. Por ser uma empresa global, TNT buscou projetar uma imagem consistente
Alguns dos valores da empresa são satisfazer seus clientes a todo tempo, desafiar e melhorar tudo
que a empresa faz e medir o sucesso por meio de um lucro sustentável. A estratégia de negócios foca
na entrega como uma experiência do consumidor superior aos concorrentes. Para isso, a TNT empre-
gava sofisticada tecnologia para checar exatamente onde as entregas dos clientes estavam em tempo
real.
No mapa estratégico, foi definido que, para se chegar ao lucro sustentável, a empresa deveria pos-
suir excelência operacional, trazer inovações e gerenciar o relacionamento com seus clientes.
Como a empresa conseguiu integrar seus objetivos estratégicos com entregas operacionais?
A empresa implementou um sistema de medição das ações, o Balanced Scorecard (BSC). Com ele,
era possível estabelecer uma ligação entre as atividades operacionais e a estratégia, mensurando o
impacto. O mapa estratégico da TNT e seu plano de comunicação foi considerado o melhor da cate-
goria. Desde a implantação do BSC, a empresa aumentou market share, aumentou a fidelização de
Para manter a excelência de seus serviços, a empresa precisava de um sistema avançado de análise
de dados, e o degrau para alcançar esse objetivo foi a Inteligência de Negócios ou Business Intelligence
(BI).
Como a empresa poderia dar um próximo passo, além de monitorar onde a entrega estava?
115
A empresa adotou ferramentas de BI que eram capazes de realizar análises preditivas para melhorar
sua eficiência operacional, além de dar continuidade na qualidade de serviços oferecidos aos consumi-
dores por meio de novas técnicas estatísticas. Com isso, foi possível prever determinados problemas
ou situações inconvenientes, as quais poderiam ocorrer com as entregas dos clientes.
A TNT escolheu as ferramentas SAS Analytics e SAS Statistics como nova plataforma de BI. Com
base nas novas ferramentas obtidas, foi possível desenvolver novas soluções que apoiaram a estra-
empresa. Em 13 de maio de 2016, a empresa TNT Express foi adquirida pela americana Fedex, em um
negócio de 4 bilhões de euros. Nada mal para em começou com apenas um caminhão.
<https://businesscasestudies.co.uk/tnt/delivering-a-business-strategy/introduction.html>. Acesso
TI INSIDE ONLINE. TNT usa novas ferramentas analíticas para melhorar eficiência operacional.
caso de uma empresa que atue em vários segmentos, como deve ser realizado o Balanced Scorecard
dessa organização?
116
Considerações finais
• BPM é uma estrutura para organizar, automatizar e analisar as metodologias de negócios, métri-
• Com a implantação do BPM será possível que os colaboradores das diversas áreas trabalhem
• Monitoramento de atividade de negócio (BAM) são sistemas em tempo real que alerta os geren-
tes sobre possíveis oportunidades, problemas iminentes e ameaças, capacitando-os a reagir com
modelos e colaboração.
Glossário
Balanced Scorecard (BSC): metodologia de gerenciamento e medição de desempenho que ajuda
Verificação de leitura
117
QUESTÃO 1-A primeira etapa para um BPM é:
a) fazer a estratégia;
b) elaborar o scorecard;
c) definir o orçamento;
d) instalar todos os softwares para BSC;
e) monitorar o desempenho.
Referências bibliográficas
BPM STANDARDS GROUP. Business Performance Management: Industry Framework Document.
118
2005. Disponível em: <www.bpmpartners.com/documents/BPMIndustryFramework-V5.pdf>. Acesso
em: 12 maio 2018.
BRITTO, Gart Capote de. BPM Para Todos: Uma Visão Geral Abrangente, Objetiva e Esclarecedora
sobre Gerenciamento de Processos de Negócio. 1ª ed. Rio de Janeiro: Gart Capote, 2012. Disponível
em: <http://www2.unifap.br/claudiomarcio/files/2016/10/bpm_para_todos-_julho_2013.pdf>.
HAMMER, Michael. Agenda: What Every Business Must Do to Dominate the Decade. Pittsburgh:
KAPLAN, R.; NORTON, D. The Balanced Scorecard: Translating Strategy into Action. Boston:
2001.
Gabarito
QUESTÃO 1- Resposta A.
119
A primeira etapa é fazer a estratégia, pois o plano, o monitoramento e as ações e ajustes irão
QUESTÃO 2- Resposta B.
Scorecards e Dashboards são componentes comuns de quase todos os sistemas de gerenciamento
QUESTÃO 3- Resposta E.
BPM é uma abordagem avançada de medição e análise de desempenho que inclui planejamento e
estratégia.
120