Apostila Power BI

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 314

EVOLUÇÃO NA CARREIRA

Leonardo Karpinski

2,5k / mês

2016
xperiun
Bem-vindo ao maior ecossistema
de Análise de Dados do Brasil

+35.000 +7.500 +300


Profissionais Empresas Projetos
capacitados impactadas executados
Execução de projetos Desenvolvimento
para desenvolvimento técnico e prático de
de áreas de negócios profissionais de
com o Power BI mercado

Capacitação de Formação de
equipes / empresas consultores de
altíssimo nível
POR ONDE NÓS PASSAMOS
Instrutores qualificados
MICROSOFT
REVISTA
ISTOÉ
Resultados de alunos
Eu quero que mais pessoas
também cresçam e tenham
sucesso na carreira de BI

#INCOMPARÁVEIS
VOCÊ TAMBÉM QUER SER #INCOMPARÁVEL?

#EuQueroSerIncomparável
Vivemos na Era da Informação,
onde milhares de dados são
criados a cada segundo
Por que os dados são tão
importantes para as empresas?
Dados são a matéria-prima que,
devidamente transformada, permite
às empresas tomarem decisões
melhores e mais informadas
Mas como transformar
esses dados brutos em
INTELIGÊNCIA DE NEGÓCIOS?
ATRAVÉS DO BI
(BUSINESS INTELLIGENCE)
BI é um conjunto de processos para
dar suporte à tomada de decisão,
que envolve desde a coleta até
visualização dos dados de uma
maneira lógica e estruturada
O que é BI?

Objetivo Transformar dados brutos em informações compreensíveis e significativas que orientam


Principal a tomada de decisão

Transformação e Monitoramento e
Coleta Organização Análise Compartilhamento

Das informações que são a base da gestão de negócios, tais como informações
de vendas, estoque, produção, financeiro, informações de clientes, etc.

18
Processo Tradicional de BI

19
Processo Tradicional de BI

Clientes

Estoque

Produção

Vendas
ETL DW BI Relatório

Financeiro

20
QUAIS OS BENEFÍCIOS DO
Business intelligence?
• Clareza: ter visibilidade dos indicadores das áreas

• Produtividade: dar foco na ANÁLISE de seus dados ao invés da PRODUÇÃO de relatórios

• Confiança: ter uma visão ÚNICA de seus dados e indicadores

• Agilidade: ter dados e dashboards em tempo real e atualizados automaticamente

• Otimização: identificar falhas em processos e reduzir custos

• Vantagem competitiva: ter previsibilidade com dados corretos e análises diferenciadas


“Tivemos 34% crescimento no
faturamento devido a recuperação
de clientes utilizando as análises do
BI”

Daniel Delucchi
Gerente Inteligência Comercial
BI é gerar valor para o negócio
de uma empresa através da
análise de dados
E essa visualização dos
dados é feita ATRAVÉS DE
RELATÓRIOS E DASHBOARDS
UM DASHBOARD É UM
PAINEL com INDICADORES visuais
QUE AJUDA NA TOMADA DE DECISÃO
Como muitos GESTORES
pilotam a ÁREA hoje..
Como poderia ser..
Cenário Atual nas Empresas

35
Cenário Atual nas Empresas

• Uso de Excel pelos analistas

• Tarefas repetitivas e demoradas o tempo todo

• Demora no processamento das informações

• Alta dependência da TI para extração de dados

• Compartilhamento das informações por e-mail (relatório_final_final_v9.xlsx)

• Dificuldade em se chegar a um consenso nos números

• Etc
36
Métodos tradicionais de criação
de DASHBOARDS não satisfazem
mais as necessidades das
empresas
Aqui que entra o poder do
Microsoft Power BI
O poder do Power BI

• Cada vez mais a área de Negócios está pedindo independência da TI no uso e criação de
relatórios, a fim de ganhar agilidade e autonomia

• O surgimento de Plataformas Modernas de BI, ou ferramentas de Self-Service BI, estão


ajudando muito a atingir este objetivo

• Hoje o papel da TI em projetos de BI deve caminhar para o de um parceiro estratégico ao


invés de um produtor, com o objetivo de descentralizar atividades da TI

39
Principais objetivos:

Facilitar o Processo de Criação de Relatórios e


Democratizar o Uso de Dados na Organização!

40
O que é o Power BI?

41
Microsoft Self-Service BI Suplementos do Excel

Power Query
Permite a obtenção e
manipulação de
informações a partir de
diferentes fontes de dados

Camada de ETL

Powerpivot
Permite a criação de modelos
de dados diretamente no Excel
para a transformação dos Power View
dados em informações
significativas. Fica sobre um Permite a criação de
banco de dados em memória relatórios e dashboards
extremamente rápido! que garantem uma
experiência interativa
Camada de Modelagem ao usuário
de Dados
Camada de Relatórios

42
Microsoft Power BI Suplementos do Excel em um único aplicativo

Powerpivot

Esses são os 3 componentes necessários para


Power Query Power View que uma plataforma de BI seja eficiente:
- Carregamento e tratamento de dados
- Camada semântica para modelagem
de dados
- Visualização e criação de relatórios

43
Com o Power BI é preciso montar o
relatório apenas uma vez.

Após isso é só programar as atualizações


automáticas e analisar os dados!

44
O power bi permite Você evoluir DISSO..
Para DASHBOARDS PROFISSIONAIS
E DE ALTO IMPACTO
Outras vantagens do Power BI

61
Vantagens Microsoft Power BI
• Atualizações mensais

• Grande comunidade na internet

• Inúmeras possibilidades de conexão com dados, de diversas fontes

• Integração com outras soluções da Microsoft (Azure, Azure Machine Learning, Sharepoint, SSAS, HDInsight, etc)

• Facilidade para realizar ETL e modelagem de dados

• Poder das expressões DAX para realizar cálculos avançados

• Interatividade dos relatórios, podendo filtrar dados com extrema facilidade

• Gráficos e visuais avançados, inclusive podendo-se utilizar a linguagem R

• Possibilidade de compartilhar os dashboards para qualquer pessoa

• Possui aplicativo para celular

• Possibilidade de embedar relatórios em sistemas da empresa

• E, por último, mas não menos importante, o preço imbatível: $9,90 por usuário por mês

62
Quadrante Mágico Gartner

63
“Versões” do Power BI
Versão Versão Online Versão Online
Desktop Plano Free Plano Pro
Realizar transformações, construir modelos e utilizar funções DAX

Conectar-se a fontes de dados locais (on-premise)

Conectar-se a fontes de dados online

Construir relatórios

Construir dashboards

Publicar relatório na Web (link aberto)

Criar e colaborar em workspaces (grupos)

Compartilhar conteúdos com outros usuários de forma segura

Visualizar conteúdos compartilhados por outros usuários

Criar e utilizar Fluxo de Dados (Dataflows)

Valor Grátis Grátis $9,90/mês

64 Não recomendado
Workflow de projetos de bi
METODOLOGIA ESI
1. Entendimento do negócio
Nesta primeira etapa você deve entender como funciona a
operação do cliente que irá atender através de:
1. Análise de informações gerais;
2. Perguntas abertas para o cliente;
3. Análise de documentos fornecidos pelo cliente.
2. Entendimento dos requisitos
Identificação dos desafios e desejos

• Neste passo você precisa entender as dores e


necessidades para saber como resolver através de
painéis.
• Portanto seja muito curioso e deixe o cliente falar a
respeito do negócio e dos seus problemas.
2. Entendimento dos requisitos
Perguntas que ajudam
• Como é o processo atual de análise de dados e tomada
de decisão?
• Quais os desafios atuais neste processo?
• O quanto esses problemas te incomodam diariamente?
• Como você identifica oportunidades de melhoria?
• Como seria a solução de BI perfeita para você?
2. Entendimento dos requisitos
Definição DOS REQUISITOS FUNCIONAIS
Faça perguntas que ajudem o cliente a explicar quais eventos
ele deseja acompanhar e como ele quer analisar:
• O que aconteceu? (What)
• Como aconteceu? (How)
• Onde aconteceu? (Where)
• Quando aconteceu? (When)
• Quem fez? (Who)
2. Entendimento dos requisitos
Perguntas que ajudam na definição dos requisitos funcionais
• Quais eventos e indicadores importantes você precisa
acompanhar?
• Quais as regras de negócio desses indicadores?
• Como você deseja analisar esses indicadores? Por quais
visões?
• Quais ações devem ser geradas a partir das respostas?
Vamos ver na prática como
foi a reunião de mapeamento
de requisitos DA pinski?
3. ENTENDIMENTO DOS DADOS
O grande objetivo é mapear as fontes de dados e definir
como a solução deve ser comportar em relação à
governança, segurança, disponibilidade, manutenção, etc.
3. ENTENDIMENTO DOS DADOS
PERGUNTAS SOBRE A FONTE DE DADOS
• Quais os sistemas e ERPs utilizados?
• Quais as fontes de dados no projeto?
• Qual é o banco de dados transacional?
• Quem controla o servidor do banco de dados?
• Podemos ter acesso a um backup do banco ou a um
ambiente de desenvolvimento?
3. ENTENDIMENTO DOS DADOS
PERGUNTAS SOBRE SEGURANÇA E COMPARTILHAMENTO
• Quem vai utilizar o Dashboard?
• Quantos usuários teremos?
• Os painéis devem ser filtrados de acordo com o perfil do
usuário que acessar?
• Onde os usuários irão acessar o Dashboard?
• Qual a frequência de atualização?
4. MaPA de requisitos
bus matrix
• Importante para documentar e comunicar a arquitetura
do negócio, o que nos permite também definir o modelo
de dados do Data Warehouse
• Coloque os indicadores nas linhas e os atributos nas
colunas, marcando com um X quando as informações se
cruzarem
4. Mapa de requisitos
bus matrix
4. MaPA de requisitos
canvas
• Ferramenta visual inspirada no Business Model Canvas
• Proporciona clareza ao projeto, consolidando os principais
pontos em um único documento
• Assegura que todos os aspectos cruciais do projeto sejam
contemplados desde o começo
MAPA DE REQUISITOS
MAPA DE REQUISITOS
5. Cronograma de entrega
• Sempre quebre o projeto em etapas
• Comece pelo o que é mais importante ou o que é mais
fácil e rápido de entregar
• Isso traz mais valor para o cliente
• Você consegue testar e errar rápido
5. Cronograma de entrega
O PROFISSIONAL QUE SABE ANALISAR
DADOS E CRIAR DASHBOARDS COMO ESSES
É ALTAMENTE REQUISITADO NO MERCADO
O mercado de DADOS

Oportunidades

Profissionais
Capacitados

O Power BI é a principal ferramenta de análise de dados do mercado e


as empresas estão trocando seus relatórios de Excel para Power BI
Então não tem momento
melhor para quem
trabalha com dados do
que o momento atual...
O que é preciso para construir
dashboards como esses?
Não basta apenas usar uma
ferramenta como o power bi
É mais do que FERRAMENTA apenas
OS 3 PILARES
Do método buks
01 02 03
BUSINESS KNOW-HOW SOFT SKILLS

Você se tornará um verdadeiro Você vai aprender com a maior Você terá acesso a conteúdos
especialista em entender sobre referência de Power BI do para desenvolver suas
indicadores de negócios e mercado e ter acesso ao meu habilidades interpessoais e
influenciar positivamente o método comprovado para aprender a fazer um bom
sucesso das empresas. dominar tudo sobre o Power BI. marketing pessoal.
Editor de Consultas
(Power Query)

95
Editor de Consultas

• Originalmente chamado de Power Query, é a camada de ETL no Power BI


– Query: qualquer comando de consulta, inclusão ou alteração de tabelas de uma fonte de dados
– ETL: Extract, Transform and Load (Extrair, Transformar e Carregar)

• Foi desenvolvido com foco no Analista de Negócios, que pode realizar inúmeras ações
apenas com o clique do mouse

• Utiliza a linguagem M por trás, que por sua vez foi desenvolvida com foco no Analista de
Dados, usuários que se sentem mais confortáveis com uso de fórmulas
– Algumas ações mais avançadas são possíveis somente através do uso da linguagem M, porém a grande
maioria é possível de ser realizada com o clique do mouse.
– Não é necessário aprender esta linguagem a fundo, mas entender um pouco do contexto e das estruturas
dos códigos gerados lhe ajudará a ganhar mais produtividade nas criações.

96
Principais Funcionalidades

• Conexão com uma ampla variedade de fonte de dados

• Tratamento e limpeza de dados

• Agregações entre consultas, como Mesclar Consultas e Adicionar Consultas

• Transformação de colunas em linhas (Unpivot Columns)

• Dinamização de colunas (Pivot Columns)

• Preenchimento automático de dados

• Criação de novas colunas

• Etc...

97
Linguagem M

98
Linguagem M

• Cada passo executado na Interface é armazenado como um comando M no Editor


Avançado

99
Linguagem M

100
Linguagem M

• Queries podem referenciar outras queries pelo seu nome


• Queries são iniciadas com a expressão “let”
• A expressão “let” que permite que você quebre uma expressão em múltiplas partes (linhas)
• Cada linha é representada por uma variável, cujo nome vem antes do sinal de igual
• Variáveis podem armazenar qualquer tipo de dado: tabelas, listas, números, textos, etc
• Cada linha requer vírgula no final, com exceção da última
• O retorno da expressão “let” é informada na cláusula “in”

101
Linguagem M

Uma coluna na tabela é uma lista.

102
Linguagem M

Uma linha na tabela é um registro.

103
Linguagem M

Uma tabela é uma lista de registros.

104
Parâmetros

105
Parâmetros

• Parâmetros são utilizados no Editor de Consultas com o objetivo de facilitar a manutenção


das consultas

• São um tipo especial de query que retornam um único valor, e podem ser utilizados em
múltiplas outras queries

• Podem ser de qualquer tipo, incluindo texto, números e datas, porém não podem ser
tabelas nem listas

• Exemplos de uso:
– Caminho do diretório ou caminho para a fonte de dados, que pode mudar ao longo do tempo e precisa ser
reconfigurada em cada uma das consultas
– Filtro de quaisquer informações em uma tabela, que pode mudar para diferentes cenários de uso

106
Exemplo de Parâmetro

107
Junção de Tabelas

108
109
110
111
112
113
114
115
Visualizando Online

https://app.powerbi.com/view?r=eyJrIjoiYmNhN
zgzYjAtNjc2OS00YjQwLTgwNzItM2Q1MzcyMmJl
YjMyIiwidCI6IjZjMGE1YjljLTA4OWEtNDk0ZS1iM
DVlLTcxNjEwOTgyOTA0NyIsImMiOjF9

116
Combinando Arquivos de uma Pasta

117
Combinando Arquivos de uma Pasta

• Muitas vezes temos uma pasta onde colocamos arquivos periodicamente que possuem
todos mesmos formatos

• O Power BI permite a combinação automática desses arquivos escolhendo “Pasta” como


origem de dados

118
Tabela de Data (Calendário)

119
Tabela de Data (Calendário)

• Importantíssimo para a modelagem de dados

• É possível criar facilmente uma tabela de datas a partir de uma lista no Editor de Consultas

• De dentro do Editor de Consultas, deve-se seguir os seguintes passos:


– Nova Fonte
– Consulta Nula
– Digitar na barra de fórmulas: “= List.Dates”
– Escolher a data de início, a quantidade de dias desejados, e o incremento (geralmente será igual à 1)
– Clicar em “Invocar”

• Com a lista criada, basta agora transforma-la em uma tabela clicando em “Para a Tabela”

• Com a tabela de datas criada é possível agora criar novas colunas a partir da coluna de data
120
Tabela de Data (Calendário)

• Após Fechar e Aplicar, é importantíssimo marcar


esta tabela como Tabela de Data do Modelo

• Isso irá garantir que as medidas DAX de


Inteligência de Tempo irão funcionar de forma
correta

• Com o botão da direita na tabela de Data vá em


“Marcar como tabela de data” e na sequência
escolha a coluna do tipo Date como coluna de
Data do Modelo

121
Introdução à Modelagem de Dados

122
Power BI Conectado Diretamente na Fonte (sem DW)

Clientes

Estoque

Produção

Vendas

Financeiro

123
Modelo de Dados

Conjunto de tabelas conectadas por


relações entre colunas, que tem o objetivo
de responder a questões de negócio

124
Modelo de Dados

Quando você tem um único tabelão, você acaba


na verdade criando um relatório semelhante
ao que já faz no Excel.

O poder do Power BI está na possibilidade


de criar modelos de dados a partir de
relações entre diferentes tabelas!

125
Modelo de Dados

• Do ponto de vista de Vendas, a tabela está com a granularidade correta.

• Porém do ponto de vista de Clientes e Produtos ela não está na granularidade adequada.

• Dizemos que esta tabela está 100% desnormalizada, com informações espalhadas demais nela,
que se repetem em diversas linhas.

• Isso dificulta a criação de medidas e a análise em torno das propriedades de um Cliente ou


Produto

• Essa situação fica pior ainda quando temos mais de uma tabela Fato no modelo, visto que com
ambas 100% desnormalizadas não conseguimos relacioná-las para realizar comparações de
dados.

• Para corrigir isso, precisamos criar tabelas auxiliares nas granularidades corretas.
– Chamamos essas tabelas de tabelas Dimensão, e devemos relacioná-las às tabelas Fato

126
Tabelas Dimensão e Fato

127
Banco de Dados Dimensional
Dimensão A Tabelas Dimensão:

• Pontos de vista dos quais os fatos


podem ser analisados
• Fatores de agrupamento ou
perspectivas
• Tendem a ser menores que as fatos
• Cada registro é identificado de forma
única através de um ID
• Ex: local, data, cliente, produto, etc
Fato
Dimensão B Dimensão E
• Medidas sobre o negócio
• Valores que posso agregar
• Dados quantificáveis
• Pode conter milhões de
linhas
• Ex: quantidade de vendas,
valor das vendas, lucro
Esquema
Estrela
Dimensão C Dimensão D

128
Dimensões x Fatos

• Uma dimensão deve representar uma entidade que possui determinadas propriedades.
– Cliente: Nome, Idade, Escolaridade, Localização, etc
– Produto: Nome do Produto, Categoria, Subcategoria, Cor, Tamanho, etc

• Essas dimensões interagem entre si e geram um evento, que é armazenado em tabelas Fato:
– Um produto é vendido em uma determinada DATA, para um determinado CLIENTE, que mora em uma CIDADE,
e por aí vai.

• Quando criamos um modelo de dados tentamos sempre deixá-lo no Esquema Estrela (Star
Schema), visto que ele é comprovadamente o esquema mais eficiente para análise de dados.

• Isso significa ter uma ou mais tabelas fatos com dimensões ligadas à ela
– As tabelas fato NUNCA devem estar relacionadas entre si!

129
Dimensões x Fatos

DIMENSÃO FATO
Tipo de • Define entidades de negócios • Armazena observações/eventos
• Exemplo: produtos, clientes, históricos
informação fornecedores, data, contas, etc • Exemplo: vendas, transações,
estoque, orçamento, títulos pagos, etc
Estrutura • Possui uma chave única • Chaves das dimensões que se
(identificador da dimensão) repetem ao longo das linhas
• Colunas descritivas (atributos) • Colunas numéricas

Quantidade • Geralmente possuem poucas linhas • Pode conter milhões ou bilhões de


linhas
de dados
Objetivo • Filtrar os valores numéricos das • Realizar agregações dos valores
fatos (soma, média, contagem, percentual,
• Agrupar as informações etc)

130
Relacionamento Entre Tabelas

131
Relacionamento Entre Tabelas

Dimensão Fato

Direção

Cardinalidade
132
Cardinalidade do Relacionamento

• Um para Muitos (1:N)


– Tipo mais usual de relacionamentos

• Um para Um (1:1)
– Não é usual, e se existe é porque ambas as tabelas poderia ser uma única

• Muitos para Muitos (N:N):


– Surgiu no final de 2018
– Possibilita relacionar colunas que se repetem ao longo das linhas em ambas as tabelas
– Evita a necessidade de criar tabelas auxiliares com valores únicos como ponte
– Geralmente utilizado para relacionar tabelas em diferentes granularidades
– É preciso decidir o sentido do relacionamento (Único ou Ambos)

133
Direção do Filtro Cruzado

• Único:
– Filtro se propaga do lado 1 para o lado N, ou seja, das Dimensões para as Fatos
– Comportamento padrão, mais seguro e eficiente computacionalmente

• Ambos:
– Filtro se propaga em ambos os sentidos (Bidirecional)
– Precisa ser ativado manualmente
– Perigoso e mais lento que o padrão Unidirecional

134
Resumindo...

• O Modelo Tabular trabalha muito bem


com relacionamentos 1:N e filtros
unidirecionais, ou seja, quando o filtro
percorre o sentido do lado 1 para
o lado N (Dimensões para as Fatos)

• Para trabalhar com relacionamentos


N:N ou então com filtros bidirecionais
(ambos os sentidos), é preciso ter
bastante cautela!

• Então tente sempre deixar seus


relacionamentos 1:N com filtros
unidirecionais

135
Relacionamento Entre Tabelas

136
Relacionamento Entre Tabelas
Produto
ID Produto Produto Categoria

1 Caixa Som Audio

2 iPhone 8 Cell phones


Vendas
3 Rádio Audio
ID Produto Valor
4 DVD Player Audio
1 R$300,00
5 Dell XPS Computers
1 R$550,00
1
2 R$430,00

3 R$259,00
*
3 R$198,00

4 R$59,00

5 R$980,00

137 5 R$1280,00
Linguagem DAX

138
Linguagem DAX

Linguagem do Power Pivot, Analysis Services e Power BI


Peça fundamental de um modelo de dados

• Permite cálculos extremamente avançados e complexos em poucas linhas de código


• Lembra muito o Excel, justamente por ter nascido com o Powerpivot
– Trabalha com colunas inteiras, portanto não há o conceito de linha nem de célula
• Simples, porém não é trivial
• Conceito de contexto de avaliação é algo que se aprende aos poucos, de forma
iterativa
• Muitas vezes conseguimos fazer a fórmula funcionar, porém sem entender o porquê
• É imprescindível aprender a teoria para entender DAX

139
Funções DAX

Funções lógicas
01 Agem sobre uma expressão para retornar informações sobre os
valores da expressão.
DAX
DATA ANALYSIS EXPRESSIONS Funções de data e hora
02 Semelhantes às funções de data e hora do Microsoft Excel. No
entanto, as funções DAX se baseiam nos tipos de dados datetime
Coleção de funções, operadores e usados pelo Microsoft SQL Server.
constantes que podem ser usados em
uma fórmula ou expressão, para calcular e Funções de filtro
retornar um ou mais valores. 03 Permitem manipular o contexto de dados para criar cálculos
dinâmicos
Funções semelhantes às do Excel.
Funções de inteligência de tempo
04 Usando intervalos de hora e data em combinação com agregações
ou cálculos, é possível criar comparações significativas em
períodos de tempo comparáveis.

140
M vs DAX

141
M vs DAX

M (Power Query) DAX (Power Pivot)


• Linguagem do Power Query, voltada • Linguagem voltada para análise de
para manipulação, limpeza e dados
preparação de dados

X
• Voltado para modelagem de negócio
• Voltado para ETL
• Pode referenciar colunas de
• Sempre que possível é preferível quaisquer tabelas através de
criar colunas e tabelas pelo Power relacionamentos e Lookups
Query devido à melhor compressão

• Pode referenciar apenas colunas da


mesma tabela

Em geral, utilize M para manipulação de dados e


criação de colunas e tabelas simples, e DAX para
142 análise de dados com eles já carregados
M + DAX
e não

M vs DAX
143
Coluna Calculada x Medida

144
Coluna Calculada x Medida

Coluna Calculada Medida

• Contexto de linha • Contexto de filtro

• Valor calculado para cada linha da • Valor calculado somente no

X
tabela, sendo recalculadas a cada momento do seu uso e somente para
atualização as linhas visíveis nos visuais do
relatório
• Consomem memória, recurso
escasso e que afeta a performance • Consomem CPU apenas, sendo mais
eficientes computacionalmente
• Utilizada quando se deseja expor os
valores em um eixo do gráfico • Utilizada sempre que tivermos
valores para expor em um gráfico

145
Vamos criar uma Coluna Calculada e
uma Medida no Power BI

146
Por que criar Medidas com DAX se podemos
utilizar as Colunas e deixar o Power BI fazer a
Soma, Média, Contagem, etc?

147
Coluna Calculada x Medida

Produto Venda Lucro Margem


A 100 10 0,10
Agregando por Produto

A 80 20 0,25
SUM SUM SUM
A 120 36 0,30 Produto
Venda Lucro Margem
B 50 5 0,10 A 300 66 0,65
B 100 20 0,20 B 230 35 0,425
B 80 10 0,125

[Margem Correta] =
SUM ( Tabela[Lucro] ) / SUM ( Tabela[Venda] )

Tabela[Margem] =
Tabela[Lucro] / Tabela[Venda]
148
Tecnicamente seria possível ignorar completamente
DAX se o máximo que precisássemos fossem
Somas, Médias, Contagens, etc.

A partir do momento que precisamos calcular


porcentagens ou medidas mais complicadas,
não há outra saída a não ser utilizar as funções DAX

149
Além disso, medidas Explícitas são mais indicadas para
serem utilizadas no Valor dos gráficos no lugar de
colunas, que geram medidas implícitas

150
Funções Agregadoras

151
Funções Agregadoras

• Como o próprio nome diz, são úteis para agregar valores


– SUM
– AVERAGE
– MIN
– MAX

• Funcionam apenas com colunas numéricas

• Agregam apenas uma coluna por vez:


– Certo: Total Vendas = SUM ( Vendas[Valor Venda] )
– Errado: Total Custo = SUM ( Vendas[Quantidade] * Venda[Custo Unitário] )
• Solução 1: criar uma coluna calculada com a multiplicação das duas colunas
• Solução 2: utilizar os agregadores X, como a SUMX

152
Iteradores

153
Iteradores

• Funções Agregadoras que adicionam contexto de linha ao contexto de filtro visível:


– SUMX
– AVERAGEX
– MINX
– MAXX
– etc

• Iteram linha a linha sobre uma determinada tabela e avaliam a expressão em cada linha,
agregando ao final o valor resultante das iterações

• Sintaxe: • Exemplo:
SUMX ( Total Custo =
< tabela >;
SUMX (
< expressão >
Vendas;
)
Vendas[Quantidade] * Vendas[Custo Unitário]
)
154
Buscando Valores em Outras Tabelas

155
Função RELATED

• Permite percorrer o relacionamento do lado N para o lado 1 (Fatos para Dimensões) a fim
de obter o valor de uma coluna da tabela Dimensão
• Utilizada em situações onde há um contexto de linha, como em uma coluna calculada ou
em funções iteradoras, como a SUMX
• Recebe uma coluna e retorna um único valor

Coluna Calculada:

Vendas[Valor Custo] = Vendas[Quantidade] * RELATED( Produto[Custo Unitário] )

Medida:

[Total Custo] = SUMX ( Vendas; Vendas[Quantidade] * RELATED( Produto[Custo Unitário] ) )

156
Funções de Tabela

157
Funções de Tabela

Geralmente são aplicadas como filtros e/ou como tabelas virtuais no meio de fórmulas.

Dificilmente são utilizadas para se gerar novas tabelas físicas em modelos bem estruturados, a
não ser para testes e para estudo de como funcionam.

• FILTER
• ALL
• VALUES
• DISTINCT
• CROSSJOIN
• GENERATE
• SUMMARIZE
• ADDCOLUMNS
• SUMMARIZECOLUMNS

158
FILTER

• Iterador que vai linha a linha da tabela passada no primeiro argumento checando a condição do segundo
argumento. Ao final retorna uma tabela filtrada contendo apenas as linhas que satisfazem a condição:

FILTER(
< tabela >;
< filtro >
)

• Exemplo:

Vendas com Qde > 10 =


FILTER (
Vendas;
Vendas[Quantidade] > 10
)

159
ALL

• Retorna uma tabela com todos os valores da(s) tabela(s) ou coluna(s) informada(s),
ignorando quaisquer filtros prévios existentes:

ALL (
< tabela > ou < coluna >
)

• Exemplo:

Todas as Vendas =
ALL ( Vendas[No. Venda] )

160
VALUES

• Retorna uma tabela com todos os valores da(s) tabela(s) ou coluna(s) informada(s),
respeitando quaisquer filtros prévios existentes:

VALUES (
< tabela > ou < coluna >
)

• Exemplo:

Todas as Vendas =
VALUES ( Vendas[No. Venda] )

161
ALL x VALUES

• A diferença entre ALL e VALUES só é percebida quando aplicamos a função a uma medida e
aplicamos diferentes filtros, como por exemplo:

Qde Vendas ALL =


COUNTROWS ( ALL ( Vendas[No. Venda] ) )

Qde Vendas VALUES =


COUNTROWS ( VALUES ( Vendas[No. Venda] ) )

162
Medidas Rápidas no Power BI

163
Medidas Rápidas

• O Power BI oferece uma funcionalidade muito interessante para quem está iniciando o
aprendizado em DAX, que é a possibilidade de criar medidas de forma intuitiva

• Vamos calcular as seguintes medidas:


– Total de Vendas para a categoria de produto Audio

– Média de Vendas por Cliente

– Total de Vendas acumulado no ano

164
Contextos de Avaliação

Principal conceito para entendimento completo das funções DAX

Simples a primeira vista, mas que gera muita confusão em alguns casos

165
O que é um contexto de avaliação?

• O que essa fórmula irá computar?

166
O que é um contexto de avaliação?

O valor de uma fórmula DAX


depende do seu contexto

167
Fontes de um contexto

168
Fontes de um contexto

Leitura desta medida:

“A soma do valor total em vendas


para o contexto visível”

169
Perguntas:

Como é obtido o valor na linha/coluna Total da tabela?

Qual o contexto de filtro neste campo?

O que aconteceria se, ao invés de soma, a medida


calculasse uma contagem distinta?

170
Exemplificando Contextos de Avaliação

Total Vendas = SUM( Vendas[Valor Venda] )

171
Tipos de Contexto

Contexto de Filtro define quais linhas estão visíveis na tabela, podendo ser obtido por:
• Eixo dos visuais
• Filtros do canvas
• Filtros laterais
• Interação entre visuais

Contexto de Linha possui o conceito de “linha atual” para cada iteração, sendo definido por:
• Colunas calculadas
• Iteradores (funções SUMX, AVERAGEX, FILTER, etc)

Sempre devemos iniciar levando em consideração os contextos de filtro presentes, ou seja,


quais linhas da tabela estão visíveis para o cálculo de uma medida!

172
Função CALCULATE

173
Função CALCULATE

• Principal função DAX


• Única função capaz de modificar o contexto de avaliação
• Sintaxe:

CALCULATE (
< expressão >;
< filtro 1 >;
< filtro 2 >;
....;
< filtro n >
)

• Primeiro é feita a avaliação dos filtros internos e depois a avaliação da expressão para os filtros
aplicados

174
Filtrando com CALCULATE

Total Vendas Audio =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = “Audio”
)

175
Filtrando com CALCULATE

• Resumindo:

Total Vendas Audio =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = “Audio”
)

• Primeiro deve-se avaliar quais as linhas da tabela Vendas estão visíveis através dos
contextos de filtro presentes
• Após isso aplica-se um novo filtro à tabela através do filtro no segundo argumento, que
restringe a quantidade de linhas por onde a expressão será avaliada

176
Removendo Filtros da CALCULATE com ALL

• Removendo qualquer filtro de tabelas e/ou colunas de quaisquer tabelas:


CALCULATE (
< expressão >;
ALL ( < tabela ou coluna > )
)

• Remover filtros obedecendo os filtros externos que estão selecionados no momento:


CALCULATE (
< expressão >;
ALLSELECTED ( < tabela ou coluna > )
)

• Ambas são muito úteis para calcular porcentagem de contribuição de cada categoria no total

177
Removendo Filtros da CALCULATE com ALL

Total Vendas Fixo =


CALCULATE (
[Total Vendas] ;
ALL ( Vendas )
)

178
Removendo Filtros da CALCULATE com ALL

• Resumindo:

Total Vendas Fixo =


CALCULATE (
[Total Vendas] ;
ALL ( Vendas )
)

• Ao contrário do filtro que restringe a quantidade de linhas, ALL é capaz de aumentar a


quantidade de linhas da tabela
• Reforçando: muito útil para calcular porcentagens

179
Condição E na CALCULATE

• Utilizada quando duas ou mais condições devem restringir o resultado


– A condição adicional é um novo filtro, por isso ela restringe mais o resultado

• Exemplo:

Total Vendas Audio com Qde > 3 =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = “Audio” ;
Vendas[Quantidade] > 3
)

180
Condição E na CALCULATE

Total Vendas Audio com Qde > 3 =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = "Audio“ ;
Vendas[Quantidade] > 3
)

181
Condição OU na CALCULATE

• Utilizada quando duas ou mais condições satisfazem um único filtro.


• Exemplo:

Total Vendas Audio e TV =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = “Audio” || Vendas[Categoria] = “TV”
)

Ou então:

Total Vendas Audio e TV =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] IN { “Audio” ; “TV” }
)

182
Condição OU na CALCULATE

Total Vendas Audio e TV =


CALCULATE (
[Total Vendas] ;
Vendas[Categoria] = “Audio” ||
Vendas[Categoria] = “TV”
)

183
Funções de Inteligência de Tempo

184
Funções Inteligência de Tempo

Qualquer função relacionada a agregações ao longo do tempo

• Acumulado ao ano
• Acumulado ao trimestre
• Acumulado ao mês
• Mesmo período no último ano
• Mesmo período no último trimestre
• Mesmo período no último mês

185
Funções Inteligência de Tempo

• Há diversas funções prontas para facilitar as agregações ao longo do tempo


• Sintaxe de acumulado ao ano:
CALCULATE (
< expressão >;
DATESYTD ( < coluna de data > )
)

• Sintaxe de mesmo período último ano (muito útil para calcular porcentagem de crescimento ao longo do tempo):
CALCULATE ( CALCULATE (
< expressão >; < expressão >;
DATEADD (
< coluna de data >; - 1; YEAR
= SAMEPERIODLASTYEAR (
< coluna de data >

) )
)
)

186
Funções Inteligência de Tempo

• É possível utilizar a função FILTER para acumular ao longo do período de tempo desejado:

Total de Vendas Acc após 01-03-2016 = Total de Vendas Acc =


CALCULATE ( CALCULATE (
[Total Vendas]; [Total Vendas];
FILTER ( FILTER (
ALL ( Data ); ALL ( Data );
Data[Data] >= DATE (2017, 03, 01) Data[Data] <= MAX ( Data[Data] )
) )
) )

187
Funções Inteligência de Tempo

• É possível utilizar a função FILTER em conjunto com a ALLSELECTED para considerar


apenas o período de tempo do slicer:

Total de Vendas Acc Seleção =


CALCULATE (
[Total Vendas];
FILTER (
ALLSELECTED ( Data );
Data[Data] <= MAX ( Data[Data] )
)
)

188
Variáveis

189
Variáveis

• Evitam repetição de código e de cálculo de uma determinada expressão


• Tornam a leitura da medida mais fácil
• Calculadas apenas uma vez e no momento que for utilizada pela primeira vez na fórmula, otimizando
o cálculo
• Poderiam ser chamadas de “Constantes”, pois seu valor é atribuído no início da medida e não muda
mais para esta medida, podendo ser atribuídos valores de quaiquer tipos, inclusive tabelas

[Medida] =
[Medida] = VAR TotalVendas = SUM ( fVendas[Vendas] )
IF ( RETURN
SUM ( fVendas[Vendas] ) < 100; IF (
SUM ( fVendas[Vendas] ) * 1,25; TotalVendas < 100;
SUM ( fVendas[Vendas] ) * 0,90 TotalVendas * 1,25;
) TotalVendas * 0,90
)

190
Relacionamentos Especiais:
Muitos para Muitos, Bidirecionais e Inativos

191
Relacionamentos de Muitos para Muitos (N:N)

Há dois tipos de relacionamentos chamados N:N no Power BI:

1. Entre duas dimensões/entidades (clássico tipo de relacionamento N:N)

2. Entre tabelas em diferentes granularidades

192
Relacionamentos de Muitos para Muitos (N:N)

1. Exemplos de relacionamentos N:N entre duas


dimensões:
– Cliente e Vendedor, quando um cliente é atendido por
mais de um vendedor, e um vendedor pode atender mais
de um cliente

– Conta Bancária e Cliente, quando uma conta bancária


pode ser controlada por mais de um cliente, e um cliente
pode ter mais de uma conta bancária

• Para contornar este problema é necessário ter


uma terceira tabela, chamada de tabela ponte
(bridge table), que irá fazer um De-Para de quais
entidades estão relacionadas entre si.
Geralmente é uma tabela com apenas duas
colunas, uma para cada entidade

193
Relacionamentos de Muitos para Muitos (N:N)

2. Exemplos de relacionamentos N:N entre


tabelas com diferentes granularidades:
– Metas e Produto, quando a Meta é por Categoria e o
Produto está na granularidade de SKU
– Metas e Data, quando a Meta é Mensal ou Anual e a Data
é Diária

• Hoje o Power BI já permite a sua criação de


forma nativa, conforme no exemplo ao lado com
a tabela de Metas e Produto

• ATENÇÃO:
– UTILIZAR SEMPRE COM FILTRO UNIDERECIONAL, COM A
DIMENSÃO FILTRANDO A FATO
– JAMAIS CRIAR RELACIONAMENTOS N:N ENTRE TABELAS
FATO

194
Filtros Bi-Direcionais

• Utilizado comumente para tratar casos de


relacionamentos N:N entre duas dimensões
• Deve-se ativar o filtro bi-direcional com
cautela, apenas quando estiver seguro, visto
que podem introduzir ambiguidade
• Há um potencial muito grande de
filtrar coisas demais quando há múltiplas
tabelas Fato
• Geralmente filtros bi-direcionais são mais
lentos que filtros unidirecionais
• Dê preferência para utilizar a função
CROSSFILTER para ativar o filtro apenas
em medidas específicas

195
CROSSFILTER

• Utilizada para mudar o sentido do relacionamento, como um argumento da


função CALCULATE

• Geralmente utilizada para ativar filtro bi-direcional na medida em questão

• Sintaxe:
CROSSFILTER( <Coluna 1>; <Coluna 2>; <Direção> )

• <Direção>:
– ONE: considera o relacionamento do lado 1 para o lado N
– BOTH: considera o relacionamento nos dois sentidos
– NONE: elimina o relacionamento

196
USERELATIONSHIP

• Em muitos casos optamos por deixar um relacionamento inativo e ativá-lo somente em


determinadas situações

• Muito utilizado quando temos relacionamento de duas colunas na Fato para uma única
coluna na Dimensão, como “Data de Vendas” e “Data de Envio”, ou quando duplicamos
uma tabela Dimensão para comparação de dados da mesma Dimensão

• Seu uso é bastante similar ao da função CROSSFILTER


– A função CROSSFILTER é utilizada para mudar o sentido do relacionamento
– A função USERELATIONSHIP é utilizada para ativar um relacionamento que está como inativo
– Utilizada como um argumento da função CALCULATE

• Sintaxe:
USERELATIONSHIP( <Coluna 1>; <Coluna 2> )

197
TREATAS

• Quando não conseguimos criar um relacionamento físico, podemos criar relacionamentos


virtuais com a função TREATAS dentro de medidas

• Com isso conseguimos transferir o contexto de filtro de uma tabela para outra mesmo
sem a presença de um relacionamento entre elas

• Sempre que possível é preferível criar relacionamentos físicos, pois são mais eficientes que
relacionamentos virtuais

• Sintaxe:
TREATAS( < expressão tabela > ; < coluna target > )

198
RANKX e TOPN

199
RANKX

• Muito útil para ranquear uma determinada categoria de acordo com uma expressão

• Sintaxe:

RANKX (
< tabela>;
< expressão >;
< opcionais >
)

200
RANKX

• Remover o valor do Ranking da linha “Total” com as funções IF e HASONEVALUE

201
TOPN

• Função que retorna uma tabela com as TOP N linhas de uma tabela avaliada em uma
determinada expressão
• Sintaxe:

TOPN (
N,
< tabela >;
< expressão >;
< opcionais >
)

202
Storytelling e Visualização de Dados

203
Alguma vez você fez um
super dashboard e ele não
teve utilidade?
Ou então seu chefe pediu
para você exportar pra
excel?
Por que será que isso
acontece?
Qual o segredo para que um
dashboard traga valor e
seja utilizado de verdade?
Não basta apenas usar a
ferramenta certa e ter um
design bonito..
É preciso também ter um bom
storytelling que esteja alinhado
às necessidades de negócio
Dados vs informação vs conhecimento
Ou seja, medir é diferente de analisar

Assim como métrica é diferente de indicador


Storytelling com Dados

220
Por que Storytelling é Importante?

• Melhora a compreensão dos dados

• Reduz confusão e tempo de leitura

• Identifica padrões escondidos e possibilita novos


insights

• Melhora eficiência em relação à tomada de decisão

• Não frustram os usuários pois mostram apenas o


necessário e destacam os pontos mais importantes

• Melhora a satisfação dos usuários e as chances de


sucesso

221
Ciência por Trás da Visualização de Dados

O cérebro humano 90% das informações


processa informação transmitidas para o
visual 60.000 vezes cérebro são visuais
mais rápido que texto

Visuais aumentam As pessoas leem


a retenção em 42% apenas 28% do
texto de uma página
de um website

222
Recomendações para Visualização de Dados

• Estética é importa mais do que você imagina!


• Primeiro passo: identifique sua audiência
• Escolha uma paleta de cores adequada e use-a como
padrão em todos os visuais
• Escolha um background adequado e mantenha
consistência
• Escolha o tipo de fonte adequado e cuidado com os erro de
escrita
• Escolha os tipos de visuais adequados para cada objetivo
• Enfatize o que é importante e mantenha apenas o que é
necessário
• Mantenha os visuais sempre alinhados e no
tamanho adequado
• Pense fora da caixa!

223
Recomendação de Leitura

224
Antes x Depois

Dê destaque ao
que importa!

225
Antes x Depois

Utilize gráficos de linha


para dados históricos!

226
Antes x Depois

Não utilize gráficos 3D,


muito menos de pizza!

227
Antes x Depois

Não utilize gráficos de pizza para


mais de 3 categorias, muito menos
para comparar diferentes cenários!

228
Antes x Depois

38%

29%

22%

16%

229
Antes x Depois

Deixe seu visual limpo e com poucos


detalhes. O foco precisa estar na
informação relevante!

230
231
ALGO DE
ERRADO NÃO
ESTÁ MUITO
CERTO!
Galerias de Relatórios

• Data Stories Gallery:


https://community.powerbi.com/t5/Data-Stories-Gallery/bd-
p/DataStoriesGallery

• Power BI Arte:
http://powerbiarte.com.br/

233
Guia de Referência de Visuais

234
Storytelling com Power BI

235
236
237
238
Visualizando Online

https://app.powerbi.com/view?r=eyJrIjoiMDA4Y
WIwZWEtMDE3ZS00YmFhLWE5YWMtODFlZWE
zNTU1ODNiIiwidCI6IjZjMGE1YjljLTA4OWEtNDk0
ZS1iMDVlLTcxNjEwOTgyOTA0NyIsImMiOjF9

239
Storytelling com Power BI

Além de oferecer visuais modernos e interativos, o Power BI contem features muito interessantes
que ajudam na narração de dados:

• Drill-Down e Drill-Through
• Formatação condicional
• Tooltips
• Painel de seleção
• Painel de indicadores
• Perguntas e Respostas
• Explicar aumento/diminuição
• Insights rápidos
• Desenvolvimento de layout
para mobile
• Etc

240
Visual Customizado para Storytelling

241
Aplicativo Mobile

242
Aplicativo Mobile

243
Power BI Online

244
Principais Funcionalidades do Serviço do Power BI

1) Visualização de relatórios

2) Criação e visualização de painéis (dashboards)

3) Compartilhamento de relatórios e painéis

4) Atualização automática dos dados

5) Criação de fluxos de dados

245
Processo de Publicação de um Relatório

Power BI Online
Publicar
Servidor da Microsoft
Conjunto
de Dados Relatório

Workspace

Modelo +
Tabelas
Importar Relatório

Ambiente Local
Banco de Dados Power BI Desktop
Servidor da Empresa
246
247
Workspaces

Meu Workspace
Destinado para uso pessoal;

Ideal para teste de relatórios antes de publicar em workspaces


compartilhados;

Evita-se compartilhar conteúdos para outros usuários a partir


deste espaço.

Espaço onde ficam seus conjuntos de dados,


relatórios e painéis

248
Workspaces

Workspaces do Aplicativo
São ambientes de desenvolvimento com espaços de trabalho
compartilhados, onde múltiplos usuários podem colaborar com a
criação de relatórios e painéis;

Destinado preferencialmente para colaboração no desenvolvimento,


portanto adicione com cautela apenas usuários que precisarão
criar/editar relatórios;

Qualquer edição por parte de um usuário em um relatório ou painel


será aplicada aos demais membros, visto que é um espaço comum entre
todos

249
Adicionando Pessoas aos Workspaces

250
Permissões em um Workspace

251
Compartilhamento

252
Compartilhamento de Conteúdo

Além da possibilidade de incluir os usuários no Workspace, atualmente o Power BI permite você


distribuir seus conteúdos de 5 diferentes formas:

1. Compartilhamento individual de relatórios e painéis

2. Publicando aplicativos

3. Publicando na Web

4. Embedando para sua organização

5. Embedando para seus clientes

253
Compartilhamento de Conteúdo

Para visualização de conteúdo de dentro do Portal Online do Power BI essas são as duas formas de compartilhamento:

1. Compartilhamento individual
Indicado quando se deseja compartilhar poucos relatórios/painéis ou quando o conteúdo deve ser
compartilhado com poucos usuários.

Ao compartilhar desta forma, qualquer mudança feita é instantaneamente visualizada pelo usuário que recebeu
o compartilhamento.

2. Publicando Aplicativos
Melhor forma para compartilhar conteúdo com grandes audiências. É possível deixar bem personalizado e com
aparência de um software.

As edições nos visuais dos relatórios e painéis não são refletidas automaticamente no Aplicativo publicado.
Aplicativos são mais recomendados pois é possível maior controle e visibilidade, porém é possível criar apenas
um Aplicativo por Workspace.

254
Licenciamento

255
Planos do Power BI

• Duas categorias de licenciamento:


– Licença de usuário: Free ou Pro
– Capacidade dedicada: Premium EM (embedding), Premium P (Premium) ou Embedded A (Azure)

• Qualquer usuário no Power BI possui OU um plano Free OU um plano Pro.


– Não existe usuário com Plano Premium!

• Principal diferença entre Free e Pro: possibilidades de colaboração e


compartilhamento:
– Somente usuários Pro podem publicar o conteúdo em espaços de trabalho do aplicativo, consumir
aplicativos e compartilhar dashboards.
– Usuários Free podem criar relatórios e publicar no Meu Workspace à vontade, porém não podem
compartilhar e nem visualizar conteúdos compartilhados

256
Planos do Power BI (sem Premium)
Versão Versão Online Versão Online
Desktop Plano Free Plano Pro
Construir modelos e utilizar funções DAX

Conectar-se a fontes de dados on-premise

Conectar-se a fontes de dados online

Construir relatórios

Construir dashboards

Publicar na Web

Criar e colaborar em espaços de trabalho

Compartilhar aplicativos e dashboards com outros usuários

Visualizar aplicativos e dashboards compartilhados no portal do Power BI

Visualizar relatórios embedados em aplicações Web internas da


organização

Valor Grátis Grátis $9,90/mês


257
Power BI Premium por Capacidade

258
O que é o Power BI Premium?

• Plano lançado em Junho/2017 e disponível para aquisição no portal do Office 365

• Fornece recursos dedicados à execução do serviço do Power BI

• Voltado para capacidade de processamento, e não para licença de usuário

• Não se compara um plano Premium com um Plano Pro


– Plano Pro é para licença de usuário
– Plano Premium é voltado para obtenção de uma capacidade dedicada

• Você escolhe quais Espaços de Trabalho incorporar à capacidade dedicada


– Os que não foram atribuídos a uma capacidade Premium continuarão em capacidade compartilhada

259
Atribuindo Plano Premium a um Workspace

260
Principal Vantagem do Power BI Premium

Possibilitar que usuários Free visualizem


o conteúdo do Workspace

261
Planos do Power BI Premium

Planos EM Planos P

Voltados para visualização de relatórios Voltados para visualização de


embedados em aplicações internas da conteúdos no portal online do Power BI

X
organização
Usuários Free, além das vantagens ao
Usuários Free que possuem conta no lado, podem também visualizar
AAD podem visualizar relatórios aplicativos e dashboards
embedados em aplicações SaaS, como compartilhados diretamente no portal
Sharepoint, Microsoft Teams, ou em online do Power BI
sua própria aplicação Web

262
Outras Vantagens do Power BI Premium

• Ganho de performance por estar em hardware dedicado na Microsoft


• Limite de atualização aumenta de 8x/dia para 48/dia, podendo agendar uma
atualização a cada minuto
• Restrição de 1GB por dataset aumenta para até 10GB por dataset
• Limite de 10GB por espaço de trabalho aumenta para até 100TB por espaço de
trabalho

Essas vantagens só fazem sentido


quando utiliza-se o modo Import

Nos modos DirectQuery e Live Connection a


performance é ditada pela fonte de origem

263
Quando Adquirir os Planos P do Power BI Premium?

• De um ponto de vista financeiro, quando seu aplicativo for distribuído para mais de
505 usuários finais que irão apenas visualizar relatórios (não irão editar):
– Acima de 505 usuários é mais vantajoso adquirir o Plano P1 e deixar todos eles com conta Free
– Abaixo de 505 usuários é mais vantajoso deixar todos eles com a conta Pro
– $9,90 x 505 usuários = $4.999,50 por mês

Nó Cores Memória Valor Mensal

P1 8 25GB $4.995

P2 16 50GB $9.995

P3 32 100GB $19.995

264
Quando Adquirir os Planos P do Power BI Premium?

• Já de um ponto de vista funcional, quando o volume de dados e o tamanho da base é


grande, a melhor opção na minha opinião é partir para o Analysis Services:
– Arquivos PBIX maiores que 500MB deixam a máquina lenta;
– Demoram para salvar;
– Demoram para ser publicados;

• Para contornar esses pontos, há a possibilidade de trabalhar com uma amostra


pequena dos dados no Power BI Desktop e, após publicá-lo, atualizar essa amostra
para a base completa no serviço do Power BI através de Parâmetros do Editor de
Consultas
– Funciona, porém não é tão eficiente quanto o uso de partições no Analysis Services

265
Quando Adquirir os Planos EM do Power BI Premium?

• Quando os usuários possuírem conta no seu AAD e você quiser incorporar seu
relatório em aplicações Web para mais de 63 usuários finais
– Acima de 63 usuários é mais vantajoso adquirir o Plano EM1 e deixar todos eles com conta Free
– Abaixo de 63 usuários é mais vantajoso deixar todos eles com a conta Pro
– $9,90 x 63 usuários = $623,70 por mês

Nó Cores Memória Valor Mensal Lembre que esses usuários Free


não poderão visualizar aplicativos
EM1 1 3GB $625 e dashboards compartilhados
pelo portal do Power BI Online.
EM2 2 5GB $1.245
Apenas os planos Premium P
EM3 4 10GB $2.495 tem essa vantagem.

266
Planos do Power BI (com Premium)
Versão Versão Online Versão Online
Desktop Plano Free Plano Pro
Construir modelos e utilizar funções DAX

Conectar-se a fontes de dados on-premise

Conectar-se a fontes de dados online

Construir relatórios

Construir dashboards

Publicar na Web

Criar e colaborar em espaços de trabalho

Compartilhar aplicativos e dashboards com outros usuários

Visualizar aplicativos e dashboards compartilhados no portal do Power BI

Visualizar relatórios embedados em aplicações Web internas da


organização

Valor Grátis Grátis $9,90/mês

Premium EM Premium P
267
Atualização de Dados

268
Processo de Publicação de um Relatório

Power BI Online
Servidor da Microsoft
Conjunto
Publicar de Dados Relatório

Workspace

Modelo +
Tabelas
Importar Relatório

Ambiente Local
Banco de Dados Power BI Desktop
Servidor da Empresa
269
Gateway de Dados Local

• Quando nossa fonte de dados é local (on-premises), precisamos instalar e configurar


um gateway para a comunicação entre a fonte e o conjunto de dados no serviço
online do Power BI

• Ele funciona como uma ponte fornecendo uma transferência de dados rápida e segura
entre os dados locais e os serviços do Power BI na nuvem

• Há quatro etapas principais para usar um gateway:


– Instalar o gateway em um computador local, usando o modo apropriado
– Adicionar usuários ao gateway, para que possam acessar as fontes de dados locais
– Conectar-se a fontes de dados, para que eles possam ser usados em relatórios e painéis
– Atualizar dados locais, para que os relatórios do Power BI sejam atualizados

• Passo a passo para instalação:


– https://docs.microsoft.com/pt-br/power-bi/service-gateway-install

270
Segurança a Nível de Linha (RLS)

271
Segurança a Nível de Linha (RLS)

• Usada para restringir o acesso a dados para determinados usuários

• Cria-se uma função no Power BI Desktop através da aplicação de um filtro que irá restringir os
dados no nível de linha

• Na aba Modelagem, selecione Gerenciar Funções

• Após isso selecione “Criar” e forneça um nome para a nova função

272
Segurança a Nível de Linha (RLS)

• Selecione a tabela à qual você deseja aplicar a regra e insira a expressão DAX
– Esta expressão deve retornar TRUE ou FALSE

• No exemplo ao lado estamos criando


uma função chamada “Lojas Asia” que
aplica um filtro na tabela “Loja”, retornando
apenas as linhas da tabela onde a coluna
“Continente” tem o valor “Asia”

• Este filtro irá se propagar de forma


semelhante aos demais filtros, no sentido
1 para N (dimensões para fatos)

273
Segurança a Nível de Linha (RLS)

• Ao publicar este relatório no serviço do Power BI, será necessário atribuir os usuários finais às
funções criadas no Power BI Desktop

• Para gerenciar a segurança no modelo de dados, deve-se ir à aba “Conjunto de dados”, clicar
nas reticências e depois em “Segurança”

• Pronto, após isso basta adicionar o


e-mail dos usuários à função desejada

• Pode-se utilizar grupos de segurança


do Office 365 caso seja mais conveniente
do que adicionar e-mails individuais

274
Administração e Governança

275
Cenário nas Empresas Antes do Power BI

• Uso de Excel pelos analistas

• Tarefas repetitivas e demoradas o tempo todo

• Demora no processamento das informações

• Alta dependência da TI para extração de dados

• Compartilhamento das informações por e-mail (relatório_final_final_v9.xlsx)

• Dificuldade em se chegar a um consenso nos números

• Etc
276
Aí surgiu o Power BI e todos os
problemas se acabaram!!!

277
Será mesmo?!

278
Utilizando Power BI na Organização

Aline:
Vendas x
Leonardo:
Base Budget.PBIX
Visão
Vendas Gerentes.pbix
ETL

Leonardo:
Visão
Vendedores.pbix Leonardo:
Budget Visão
Diretoria.pbix

Fernando:
Vendas x
Base Compras.PBIX Perceberam que tem uma transformação errada sendo
Compras aplicada na Base de Budget e que tem um KPI
de Vendas sendo calculado de forma errada!

279
Problemas Comuns Encontrados no Uso do Power BI

• Trabalhos repetidos: as mesmas transformações de dados presentes em diferentes


arquivos PBIX

• Falta de padronização nos processos: diferentes pessoas realizando ETL de maneiras


diferentes

• Criação de diversos modelos de dados com os mesmos dados e medidas DAX


repetidas

• Troca de arquivos PBIX entre colegas de trabalho

• Resultado final: dificuldades de manutenção e criação silos de dados totalmente sem


padronização! Qualquer mudança precisa ser realizada em inúmeros locais de forma
manual e repetitiva.

280
Governança de Dados

• Antes de mais nada: Self-Service BI não significa fazer as coisas de qualquer


jeito, de forma independente. Cuidado com este termo!

• Implementar uma solução com Power BI é relativamente simples. Difícil é


mantê-la e crescer de forma organizada e sustentável.

• Não é porque estamos utilizando o Power BI que agora teremos a vida fácil.

• Automatizar tarefas repetitivas que antes eram feitas de forma manual no


Excel foi apenas o primeiro passo estabelecer uma Cultura de Dados na
Organização.

281
Governança de Dados

• Se você quiser manter uma solução com pouca manutenção, altamente


escalável, consistente e robusta, então será necessário ter a arquitetura correta
e a governança adequada.

• É preciso unificar e padronizar todo esse trabalho!

• O Power BI oferece duas funcionalidades muito importantes para isso:


– Fluxo de Dados (Dataflows)
– Conjuntos de dados compartilhados (Shared datasets)

282
Fluxo de Dados

283
Fluxo de Dados

• Power Query Online que pode servir


como um Data Warehouse, ou camada de
Staging, para as empresas

• Permite conexão com ampla gama de


fontes de dados, oferecendo as mesmas
facilidades do Power Query Desktop

• Disponível para planos Pro e não custa


nada a mais

• Não está disponível no Meu Workspace,


apenas nos Workspaces do Aplicativo

• Utiliza o poder da nuvem para


processamento e salva os dados no Azure
Data Lake Storage no formato de arquivos
CSV

284
Fluxo de Dados

Principais benefícios oferecidos pelo Dataflow:

1. Fornecer uma cópia das tabelas de banco de dados aos analistas de negócios, visto que dificilmente a TI
libera acesso para eles diretamente ao banco de dados. Com isso uma pessoa elencada pela TI pode
ficar responsável por criar essas Entidades no Dataflow (Entidade é a nomenclatura para Tabela no DF);

2. Centralização e reaproveitamento das tabelas resultantes de transformações pelo Power Query, evitando
o trabalho de copiar queries de um PBIX para outro e ter que manter as mesmas transformações em
diferentes locais;

3. Programação de diferentes horários e frequências de atualização de acordo com as entidades definidas


em cada Dataflow.
• Digamos que você tem um relatório que é composto por duas fontes, e uma delas você precisa atualizar apenas uma vez no dia e a
outra você precisa atualizar 8x no dia. Você pode criar dois Dataflows distintos e programar diferentes horários e frequências de
atualização, acelerando muito o tempo de atualização do conjunto de dados final que é composto por esses dois Dataflows.

285
Sem Fluxo de Dados

Comercial
Dimensão Data
utilizada no arquivo
Comercial.pbix

Dimensão Data
utilizada no arquivo
Financeiro.pbix

Financeiro

Transformações da Dimensão Data executadas múltiplas vezes, enquanto


seria necessário apenas uma vez
286
Com Fluxo de Dados

Comercial
Arquivo
Comercial.pbix

Dimensão Data
processada no
Fluxo de Dados Arquivo
Financeiro.pbix

Financeiro

Transformações da Dimensão Data executadas apenas uma vez, e


reaproveitadas múltiplas vezes
287
Com Fluxo de Dados

Workspace A

Conjunto de
Dados A1

Conjunto de
Fluxo de Dados A
Dados A2

Workspace B

Conjunto de
288 Dados B1
Processo de BI

289
Processo de BI Conceitual

Clientes

Estoque

Produção

Vendas
ETL DW BI Relatório

Financeiro

290
Processo de BI com Power BI

Clientes

Estoque

Produção

Vendas
Conjunto de Dados Relatórios
Power Query Fluxo de Dados
e Painéis
Online
Financeiro

Base de Dados
291
Shared Datasets

292
Conjuntos de Dados Compartilhados

• Ao publicar um arquivo PBIX, duas estruturas são criadas no Serviço Online do Power BI:
1) Relatório; 2) Conjunto de Dados

• O Conjunto de Dados é a estrutura que contém os dados transformados, os relacionamentos e


as medidas DAX. Ou seja, é o nosso Modelo de Dados.

• Um Conjunto de Dados em um Workspace pode ser utilizado para a criação de diferentes


relatórios. Melhor ainda, é possível publicar esses relatórios em diferentes Workspaces.

• Com isso evita-se a duplicação e manutenção do mesmo modelo, e todo o processo de


manutenção e atualização é realizado apenas no Conjunto de Dados original.

• Importante: não há como adicionar tabelas/dados ao conectar-se a Conjuntos de Dados,


somente medidas. Para isso é preciso trabalhar no PBIX original que gerou o Conjunto de
Dados.

293
Conjuntos de Dados Compartilhados

Workspace A

Relatório A1

Conjunto de Dados A Relatório A2

Workspace B
É criado um link para
o Conjunto de Dados
original, não havendo
duplicação dos dados
294 Relatório B1
Conjuntos de Dados Promovidos e Certificados

• Permite usuários encontrar e utilizar


datasets confiáveis

• Criadores de conteúdo podem promover


seus datasets para marca-los como
confiáveis, atribuindo uma tag “Promoted”

• Administradores podem eleger usuários-


chave a certificar datasets, que poderão
atribuir a tag de “Certified” aos datasets
que possuírem acesso

• Ao criar um novo relatório, usuários terão


acesso aos datasets compartilhados com
ele e aos que estão nos Workspaces onde
ele participa (inclusive o Meu Workspace)

295
Arquitetura Ideal
Necessita de atualização e não Essas 3 estruturas criadas podem
Necessita de atualização e exige gateway se não forem estar em Workspaces diferentes
exige gateway se a base adicionadas bases de dados
de dados for local locais ao Fluxo de Dados

ETL Publicar Publicar


Fluxo de Conjunto de Relatório
Dados Dados Online Online

Power BI Online

Ambiente Local

Conectar
Importar Live
Base de Modelo de Relatório
Dados Dados PBIX PBIX

Possibilita novas transformações Possibilita a criação de novas


no Power Query e importação medidas, mas não é possível
296 de outras bases de dados importar novos dados
Arquitetura Ideal

1) Criar um Workspace que servirá como Repositório no PBI Online. (TI)


2) Criar os Fluxos de Dados neste Workspace para importar as tabelas das fontes de dados. Essas tabelas
importadas são chamadas de Entidades nos Fluxos de Dados. (TI)
3) Configurar a atualização automática dos Fluxos de Dados no PBI Online. (TI)
4) Criar os Modelos de Dados (Relacionamentos + DAX) no PBI Desktop importando as Entidades dos
Fluxos de Dados. É possível importar Entidades de mais de um Fluxo de Dados. (TI + Negócios)
5) Publicar os Modelos de Dados em Workspaces, que são chamados de Conjuntos de Dados no PBI
Online. É possível publicar os Modelos de Dados em Workspaces diferentes dos originais que contém os
Fluxos de Dados. (TI + Negócios)
6) Configurar a atualização automática dos Conjuntos de Dados no PBI Online. (Negócios)
7) Criar os Relatórios pelo Power BI Desktop conectando a um Conjunto de Dados. É possível conectar em
apenas um Conjunto de Dados por relatório. (Negócios)
8) Publicar os Relatórios em Workspaces. É possível publicar os Relatórios em Workspaces diferentes dos
originais que contém os Conjuntos de Dados. Os Conjuntos de Dados nesses novos Workspaces serão
links para os originais, portanto os dados não são duplicados. (Negócios)
297
Arquitetura Ideal

Benefícios desta arquitetura:

• Separação das camadas de ETL, Modelagem de Dados e Visualização

• Maior facilidade no trabalho em equipe, podendo-se separar as equipes que cuidam de cada
camada.

• Redução no tempo de atualização do Conjunto de Dados, por deixar o trabalho pesado de


transformações no Dataflows

• Reutilização de transformações de dados, modelos de dados e cálculos, reduzindo


redundância e manutenção e aumentando a consistência

• Resumindo: uma única versão da verdade!

298
Data Lineage

299
Data Lineage

Dúvidas comuns de quem cria os modelos de dados:


• Quais relatórios serão impactados se eu fizer uma mudança no modelo?
• Quem está utilizando esses relatórios?
• E quem são os donos deles?

Dúvidas comuns dos analistas de negócios:


• Como posso ter certeza que este relatório é que apresenta os valores corretos que
posso confiar?
• De qual fonte vem os dados deste relatório?

Dúvidas comuns dos usuários finais:


• Os dashboards parecem estar desatualizados, o que aconteceu e como corrigir?

300
301
Data Lineage

• Caminho completo desde as fontes de dados até os dashboards


• Informa última atualização e se houve falhas de atualização

302
Modelo Tabular

303
Modelo Tabular

• Banco de dados em memória

• Baseado na metodologia relacional

• Orientado a colunas, e não a linhas

• Composto por dois motores: Formula Engine e Storage Engine (VertiPaq)

• Lançado em 2012 junto com o SQL Server 2012


– Até então utilizava-se essencialmente o modelo multidimensional para modelagem de dados

• DAX é uma linguagem fácil de ser aprendida, porém não tão simples de dominar por completo
– Há sempre diversas maneiras de se obter o mesmo resultado
– Saber qual é a melhor maneira não é uma tarefa fácil
– Requer grandes esforços para otimização quando se trabalha com grandes bases de dados

304
Modelo Tabular

305
VertiPaq Engine

• Nome oficial: xVelocity in-memory Analytics Engine

• Durante o processamento de dados, quando atualizamos os dados no Power BI, por


exemplo, a VertiPaq Engine lê o conteúdo da sua fonte de dados e os transforma em sua
estrutura interna

• Passos executados:
– Leitura dos dados, transformação em uma estrutura colunar codificada e comprimida
– Criação de dicionários e índices para cada coluna
– Criação de estrutura de dados para relacionamentos
– Cálculo e compressão das colunas calculadas (portanto são comprimidas após as colunas originais)

• Cada coluna é gravado em um espaço separado, evitando a necessidade de índices


– O acesso às colunas utiliza o mínimo de I/O possível, tornando a operação muito mais rápida e otimizada

306
Compressão Colunar

307
Compressão Colunar

Três formas de codificação e compressão

• Value Encoding:
– Realiza operações matemáticas nos valores da coluna a fim de diminuir a quantidade de bits armazenado
– Válido apenas para colunas de números inteiros

• Dictionary Encoding

• Run Length Encoding (RLE)

308
Dictionary Encoding
• Troca o armazenamento de strings por inteiros e cria um dicionário dos valores distintos (De-Para dos valores)
• Esta troca do tipo de dados reduz a quantidade de bits necessário para o armazenamento
• Torna o modelo tabular praticamente independente do tipo de dado das colunas, pois sempre haverá a
transformação deles para número inteiro
• Seu tamanho é altamente afetado pela quantidade de valores únicos na coluna

Dictionary Encoding

309
Run Length Encoding (RLE)
• Cria uma estrutura que diminui o tamanho da tabela evitando valores repetidos
• Depende muito da ordenação da coluna e também da quantidade de valores únicos
– Esses são os dois piores inimigos da VertiPaq Engine
– A quantidade de linhas e o tipo de dado são menos importantes que a cardinalidade e a distribuição dos dados
• O algoritmo do modelo tabular automaticamente define a melhor ordenação
• Quando a quantidade de valores distintos é tão grande, ou a distribuição é ruim, a Engine mantém a estrutura inicial da coluna
• Chaves primárias nunca são comprimidas pelo método RLE

2
RLE
1

310
1
Compressão Final

• Dictionary Encoding + Run Length Encoding


– Estrutura final da coluna que será utilizada na leitura dos dados
Estrutura Final

Dicionário
Dictionary
Encoding

Dados
RLE

311
VertiPaq Analyzer

• Construído a partir da leitura dos dados do DMV e organizado em forma de um modelo do


Powerpivot, o VertiPaq Analyser fornece informações de metadados e da estrutura que foi
processada em um modelo de dados
– Tamanho das colunas e tabelas
– Tipo de compressão utilizada
– Etc

• Muito útil também para documentação de modelos

• Download: https://www.sqlbi.com/tools/vertipaq-analyzer/

312
DAX Studio

• Ferramenta para analisar queries DAX e mensurar performance

• É possível capturar queries DAX de um modelo PBIX aberto, a fim de encontrar possíveis
gargalos em questão de performance e otimizar o modelo

• Download: https://www.sqlbi.com/tools/dax-studio/

• Vídeos interessantes:
– https://www.youtube.com/watch?v=tR9WPT4L87M
– https://www.youtube.com/watch?v=B-h3Pohtn1Y

313
314

Você também pode gostar