@Odemir Depieri Jr
Guia rápido
sobre o
framework
Pandas
@Odemir Depieri Jr
Criando uma serie de dados
Vamos importar a biblioteca pandas para podemos utilizar seus
recursos.
A partir de agora os recursos do pandas foram apelidados de ‘pd’.
Vamos criar nossa serie de dados.
Definimos uma variável chamada ‘Serie’ e nela chamamos a função ‘pd.Series’ e
passamos como parâmetros as listas que criamos.
Podemos selecionar apenas um rotulo da serie
Podemos fazer operações matemáticas na serie
Nesse caso estamos aplicando um multiplicação na serie inteira.
Podemos criar outra serie e somar junto a serie anterior
@Odemir Depieri Jr
Criando uma base de dados
Vamos criar uma base dados.
Selecionar apenas 1 (uma) coluna
Selecionar 2 colunas
Criando uma nova coluna e fazendo operações matemáticas entre as
colunas
Para criar uma coluna
basta nomeá-la e definir
os parâmetros
@Odemir Depieri Jr
Comandos sobre a base de dados
Excluir uma coluna
Nesse caso estamos excluindo uma coluna definitivamente da base de dados.
O parâmetro ‘inplace=True’ quer dizer que vamos excluir da base origem, caso
fosse ‘inplace=False’ iria excluir apenas na situação atual.
O parâmetro ‘axis=1’ quer dizer que vamos excluir a coluna. Quando quiser excluir
uma linha é usado ’axis=0’.
Localizar uma linha inteira
Localizar diversas linhas e colunas
Localizar diversas linhas e colunas usando parâmetros numéricos
através da posição da base de dados
Linhas Colunas
@Odemir Depieri Jr
Comandos sobre a base de dados
Verificando se há valores menores de 0 na base inteira
Nesse caso estamos verificando em toda a base de dados se há valores maiores
que zero.
Nesse contexto o pandas retorna se é verdadeiro ou false quanto a condição que
passamos.
Filtrando dados na base de dados
Nesse caso estamos :
1º Passando um parâmetro para verificar todos os casos maiores que 0 na coluna A
2º Retornando apenas os valores da coluna C
Filtrando dados na base de dados com parâmetros em variáveis
Nesse caso estamos :
1º Criando uma variável na qual estamos passando como parâmetro todos os
casos da coluna C maior que 0
* Lembrando que nesse caso o pandas irá retornar verdadeiro ou falso
2º Criamos uma nova base de dados e passamos como filtro a variável definida na
etapa 1
3º Retornando apenas os valores da coluna A
@Odemir Depieri Jr
Comandos sobre a base de dados
Filtrando os dados com diversos parâmetros e condições
Nesse caso estamos filtrando todos os casos da coluna A maior que 1 e passando
outro parâmetro para filtrar todos os casos da coluna C maior 0.
Transformando o index em uma coluna
Nesse caso transportamos o index das linhas para virar uma coluna na base de
dados. Assim o index foi resetado e ficou como numérico a partir de agora.
Se colocar o comando ‘inplace=True’ entre os parênteses, esse comando será
aplicado para a base de origem.
@Odemir Depieri Jr
Concatenar, Juntar e Mesclar
Criando as bases de dados para o exemplo
Empilhando os dados
O comando concat irá empilhar todas as bases de dados, desde que todas tenham
a mesma estrutura ( colunas ).
@Odemir Depieri Jr
Concatenar, Juntar e Mesclar
Função Mesclar permite que mescle os dados de diferentes base de
dados. Essa função é semelhante a mesclagem de tabelas do SQL
O comando merge uni as colunas baseando em uma chave, muito similar ao SQL.
O parâmetro ‘how’ há diversas forma:
- inner = apenas os casos que localizou em ambos os lados
- left = apenas os dados da base de dados do lado esquerdo
- right = apenas os dados da base de dados do lado direito
- outer = união das chaves em ambos os lados
- cross = cria o produto cartesiano de ambos os quadros
Função Juntar combina as colunas de ambas as bases de dados
Colunas A,BC eram da base de
dados 1 e as colunas D,E,F eram
da base de dados 2. Assim o join
uniu todas elas
@Odemir Depieri Jr
Final
Esse guia é super rápido e apenas uma introdução sobre o
tema.
Guia da documentação caso queira mais detalhes
https://pandas.pydata.org/docs/reference/io.html
Odemir Depieri Jr
Software Engineer Sr
Tech Lead
Specialization AI