0% acharam este documento útil (0 voto)
142 visualizações

Guia Pandas Python

Este documento fornece um guia rápido sobre o framework Pandas para análise de dados, demonstrando como criar séries e bases de dados, selecionar dados, filtrar, concatenar e mesclar dados. É apresentado como importar bibliotecas Pandas, criar séries e bases de dados simples, selecionar colunas, criar novas colunas, localizar dados, filtrar por condições, transformar índices em colunas e combinar bases de dados.

Enviado por

Alefe
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
142 visualizações

Guia Pandas Python

Este documento fornece um guia rápido sobre o framework Pandas para análise de dados, demonstrando como criar séries e bases de dados, selecionar dados, filtrar, concatenar e mesclar dados. É apresentado como importar bibliotecas Pandas, criar séries e bases de dados simples, selecionar colunas, criar novas colunas, localizar dados, filtrar por condições, transformar índices em colunas e combinar bases de dados.

Enviado por

Alefe
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 9

@Odemir Depieri Jr

Guia rápido
sobre o
framework
Pandas
@Odemir Depieri Jr

Criando uma serie de dados


Vamos importar a biblioteca pandas para podemos utilizar seus
recursos.

A partir de agora os recursos do pandas foram apelidados de ‘pd’.

Vamos criar nossa serie de dados.

Definimos uma variável chamada ‘Serie’ e nela chamamos a função ‘pd.Series’ e


passamos como parâmetros as listas que criamos.

Podemos selecionar apenas um rotulo da serie

Podemos fazer operações matemáticas na serie

Nesse caso estamos aplicando um multiplicação na serie inteira.

Podemos criar outra serie e somar junto a serie anterior


@Odemir Depieri Jr

Criando uma base de dados


Vamos criar uma base dados.

Selecionar apenas 1 (uma) coluna

Selecionar 2 colunas

Criando uma nova coluna e fazendo operações matemáticas entre as


colunas

Para criar uma coluna


basta nomeá-la e definir
os parâmetros
@Odemir Depieri Jr

Comandos sobre a base de dados

Excluir uma coluna

Nesse caso estamos excluindo uma coluna definitivamente da base de dados.

O parâmetro ‘inplace=True’ quer dizer que vamos excluir da base origem, caso
fosse ‘inplace=False’ iria excluir apenas na situação atual.

O parâmetro ‘axis=1’ quer dizer que vamos excluir a coluna. Quando quiser excluir
uma linha é usado ’axis=0’.

Localizar uma linha inteira

Localizar diversas linhas e colunas

Localizar diversas linhas e colunas usando parâmetros numéricos


através da posição da base de dados

Linhas Colunas
@Odemir Depieri Jr

Comandos sobre a base de dados

Verificando se há valores menores de 0 na base inteira

Nesse caso estamos verificando em toda a base de dados se há valores maiores


que zero.
Nesse contexto o pandas retorna se é verdadeiro ou false quanto a condição que
passamos.

Filtrando dados na base de dados

Nesse caso estamos :


1º Passando um parâmetro para verificar todos os casos maiores que 0 na coluna A
2º Retornando apenas os valores da coluna C

Filtrando dados na base de dados com parâmetros em variáveis

Nesse caso estamos :


1º Criando uma variável na qual estamos passando como parâmetro todos os
casos da coluna C maior que 0
* Lembrando que nesse caso o pandas irá retornar verdadeiro ou falso
2º Criamos uma nova base de dados e passamos como filtro a variável definida na
etapa 1
3º Retornando apenas os valores da coluna A
@Odemir Depieri Jr

Comandos sobre a base de dados

Filtrando os dados com diversos parâmetros e condições

Nesse caso estamos filtrando todos os casos da coluna A maior que 1 e passando
outro parâmetro para filtrar todos os casos da coluna C maior 0.

Transformando o index em uma coluna

Nesse caso transportamos o index das linhas para virar uma coluna na base de
dados. Assim o index foi resetado e ficou como numérico a partir de agora.
Se colocar o comando ‘inplace=True’ entre os parênteses, esse comando será
aplicado para a base de origem.
@Odemir Depieri Jr

Concatenar, Juntar e Mesclar


Criando as bases de dados para o exemplo

Empilhando os dados

O comando concat irá empilhar todas as bases de dados, desde que todas tenham
a mesma estrutura ( colunas ).
@Odemir Depieri Jr

Concatenar, Juntar e Mesclar

Função Mesclar permite que mescle os dados de diferentes base de


dados. Essa função é semelhante a mesclagem de tabelas do SQL

O comando merge uni as colunas baseando em uma chave, muito similar ao SQL.
O parâmetro ‘how’ há diversas forma:
- inner = apenas os casos que localizou em ambos os lados
- left = apenas os dados da base de dados do lado esquerdo
- right = apenas os dados da base de dados do lado direito
- outer = união das chaves em ambos os lados
- cross = cria o produto cartesiano de ambos os quadros

Função Juntar combina as colunas de ambas as bases de dados

Colunas A,BC eram da base de


dados 1 e as colunas D,E,F eram
da base de dados 2. Assim o join
uniu todas elas
@Odemir Depieri Jr

Final
Esse guia é super rápido e apenas uma introdução sobre o
tema.

Guia da documentação caso queira mais detalhes


https://pandas.pydata.org/docs/reference/io.html

Odemir Depieri Jr
Software Engineer Sr
Tech Lead
Specialization AI

Você também pode gostar