Python
Python
avançados de
Python focados
em análise
de dados + 4
indicações de
livros
Considerando que estamos falando Também é relevante destacar a
sobre um trabalho extenso e que força da comunidade para aqueles
demanda o uso de ferramentas de que utilizam a linguagem. O
automação para lidar com grandes compartilhamento de recursos e
Boa leitura!
CLIQUE NO ASSUNTO
3. 8 dicas para visualizar
dados em um gráfico
PARA SER DIRECIONADO
4.
PARA À PÁGINA
Quer se desenvolver em
Python? Saiba como
(+ dicas de livros)
5. Encerramento
Quais são as
bibliotecas mais
utilizadas para
análise de dados?
As libraries são o diferencial para que Python seja uma boa
escolha para a análise de dados. Com elas, é possível obter
soluções completas para que as tarefas sejam realizadas com
sucesso. Saiba mais sobre as principais bibliotecas a seguir:
#1
Diferenciais da pandas: remodelamento,
expansão e filtragem de subconjuntos de dados.
Quais são as bibliotecas Ideal para a computação numérica com matrizes multidimensionais,
ela processa arranjos e matrizes grandes e multidimensionais. Também
mais utilizadas para
possui funções matemáticas para manipular esses arrays.
análise de dados?
Quando o assunto é análise de dados, ela é utilizada como contêiner
primário. Assim, possibilita-se o compartilhamento de dados entre
algoritmos. Por que os arranjos em NumPy se destacam?
#2 1.
Método superior de
armazenamento e manipulação de 2.
Libraries de linguagens de
níveis mais baixos podem ler e
NUMPY
dados numéricos em comparação alterar os dados armazenados
às estruturas nativas de Python; nesses arrays.
Quais são as bibliotecas Já essa biblioteca se destaca pela ampla possibilidade de produções
de gráficos, como os tipos bidimensionais, de forma nativa. E não para
mais utilizadas para
por aí, pois há a possibilidade de utilizar extensões para maximizar suas
análise de dados?
possibilidades para:
1. 2. 3.
#3
Projeções Gráficos Mais produtos
cartográficas; tridimensionais; gráficos.
MATPLOTLIB Aliás, você sabia que os gráficos gerados pela pandas possuem o
Matplotlib como origem?
Além das
Seaborn TensorFlow e Keras
bibliotecas que Foco em visualização Redes neurais, otimização
de dados; e modelos mais complexos
citamos acima, de machine learning.
ainda existem
as seguintes Scikit-learn
Para a modelagem
alternativas: estatística;
9 conceitos para
colocar a mão na
massa
1
9 conceitos para colocar
a mão na massa
/pd.read_csv
2
9 conceitos para colocar
a mão na massa
/import
Essa instrução diz respeito à biblioteca Outro ponto é o estilo do gráfico,
que será utilizada no código. Então, que pode ser utilizado da seguinte
vamos supor que pandas seja a nossa forma:
primeira escolha. Veja:
3
9 conceitos para colocar
a mão na massa
/head()
4
9 conceitos para colocar
a mão na massa
/describe()
5
9 conceitos para colocar
a mão na massa
/dtypes
6
9 conceitos para colocar
a mão na massa
/shape
7
9 conceitos para colocar
a mão na massa
/columns
8
9 conceitos para colocar
a mão na massa
/isnull()
9
9 conceitos para colocar
a mão na massa
/value_counts
8 dicas para
visualizar dados
em um gráfico
dados em um gráfico
Grid Rot
Para definir a linha de Grau de rotação dos dados
grade no gráfico. relacionados ao eixo X.
1
Uma linha de código,
cinco argumentos
2
quantile
conda install -c anaconda pandas-profiling
statistics
Pandas profiling
Essa linha cumpre com o objetivo de exibir o relatório de criação de perfil de
A função amplia o DataFrame para uma ágil análise
dados em um Jupyter Notebook de forma detalhada e com gráficos.
de dados. Uma linha de código gera volume de
Para exportar o relatório para um arquivo HTML interativo, utilize o código:
informações, além de um relatório HTML interativo.
profile = df.profile_report(title=’Pandas Profiling Report’)
df.describe()df.info()functionsdf.profile_report() profile.to_file(outputfile=”Titanic data profiling.html”)
import plotly.offline
3
cf.go_offline()
cf.set_config_file(offline=False, world_readable=True)
4
de zoom e redimensionamento, substitua “inline” por “notebook”, mas
confira se a função foi chamada antes de importar a biblioteca.
Comandos
mágicos
Com a library Cufflinks, você pode utilizar
a plotagem unida à flexibilidade dos
pandas e gerar gráficos. Veja:
5
Como melhorar a
estética das estruturas
de dados?
6
</div>
7
Pressione CTRL/CMD+Z para recuperar o conteúdo de uma célula. Caso a
restauração seja de uma célula inteira que foi apagada, utilize ESC+Z ou
CTRL/CMD+ZEDIT > Undo Delete Cells.
dados em um gráfico
Criar o script de importação de dados (conjunto de dados Boston
Housing, disponível no scikit-learn)
1. 2.
Utilizando para clustering, podemos Após, vamos aplicar o
usar a Análise de Componentes agrupamento k-means
8
Principais para diminuir as para identificar grupos
dimensões e visualizar os dados em homogêneos nos dados.
um espaço bidimensional;
1. 2.
Configure o ambiente Para gerenciar o ambiente
Python no Power BI? com as bibliotecas; Python, é possível utilizar
virtualenv e pipenv ou a
distribuição conda.
conhecimento
de Python Esperamos que os conteúdos apresentados neste Por isso, desejamos que a sua jornada
e-book possam contribuir com o desenvolvimento com Python seja de muito aprendizado
da sua carreira e no aprimoramento das habilidades e evolução constante! Quer inovar com
técnicas que, assim como as soft skills, são a gente? Acesse o banco de talentos
importantes para quem deseja alcançar maior Vivo clicando aqui e venha digitalizar
reconhecimento profissional ou até mesmo um para aproximar.
cargo de gestão.
Até a próxima!