0% acharam este documento útil (0 voto)

30 visualizações

M1 - Análise de dados com Python

Enviado por

estoucientedocontrato

Direitos autorais

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

30 visualizações

M1 - Análise de dados com Python

Enviado por

estoucientedocontrato

Direitos autorais

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 23

Análise de dados com Python

Módulo 1 - Primeiros passos

na análise de dados
Sumário

Aula 1: Contextualização Aula 2: Ferramentas Essenciais

1.1 Introdução à Análise de Dados com Python 4 2.1 Criação e Manipulação de Arrays com NumPy 15
1.2 Configurando Ambientes: Jupyter 6 2.2 Pandas: Series e DataFrames 18
1.3 Revisão dos conceitos básicos de Python 11
3

Aula 1 - Contextualização
4

1.1 Introdução à Análise

de Dados com Python
Vamos começar do zero, entendendo o que é análise dados. A análise de
dados é um processo que nos permite extrair conhecimento de informações • Análise Descritiva de Dados: o que aconteceu? Informa sobre a situação
brutas, auxiliando na tomada de decisões mais assertivas e no direcionamento atual do objeto ou evento em análise. Utiliza dados reais para descrever um
estratégico para o futuro. Esse processo envolve várias etapas, incluindo comportamento.
examinar, tratar, transformar e modelar os dados, com o objetivo principal de
extrair informações significativas, geralmente para apoiar decisões e
responder a perguntas específicas. • Análise Diagnóstica e/ou Confirmatória de Dados (ACD): por que
aconteceu? Testa hipóteses usando técnicas estatísticas para validar se os
padrões identificados são significativos, determinando a causa de
Para realizar esses tipos de análises, diferentes técnicas são utilizadas, desde resultados específicos.
as mais simples, como a análise descritiva, até as mais complexas, como a
análise prescritiva. A escolha da técnica adequada dependerá do objetivo da
análise e dos dados disponíveis. • Análise Preditiva de Dados (APD): o que pode acontecer? Utiliza
As mais comuns são: algoritmos para prever eventos futuros com base em dados históricos,
permitindo ações proativas, como prever a renovação de contratos de
• Business Intelligence (BI): quais dados temos? Foco na coleta/ clientes.
mineração e armazenamento de dados de qualidade para auxiliar na
compreensão do negócio.
• Análise Prescritiva de Dados: o que devemos fazer? Recomenda ações de
negócios, utilizando algoritmos complexos e aprendizado de máquina para
• Análise Exploratória de Dados (AED): o que os dados revelam? Explora abordar problemas e antecipar tendências.
dados brutos para descobrir padrões, tendências e relações,
proporcionando uma compreensão inicial dos dados.
O dia a dia de um analista de dados envolve diversas etapas. Veja uma visão
geral das etapas e as ferramentas comumente utilizadas em cada uma delas.
5

1. Limpeza e organização de dados

4. Visualização de dados
• Python (usando bibliotecas como Pandas e Numpy): para manipulação
e limpeza de dados. • Tableau: para criação de dashboards interativos e visualizações
• R: para limpeza de dados e manipulação de dados estatísticos. avançadas.
• OpenRefine: para limpeza de dados em formato de tabela. • Power BI: para criação de relatórios interativos.
• Excel: para tarefas simples de limpeza e formatação de dados. • Python (bibliotecas como matplotlib, seaborn e plotly): para criação de
gráficos e visualizações personalizadas.

2. Análise exploratória de dados

• Excel: para gráficos básicos e visualizações rápidas.

• Python (bibliotecas como Pandas, Nump e Scipy): para análise estatística 5. Comunicação dos resultados
e de dados.
• R: para análise estatística avançada. • PowerPoint: para criação de apresentações.
• Excel: para análises simples e uso de fórmulas e tabelas dinâmicas. • Tableau/ Power BI: para apresentações interativas.
• SPSS/Stata/SAS: para análise estatística avançada. • Jupyter Notebook: para apresentar resultados em um formato narrativo e
interativo.

3. Modelagem de dados
• R e Markdown: para relatórios interativos.

• Python (bibliotecas como Scikit-learn, TensorFlow e Keras): para Neste contexto, podemos observar que Python é uma linguagem extremamente
modelagem preditiva e machine learning. versátil, pois possui uma ferramenta para quase todas as etapas e possui um
PyData stack (conjunto de ferramentas e bibliotecas em Python) muito útil para
• R: para modelagem estatística e machine learning. ciência de dados. Por isso, para a nossa trilha, adotamos o Python, juntamente
• SQL: para modelagem e agregação de dados. com o Jupyter Notebook, uma ferramenta que facilita a criação, o teste e o
compartilhamento de códigos.
6

1.2 Configurando Ambientes: Jupyter

Jupyter Notebook

O Jupyter Notebook é muito usado em análise de dados por ser fácil de instalar
e de utilizar. Ele permite escrever o código, separar o código em células para
melhor visualização e entendimento e facilita o compartilhamento do trabalho
que você fizer. Além disso, é leve, amigável ao usuário e compatível com
qualquer sistema operacional, pois funciona direto do navegador.

Para utilizar a versão online da ferramenta, realize os seguintes passos:

1. Acesse site oficial aqui.
2. No topo da página, clique em “Try”.
3. Em seguida, selecione uma das opções ou “JupyterLab”, ou "Jupyter
Notebook”.

JupyterLab vs Jupyter Notebook

O JupyterLab é a próxima geração da interface de usuário do Jupyter, que

oferece uma experiência mais flexível e extensível. Ele fornece uma interface de
usuário baseada em abas e painéis que permite trabalhar com múltiplos
documentos e ferramentas simultaneamente. Entretanto, a interface mais
avançada pode ter uma curva de aprendizado mais acentuada para novos
Foto de fabricasimf
disponível no Freepik.

usuários. Assim, aconselhamos novos usuários a começarem pelo Jupyter Editada pelo autor.

Notebook, que possui uma interface intuitiva e fácil de navegar.

Instalar Jupyter Notebook Usando o Miniconda No Windows, realize os seguintes passos:

• Execute o arquivo .exe baixado.
Uma alternativa para utilizar o Jupyter Notebook é fazer a instlação no nosso • Siga as instruções do instalador.
compputador por meio do Anaconda, um gerenciador com ferramentas pré • Apenas marque a opção "Add Miniconda to my PATH environment
instaladas, que facilitam o uso e a configuração para os usuários. Com o objetivo de variable" se você quiser abrir o Jupyter de qualquer terminal. Mas tenha em
deixar a instalação mais leve e personalizada, sugerimos o baixar o Miniconda, uma mente que, se você tiver outras instalações do Python, isso vai substitui-la por
versão que evita a instalação de dependências que não iremos utilizar.Primeiro, vá essa que vem junto com o Miniconda. Por padrão, vamos deixar desmarcado
no site do Anaconda e baixe o Miniconda, em seguida clique em "Installing e isso vai exigir que você utilize o terminal do Anaconda sempre que quiser
Miniconda". abrir o Jupyter.

Escolha o instalador adequado para seu sistema operacional (Windows, macOS ou

Linux). Depois de baixar, execute o instalador e siga o passo a passo, mantendo as
configurações padrão (só aperte next!)
8

Instalar o Jupyter Notebook

Agora, vamos utilizar o terminal para instalar o Jupyter notebook. Para isso, vamos
usar o gerenciador de pacotes do Python, chamado pip. Primeiro, procure nos
programas do seu computador o terminal do Anaconda.

Execute no Anaconda Powershell Prompt: "pip install jupyter"

Iniciar o Jupyter Notebook

Execute no Anaconda Powershell Prompt: "jupyter notebook".

Isso abrirá o Jupyter Notebook em seu navegador padrão.

IMPORTANTE! Se você não marcou a caixinha de adicionar o Python no PATH do

seu sistema operacional durante a instalação, este comando deve ser executado a
partir do terminal do Anaconda, porque outros terminais podem não conseguir
executar o comando de instalação. Caso contrário, deve funcionar de qualquer
terminal.

Caso a página com a aplicação carregada não apareça, clique ou copie e cole o link
que apareceu no terminal no seu navegador:
9

Usar o Jupyter Notebook

Na interface do Jupyter Notebook, escolha uma pasta onde irá trabalhar e clique
em “File” -> “New” -> “Notebook”. Isso vai criar um arquivo novo com o nome
Untitled.ipynb, que você pode renomear depois.

Feito isso, vamos à interface de edição do Jupyter Notebook:

Ao clicar, o seu novo notebook vai abrir em outra aba, perguntando qual o
Kernel Python, ou versão de interpretação dele, que queremos usar. Você pode
escolher e apertar “Select” para prosseguir.

Adicionar e Executar Código

Começando pelo nome do arquivo: você pode clicar no nome ao lado do logotipo
do Jupyter e renomear o arquivo que criamos, onde está escrito “Untitled”. Ao
clicar lá, poderá renomear à vontade que ele já salva para você.
10

O Jupyter Notebook é formado de células. Cada célula contém uma seção do seu
projeto. Em cada seção, você pode fazer três ações: Adicione código nas células e execute-o clicando em "Run" (o símbolo de play em
1. Criar células de texto corrido sem formatação e que não executa em Python cima) ou pressionando Shift + Enter.
para descrição ou comentários.
2. Criar células formatadas via Markdown, que é uma linguagem bastante Salvar e Fechar Notebooks
comum para documentação e permite estilizar seu texto com alguns símbolos.
Você encontra orientações no site Markdown Guide.
3. Criar células com código Python. Use o menu "File" para salvar seu trabalho e fechar o notebook.

Para alterar o formato do conteúdo das células, clique na célula desejada. Em

seguida, na parte superior, selecione o menu "Code". Esse menu permite que
você escolha entre diferentes tipos de células, facilitando a troca entre eles.
11

1.3 Revisão dos conceitos

básicos de Python
Python se tornou uma das linguagens de programação mais populares no campo Os tipos de dados padrão no Python são os seguintes:
da ciência de dados e análise de dados, graças à sua simplicidade e versatilidade. • Inteiro (int): o tipo inteiro é um tipo composto por caracteres numéricos
Neste tópico vamos revisar os principais conceitos de Python aplicados a dados. inteiros, pode ser positivou ou negativo.
• Ponto Flutuante ou Decimal (float): é um tipo composto por caracteres
Tipos de Dados numéricos decimais.
• String (str): é um conjunto de caracteres dispostos numa determinada
ordem, geralmente utilizada para representar palavras, frases ou textos.
Python é uma linguagem dinamicamente tipada, o que significa que não é
necessário declarar o tipo de variável ou fazer casting (mudar o tipo de variável), • Booleano (bool): tipo de dado lógico que pode assumir apenas dois
pois o Interpretador se encarrega disso. Isso significa também que o tipo da valores: falso ou verdadeiro. Na lógica computacional, podem ser
variável pode mudar durante a execução do código. considerados como 0 ou 1.

Saiba que em determinados cenários, pode ser necessário mudar o tipo de uma
variável.

Variáveis

Variáveis são utilizadas para armazenar valores com o operador de atribuição

sendo o sinal de igual. É uma boa prática usar nomes de variáveis com algum
significado. Veja alguns exemplos:
12

# Armazena o nome do cliente com texto

nome = ‘Joaquim’ Estrutura de Dados

# Armazena a idade do cliente com números inteiros

idade = 21 Continuando a revisão de conceitos, é crucial entender as estruturas de dados
básicas da linguagem. Elas formam a base sobre a qual construímos operações mais
# Indica se o cliente é VIP (bool) (verdadeiro/falso) complexas e análises avançadas. Veja os exemplos principais:
cliente_vip = True
• Lista (list): são coleções ordenadas de itens que podem ser de diferentes
# números quebrados, ou decimais tipos. O endereço de cada elemento em uma lista é chamado de índice, que é
valor_carteira = 13.25 usado para acessar e referir-se aos itens de uma lista. Elas são mutáveis, o
que significa que seus valores podem ser alterados após a criação.

Funções minha_lista = [1, 2, 3, 'quatro', 5.0]

Outro conceito importante que precisamos lembrar são as funções. Elas permitem • Tupla (tuple): assim como Listas, Tupla é um tipo que agrupa um conjunto de
agrupar um conjunto de instruções que executam uma tarefa específica mais de elementos variados. A diferença para Lista é que Tuplas são imutáveis, ou
uma vez. Ajudam também a separar nosso código em blocos mais fáceis de seja, uma vez criadas, suas entradas não podem ser modificadas. Um índice
entender. Veja exemplos: também é usado para acessar e referir-se aos itens de uma tupla.

# Definição de uma função simples que soma dois números minha_tupla = (1, 2, 3, 'quatro', 5.0)
def soma(valor_um, valor_dois):
return valor_um + valor_dois • Dicionário (dict): eles são utilizados para agrupar elementos através da
estrutura de chave e valor, onde a chave é o primeiro elemento, que deve ser
imutável e único, associada a um valor.
# Chamada da função
resultado = soma(3, 5) meu_dicionario = {'nome': 'Daenerys Targaryen', 'idade': 20}
print(resultado) # Saída: 8

# somando dois números de texto

print(soma("1","2") # Saída: "12" em texto!

# somando texto e número

print(soma("José", 13)) # Dá erro! Os tipos são diferentes :(
13

Além de conhecer as estruturas de dados, você também precisa saber controlar o

fluxo de execução, usando estruturas de controle: Módulos, Pacotes e Bibliotecas
# Estrutura de controle if-else
# Dica: caso algo for verdadeiro, execute determinado bloco de código; caso contrário,
Por fim, em Python, podemos usar módulos, pacotes e bibliotecas para organizar e
execute outro. reutilizar código. Entenda o que é cada um deles.
idade = 20

if idade >= 18: • Módulos: um módulo é um único arquivo Python que pode conter definições
print("Maior de idade") de funções, classes e variáveis, bem como código executável. Por exemplo:
else: O módulo math fornece funções matemáticas como sin(), que calcula o seno
print("Menor de idade") de uma tangente matemática, e cos(), que calcula o cosseno.
• Pacotes: um pacote é uma coleção de módulos organizados em diretórios que
# Estrutura de controle for loop fornecem uma hierarquia de namespace. Um pacote é simplesmente um
# Dica: rode para todos os itens dentro de um contexto diretório que contém um arquivo especial chamado __init__.py e um ou mais
for i in range(5): módulos. Por exemplo:
print(i) O pacote collections contém tipos de dados especializados como deque,
Counter, OrderedDict etc.
# Estrutura de controle while loop • Bibliotecas: uma biblioteca é uma coleção de módulos e pacotes que
# Dica: rode enquanto uma sentença for verdadeira fornecem funcionalidades específicas e que podem ser reutilizadas em
contador = 0 diferentes projetos. Bibliotecas podem ser instaladas e gerenciadas usando
while contador < 5: ferramentas como pip, que é o gerenciador de pacotes padrão do Python. Por
print(contador) exemplo:
contador += 1 As bibliotecas NumPy e Pandas fornecem funcionalidades avançadas para
manipulação e análise de dados, que utilizaremos ao longo da trilha, inclusive.
# Estrutura de controle try-except:
# Dica: tente fazer, se der errado, faça outra coisa sem explodir tudo
try:
resultado = 10 / 0
except ZeroDivisionError:
print("Erro: Divisão por zero!")
14

Foto de tohamina
disponível no Freepik.
Editada pelo autor.

Aula 2 - Ferramentas essenciais

2.1 Criação e Manipulação de Arrays

com NumPy
O que é NumPy?

O Python oferece ferramentas poderosas para análise de dados, sendo o

NumPy uma das principais. Essa biblioteca permite manipular dados
multidimensionais e realizar operações matemáticas avançadas de forma
simples e eficiente.

Estrutura de Dados: Arrays

O NumPy utiliza arrays, que são mais rápidos e consomem menos memória que
as listas tradicionais do Python. Além disso, o NumPy fornece uma ampla gama
de funções matemáticas e científicas.

A seguir, temos um código que compara a criação de listas usando o Python

nativo e o numpy, respectivamente, avaliando a performance dos dois (você
pode executar isso no Jupyter Notebook na sua máquina para tirar a prova!):
16

# instalando o numpy! #### Mãos à obra!

!pip install numpy # Avaliando tempo para criar uma lista usando Python
python_tempo_decorrido = timeit.timeit(cria_lista_em_python, number=1)
import timeit
import sys # Avaliando o tempo para criar uma lista usando NumPy
import numpy as np numpy_tempo_decorrido = timeit.timeit(cria_lista_numpy, number=1)

# Esse código vai criar duas listas: # Usa as funções para saber o tamanho em memória das listas em megabytes
# Uma, usando listas nativas do python, outra usando o numpy. tamanho_lista_python =
# Depois, vê o tempo decorrido para criá-las e o tamanho em memória! avalia_tamanho_da_lista_em_python(cria_lista_em_python())
tamanho_lista_numpy = avalia_tamanho_da_lista_em_numpy(cria_lista_numpy())
# Função que avalia o tamanho da lista em memória para numpy
def avalia_tamanho_da_lista_em_numpy(lista): # Imprime o tempo decorrido e o espaço necessário para criar as listas nos dois
return f'{lista.nbytes / (1024 * 1024):.3f}' cenários
print('Tempo decorrido para criar as listas:')
# Função que avalia o tamanho da lista em memória para listas Python print('-> Python:')
def avalia_tamanho_da_lista_em_python(lista): print(f' - Tempo de execução: {python_tempo_decorrido:.4f} segundos')
list_size = sys.getsizeof(lista) print(f' - Espaço em memória: {tamanho_lista_python} MB')
element_size = sys.getsizeof(0) print()
total_elements_size = len(lista) * element_size print('-> NumPy:')
return f'{(list_size + total_elements_size) / (1024 * 1024):.3f}' print(f' - Tempo de execução: {numpy_tempo_decorrido:.4f} segundos')
print(f' - Espaço em memória: {tamanho_lista_numpy} MB')
# Função para criar uma lista em Python
def cria_lista_em_python():
return [i for i in range(1_000_000 + 1)]
Nesse caso, a saída foi a seguinte:
# Função para criar uma lista em NumPy
def cria_lista_numpy():
return np.arange(0, 1_000_000 + 1, dtype=‘int64')
17

Veja que a criação do array com o NumPy foi muito mais rápida, usando apenas Saída:
uma fração da memória. Para tarefas e aplicações com uso intensivo de dados
que exigem cálculos numéricos rápidos, o aproveitamento do NumPy pode levar
a acelerações significativas e utilização mais eficiente de recursos. Criação de arrays multidimensionais ou matrizes
# Criando uma matrix quadrada de 3x3 elementos, de 1 a 9
Além disso, podemos fazer muito mais com o NumPy. Veja alguns exemplos. matrix = np.arange(1., 10.).reshape((3, 3))
print(matrix)

Criação de um array de inteiros

import numpy as np
Saída:
arr = np.array([1, 2, 3, 4, 5])
print(f"Elementos: {arr}, Tipo dos elementos: {arr.dtype}, Tamanho do array: Nesse caso, primeiro criamos um array da sequência de números de 1 a 9, com o
{arr.shape}") tipo ponto flutuante, utilizando o “arange”, e em seguida transformamos o
formato desse array para uma matriz de 3 colunas por 3 linhas, usando o
Saída: "reshape”.

Operações matemáticas de forma eficiente em vetores

Indexação e fatiamento
a = np.array([1.0, 2.0, 3.0])
# acesso ao terceiro elemento do array (índice 2): b = 2.0
elemento = arr[2] # Lembra que o índice começa sempre do zero!
print("Elemento:", elemento) resultado = a * b
print("Resultado da multiplicação do vetor:", resultado)
Saída:
Saída:
# obtendo um subconjunto de elementos de índice 1 a 3
subset = arr[1:4]
print("Subconjunto:", subset)
18

2.2 Pandas: Series e DataFrames

Enquanto o NumPy permite a manipulação de dados em forma de

arrays, o Pandas expande esses conceitos para a manipulação de
conjuntos de dados completos. Os dois elementos principais que
compõem o Pandas são as Series e os Dataframes. Entenda o que é
cada um deles.

Séries
É um arranjo unidimensional, como uma Lista. Ao aplicar alguma
função em uma Serie, ela é aplicada a todos os seus elementos. Para
melhor visualizar na mente, uma série é parecida com uma coluna no
excel. Eles podem ser organizados de acordo com um índice, que
funciona como os rótulos das linhas da sua planilha.

Existem muitas maneiras diferentes de criar uma Serie no Pandas.

Vamos começar criando uma série a partir de listas.

Primeiro, importe a biblioteca pandas como pd, defina uma lista

Python com os nomes ou valores que você quer ter na coluna do seu
dataframe e em seguida transforme esta lista em uma série do
Pandas.
19

import pandas as pd Dataframe

cidades = ["São Paulo (SP)", "Manaus (AM)", "Brasília (DF)"]

Um Dataframe é composto por linhas e colunas. Para criar um DataFrame,
cidades_serie = pd.Series(cidades)
podemos usar um dicionário, no qual as chaves representam os nomes das
print(cidades_serie)
colunas, e os valores representam os dados. Os índices dos registros estão
à esquerda, de 0 a 2. Também notamos na parte superior os nomes das
colunas, 'cidade' e 'população':
import pandas as pd

cidades_serie = pd.Series([
Saída: "São Paulo (SP)",
"Manaus (AM)",
Assim como nos arrays, conseguimos acessar um índice: "Brasília (DF)"
])
cidades_serie[2]
populacoes_serie = pd.Series([
12.0,
Saída: 6.5,
3.0
])
Ou acessar uma faixa de índices:
cidades_populosas = pd.DataFrame({
print(cidades_serie[:2]) 'Cidade': cidades_serie,
'População em milhões': populacoes_serie
})

print(cidades_populosas)

Saída:

Saída:
20

Acessando apenas uma Coluna Calculando a média de uma coluna

print(cidades_populosas['Cidade']) media_populacao = cidades_

populosas['População em milhões'].mean()
print("Média de população:", f'{media_populacao:.2f}', 'milhões de
habitantes')
Saída:

Acessando uma faixa de elementos com o método iloc[ ] Saída:

print(cidades_populosas.iloc[:2])
Adicionando uma nova coluna de números como texto
Quando estamos trabalhando com um DataFrame, muitas vezes temos a
necessidade de adicionar novas informações. Para fazer isso no Pandas,
Saída: basta criar uma nova coluna e atribuir os novos elementos:
# Aqui é texto! Lembre-se disso, depois a gente vai converter! :D
area_urbana = ['914', '640', '590']
cidades_populosas['Área urbana em km²'] = area_urbana
print(cidades_populosas)
Os dois pontos indicam que queremos selecionar um intervalo de linhas. O
número antes dos dois pontos (omitido neste caso) representa o índice
inicial (que, por padrão é 0). O número após os dois pontos (2) representa o
índice final (exclusivo), ou seja, a seleção vai até a linha de índice 1 (segunda
linha).
Saída:
21

Multiplicando valores de uma coluna

Para mudar a escala de representação numérica de uma coluna, podemos Efetuando cálculos sobre uma coluna
criar uma outra coluna e multiplicar os valores por um fator único. Aqui, vamos Com as duas colunas nos formatos e tipos corretos, conseguimos criar uma
representar a população de cada cidade com o número completo e adicionar nova coluna, adicionando ao nosso conjunto de dados a informação sobre a
no nosso dataframe: quantidade de habitantes por km² em cada cidade:
valor_bruto = cidades_populosas['População em milhões'] * 1_000_000 habitantes_km = cidades_populosas['População em milhões'] /
cidades_populosas['População - valor bruto'] = valor_bruto cidades_populosas['Área urbana em km²']
print(cidades_populosas)
cidades_populosas['Habitantes por km²'] = habitantes_km

Saída:

Modificando o Tipo de dado de uma coluna

Quando adicionamos as informações sobre a área urbana, lembra que usamos
uma lista de números como texto? Mas, para realizar o cálculo, iremos
transformar o tipo da coluna para inteiros usando o método 'astype' na coluna
e colocando no lugar da antiga.

int_area_urbana = cidades_populosas['Área urbana em km²'].astype(int)

cidades_populosas['Área urbana em km²'] = int_area_urbana
22

Explore mais!

Pratique Python com exercícios simples, disponibilizados pela

comunidade Phyton Brasil. Clique aqui.

Leia o livro Python Para Análise de Dados: Tratamento de Dados com

Pandas, NumPy & Jupyter de Wes McKinney, para estudar mais sobre
Python e análise de dados.

MyCompiler é uma ferramenta prática ideal para testar rapidamente

pequenos trechos de código sem configurar um ambiente de
desenvolvimento completo, ótimo para revisões. Clique aqui.

Assista ao tutorial Introduction to Numerical Computing with NumPy,

apresentado por Alex Chabot-Leclerc e aprofunde como funciona o NumPy.
Ele aborda funções da biblioteca e aprofunda conceitos e execuções. Clique
aqui.

Acesse o guia PEP-8. Ele cobre convenções de nomenclatura, formatação de

código, e boas práticas de escrita, essenciais para garantir código limpo,
legível e consistente em projetos de Python. Clique aqui.
23

Referências bibliográficas
Array objects — NumPy v1.26 manual (2024). Disponível em: <https:// SILVA, Andressa. Por onde começar em Análise de Dados. Disponível em:
numpy.org/doc/stable/reference/arrays.html>. Acesso em: 15 abr. 2024. <https://medium.com/data-hackers/por-onde-come%C3%A7ar-em-
an%C3%A1lise-de-dados-a0793af9b6c8>. Acesso em: 24 jul. 2024.

DataFrame — Pandas 2.2.2 documentation (2024). Disponível em: <https://

pandas.pydata.org/docs/reference/frame.html>. Acesso em: 22 abr. 2024.

Executando o Notebook [s.d]. Project Jupyter documentation. Disponível em:

<https://docs.jupyter.org/pt-br/latest/running.html> Acesso em: 15 abr.
2024.

NumPy C-API — NumPy v1.26 manual (2024). Disponível em: <https://

numpy.org/doc/stable/reference/c-api/index.html>. Acesso em: 15 abr. 2024.

Python para quem está começando [s.d]. Python Brasil. Disponível em:
<https://python.org.br/introducao/>. Acesso em: 15 abr. 2024.

Routines — NumPy v1.26 manual (2024). Disponível em: <https://numpy.org/

doc/stable/reference/routines.html>. Acesso em: 17 abr. 2024.

Series — Pandas 2.2.2 documentation (2024). Disponível em: <https://

pandas.pydata.org/docs/reference/series.html>. Acesso em: 18 abr. 2024.

Você também pode gostar

FBD1, F.14 e SM35-Lançamentos Periódicos
100% (1)
FBD1, F.14 e SM35-Lançamentos Periódicos
10 páginas
Python Programming For Data Analysis Traduzido
Ainda não há avaliações
Python Programming For Data Analysis Traduzido
264 páginas
Análise de Dados em Python Com Pandas - Ebook - 02.01
Ainda não há avaliações
Análise de Dados em Python Com Pandas - Ebook - 02.01
12 páginas
Abordagem de Estudo de Caso para A Criação de Projetos de Ciência de Dados Bem-Sucedidos Usando Python, Pandas e Scikit-Learn Stephen Klosterman
Ainda não há avaliações
Abordagem de Estudo de Caso para A Criação de Projetos de Ciência de Dados Bem-Sucedidos Usando Python, Pandas e Scikit-Learn Stephen Klosterman
58 páginas
Pdu Sad
100% (2)
Pdu Sad
6 páginas
TLP 12 - Fundamentos de Base de Dados PDF
100% (1)
TLP 12 - Fundamentos de Base de Dados PDF
106 páginas
Apostila Completa Aula 4: Impressionador Do Absoluto Zero!
Ainda não há avaliações
Apostila Completa Aula 4: Impressionador Do Absoluto Zero!
36 páginas
Guia de Início Rápido Do Jupyter Notebook
Ainda não há avaliações
Guia de Início Rápido Do Jupyter Notebook
3 páginas
Como Criar Um Projeto de Data Science
Ainda não há avaliações
Como Criar Um Projeto de Data Science
25 páginas
Aula01 Numpy Pandas
Ainda não há avaliações
Aula01 Numpy Pandas
76 páginas
AMOSTRA_PythonDataScienceHandbook
Ainda não há avaliações
AMOSTRA_PythonDataScienceHandbook
15 páginas
Básico: Colab, Python, Numpy E Pandas: 2.1. Ambiente Google Colaboratory Ou
Ainda não há avaliações
Básico: Colab, Python, Numpy E Pandas: 2.1. Ambiente Google Colaboratory Ou
19 páginas
Ebook Pythonparaanalisededados
Ainda não há avaliações
Ebook Pythonparaanalisededados
14 páginas
Python Data Science Handbook - Jake VanderPlas (001-253)
Ainda não há avaliações
Python Data Science Handbook - Jake VanderPlas (001-253)
253 páginas
Python para Análise de Dados: Um Guia Definitivo
Ainda não há avaliações
Python para Análise de Dados: Um Guia Definitivo
4 páginas
DS - Data Science I
Ainda não há avaliações
DS - Data Science I
36 páginas
M1 Análise de dados
Ainda não há avaliações
M1 Análise de dados
135 páginas
Python Para Ciencia de Dados Aula 1 e 2
Ainda não há avaliações
Python Para Ciencia de Dados Aula 1 e 2
61 páginas
Apostila Intensivão de Python - Aula 1
100% (1)
Apostila Intensivão de Python - Aula 1
54 páginas
Python
Ainda não há avaliações
Python
30 páginas
Modelagem De Dados Gráficos Em Python
No Everand
Modelagem De Dados Gráficos Em Python
Jideon Marques Marques
Ainda não há avaliações
Aprendizado Analise de Dados
Ainda não há avaliações
Aprendizado Analise de Dados
14 páginas
Profissao Cientista de Dados M4 Boas praticas
Ainda não há avaliações
Profissao Cientista de Dados M4 Boas praticas
15 páginas
Conteúdo Programático - Data Analytics Bootcamp
Ainda não há avaliações
Conteúdo Programático - Data Analytics Bootcamp
5 páginas
Apostila - Módulo 2 - Bootcamp Desenvolvedor (A) Python
Ainda não há avaliações
Apostila - Módulo 2 - Bootcamp Desenvolvedor (A) Python
29 páginas
CAP 01 - INTRODUÇÃO
Ainda não há avaliações
CAP 01 - INTRODUÇÃO
26 páginas
Plano_de_estudos_databricks
Ainda não há avaliações
Plano_de_estudos_databricks
13 páginas
Daniel Chen Pandas For Everyone Python Data Analysis Addison Wesley Data Analytics Series Addis 1 200
Ainda não há avaliações
Daniel Chen Pandas For Everyone Python Data Analysis Addison Wesley Data Analytics Series Addis 1 200
200 páginas
Tema 5
Ainda não há avaliações
Tema 5
38 páginas
Python para Usuários de Excel - Apostila Asimov Academy
Ainda não há avaliações
Python para Usuários de Excel - Apostila Asimov Academy
58 páginas
Ebook Conceitos Avançados de Python
Ainda não há avaliações
Ebook Conceitos Avançados de Python
31 páginas
Ciencia de Dados - Modulo 1 - Aula 2 - Engenharia de Dados
100% (1)
Ciencia de Dados - Modulo 1 - Aula 2 - Engenharia de Dados
125 páginas
Aula 01
Ainda não há avaliações
Aula 01
35 páginas
Analise_de_Dados_Avancado (1)
Ainda não há avaliações
Analise_de_Dados_Avancado (1)
8 páginas
Pandas Python: Data Wrangling para Ciência de Dados
No Everand
Pandas Python: Data Wrangling para Ciência de Dados
Eduardo Corrêa
Ainda não há avaliações
Jupyterlab Spyder
Ainda não há avaliações
Jupyterlab Spyder
7 páginas
Todos Os E-Books - Paradigma
100% (1)
Todos Os E-Books - Paradigma
255 páginas
Apostila - Módulo 2 - PYT
Ainda não há avaliações
Apostila - Módulo 2 - PYT
30 páginas
Guia adicional
Ainda não há avaliações
Guia adicional
10 páginas
Ferramentas Matemáticas Aplicadas
Ainda não há avaliações
Ferramentas Matemáticas Aplicadas
22 páginas
67-Manuscrito de capítulo-544-1-10-20210705
Ainda não há avaliações
67-Manuscrito de capítulo-544-1-10-20210705
49 páginas
Ementa Do Curso - Data Science Do Zero
Ainda não há avaliações
Ementa Do Curso - Data Science Do Zero
14 páginas
Bíblia De Programação Python Para Iniciantes
No Everand
Bíblia De Programação Python Para Iniciantes
Jideon F Marques
Ainda não há avaliações
P1 Metodologia Da Pesquisa Cient Fica
Ainda não há avaliações
P1 Metodologia Da Pesquisa Cient Fica
6 páginas
Python para ciência de dados e-book estendido.pdf
Ainda não há avaliações
Python para ciência de dados e-book estendido.pdf
70 páginas
V2 Apostila Aluno Python Data Science
Ainda não há avaliações
V2 Apostila Aluno Python Data Science
184 páginas
Data Visualization: Transforme dados em conhecimento
No Everand
Data Visualization: Transforme dados em conhecimento
Ronaldo Braghittoni
Ainda não há avaliações
INTRODUÇÃO GUIA PYTHON_PARTE 1
Ainda não há avaliações
INTRODUÇÃO GUIA PYTHON_PARTE 1
21 páginas
Aulas Do Módulo 02
Ainda não há avaliações
Aulas Do Módulo 02
229 páginas
Capitulo 9786586057102
Ainda não há avaliações
Capitulo 9786586057102
58 páginas
AMOSTRA PythonParaExcel
Ainda não há avaliações
AMOSTRA PythonParaExcel
15 páginas
Linguagem de Programação
Ainda não há avaliações
Linguagem de Programação
4 páginas
4 - Análise de Dados de Python Com Pandas
Ainda não há avaliações
4 - Análise de Dados de Python Com Pandas
74 páginas
Profissões em Tecnologia
No Everand
Profissões em Tecnologia
Ricardo Garay
Ainda não há avaliações
EdI-2023-introducao Ciencia Dados
Ainda não há avaliações
EdI-2023-introducao Ciencia Dados
6 páginas
Ava Univirtus5
Ainda não há avaliações
Ava Univirtus5
26 páginas
GRÁFICOS COM PYTHON NO POWER BI para Biblioteca
Ainda não há avaliações
GRÁFICOS COM PYTHON NO POWER BI para Biblioteca
41 páginas
Aula1 Pandas Dataviz
Ainda não há avaliações
Aula1 Pandas Dataviz
49 páginas
01.07.1 Instalando Anaconda Python No Windows
Ainda não há avaliações
01.07.1 Instalando Anaconda Python No Windows
15 páginas
01.07.1 Instalando Anaconda Python No Linux Ubuntu 16.04 LTS PDF
Ainda não há avaliações
01.07.1 Instalando Anaconda Python No Linux Ubuntu 16.04 LTS PDF
17 páginas
Intro_JupyterNotebook-estudante
Ainda não há avaliações
Intro_JupyterNotebook-estudante
3 páginas
Python - Guia Pratico Do Basico - Rafael F. V. C. Santos
100% (7)
Python - Guia Pratico Do Basico - Rafael F. V. C. Santos
268 páginas
02 Navegando Pelo Mar de Dados Com Python e Pandas Uma Jornada Rumo À Análise e Manipulação de Dados
Ainda não há avaliações
02 Navegando Pelo Mar de Dados Com Python e Pandas Uma Jornada Rumo À Análise e Manipulação de Dados
1 página
07_SQLPowerArchitectUserGuide-1.0.0pt
Ainda não há avaliações
07_SQLPowerArchitectUserGuide-1.0.0pt
138 páginas
05_Primeira_Aula_Interativa_Módulo_2
Ainda não há avaliações
05_Primeira_Aula_Interativa_Módulo_2
15 páginas
04_Slides - Módulo 1 - Analista de banco de dados
Ainda não há avaliações
04_Slides - Módulo 1 - Analista de banco de dados
328 páginas
M3 - Análise de dados com Python
Ainda não há avaliações
M3 - Análise de dados com Python
27 páginas
M2 - Análise de dados com Python
Ainda não há avaliações
M2 - Análise de dados com Python
28 páginas
How_use_Nobody_Somebody_Anybody_Everybody
Ainda não há avaliações
How_use_Nobody_Somebody_Anybody_Everybody
3 páginas
Guia_De_Estudo_Aprendizagem-DSA
Ainda não há avaliações
Guia_De_Estudo_Aprendizagem-DSA
40 páginas
arquivo3
Ainda não há avaliações
arquivo3
1 página
arquivo2
Ainda não há avaliações
arquivo2
1 página
Criar Perfil No Sap - Marcolin's Blog
Ainda não há avaliações
Criar Perfil No Sap - Marcolin's Blog
14 páginas
Gabarito - FUNSAÚDE-CE 2021
Ainda não há avaliações
Gabarito - FUNSAÚDE-CE 2021
43 páginas
Stallings Cap10
Ainda não há avaliações
Stallings Cap10
21 páginas
1 Sipea
Ainda não há avaliações
1 Sipea
64 páginas
373711-2 Lista de Modelos Probabilísticos Discretos 2017 1 Eng Minas
Ainda não há avaliações
373711-2 Lista de Modelos Probabilísticos Discretos 2017 1 Eng Minas
4 páginas
Comprovante Pix Next (1) (1)
Ainda não há avaliações
Comprovante Pix Next (1) (1)
1 página
Questionário Unid 1
Ainda não há avaliações
Questionário Unid 1
3 páginas
Tutorial Programa Subtitle Edit PDF
Ainda não há avaliações
Tutorial Programa Subtitle Edit PDF
13 páginas
Prova de Cep
Ainda não há avaliações
Prova de Cep
2 páginas
Função Cúbica 3 Teste
100% (1)
Função Cúbica 3 Teste
13 páginas
Especificação Técnica ET-4100.02-6443-862-CA8-001
Ainda não há avaliações
Especificação Técnica ET-4100.02-6443-862-CA8-001
12 páginas
Gates Catalogo Kits de Correias 2019
Ainda não há avaliações
Gates Catalogo Kits de Correias 2019
16 páginas
Av1 - Sistemas de Informação Gerencial
Ainda não há avaliações
Av1 - Sistemas de Informação Gerencial
3 páginas
Relatório de Inspeção Termográfica - Parte 2
Ainda não há avaliações
Relatório de Inspeção Termográfica - Parte 2
6 páginas
2008 EAI - eFolio-A
Ainda não há avaliações
2008 EAI - eFolio-A
2 páginas
Como Criar Um Pendrive Bootavel
100% (1)
Como Criar Um Pendrive Bootavel
3 páginas
Como Tirar o Visto para o Canadá Pela Internet
Ainda não há avaliações
Como Tirar o Visto para o Canadá Pela Internet
9 páginas
Brams Doxygen
Ainda não há avaliações
Brams Doxygen
5 páginas
Curriculum Daniel Xavier 2011
Ainda não há avaliações
Curriculum Daniel Xavier 2011
2 páginas
Roteiro Google Docs
Ainda não há avaliações
Roteiro Google Docs
10 páginas
Ficha de Trabalho Nº 8 - Probabilidade Condicionada. Acontecimentos Independentes
Ainda não há avaliações
Ficha de Trabalho Nº 8 - Probabilidade Condicionada. Acontecimentos Independentes
3 páginas
Arvores Semanticas
Ainda não há avaliações
Arvores Semanticas
36 páginas
Relatorio PIC 16F690 Rev01
Ainda não há avaliações
Relatorio PIC 16F690 Rev01
19 páginas
Análise Econômico Financeira
Ainda não há avaliações
Análise Econômico Financeira
357 páginas
Tabela de Cores Originais VW
Ainda não há avaliações
Tabela de Cores Originais VW
28 páginas
Apresentação NR-17
Ainda não há avaliações
Apresentação NR-17
18 páginas
Curso de Profissional CAD (Autocad) - Microlins
Ainda não há avaliações
Curso de Profissional CAD (Autocad) - Microlins
9 páginas