0% found this document useful (0 votes)

0 views6 pages

One-Day Intensive Python Data Analysis and Visuali

Uploaded by

Meet Pardeshi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

0 views6 pages

One-Day Intensive Python Data Analysis and Visuali

Uploaded by

Meet Pardeshi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

One-Day Intensive Python Data Analysis and

Visualization Workshop
Welcome! This expertly crafted curriculum is designed for absolute beginners to master the
essential Python libraries for data analysis and visualization: Pandas, NumPy, Matplotlib,
Seaborn, and Plotly. By the end, you’ll be able to manipulate, analyze, and visualize data
confidently.

1. Pandas: Data Manipulation Made Easy

What is Pandas & Why It’s Important?
Pandas is the most widely used Python library for data analysis. It provides intuitive structures
(Series & DataFrame) to clean, transform, and analyze tabular data efficiently.

A. Core Data Structures

Series: A one-dimensional labeled array.
DataFrame: A two-dimensional labeled data table (think spreadsheet).

import pandas as pd

# Series example
grades = pd.Series([85, 90, 95], index=['Alice', 'Bob', 'Charlie'])

# DataFrame example
data = {'Name': ['Alice', 'Bob'], 'Grade': [85, 90]}
df = pd.DataFrame(data)

B. Reading and Writing Data

# Read from CSV

df = pd.read_csv('data.csv')

# Write to Excel
df.to_excel('output.xlsx', index=False)
C. Data Cleaning and Preprocessing
Handling missing values:

df.isnull().sum() # Find missing

df['col'].fillna(0, inplace=True) # Replace missing

Dropping duplicates/rows:

df.drop_duplicates(inplace=True)
df.dropna(subset=['col'], inplace=True)

D. Filtering, Grouping, and Aggregating

# Filtering rows
df_filtered = df[df['Grade'] > 85]

# Grouping and aggregating

df_grouped = df.groupby('Name')['Grade'].mean()

E. Efficient Manipulation Tips

Use df.loc and df.iloc for indexing
Prefer vectorized operations over loops for speed
Exercise: Load a CSV of IPL player scores, clean missing values, and compute average runs per
player.

2. NumPy: Fast Numerical Computing

What is NumPy?
NumPy supplies the backbone for high-speed numerical calculations in Python, using arrays
much faster than standard lists.

A. Arrays vs. Lists

import numpy as np
arr = np.array([1, 2, 3, 4])

Arrays consume less memory and are much faster for calculations.
B. Basic Operations

arr2 = arr * 2 # Vectorized multiplication

sum_arr = np.sum(arr)
mean_arr = np.mean(arr)

C. Shapes & Dimensions

matrix = np.array([[1, 2], [3, 4]])

matrix.shape # (2, 2)
matrix.flatten() # 1D version

D. Indexing & Slicing

arr[:2] # first two elements

matrix[1, 0] # row 1, column 0

E. Broadcasting
Allows operations on arrays of different shapes (automatically stretches arrays).

arr = np.array([1, 2, 3])

arr + 10 # [11, 12, 13]

Exercise: Create a 2D array and compute the sum of each row.

3. Matplotlib: Foundation of Data Visualization

Purpose:
Matplotlib is the classic plotting library for static, publication-quality graphics.

A. Basic Plotting

import matplotlib.pyplot as plt

# Line plot
plt.plot([1, 2, 3, 4], [10, 20, 15, 25])
plt.title('Growth Over Time')
plt.xlabel('Time')
plt.ylabel('Value')
plt.show()

# Scatter plot
plt.scatter([1,2,3], [4,5,6])
plt.show()

# Bar chart
plt.bar(['A', 'B', 'C'], [10, 20, 5])
plt.show()

B. Customization
Add legend: plt.legend(['Label'])
Change colors, linewidths, markers

C. Saving Plots

plt.savefig('my_plot.png')

Exercise: Visualize IPL top run scorers as a bar plot.

4. Seaborn: Beautiful Statistical Plots

What is Seaborn?
Built on Matplotlib, Seaborn automates attractive formatting and provides statistical
visualizations.

A. Attractive Themes

import seaborn as sns

sns.set_style('darkgrid')

B. Key Plot Types

Distribution Plot: Shows data spread
sns.histplot(df['runs'])

Categorical Plot: Compare categories

sns.boxplot(x='team', y='runs', data=df)

Heatmap: Display matrix data

sns.heatmap(data.corr())
C. Combining with Matplotlib

fig, ax = plt.subplots()
sns.violinplot(x='team', y='runs', data=df, ax=ax)
plt.show()

D. Customizing Colors

sns.set_palette('coolwarm')

Exercise: Make a boxplot comparing player runs by team.

5. Plotly: Interactive, Web-Ready Visualizations

What is Plotly?
Plotly allows creation of interactive charts you can hover, zoom, or embed in web apps–essential
for modern dashboards.

A. Interactive Plots

import plotly.express as px

# Interactive line plot

fig = px.line(df, x='Match', y='Score', title='IPL Match Scores')
fig.show()

# Interactive bar chart

fig = px.bar(df, x='Player', y='Runs', color='Team')
fig.show()

B. Embedding in Web Apps

Dashboards via Plotly Dash
Save html: fig.write_html('plot.html')

C. Customizing Interactivity
Tooltips with additional info
Enable/disable zoom/pan

D. Plotly vs. Others

Plotly: interactive, web-based
Matplotlib/Seaborn: static, publication-friendly
Exercise: Create an interactive IPL run distribution that lets you filter by year.
Final Tips and Pitfalls
Always check data shapes before analysis.
Use .head(), .info(), .describe() for exploration.
Avoid loops within pandas and NumPy; use vectorized functions.
Plot small examples to test before applying on large datasets.
Break problems into single steps; ask questions when stuck!

Conclusion and Next Steps

By practicing these libraries, trying the hands-on exercises above, and consulting official
tutorials, you’ll build strong foundations for all future Python data projects. Success comes from
experimenting, asking questions, and building real projects – keep exploring!

NCA-GENL Nvidia Generative Ai Llms Exam Dumps
No ratings yet
NCA-GENL Nvidia Generative Ai Llms Exam Dumps
5 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Machine Learning Experiment
No ratings yet
Machine Learning Experiment
69 pages
NumPy, Pandas, MatplotLib, Seaborn, ScikitLearn (SkLearn)
No ratings yet
NumPy, Pandas, MatplotLib, Seaborn, ScikitLearn (SkLearn)
14 pages
Python
No ratings yet
Python
29 pages
V Unit
No ratings yet
V Unit
17 pages
Unit 5 PythonPackages (Matplotlib)
No ratings yet
Unit 5 PythonPackages (Matplotlib)
24 pages
3-Numpy Pandas
No ratings yet
3-Numpy Pandas
37 pages
Session3 - Analytics For Programming II - Siryani - 090524
No ratings yet
Session3 - Analytics For Programming II - Siryani - 090524
28 pages
DAP 5 Module
No ratings yet
DAP 5 Module
68 pages
Essential Python Data Visualization Libraries 1687141550
No ratings yet
Essential Python Data Visualization Libraries 1687141550
16 pages
Unit 5 Python Notes HM
No ratings yet
Unit 5 Python Notes HM
59 pages
DMV Unit-4-1 PDF
No ratings yet
DMV Unit-4-1 PDF
10 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
DA&V_module_6(SAMI)
No ratings yet
DA&V_module_6(SAMI)
10 pages
CRAI AI BOOTCAMP week two 2025
No ratings yet
CRAI AI BOOTCAMP week two 2025
29 pages
Data Visualisation
No ratings yet
Data Visualisation
5 pages
Jmis 26 4 167
No ratings yet
Jmis 26 4 167
9 pages
Ex1 - Plotting and Visualization Using Numpy and Pandas
No ratings yet
Ex1 - Plotting and Visualization Using Numpy and Pandas
14 pages
EXP1-siddhant Gupta (23 - SE - 148)
No ratings yet
EXP1-siddhant Gupta (23 - SE - 148)
17 pages
Unit 4
No ratings yet
Unit 4
27 pages
Python Unit IV
No ratings yet
Python Unit IV
12 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
Aids Lab
No ratings yet
Aids Lab
45 pages
MLS 1 - Python For Data Science
No ratings yet
MLS 1 - Python For Data Science
33 pages
Numpy Code
No ratings yet
Numpy Code
10 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
96 pages
MCA - S3 - Data Visualisation - U5
No ratings yet
MCA - S3 - Data Visualisation - U5
19 pages
Data Visualization
No ratings yet
Data Visualization
19 pages
Module 4
No ratings yet
Module 4
57 pages
Unit 5
No ratings yet
Unit 5
27 pages
L6 and 7-Data Preprocessing-Coding
No ratings yet
L6 and 7-Data Preprocessing-Coding
34 pages
PP&DS Unit Iii
No ratings yet
PP&DS Unit Iii
26 pages
Programming 2 Lectures
No ratings yet
Programming 2 Lectures
41 pages
Updated New Eda Manual
No ratings yet
Updated New Eda Manual
76 pages
Program Questions
No ratings yet
Program Questions
2 pages
DAV EXP 1 t12 31
No ratings yet
DAV EXP 1 t12 31
39 pages
Day2Part2. DataVisualization
No ratings yet
Day2Part2. DataVisualization
29 pages
Data Analysis and Visualisation With Python
No ratings yet
Data Analysis and Visualisation With Python
75 pages
Data Visualization
No ratings yet
Data Visualization
25 pages
Unit 4
No ratings yet
Unit 4
105 pages
Data Mining - Week - 6
No ratings yet
Data Mining - Week - 6
7 pages
Data Visualization Python Tutorial
100% (1)
Data Visualization Python Tutorial
9 pages
Data Visualization With Matplotlib
No ratings yet
Data Visualization With Matplotlib
20 pages
Q-Step WS 06112019 Data Analysis and Visualisation With Python
No ratings yet
Q-Step WS 06112019 Data Analysis and Visualisation With Python
76 pages
Unit 4 Fod
100% (1)
Unit 4 Fod
21 pages
Python Comands
No ratings yet
Python Comands
3 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Unit 3 (Python)
No ratings yet
Unit 3 (Python)
29 pages
Python Libraries
No ratings yet
Python Libraries
27 pages
Session 7 - Data Visualization With Python
No ratings yet
Session 7 - Data Visualization With Python
17 pages
Pandas Numpy
No ratings yet
Pandas Numpy
4 pages
PR Final File
No ratings yet
PR Final File
49 pages
Mohit
No ratings yet
Mohit
19 pages
ML Assignment -1
No ratings yet
ML Assignment -1
7 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
72 pages
Data Visualization Lesson
No ratings yet
Data Visualization Lesson
4 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Quick Python Guide
From Everand
Quick Python Guide
Coder1
No ratings yet
Pandas Notes
No ratings yet
Pandas Notes
8 pages
Data Analysis Lab - Final - 23-24
No ratings yet
Data Analysis Lab - Final - 23-24
11 pages
AI Lab 05 Lab Tasks Maaz
No ratings yet
AI Lab 05 Lab Tasks Maaz
23 pages
VSEMESTERIT
No ratings yet
VSEMESTERIT
16 pages
Pandas
No ratings yet
Pandas
82 pages
SQL Vs Pandas
No ratings yet
SQL Vs Pandas
38 pages
Data Science Using Python
No ratings yet
Data Science Using Python
10 pages
Informatics Practices Record Class 12
No ratings yet
Informatics Practices Record Class 12
60 pages
Bulba Code ICE - RLHF Synthetic & Organic Loss
No ratings yet
Bulba Code ICE - RLHF Synthetic & Organic Loss
94 pages
Python
No ratings yet
Python
16 pages
Credit Card Default Prediction: Final Project Report
No ratings yet
Credit Card Default Prediction: Final Project Report
28 pages
Class 12 Complete Series and DataFrame Last Year Question
No ratings yet
Class 12 Complete Series and DataFrame Last Year Question
3 pages
Artificail Intellegence and Machine Learning Using Python
No ratings yet
Artificail Intellegence and Machine Learning Using Python
230 pages
1-Pandas Cheat Sheet
No ratings yet
1-Pandas Cheat Sheet
7 pages
CampusX Data Science Mentorship Program Curriculum
No ratings yet
CampusX Data Science Mentorship Program Curriculum
40 pages
Pandas
No ratings yet
Pandas
4 pages
UpGrad Campus - Data Science & Analytics Brochure
No ratings yet
UpGrad Campus - Data Science & Analytics Brochure
11 pages
PGDDS Syllabus Final (2025)
No ratings yet
PGDDS Syllabus Final (2025)
20 pages
Data Analysis - Tushar06 - Resume
No ratings yet
Data Analysis - Tushar06 - Resume
3 pages
Pandasguide
No ratings yet
Pandasguide
65 pages
Practical Assignment Python
No ratings yet
Practical Assignment Python
28 pages
Data Analyst Roadmap 2025?
No ratings yet
Data Analyst Roadmap 2025?
11 pages
Machine Learning & Deep Learning With Python - Course Contents
No ratings yet
Machine Learning & Deep Learning With Python - Course Contents
1 page
Data Analytics Roadmap
No ratings yet
Data Analytics Roadmap
8 pages
DevOps Engineer Master Program
No ratings yet
DevOps Engineer Master Program
38 pages
FINAL INTERN DOCUMENT Dhanunjai
No ratings yet
FINAL INTERN DOCUMENT Dhanunjai
26 pages
Pandas
No ratings yet
Pandas
3,603 pages
PM Shri Kendriya Vidyalaya Pattom Shift Ii: Movie Data Analysis
No ratings yet
PM Shri Kendriya Vidyalaya Pattom Shift Ii: Movie Data Analysis
35 pages

One-Day Intensive Python Data Analysis and Visuali

Uploaded by

One-Day Intensive Python Data Analysis and Visuali

Uploaded by

One-Day Intensive Python Data Analysis and

1. Pandas: Data Manipulation Made Easy

A. Core Data Structures

B. Reading and Writing Data

# Read from CSV

df.isnull().sum() # Find missing

D. Filtering, Grouping, and Aggregating

# Grouping and aggregating

E. Efficient Manipulation Tips

2. NumPy: Fast Numerical Computing

A. Arrays vs. Lists

arr2 = arr * 2 # Vectorized multiplication

C. Shapes & Dimensions

matrix = np.array([[1, 2], [3, 4]])

D. Indexing & Slicing

arr[:2] # first two elements

arr = np.array([1, 2, 3])

Exercise: Create a 2D array and compute the sum of each row.

3. Matplotlib: Foundation of Data Visualization

import matplotlib.pyplot as plt

Exercise: Visualize IPL top run scorers as a bar plot.

4. Seaborn: Beautiful Statistical Plots

import seaborn as sns

B. Key Plot Types

Categorical Plot: Compare categories

Heatmap: Display matrix data

Exercise: Make a boxplot comparing player runs by team.

5. Plotly: Interactive, Web-Ready Visualizations

# Interactive line plot

# Interactive bar chart

B. Embedding in Web Apps

D. Plotly vs. Others

Conclusion and Next Steps

You might also like