0% found this document useful (0 votes)

33 views11 pages

EDA Python Guide

Uploaded by

Muhammad Faizan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

33 views11 pages

EDA Python Guide

Uploaded by

Muhammad Faizan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

Exploratory Data Analysis in Python

1. Loading Libraries

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

from scipy import stats

from sklearn.preprocessing import MinMaxScaler, StandardScaler

Exploratory Data Analysis in Python

2. Loading the Dataset

# Example: Loading a CSV file

df = pd.read_csv('your_dataset.csv')
Exploratory Data Analysis in Python

3. Data Overview

# Display the first few rows of the dataset

print(df.head())

# Display summary statistics

print(df.describe())

# Display information about the dataset

print(df.info())
Exploratory Data Analysis in Python

4. Cleaning Data

# Handling missing values

print(df.isnull().sum())

df.fillna(df.mean(), inplace=True)

# Handling duplicates

print(df.duplicated().sum())

df.drop_duplicates(inplace=True)
Exploratory Data Analysis in Python

5. Preprocessing Data

# Encoding categorical variables

df = pd.get_dummies(df, columns=['categorical_column'])

# Feature Engineering

df['new_feature'] = df['existing_feature1'] * df['existing_feature2']

Exploratory Data Analysis in Python

6. Outlier Detection and Treatment

# Using Z-score to identify outliers

z_scores = stats.zscore(df['column_name'])

abs_z_scores = np.abs(z_scores)

filtered_entries = (abs_z_scores < 3)

df = df[filtered_entries]
Exploratory Data Analysis in Python

7. Scaling and Normalization

# Min-Max Scaling

scaler = MinMaxScaler()

df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

# Alternatively, for Standardization

# scaler = StandardScaler()

# df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

Exploratory Data Analysis in Python

8. Data Visualization (Examples)

# Histogram

plt.figure(figsize=(10, 6))

sns.histplot(df['column_name'], kde=True)

plt.title('Histogram of column_name')

plt.show()

# Boxplot

plt.figure(figsize=(10, 6))

sns.boxplot(x=df['column_name'])

plt.title('Boxplot of column_name')

plt.show()

# Scatter plot

plt.figure(figsize=(10, 6))

sns.scatterplot(x='column1', y='column2', data=df)

plt.title('Scatter plot between column1 and column2')

plt.show()

# Heatmap for correlation

plt.figure(figsize=(12, 8))

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.title('Correlation Heatmap')

plt.show()
Exploratory Data Analysis in Python
Exploratory Data Analysis in Python

9. Summarizing Findings

print("Key Findings:")

print("1. Description of key patterns or anomalies.")

print("2. Potential relationships between features.")

print("3. Insights on missing values and outliers.")

Data Analysis With Python
No ratings yet
Data Analysis With Python
29 pages
Employee Attrition Study Case
No ratings yet
Employee Attrition Study Case
88 pages
Comprehensive EDA Python Guide
No ratings yet
Comprehensive EDA Python Guide
13 pages
Edap Lab
No ratings yet
Edap Lab
47 pages
Data Analysis
No ratings yet
Data Analysis
42 pages
IOT-Domain Analyst
No ratings yet
IOT-Domain Analyst
11 pages
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
IMPDAV
No ratings yet
IMPDAV
105 pages
What Is Exploratory Data Analysis - by Prasad Patil - Towards Data Science
No ratings yet
What Is Exploratory Data Analysis - by Prasad Patil - Towards Data Science
17 pages
Unit - Iii - Eda
No ratings yet
Unit - Iii - Eda
25 pages
What Is Exploratory Data Analysis?: Intuition
No ratings yet
What Is Exploratory Data Analysis?: Intuition
8 pages
Dsi237 Group 2
No ratings yet
Dsi237 Group 2
27 pages
Perform Exploratory Data Analysis
No ratings yet
Perform Exploratory Data Analysis
5 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
PDF Experiments-1 DADV
No ratings yet
PDF Experiments-1 DADV
41 pages
Learneverythingai
No ratings yet
Learneverythingai
9 pages
Comprehensive Guide Data Exploration Sas Using Python Numpy Scipy Matplotlib Pandas
100% (1)
Comprehensive Guide Data Exploration Sas Using Python Numpy Scipy Matplotlib Pandas
12 pages
Week 6 - Data Cleaning
No ratings yet
Week 6 - Data Cleaning
8 pages
Exploratory Data Analysis: by Neha Mathur
No ratings yet
Exploratory Data Analysis: by Neha Mathur
14 pages
ML Unit 2
No ratings yet
ML Unit 2
52 pages
Exploratory Data Analysis-1
No ratings yet
Exploratory Data Analysis-1
10 pages
AUTOMATED EDA Libraries
No ratings yet
AUTOMATED EDA Libraries
12 pages
Exploratory Analysis: Here Should Start Making Some Notes About Potential Fixes (More in Data Cleaning)
No ratings yet
Exploratory Analysis: Here Should Start Making Some Notes About Potential Fixes (More in Data Cleaning)
2 pages
Explorato Ry: Data Analysis
No ratings yet
Explorato Ry: Data Analysis
6 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
FOUND. DATA SCIENCE Practical
No ratings yet
FOUND. DATA SCIENCE Practical
15 pages
Exploratory Data
No ratings yet
Exploratory Data
47 pages
Mastering Exploratory Data Analysis With Python - A Comprehensive Guide To Unveiling Hidden Insights
No ratings yet
Mastering Exploratory Data Analysis With Python - A Comprehensive Guide To Unveiling Hidden Insights
73 pages
Machine Learning Project Roadmap
No ratings yet
Machine Learning Project Roadmap
4 pages
Data Analysis For Beginners Book - 2
No ratings yet
Data Analysis For Beginners Book - 2
27 pages
DataPreparation - Outlier - Treatment ASSIGEMENT ANSWER
No ratings yet
DataPreparation - Outlier - Treatment ASSIGEMENT ANSWER
4 pages
Dsbda Ass2
No ratings yet
Dsbda Ass2
49 pages
Data Cleaning and Preparation
No ratings yet
Data Cleaning and Preparation
9 pages
04 DS 2023
No ratings yet
04 DS 2023
63 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Advance Python
No ratings yet
Advance Python
5 pages
DSBDA Lab Assignment No 2
No ratings yet
DSBDA Lab Assignment No 2
7 pages
Module 3
No ratings yet
Module 3
108 pages
DAV Assign6
No ratings yet
DAV Assign6
8 pages
Statistics IMP Questions and Answers
No ratings yet
Statistics IMP Questions and Answers
23 pages
Mastering Exploratory Data Analysis (EDA)_ Everything You Need to Know _ by Sze Zhong LIM _ Data and Beyond _ Medium
No ratings yet
Mastering Exploratory Data Analysis (EDA)_ Everything You Need to Know _ by Sze Zhong LIM _ Data and Beyond _ Medium
63 pages
Résumé-Analyse Des Données resumee resumee
No ratings yet
Résumé-Analyse Des Données resumee resumee
4 pages
Lesson 2 - Data Preprocessing
100% (1)
Lesson 2 - Data Preprocessing
72 pages
Data Exploration in Python PDF
No ratings yet
Data Exploration in Python PDF
1 page
Lecture 22
No ratings yet
Lecture 22
20 pages
EDA With Pandas CheatSheet
No ratings yet
EDA With Pandas CheatSheet
3 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
DAP Writeups - Merged
No ratings yet
DAP Writeups - Merged
33 pages
Exploratory Data Analysis: Prasad Deshmukh
No ratings yet
Exploratory Data Analysis: Prasad Deshmukh
15 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
15 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
84 pages
Exploring Relationships: Allen Downey
No ratings yet
Exploring Relationships: Allen Downey
38 pages
Eda 2
No ratings yet
Eda 2
69 pages
Exploratory Data Analysis: by Neha Mathur
No ratings yet
Exploratory Data Analysis: by Neha Mathur
14 pages
FDS Most Imp Question
No ratings yet
FDS Most Imp Question
12 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
2 pages
Bortolini Eugenio Thesis Corrected Editedforcopyright
No ratings yet
Bortolini Eugenio Thesis Corrected Editedforcopyright
440 pages
Data Analytics With Python Curriculum (LOCTECH) PDF
No ratings yet
Data Analytics With Python Curriculum (LOCTECH) PDF
6 pages
# Hotel Bookings Exploratory Data A
No ratings yet
# Hotel Bookings Exploratory Data A
4 pages
VL2024250502040 Assignmt1
No ratings yet
VL2024250502040 Assignmt1
3 pages
TeM SWDND501 NoSQL Database Development
No ratings yet
TeM SWDND501 NoSQL Database Development
170 pages
Road Map To Become: Data Analyst
No ratings yet
Road Map To Become: Data Analyst
1 page
TE - Internship Report Format (Word)
No ratings yet
TE - Internship Report Format (Word)
19 pages
MULTIVARIATE ANALYSIS Part 1
No ratings yet
MULTIVARIATE ANALYSIS Part 1
30 pages
120CS0121 - R - B Naga Pravallika
No ratings yet
120CS0121 - R - B Naga Pravallika
15 pages
MATERI WEBINAR DATA ANALYTICS by KMTI UMS
No ratings yet
MATERI WEBINAR DATA ANALYTICS by KMTI UMS
82 pages
Tarun Bhatt Resume
No ratings yet
Tarun Bhatt Resume
2 pages
Data Science and Analytics
No ratings yet
Data Science and Analytics
3 pages
Document
No ratings yet
Document
21 pages
Elective Data and Analysis Prelim Examination
No ratings yet
Elective Data and Analysis Prelim Examination
1 page
AIML-Curriculum by Pregrad
No ratings yet
AIML-Curriculum by Pregrad
33 pages
Advance Certification in DS ML
No ratings yet
Advance Certification in DS ML
11 pages
AI - Based Road Safety Audit System
No ratings yet
AI - Based Road Safety Audit System
13 pages
Unit 4
No ratings yet
Unit 4
42 pages
Exploratory Data Analysis & Data Preprocessing
No ratings yet
Exploratory Data Analysis & Data Preprocessing
16 pages
Goals, Process, and Challenges of Exploratory Data Analysis: An Interview Study
No ratings yet
Goals, Process, and Challenges of Exploratory Data Analysis: An Interview Study
10 pages
R Programming Lab Manual
No ratings yet
R Programming Lab Manual
54 pages
Dev
No ratings yet
Dev
33 pages
Crime Dashboard
No ratings yet
Crime Dashboard
9 pages
Data Science Curriculum
No ratings yet
Data Science Curriculum
3 pages
Student's Behavior Clustering Based On Ubiquitous Learning Log Data Using Unsupervised Machine Learning
No ratings yet
Student's Behavior Clustering Based On Ubiquitous Learning Log Data Using Unsupervised Machine Learning
7 pages
12 Ai Data Story 3
No ratings yet
12 Ai Data Story 3
20 pages
Assignment 2 - Data Management
No ratings yet
Assignment 2 - Data Management
68 pages

EDA Python Guide

Uploaded by

EDA Python Guide

Uploaded by

Exploratory Data Analysis in Python

Exploratory Data Analysis in Python

import matplotlib.pyplot as plt

import seaborn as sns

from scipy import stats

from sklearn.preprocessing import MinMaxScaler, StandardScaler

2. Loading the Dataset

# Example: Loading a CSV file

# Display the first few rows of the dataset

# Display summary statistics

# Display information about the dataset

# Handling missing values

# Encoding categorical variables

df['new_feature'] = df['existing_feature1'] * df['existing_feature2']

6. Outlier Detection and Treatment

# Using Z-score to identify outliers

filtered_entries = (abs_z_scores < 3)

7. Scaling and Normalization

df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

# Alternatively, for Standardization

# df[['column1', 'column2']] = scaler.fit_transform(df[['column1', 'column2']])

8. Data Visualization (Examples)

sns.scatterplot(x='column1', y='column2', data=df)

plt.title('Scatter plot between column1 and column2')

# Heatmap for correlation

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

print("1. Description of key patterns or anomalies.")

print("2. Potential relationships between features.")

print("3. Insights on missing values and outliers.")

You might also like