0% found this document useful (0 votes)

45 views21 pages

ML Assignment 01 Code

The document discusses performing principal component analysis (PCA) on the Iris dataset using Python and Scikit-learn. It loads and explores the Iris data, performs PCA to reduce the dimensions, and analyzes the results including the number of components retained, explained variance, and feature contributions to the principal components.

Uploaded by

Awais Khan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

45 views21 pages

ML Assignment 01 Code

Uploaded by

Awais Khan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 21

Title

No category Today 8:07 PM

import numpy as np
import pandas as pd
from sklearn import datasets
from sklearn.decomposition import
PCA

# Load the Iris dataset

iris = datasets.load_iris()
data, columns = iris.data,
iris.feature_names

# Create a Pandas DataFrame from

the Iris dataset
df = pd.DataFrame(data,
columns=columns)

# Step 1: Mean normalize the features

normalized_data = (df - df.mean()) /
df.std()

# Step 2: Find the covariance matrix

covariance_matrix =
np.cov(normalized_data,
rowvar=False)

# Step 3: Find eigenvalues and

eigenvectors of the covariance matrix
eigenvalues, eigenvectors =
np.linalg.eig(covariance_matrix)

# Step 4: Arrange eigenvalues in

descending order
sorted_indices =
np.argsort(eigenvalues)[::-1]
sorted_eigenvalues =
eigenvalues[sorted_indices]
sorted_eigenvectors = eigenvectors[:,
sorted_indices]

# Step 5: Select eigenvalues that

retain the required variance
total_variance =
np.sum(sorted_eigenvalues)
variance_to_retain = 0.95
cumulative_variance =
np.cumsum(sorted_eigenvalues) /
total_variance
num_components_to_retain =
np.argmax(cumulative_variance >=
variance_to_retain) + 1

selected_eigenvalues =
sorted_eigenvalues[:num_component
s_to_retain]
selected_eigenvectors =
sorted_eigenvectors[:, :num_compone
nts_to_retain]
# Step 6: Transform original data
using eigen vectors corresponding to
selected eigenvalues
transformed_data =
np.dot(normalized_data,
selected_eigenvectors)

# Print the results

print(f"Number of components to
retain {variance_to_retain * 100}%
variance:
{num_components_to_retain}")
print("Explained variance ratio:",
selected_eigenvalues /
total_variance)

# Interpret which features inﬂuenced

the principal components the most
feature_contributions =
np.abs(selected_eigenvectors) /
np.sum(np.abs(selected_eigenvectors
), axis=0)
feature_contributions_df =
pd.DataFrame(feature_contributions,
index=columns,

columns=[f'PC{i + 1}' for i in

range(num_components_to_retain)])
print("\nFeature contributions to
Principal Components:")
print(feature_contributions_df)

Code 02

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets
from sklearn.decomposition import
PCA

def load_iris_data():
iris = datasets.load_iris()
data, columns = iris.data,
iris.feature_names
return pd.DataFrame(data,
columns=columns), iris.target

def display_correlation_matrix(df):
correlation_matrix = df.corr()
print("Correlation Matrix:")
print(correlation_matrix)

def normalize_features(df):
return (df - df.mean()) / df.std()

def perform_pca(data, target):

pca = PCA(n_components=0.95)
transformed_data =
pca.ﬁt_transform(data)
plot_before_after_pca(data,
transformed_data, target)
display_pca_info(pca)

display_feature_contributions(pca.co
mponents_, data.columns)

def
plot_before_after_pca(original_data,
transformed_data, target):
plt.ﬁgure(ﬁgsize=(12, 6))
# Original Data
plt.subplot(1, 2, 1)
plt.scatter(original_data.iloc[:, 0],
original_data.iloc[:, 1], c=target,
cmap='Set1')
plt.title('Original Data')
plt.xlabel('Feature 01')
plt.ylabel('Feature 02')

# Data after PCA

plt.subplot(1, 2, 2)
plt.scatter(transformed_data[:, 0],
transformed_data[:, 1], c=target,
cmap='Set1')
plt.title('Data after PCA')
plt.xlabel('Principal Component 01')
plt.ylabel('Principal Component 02')

plt.saveﬁg('output_plot.png')
plt.show()

def display_pca_info(pca):
print(f"\nNumber of components to
retain 95% variance:
{pca.n_components_}")
print("Explained variance ratio:",
pca.explained_variance_ratio_)

def
display_feature_contributions(compo
nents, columns):
feature_contributions =
np.abs(components) /
np.sum(np.abs(components), axis=1)
[:, np.newaxis]
feature_contributions_df =
pd.DataFrame(feature_contributions.T
, index=columns,

columns=[f'PC{i + 1}' for i in

range(components.shape[0])])

print("\nFeature contributions to
Principal Components:")
print(feature_contributions_df)
# Plotting the feature contributions
plt.figure(figsize=(12, 6))
for i in
range(components.shape[0]):
plt.subplot(1,
components.shape[0], i + 1)
plt.bar(columns,
feature_contributions_df.iloc[:, i])
plt.title(f'PC{i + 1} Feature
Contributions')
plt.xlabel('Original Features')
plt.ylabel('Contribution')
plt.savefig('output_plot_feature_contri
butions.png')
plt.show()

def main():
iris_data, target = load_iris_data()

display_correlation_matrix(iris_data)
normalized_data =
normalize_features(iris_data)
perform_pca(normalized_data,
target)

if __name__ == "__main__":
main()
Code 03

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets
from sklearn.decomposition import
PCA

# Load the Iris dataset

iris = datasets.load_iris()
data, columns = iris.data,
iris.feature_names
# Create a Pandas DataFrame from
the Iris dataset
df = pd.DataFrame(data,
columns=columns)

# Display the correlation matrix

correlation_matrix = df.corr()
print("Correlation Matrix:")
print(correlation_matrix)

# Mean normalize the features

normalized_data = (df - df.mean()) /
df.std()
# Perform PCA using Scikit-learn
pca = PCA(n_components=0.95) #
Retain 95% variance
transformed_data =
pca.ﬁt_transform(normalized_data)

# Plotting the data before and after

PCA
plt.ﬁgure(ﬁgsize=(12, 6))

# Original Data
plt.subplot(1, 2, 1)
plt.scatter(normalized_data.iloc[:, 0],
normalized_data.iloc[:, 1],
c=iris.target, cmap='Set1')
plt.title('Original Data')
plt.xlabel('Feature 01')
plt.ylabel('Feature 02')

# Data after PCA

plt.subplot(1, 2, 2)
plt.scatter(transformed_data[:, 0],
transformed_data[:, 1], c=iris.target,
cmap='Set1')
plt.title('Data after PCA')
plt.xlabel('Principal Component 01')
plt.ylabel('Principal Component 02')

plt.saveﬁg('output_plot.png')
plt.show()
# Display the number of components
and explained variance ratio
print(f"\nNumber of components to
retain 95% variance:
{pca.n_components_}")
print("Explained variance ratio:",
pca.explained_variance_ratio_)

# Interpreting which features

inﬂuenced the principal components
the most
feature_contributions =
np.abs(pca.components_) /
np.sum(np.abs(pca.components_),
axis=1)[:, np.newaxis]
feature_contributions_df =
pd.DataFrame(feature_contributions.T
, index=columns,

columns=[f'PC{i + 1}' for i in

range(pca.n_components_)])

print("\nFeature contributions to
Principal Components:")
print(feature_contributions_df)

# Plotting the feature contributions

plt.ﬁgure(ﬁgsize=(12, 6))
for i in range(pca.n_components_):
plt.subplot(1, pca.n_components_, i
+ 1)
plt.bar(columns,
feature_contributions_df.iloc[:, i])
plt.title(f'PC{i + 1} Feature
Contributions')
plt.xlabel('Original Features')
plt.ylabel('Contribution')

plt.saveﬁg('output_plot_feature_contri
butions.png')
plt.show()

Crank Nicholson Method
No ratings yet
Crank Nicholson Method
49 pages
Week6 - Colab
No ratings yet
Week6 - Colab
3 pages
Experiment 3 Code
No ratings yet
Experiment 3 Code
2 pages
Program - 3
No ratings yet
Program - 3
4 pages
PCA Explained
No ratings yet
PCA Explained
9 pages
Strangers
No ratings yet
Strangers
8 pages
PGM 3
No ratings yet
PGM 3
2 pages
Dimensionality Reduction - PCA LDA
No ratings yet
Dimensionality Reduction - PCA LDA
25 pages
DAI Amberish LAB ASSIGNMENT 3
No ratings yet
DAI Amberish LAB ASSIGNMENT 3
7 pages
Principal Component Analysis Notes : Info
No ratings yet
Principal Component Analysis Notes : Info
22 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
34 pages
Experiment 10
No ratings yet
Experiment 10
3 pages
DS Prac 9
No ratings yet
DS Prac 9
3 pages
Dvpd11 Merged Merged 27 83
No ratings yet
Dvpd11 Merged Merged 27 83
57 pages
Assignment 2 Documentation
No ratings yet
Assignment 2 Documentation
15 pages
Pca
No ratings yet
Pca
7 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
Implementing PCA in Python With Scikit
No ratings yet
Implementing PCA in Python With Scikit
6 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
11 pages
ml10
No ratings yet
ml10
2 pages
ML Lab
No ratings yet
ML Lab
14 pages
Experiment 3 PCA On Iris Dataset
No ratings yet
Experiment 3 PCA On Iris Dataset
2 pages
Slip Clustering
No ratings yet
Slip Clustering
2 pages
week-2-b
No ratings yet
week-2-b
12 pages
ML LAB - Principal Component Analysis
No ratings yet
ML LAB - Principal Component Analysis
3 pages
Data Set
No ratings yet
Data Set
3 pages
Reduce Data Dimensionality Using PCA
No ratings yet
Reduce Data Dimensionality Using PCA
6 pages
ML 3
No ratings yet
ML 3
2 pages
Principal Component Analysis: #Question 1
No ratings yet
Principal Component Analysis: #Question 1
6 pages
Face Recognition Using PCA
No ratings yet
Face Recognition Using PCA
8 pages
ML Short
No ratings yet
ML Short
2 pages
Exp 15
No ratings yet
Exp 15
12 pages
ML Expt 10
No ratings yet
ML Expt 10
2 pages
A COMPLETE GUIDE TO PRINCIPAL COMPONENT ANALYSIS in ML 1598272724
No ratings yet
A COMPLETE GUIDE TO PRINCIPAL COMPONENT ANALYSIS in ML 1598272724
16 pages
Practical 5
No ratings yet
Practical 5
6 pages
Exp 3 A
No ratings yet
Exp 3 A
2 pages
AML Non Evaluative Assignment 2
No ratings yet
AML Non Evaluative Assignment 2
2 pages
ML Lab - Exp1-10
No ratings yet
ML Lab - Exp1-10
4 pages
B22EE010 Report
No ratings yet
B22EE010 Report
9 pages
Principal Component Analysis
No ratings yet
Principal Component Analysis
8 pages
ML Lab Manual PRGM 2&3
No ratings yet
ML Lab Manual PRGM 2&3
6 pages
Principal Component Analysis With Cats
No ratings yet
Principal Component Analysis With Cats
10 pages
ML - Lab Manual
No ratings yet
ML - Lab Manual
54 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Pca 2382487
No ratings yet
Pca 2382487
8 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
Project LA
No ratings yet
Project LA
13 pages
Kinya Sharon - Ass2 - Machine Learning
No ratings yet
Kinya Sharon - Ass2 - Machine Learning
12 pages
Exp7
No ratings yet
Exp7
7 pages
B58 ExpNo3
No ratings yet
B58 ExpNo3
3 pages
Importing Libraries Used in This Chapter
No ratings yet
Importing Libraries Used in This Chapter
8 pages
Principal Component Analysis (PCA) : Anisha M. Lal
No ratings yet
Principal Component Analysis (PCA) : Anisha M. Lal
20 pages
Data Reduction Using Pythonh
No ratings yet
Data Reduction Using Pythonh
5 pages
1
No ratings yet
1
13 pages
3 - Modeling - Ipynb - Colaboratory
No ratings yet
3 - Modeling - Ipynb - Colaboratory
31 pages
1 - Pca Python Code
No ratings yet
1 - Pca Python Code
1 page
Mine 5
No ratings yet
Mine 5
8 pages
MLSP Exp02
No ratings yet
MLSP Exp02
10 pages
HIV Regression Source Code
No ratings yet
HIV Regression Source Code
26 pages
Exp 3
No ratings yet
Exp 3
4 pages
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Psc Base Paper (1)
No ratings yet
Psc Base Paper (1)
6 pages
ITNE2002-Lab4 - New-2
No ratings yet
ITNE2002-Lab4 - New-2
3 pages
ITNE2002 Lab5
No ratings yet
ITNE2002 Lab5
7 pages
MEM601 - Assessment 2 - 20240603
No ratings yet
MEM601 - Assessment 2 - 20240603
7 pages
Lab 02 Open Circuit Test
No ratings yet
Lab 02 Open Circuit Test
5 pages
DCS Assignment03
No ratings yet
DCS Assignment03
3 pages
Application Tips 2022
No ratings yet
Application Tips 2022
6 pages
Slide 05
No ratings yet
Slide 05
16 pages
Slide
No ratings yet
Slide
13 pages
Slide 03
No ratings yet
Slide 03
15 pages
Factor of Quadratic Trinomials
No ratings yet
Factor of Quadratic Trinomials
23 pages
Linear Algebra
No ratings yet
Linear Algebra
15 pages
B Simplex Method
78% (9)
B Simplex Method
14 pages
Interpolation
No ratings yet
Interpolation
10 pages
MATLAB - Session 3 - Secant Method - Fall - 2021-2022
No ratings yet
MATLAB - Session 3 - Secant Method - Fall - 2021-2022
9 pages
Nelson U3&4 Methods Textbook Chapter 1
No ratings yet
Nelson U3&4 Methods Textbook Chapter 1
43 pages
Solutions of Linear Programming Model
No ratings yet
Solutions of Linear Programming Model
9 pages
Computational Methods For Numerical Analysis With R 1st Edition James Patrick Howard Ii Instant Download
No ratings yet
Computational Methods For Numerical Analysis With R 1st Edition James Patrick Howard Ii Instant Download
54 pages
Viscous Fluid Flow
100% (2)
Viscous Fluid Flow
48 pages
Unboundedness and Infeasibility of LPP
No ratings yet
Unboundedness and Infeasibility of LPP
11 pages
Assignment 2 Interpolation
No ratings yet
Assignment 2 Interpolation
2 pages
Activity
No ratings yet
Activity
4 pages
Cse 212: Theory of Structures Ii Lecture 5: Moment Distribution Method
No ratings yet
Cse 212: Theory of Structures Ii Lecture 5: Moment Distribution Method
8 pages
An Assignment Problem Is A Particular Case of Transportation Problem
No ratings yet
An Assignment Problem Is A Particular Case of Transportation Problem
7 pages
Rts 2 Polynomials (O.p. Gupta)
No ratings yet
Rts 2 Polynomials (O.p. Gupta)
4 pages
16.323 Optimal Control Problems Set 1
No ratings yet
16.323 Optimal Control Problems Set 1
3 pages
Class 9 All Notes
No ratings yet
Class 9 All Notes
10 pages
Runge Kutta Methods
No ratings yet
Runge Kutta Methods
8 pages
Example 2: The Diet Problem
No ratings yet
Example 2: The Diet Problem
15 pages
2nd 2 The Rational Root Theorem and Fundamental Theorem of Algebra
No ratings yet
2nd 2 The Rational Root Theorem and Fundamental Theorem of Algebra
17 pages
Linear Programming Formulations
No ratings yet
Linear Programming Formulations
61 pages
Test APPC Unit 1 MCQs
No ratings yet
Test APPC Unit 1 MCQs
9 pages
Cs6704 Resource Management Techniques
No ratings yet
Cs6704 Resource Management Techniques
11 pages
Course 1
No ratings yet
Course 1
30 pages
Guide To BSC Numerical Methods
75% (24)
Guide To BSC Numerical Methods
223 pages
The Basic Finite Volume Method
No ratings yet
The Basic Finite Volume Method
15 pages
Numerical Methods: Dr. Nasir M Mirza
No ratings yet
Numerical Methods: Dr. Nasir M Mirza
27 pages
Basic Solutions
No ratings yet
Basic Solutions
56 pages
EE364a Homework 6 Solutions: I 1,..., K I I I
No ratings yet
EE364a Homework 6 Solutions: I 1,..., K I I I
20 pages

ML Assignment 01 Code

Uploaded by

ML Assignment 01 Code

Uploaded by

Title

No category Today 8:07 PM

# Load the Iris dataset

# Create a Pandas DataFrame from

# Step 1: Mean normalize the features

# Step 2: Find the covariance matrix

# Step 3: Find eigenvalues and

# Step 4: Arrange eigenvalues in

# Step 5: Select eigenvalues that

# Print the results

# Interpret which features inﬂuenced

columns=[f'PC{i + 1}' for i in

def perform_pca(data, target):

# Data after PCA

columns=[f'PC{i + 1}' for i in

# Load the Iris dataset

# Display the correlation matrix

# Mean normalize the features

# Plotting the data before and after

# Data after PCA

# Interpreting which features

columns=[f'PC{i + 1}' for i in

# Plotting the feature contributions

You might also like