0% found this document useful (0 votes)

34 views

ML Assignment 3

The document contains assignments submitted by a student for their Machine Learning course. It includes: 1) A regression model to predict Boston housing prices using scikit-learn with linear regression, achieving an RMSE of $X and R2 score of $Y on test data. 2) A K-means clustering model to classify diabetes patients using patient data on glucose, insulin, and BMI, achieving $Z accuracy on test data, with clusters visualized on a 2D plot.

Uploaded by

Kishan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

34 views

ML Assignment 3

Uploaded by

Kishan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 7

Department of Electronics and Telecommunication Engineering

Ramaiah Institute of Technology

M.S.R. Nagar, Bangalore-54

MACHINE LEARNING (ETE631)

ASSIGNMENT 3

Name: R Jeevan Kumar

USN: 1MS19ET042

Submitted to
Dr. Shobha K R
Associate
Professor Dept of
ETE

2021-2022
All code uploaded to https://github.com/jeevankumar99/ML-Assignment-3

1. Develop a model using regression which can predict the housing price in Boston using
python/ scikit learn

Python code:

# Predict housing prices using Linear Regression

from sklearn.metrics import mean_squared_error, r2_score

from sklearn.model_selection import train_test_split

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

print("\n----------- HOUSING PRICE PREDICTOR------------\n")

data = load_boston()

array = data.feature_names
print(array)
array = np.append(array,['medv'])

data, target = data.data, data.target

Xtrain, Xtest, Ytrain, Ytest = train_test_split(data,target,test_size=0.3)

print(Xtrain.shape,Ytrain.shape)
print(Xtest.shape,Ytest.shape)

lin_model = LinearRegression()
lin_model.fit(Xtrain,Ytrain)
Ytrain_predict =
lin_model.predict(Xtrain)

rmse =
(np.sqrt(mean_squared_error(Ytrain,Ytrain_predict))) r2 =
r2_score(Ytrain,Ytrain_predict)

print("Model performance for training set is :\n ")

print("Root Mean Square Error: ",rmse,"\n")
print("R2 sore is: ",r2,"\n")

Ytest_predict = lin_model.predict(Xtest)

rmse =
(np.sqrt(mean_squared_error(Ytest,Ytest_predict))) r2 =
r2_score(Ytest,Ytest_predict)
print("Model performance for testing set is :\n ")
print("Root Mean Square Error: ",rmse,"\n")
print("R2 sore is: ",r2,"\n")

plt.scatter(Ytest,Ytest_predict,c = 'green')
plt.xlabel("Price in $1000's")
plt.ylabel("Predicted value")
plt.title("True value vs predicted value: Linear Regression")
plt.show()

Output:
2. Implement data classification on diabetic data set using k means clustering

Python code:

# classify diabetes using K means clustering

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.preprocessing import MinMaxScaler
import sklearn
from sklearn.cluster import KMeans
from sklearn.metrics import confusion_matrix
import seaborn as sns
from sklearn.cluster import KMeans

from sklearn import preprocessing

from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
if name == " main ":

print ("\n ---------- K MEANS CLUSTERING ON DIABETES DATA----------------

\n")
data = pd.read_csv("./data.csv") #importing files using
pandas dataset_new = data
dataset_new[[
"Glucose",
"BloodPressure",
"SkinThickness",
"Insulin", "BMI"]] =
dataset_new[[
"Glucose",
"BloodPressure",
"SkinThickness",
"Insulin",
"BMI"]].replace(0, np.NaN)

# Replacing NaN with mean values

dataset_new["Glucose"].fillna(dataset_new["Glucose"].mean(), inplace
=
True)
dataset_new["BloodPressure"].fillna(dataset_new["BloodPressure"].mean(),
inplace = True)
dataset_new["SkinThickness"].fillna(dataset_new["SkinThickness"].mean(),
inplace = True)
dataset_new["Insulin"].fillna(dataset_new["Insulin"].mean(), inplace =
True)
dataset_new["BMI"].fillna(dataset_new["BMI"].mean(), inplace = True)

# Feature scaling using MinMaxScaler

sc = MinMaxScaler(feature_range = (0, 1))
dataset_scaled = sc.fit_transform(dataset_new)

data1 = pd.DataFrame(dataset_scaled)
# Selecting features - [Glucose, Insulin, BMI]
X = data1.iloc[:, [1, 4, 5]].values
Y = data1.iloc[:, 8].values

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size =

0.20, random_state = 42, stratify = dataset_new['Outcome'] )

# Checking dimensions
print("X_train shape:", X_train.shape)
print("X_test shape:", X_test.shape)
print("Y_train shape:", Y_train.shape)
print("Y_test shape:", Y_test.shape)

KMeans_Clustering = KMeans(n_clusters =2, random_state=0)

KMeans_Clustering.fit(X_train)

print(KMeans_Clustering.cluster_centers_)
#prediction using kmeans and accuracy
kpred = KMeans_Clustering.predict(X_test)
print('Classification report:\n\n',
sklearn.metrics.classification_report(Y_test,kpred))

outcome_labels = sorted(data.Outcome.unique())
sns.heatmap(
confusion_matrix(Y_test, kpred),
annot=True,
xticklabels=outcome_labels,
yticklabels=outcome_labels
)

# Fit again and plot

KMeans_Clustering = KMeans(n_clusters =2, random_state=0)
KMeans_Clustering.fit(X)

plt.scatter(data1.iloc[:, [1]].values,data1.iloc[:, [5]].values,

c=KMeans_Clustering.labels_, cmap='rainbow')

Output:

Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
12 pages
Diabetes Case Study - Jupyter Notebook
100% (1)
Diabetes Case Study - Jupyter Notebook
10 pages
House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
Applied Math Unit1 Summary and Useful Formulas
100% (1)
Applied Math Unit1 Summary and Useful Formulas
4 pages
Grade 10-Learning Activity Sheet Q4M1
No ratings yet
Grade 10-Learning Activity Sheet Q4M1
5 pages
DOC-20241108-WA0003
No ratings yet
DOC-20241108-WA0003
16 pages
House Pricing
No ratings yet
House Pricing
15 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Final ML File
No ratings yet
Final ML File
34 pages
DWDM Lab Report
No ratings yet
DWDM Lab Report
26 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
ml
No ratings yet
ml
17 pages
ML Lab
No ratings yet
ML Lab
7 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
5 pages
ML Manual Final
No ratings yet
ML Manual Final
35 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
AIML PRACTICALS
No ratings yet
AIML PRACTICALS
22 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
DA Assignment
No ratings yet
DA Assignment
18 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
20BCE7620 AP2021228000397 Experiment-6 Removed
No ratings yet
20BCE7620 AP2021228000397 Experiment-6 Removed
19 pages
CP4252 MACHINE LEARNING LABORATORY
No ratings yet
CP4252 MACHINE LEARNING LABORATORY
37 pages
Gaurav - Data Mining Lab Assignment
No ratings yet
Gaurav - Data Mining Lab Assignment
36 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
ML pdf
No ratings yet
ML pdf
30 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
MLLabManual
No ratings yet
MLLabManual
24 pages
2
No ratings yet
2
8 pages
Machine
100% (1)
Machine
45 pages
Machine learning lab manual
No ratings yet
Machine learning lab manual
22 pages
Slip
No ratings yet
Slip
5 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
Lab Manual - MachineLearningLaboratory-DR.vaishnavi (1)
No ratings yet
Lab Manual - MachineLearningLaboratory-DR.vaishnavi (1)
71 pages
ML 7
No ratings yet
ML 7
6 pages
Assignment 5 - SourceCode - Ipynb - Colab
No ratings yet
Assignment 5 - SourceCode - Ipynb - Colab
4 pages
vertopal.com_MSML603_HW_Assignment_5
No ratings yet
vertopal.com_MSML603_HW_Assignment_5
4 pages
Data analytics
No ratings yet
Data analytics
10 pages
ML_recordjp
No ratings yet
ML_recordjp
35 pages
Data Mining Journal 4 Kashan
No ratings yet
Data Mining Journal 4 Kashan
8 pages
ml record
No ratings yet
ml record
21 pages
Binod ML Project-052
No ratings yet
Binod ML Project-052
14 pages
Assignment 2 ML
No ratings yet
Assignment 2 ML
11 pages
ML Practical File
No ratings yet
ML Practical File
30 pages
Udacity Machine Learning Analysis Supervised Learning
100% (1)
Udacity Machine Learning Analysis Supervised Learning
504 pages
Group Work Assignment Supervised and Unsupervised Learning
No ratings yet
Group Work Assignment Supervised and Unsupervised Learning
10 pages
22MCA1008 - Varun ML LAB ASSIGNMENTS
100% (1)
22MCA1008 - Varun ML LAB ASSIGNMENTS
41 pages
Team No-7
No ratings yet
Team No-7
12 pages
AIML Report.
No ratings yet
AIML Report.
12 pages
01 Machine Learning
No ratings yet
01 Machine Learning
25 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
1st PGM
No ratings yet
1st PGM
10 pages
Data Mining Assignment No. 1
No ratings yet
Data Mining Assignment No. 1
7 pages
Experiment Number: 3: Aim:-Study of The Linear Regression in The Machine Learning Using The Boston Housing Dataset. 1)
No ratings yet
Experiment Number: 3: Aim:-Study of The Linear Regression in The Machine Learning Using The Boston Housing Dataset. 1)
14 pages
Argha's ML LAB_240927_121838
No ratings yet
Argha's ML LAB_240927_121838
13 pages
machinelearning
No ratings yet
machinelearning
26 pages
DM Slip Solutions
100% (1)
DM Slip Solutions
24 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
ML INTERNAL ANSWERS
No ratings yet
ML INTERNAL ANSWERS
9 pages
Exp 5
No ratings yet
Exp 5
7 pages
ML Activity Kalyan
No ratings yet
ML Activity Kalyan
21 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Unit 1 2 OS
No ratings yet
Unit 1 2 OS
10 pages
Assignment - Report Template
No ratings yet
Assignment - Report Template
1 page
cv14-WATER SUPPLY AND SANITARY ENGINEERING
No ratings yet
cv14-WATER SUPPLY AND SANITARY ENGINEERING
20 pages
On PC Unit-1
100% (1)
On PC Unit-1
81 pages
Continuous Random Variables and The Normal Distribution: Prem Mann, Introductory Statistics, 7/E
No ratings yet
Continuous Random Variables and The Normal Distribution: Prem Mann, Introductory Statistics, 7/E
129 pages
Appendix F
No ratings yet
Appendix F
6 pages
statitics by Mesfin
No ratings yet
statitics by Mesfin
150 pages
Machine Learning Engineer Nanodegree: Supervised Learning Project: Finding Donors For Charityml
No ratings yet
Machine Learning Engineer Nanodegree: Supervised Learning Project: Finding Donors For Charityml
18 pages
Third and Fourth Year Curriculum For Civil Engineeering
No ratings yet
Third and Fourth Year Curriculum For Civil Engineeering
38 pages
Chapter 4 panel
No ratings yet
Chapter 4 panel
11 pages
MEASURES OF Dispersion
No ratings yet
MEASURES OF Dispersion
28 pages
Impacts of Population Pressure on Agricultural Production and Farming Practices of Households: The Case of Essera Woreda in Dawro Zone, SNNPR, Ethiopia
No ratings yet
Impacts of Population Pressure on Agricultural Production and Farming Practices of Households: The Case of Essera Woreda in Dawro Zone, SNNPR, Ethiopia
17 pages
The Correct Answers Are Highlighted in Green
No ratings yet
The Correct Answers Are Highlighted in Green
11 pages
A Quantitative Tour of the Social Sciences Andrew Gelman download
100% (1)
A Quantitative Tour of the Social Sciences Andrew Gelman download
48 pages
SPE 133428 Modeling Thermal Effects On Wellbore Stability
No ratings yet
SPE 133428 Modeling Thermal Effects On Wellbore Stability
23 pages
Machine Learning - A Probabilistic Perspective
No ratings yet
Machine Learning - A Probabilistic Perspective
1 page
Essentials of Econometrics
7% (27)
Essentials of Econometrics
12 pages
Uts Master Data Science and Innovation Mdsi Course Guide 2023
No ratings yet
Uts Master Data Science and Innovation Mdsi Course Guide 2023
16 pages
1 s2.0 S0167865516303324 Main
No ratings yet
1 s2.0 S0167865516303324 Main
7 pages
Excel 2007 For Scientists
100% (2)
Excel 2007 For Scientists
275 pages
(Assume α= 5% if not mentioned in the question) : Cfa, Frm, Ca, Cs, Fm, Caia, Cipm, Ccra, Ciib, Aim, Cira
No ratings yet
(Assume α= 5% if not mentioned in the question) : Cfa, Frm, Ca, Cs, Fm, Caia, Cipm, Ccra, Ciib, Aim, Cira
3 pages
Tweetminster Predicts: Findings
No ratings yet
Tweetminster Predicts: Findings
7 pages
Quality Assurance of Multiple-Choice Tests: London South Bank University, London, UK
No ratings yet
Quality Assurance of Multiple-Choice Tests: London South Bank University, London, UK
7 pages
Spam Classifier
No ratings yet
Spam Classifier
8 pages
My Life Stats-I Tracked My Habits For A Year, and This Is What I Learned by Daily Habits by Pau Blasco I Roca - Nov, 2023 - Towards Data Science
No ratings yet
My Life Stats-I Tracked My Habits For A Year, and This Is What I Learned by Daily Habits by Pau Blasco I Roca - Nov, 2023 - Towards Data Science
28 pages
Quantitative Methods
No ratings yet
Quantitative Methods
4 pages
Part 4C Quantitative Methods For Decision Analysis 354
No ratings yet
Part 4C Quantitative Methods For Decision Analysis 354
102 pages
Master Thesis Monte Carlo Simulation
100% (3)
Master Thesis Monte Carlo Simulation
6 pages
Accuracy Assessment in Remotely Sensed Categorical Information
No ratings yet
Accuracy Assessment in Remotely Sensed Categorical Information
38 pages
Raines-Eudy (2000) Dillon-Golstein Construct Reliability
No ratings yet
Raines-Eudy (2000) Dillon-Golstein Construct Reliability
19 pages
11572-Article Text-33483-1-10-20150410
No ratings yet
11572-Article Text-33483-1-10-20150410
10 pages
Troubleshooting Guide For EQA Results - 1WA
100% (1)
Troubleshooting Guide For EQA Results - 1WA
9 pages