Scikit-Learn Cheatsheet For Machine Learning

This document provides a cheat sheet summarizing key machine learning concepts in scikit-learn including data preprocessing techniques, supervised and unsupervised learning algorithms, model evaluation metrics, and model tuning. It lists common classification and regression algorithms like linear regression, support vector machines, naive bayes. It also covers preprocessing steps like standardization, normalization, encoding, imputation and dimensionality reduction using PCA. Model evaluation metrics include accuracy, classification report, MSE, R2 score. Model tuning is demonstrated using GridSearchCV.

Uploaded by

Muhammad Junaid

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views

Scikit-Learn Cheatsheet For Machine Learning

Uploaded by

Muhammad Junaid

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Visit KDnuggets.

com for more

cheatsheets and additional Standardization Unsupervised Learning Model lr.score(X_test, y_test)
learning resources.
from sklearn.preprocessing import StandardScaler from sklearn.metrics import accuracy_score
scaler = StandardScaler() accuracy_score(y_test, y_pred)
scaled_X_train = scaler.fit_transform(X_train) Principal Component Analysis

Scikit-learn CheatSheet scaled_X_test = scaler.transform(X_test)

from sklearn.decomposition import PCA
Classification Report

Normalization pca = PCA(n_components=2) from sklearn.metrics import classification_report

print(classification_report(y_test, y_pred))
from sklearn.preprocessing import Normalizer K Means
norm = Normalizer() Mean Squared Error
norm_X_train = norm.fit_transform(X_train) from sklearn.cluster import KMeans
norm_X_test = norm.transform(X_test) kmeans = KMeans(n_clusters=5, random_state=0) from sklearn.metrics import mean_squared_error
mean_squared_error(y_test, y_pred)
Binarization
R2 Score
from sklearn.preprocessing import Binarizer
Scikit-learn is an open-source Python library for all kinds binary = Binarizer(threshold=0.0) Model Fitting from sklearn.metrics import r2_score
of predictive data analysis. You can perform binary_X = binary.fit_transform(X) r2_score(y_test, y_pred)
classification, regression, clustering, dimensionality
reduction, model tuning, and data preprocessing tasks. Encoding Categorical Features Adjusted Rand Index
Supervised Learning
from sklearn.preprocessing import LabelEncoder from sklearn.metrics import adjusted_rand_score
lab_enc = LabelEncoder() lr.fit(X_train, y_train) adjusted_rand_score(y_test, y_pred)
y = lab_enc.fit_transform(y) svm_svc.fit(X_train, y_train)
Loading the Data
Imputer Unsupervised Learning
Cross-Validation
from sklearn.impute import SimpleImputer model = pca.fit_transform(X_train)
Classification imp_mean = SimpleImputer(missing_values=0, kmeans.fit(X_train)
strategy='mean')
from sklearn import datasets imp_mean.fit_transform(X_train)
X, y = datasets.load_wine(return_X_y=True) from sklearn.model_selection import cross_val_score
cross_val_score( lr, X, y, cv=5, scoring='f1_macro')
Regression Prediction
diabetes = datasets.load_diabetes()
Supervised Learning Model
X, y = diabetes.data, diabetes.target
Supervised Learning Model Tuning
Linear Regression y_pred = lr.predict_proba(X_test)
y_pred = svm_svc.predict(X_test)

Training And Test Data from sklearn.linear_model import LinearRegression

Unsupervised Learning
from sklearn.model_selection import GridSearchCV
lr = LinearRegression() parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]}
model = GridSearchCV(svm_svc, parameters)
Support Vector Machines y_pred = kmeans.predict(X_test) model.fit(X_train, y_train)
print(model.best_score_)
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC print(model.best_estimator_)
X_train, X_test, y_train, y_test = train_test_split(
svm_svc = SVC(kernel='linear')
X, y, random_state=0
) Evaluation
Naive Bayes
Subscribe to KDnuggets News
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
Accuracy Score
Preprocessing the Data

Abid Ali Awan | 2022

Business Strategy and Technology: Question Bank
No ratings yet
Business Strategy and Technology: Question Bank
50 pages
SPSS Statistics 20 Modules Specifications
No ratings yet
SPSS Statistics 20 Modules Specifications
5 pages
Computerized Rorschach Structural Summary System: ( Needed For Constellations Worksheet Adjustments)
0% (1)
Computerized Rorschach Structural Summary System: ( Needed For Constellations Worksheet Adjustments)
25 pages
Linear Regression: Scikit-Learn
No ratings yet
Linear Regression: Scikit-Learn
3 pages
Linear Regression: Scikit-Learn
No ratings yet
Linear Regression: Scikit-Learn
3 pages
Slides (A12 A14)
No ratings yet
Slides (A12 A14)
353 pages
Supervised Learning With Scikit-Learn
No ratings yet
Supervised Learning With Scikit-Learn
178 pages
Scikit-Learn: Library For Machine Learning and Data Science With Python
No ratings yet
Scikit-Learn: Library For Machine Learning and Data Science With Python
11 pages
Ch1 - Slides - Supervised Learning
No ratings yet
Ch1 - Slides - Supervised Learning
32 pages
Supervised Learning With Scikit-learn
No ratings yet
Supervised Learning With Scikit-learn
178 pages
Scikit-Learn-Exercises - Jupyter Notebook
100% (2)
Scikit-Learn-Exercises - Jupyter Notebook
28 pages
Supervised Learning: Andreas Müller
No ratings yet
Supervised Learning: Andreas Müller
43 pages
Chapter4 PDF
No ratings yet
Chapter4 PDF
34 pages
Machine Learning With Skicit-learn
No ratings yet
Machine Learning With Skicit-learn
15 pages
Scikit Learn
No ratings yet
Scikit Learn
25 pages
VTU ML (1)
No ratings yet
VTU ML (1)
62 pages
TP02
No ratings yet
TP02
3 pages
Machine Learning with Scikit-Learn
No ratings yet
Machine Learning with Scikit-Learn
2 pages
4c Sklearn-Classification-Regression-Bkhw-Spring 2019
No ratings yet
4c Sklearn-Classification-Regression-Bkhw-Spring 2019
20 pages
Pandas in Scikit-Learn
No ratings yet
Pandas in Scikit-Learn
3 pages
Scikit-Learn Cheat Sheet Python For Data Science: Preprocessing The Data Evaluate Your Model's Performance
100% (1)
Scikit-Learn Cheat Sheet Python For Data Science: Preprocessing The Data Evaluate Your Model's Performance
1 page
Scikit Learn
No ratings yet
Scikit Learn
107 pages
ML Engineer
No ratings yet
ML Engineer
2 pages
Scikit-Learn: Scikit-Learn Is An Open Source Python Library That
100% (1)
Scikit-Learn: Scikit-Learn Is An Open Source Python Library That
1 page
Chapter 2
No ratings yet
Chapter 2
50 pages
Python Scikit-Learn Cheat Sheet For Machine Learning
No ratings yet
Python Scikit-Learn Cheat Sheet For Machine Learning
3 pages
ML Cheatsheet
No ratings yet
ML Cheatsheet
4 pages
Practical 2 - Working With Scikit-Learn
No ratings yet
Practical 2 - Working With Scikit-Learn
6 pages
Introduction To Regression: George Boorman
No ratings yet
Introduction To Regression: George Boorman
50 pages
Scikit-Learn Cheat Sheet
No ratings yet
Scikit-Learn Cheat Sheet
1 page
Scikit-Learn Cheat Sheet
No ratings yet
Scikit-Learn Cheat Sheet
1 page
supervised learning using python - chapter3
No ratings yet
supervised learning using python - chapter3
47 pages
Clase-02-ML - Colab
No ratings yet
Clase-02-ML - Colab
5 pages
ML Algorithms
100% (1)
ML Algorithms
1 page
ML Assignment 3
No ratings yet
ML Assignment 3
7 pages
CHAPTER 4 Diabetes
No ratings yet
CHAPTER 4 Diabetes
6 pages
Supervised Learning With Scikit-Learn: Preprocessing Data
No ratings yet
Supervised Learning With Scikit-Learn: Preprocessing Data
32 pages
Introduction To Scikit Learn
100% (1)
Introduction To Scikit Learn
108 pages
ML Activity Kalyan
No ratings yet
ML Activity Kalyan
21 pages
Practical Guide To Scikit-Learn For Data Science
No ratings yet
Practical Guide To Scikit-Learn For Data Science
27 pages
Scikit Learn
No ratings yet
Scikit Learn
10 pages
Chapter 1
No ratings yet
Chapter 1
34 pages
How Good Is Your Model?: Andreas Müller
No ratings yet
How Good Is Your Model?: Andreas Müller
54 pages
Machine Learning Assignment (1)
No ratings yet
Machine Learning Assignment (1)
8 pages
Machine Learning Cheatsheet
No ratings yet
Machine Learning Cheatsheet
5 pages
algorithmeknn-121213175830-phpapp02
No ratings yet
algorithmeknn-121213175830-phpapp02
52 pages
122_ashishpatel_cseb_2
No ratings yet
122_ashishpatel_cseb_2
3 pages
Scikit Learn Tutorial PDF
100% (2)
Scikit Learn Tutorial PDF
151 pages
supervised learning using python - chapter1
No ratings yet
supervised learning using python - chapter1
34 pages
Scikit Hca
No ratings yet
Scikit Hca
8 pages
Scikit Learn Cheat Sheet Python
No ratings yet
Scikit Learn Cheat Sheet Python
1 page
MLDA1
No ratings yet
MLDA1
8 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Unveiling The Power
No ratings yet
Unveiling The Power
17 pages
Logistic Regression vs. SVMs - Solution
No ratings yet
Logistic Regression vs. SVMs - Solution
7 pages
Cricket 1 Prediction
No ratings yet
Cricket 1 Prediction
11 pages
Hackfest Problem Statement_ Energy Efficiency Optimization System for Vedanta Aluminium
No ratings yet
Hackfest Problem Statement_ Energy Efficiency Optimization System for Vedanta Aluminium
3 pages
Translation Quality Assessment of Google Translate From English To Kinyarwanda
100% (1)
Translation Quality Assessment of Google Translate From English To Kinyarwanda
64 pages
Chap013 Test Bank
No ratings yet
Chap013 Test Bank
7 pages
The Research Process
No ratings yet
The Research Process
24 pages
Scollan 2011 Theory
No ratings yet
Scollan 2011 Theory
12 pages
Big Data & Analytics
No ratings yet
Big Data & Analytics
14 pages
MLPC Midterm
No ratings yet
MLPC Midterm
18 pages
219 - Exp 9 - DWM
No ratings yet
219 - Exp 9 - DWM
10 pages
Chinmayee_Khade_Data_Science
No ratings yet
Chinmayee_Khade_Data_Science
1 page
Comparative Statement Analysis of Vijaya Dairy
50% (4)
Comparative Statement Analysis of Vijaya Dairy
51 pages
Full download The Handbook of Data Mining 1st Edition Nong Ye pdf docx
100% (5)
Full download The Handbook of Data Mining 1st Edition Nong Ye pdf docx
71 pages
PR2 - Imrad Format
No ratings yet
PR2 - Imrad Format
7 pages
Chapter 3 Programming Basics: 3.1 Conditional Expressions
No ratings yet
Chapter 3 Programming Basics: 3.1 Conditional Expressions
7 pages
Regression LN Ganesha
No ratings yet
Regression LN Ganesha
7 pages
FALLSEM2024-25_SWE2011_ETH_VL2024250103282_2024-08-01_Reference-Material-I
No ratings yet
FALLSEM2024-25_SWE2011_ETH_VL2024250103282_2024-08-01_Reference-Material-I
49 pages
Bhalchandra Ganesh Bansode
No ratings yet
Bhalchandra Ganesh Bansode
6 pages
Windmill Project PDF
No ratings yet
Windmill Project PDF
25 pages
Varayti NG Wika 12-47-1-PB
No ratings yet
Varayti NG Wika 12-47-1-PB
26 pages
Cem and SQ I Learning Solution Training Solution
No ratings yet
Cem and SQ I Learning Solution Training Solution
47 pages
Variable Selection in SAS Enterprise Guide and SAS Enterprise Miner - Ask The Expert - May 11 2017
No ratings yet
Variable Selection in SAS Enterprise Guide and SAS Enterprise Miner - Ask The Expert - May 11 2017
66 pages
JRTCSE.2022.2.3
No ratings yet
JRTCSE.2022.2.3
13 pages
Effects of Bullying
80% (5)
Effects of Bullying
31 pages
Strategies For Educational Inquiry: Y520 - Section 5982 Fall Semester 2002 Tuesdays 1:00 - 3:45 PM Wright 1006
No ratings yet
Strategies For Educational Inquiry: Y520 - Section 5982 Fall Semester 2002 Tuesdays 1:00 - 3:45 PM Wright 1006
4 pages
Abdullah CH 226959
No ratings yet
Abdullah CH 226959
15 pages
Facebook Data Analysis Using Hadoop and Hive (1)
No ratings yet
Facebook Data Analysis Using Hadoop and Hive (1)
4 pages
High Expectations
No ratings yet
High Expectations
18 pages