0% found this document useful (0 votes)

5 views16 pages

Loss Functions

The document outlines various loss functions used in machine learning for different tasks, including regression, classification, image segmentation, and distribution learning. Key loss functions discussed include Mean Squared Error (MSE), Mean Absolute Error (MAE), Huber Loss, Binary Cross-Entropy, and others, each with specific characteristics and applications. Additionally, it mentions other loss functions like Negative Log-Likelihood and Wasserstein Loss that serve specialized purposes in model training.

Uploaded by

rimoghoshsayan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views16 pages

Loss Functions

Uploaded by

rimoghoshsayan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 16

Alberto Molinaro

Mean Squared Error (MSE)

For Regression problems

Punishes large errors heavily.

Sensitive to outliers. Squaring exaggerates
large errors.
Alberto Molinaro

Mean Absolute Error (MAE)

For Regression problems

Same as MSE but with

absolute difference.
No squaring

More robust to noise. Linear penalty.

Harder to optimize due to non-smooth
gradients.
Alberto Molinaro

Huber Loss
For Regression problems

Transition point δ:
2 Below this line, the loss
behaves like MSE
1.5
(quadratic); above it,
1 like MAE (linear)

0.5 δ = 0.6

Combines MSE and MAE benefits.

Treat δ as a hyperparameter to tune.
Alberto Molinaro
Binary Cross-
Entropy (Log Loss)
For Binary Classification
BCE if y=1
BCE if y=0

0.5 1

Outputs interpretable probabilities.

High loss if high confidence in wrong
prediction.
Alberto Molinaro

Focal Loss
For Imbalanced Classification

When γ = 0, the curve

matches BCE exactly.

γ=0 Higher γ → more

focus on hard examples.
γ=1
γ=5

Model's confidence
0.5 1 in the true class

Down-weights easy examples, helping focus

learning on challenging cases.
Treat γ as an hyperparameter to tune.
Alberto Molinaro
Alberto Molinaro

Categorical Cross-Entropy
For Multi-Class Classification

Only the predicted

probability of the true
class affects the loss.

0.5 1

For softmax + one-hot labels.

CCE generalizes BCE to multi-class problems.
Alberto Molinaro
Sparse Categorical
Cross-Entropy
For Multi-Class, Integer Labels

Only the predicted

probability of the true
class affects the loss.

0.5 1

Saves memory and computation.

Same as CCE but with integer labels instead
of one-hot encoded labels.
Alberto Molinaro

Hinge Loss
For Classification, SVMs / Margin-
based Learning

Correct but not

confident → Linear
1 penalty
Wrong →
Strong
penalty Correct & confident
→ Loss = 0

0.5 Margin = 1

Encourages confident classification.

Alberto Molinaro

Dice Loss
For Image Segmentation
Overlap
(=numerator) 0 = no overlap
1 = perfect match
Predicted
Ground truth

Measures overlap between predicted and

true masks.
Perfect for unbalanced pixel classes (e.g.,
medical imaging).
Alberto Molinaro

IoU Loss (Jaccard Loss)

For Object Detection / Segmentation
Overlap
(=numerator)
Predicted Ground truth

Union of
Predicted and
Ground truth

Focuses on region-level accuracy.

Great when overlap quality is more
important than pixel-level error.
Alberto Molinaro
Kullback-Leibler
(KL) Divergence
For Distribution Learning
P(i) Target distribution
Q(i): Predicted distribution
P(i), P(i) P(i)
Q(i)
Q(i) Q(i)

Output
Higher KL Divergence Lower KL Divergence class (i)
(poor fit) (better fit)

Compare predicted vs target distributions.

High penalty: Q underestimates P.
Alberto Molinaro

Cosine Similarity Loss

For Text and Embedding Models
doc1 The smaller angle
corresponds to higher
doc3 cosine similarity.

doc2

Minimize loss, maximize similarity (push

angle to 0).
Cosine similarity is scale-invariant, only
direction matters.
Ranges from −1 (opposite) to +1 (identical),
in most NLP uses: [0,1].
Alberto Molinaro

Triplet Loss
For Image Recognition

Before training After training

(Embedding space) (Embedding space)
Positive

Positive

Anchor Anchor

Negative

Learn embeddings that cluster similar inputs.

Pull anchor and positive embeddings closer,
and push negatives farther than a margin α.
Alberto Molinaro
Contrastive Loss
For Image Recognition
Push negative
(Embedding space) beyond margin m.

Positive Negative

margin: m

Anchor Anchor

Minimizes same-class distance.

Maximizes different-class separation within
a margin.
m: threshold distance. Minimum distance
between dissimilar pairs. Treat as hyper-param.
Alberto Molinaro

What we saw in this post

Regression: MSE, MAE, Huber.
Classification: BCE, CCE, Focal, SCCE, Hinge.
Image Segmentation: Dice, IoU.
Distribution learning: KL divergence.
Representation learning: Triplet, Contrastive,
Cosine.
Alberto Molinaro
Other loss functions
Negative Log-Likelihood (NLL) Loss:
Generalization of CCE when working
directly with log-probabilities.
Tversky Loss: Generalization of Dice/IoU.
Perceptual Loss: Compares feature maps
instead of pixels to better capture
perceptual similarity.
Wasserstein Loss: Measures distance between
distributions in a more stable way than KL,
core to Wasserstein GANs.
Poisson Loss: Suitable for count data,
assumes the target follows a Poisson
distribution (common in event modeling).
CTC (Connectionist Temporal Classification)
Loss: Enables sequence prediction without
aligned labels, key for speech, handwriting,
and OCR tasks.

CDB Review Checklist: Program Analysis (PA) Phase Submittal Design Development (DD) Phase Submittal
No ratings yet
CDB Review Checklist: Program Analysis (PA) Phase Submittal Design Development (DD) Phase Submittal
5 pages
Evolution of Media
100% (1)
Evolution of Media
8 pages
Loss Functions
No ratings yet
Loss Functions
7 pages
Lect 9 - Loss Functions
No ratings yet
Lect 9 - Loss Functions
28 pages
Loss Functions
No ratings yet
Loss Functions
37 pages
Lesson 4 Deep Neural Network and Tools
No ratings yet
Lesson 4 Deep Neural Network and Tools
159 pages
Loss
No ratings yet
Loss
18 pages
AI and Math - Python Multiple-Choice Questions
No ratings yet
AI and Math - Python Multiple-Choice Questions
16 pages
Loss Functions
No ratings yet
Loss Functions
29 pages
Loss Functions
No ratings yet
Loss Functions
17 pages
Assignment 1 - Machine Learning
No ratings yet
Assignment 1 - Machine Learning
9 pages
Loss Function in Deep Learning
No ratings yet
Loss Function in Deep Learning
15 pages
3 - Loss Functions
No ratings yet
3 - Loss Functions
14 pages
Machine Learning Models
No ratings yet
Machine Learning Models
52 pages
Module 6 - Loss Function
No ratings yet
Module 6 - Loss Function
22 pages
Lecture 11
No ratings yet
Lecture 11
26 pages
Loss Functions Types
No ratings yet
Loss Functions Types
11 pages
ML 19.03 Sidenotes
No ratings yet
ML 19.03 Sidenotes
30 pages
Losses
No ratings yet
Losses
9 pages
Week 1 Lecture Notes
No ratings yet
Week 1 Lecture Notes
7 pages
Lesson 04 Deep Neural Network
No ratings yet
Lesson 04 Deep Neural Network
81 pages
Lecture 6
No ratings yet
Lecture 6
19 pages
9.b Handout-1-Loss Functions
No ratings yet
9.b Handout-1-Loss Functions
3 pages
Unit 2 - Part A - B - C
No ratings yet
Unit 2 - Part A - B - C
25 pages
W2 CSE 4781 - Training Linear Regression
No ratings yet
W2 CSE 4781 - Training Linear Regression
59 pages
Lecture 03 - Feedforward Networks - 4p
No ratings yet
Lecture 03 - Feedforward Networks - 4p
19 pages
Lecture 2
No ratings yet
Lecture 2
66 pages
Lecture 19
No ratings yet
Lecture 19
8 pages
4-Loss Function
No ratings yet
4-Loss Function
8 pages
Intro To ML RevisionNotes
No ratings yet
Intro To ML RevisionNotes
24 pages
MLA TAB Lecture3
No ratings yet
MLA TAB Lecture3
70 pages
Week 6 - Lecture 12-1
No ratings yet
Week 6 - Lecture 12-1
34 pages
Machine Vesion hw6
No ratings yet
Machine Vesion hw6
18 pages
Lecture 5
No ratings yet
Lecture 5
18 pages
DeekshikaJadyada20 AP24LDS11
No ratings yet
DeekshikaJadyada20 AP24LDS11
4 pages
Group 30
No ratings yet
Group 30
33 pages
Lecture 5
No ratings yet
Lecture 5
41 pages
Introduction To Machine Learning Lecture 2: Linear Regression
No ratings yet
Introduction To Machine Learning Lecture 2: Linear Regression
38 pages
Basics of ML and Evaluation
No ratings yet
Basics of ML and Evaluation
42 pages
Linear Regression Summary
No ratings yet
Linear Regression Summary
57 pages
Machine Learning - SoS 2017
No ratings yet
Machine Learning - SoS 2017
15 pages
NN WK 3 Lec 5 6 Gradient Descent
No ratings yet
NN WK 3 Lec 5 6 Gradient Descent
7 pages
04 LogisticRegression
No ratings yet
04 LogisticRegression
29 pages
Lecture 4
No ratings yet
Lecture 4
63 pages
Deep Learning (Part 2) - Loss Function and Gradient Function - by Sumbatilinda - Medium
No ratings yet
Deep Learning (Part 2) - Loss Function and Gradient Function - by Sumbatilinda - Medium
30 pages
Complete Ml
No ratings yet
Complete Ml
119 pages
(Machine Learning Coursera) Lecture Note Week 1
No ratings yet
(Machine Learning Coursera) Lecture Note Week 1
8 pages
Lecture+7+ +MLP
No ratings yet
Lecture+7+ +MLP
80 pages
Supervised Learning
No ratings yet
Supervised Learning
5 pages
Logistic Regression
No ratings yet
Logistic Regression
19 pages
ML-W2L02 Supervised Learning Setup
No ratings yet
ML-W2L02 Supervised Learning Setup
16 pages
ML:Introduction: Week 1 Lecture Notes
No ratings yet
ML:Introduction: Week 1 Lecture Notes
10 pages
8 Linear Classifiers HInge Loss 03-08-2024
No ratings yet
8 Linear Classifiers HInge Loss 03-08-2024
20 pages
Metric
No ratings yet
Metric
6 pages
DL Practical 3 Loss Function
No ratings yet
DL Practical 3 Loss Function
6 pages
ML-W2L02 Supervised Learning Setup
No ratings yet
ML-W2L02 Supervised Learning Setup
16 pages
Week#2
No ratings yet
Week#2
34 pages
Machine Learning HC
No ratings yet
Machine Learning HC
4 pages
02 - Linear Models - A
No ratings yet
02 - Linear Models - A
23 pages
Linear - Regression - SGD
No ratings yet
Linear - Regression - SGD
71 pages
Ali Hejazizo: - Curriculum Vitae
No ratings yet
Ali Hejazizo: - Curriculum Vitae
3 pages
DLL Ict 10
100% (1)
DLL Ict 10
3 pages
Automatic Hand Sanitizer Using IR
No ratings yet
Automatic Hand Sanitizer Using IR
6 pages
UNITV
No ratings yet
UNITV
34 pages
Number System Conversion
No ratings yet
Number System Conversion
30 pages
ISM - Guidelines For System Management (December 2023)
No ratings yet
ISM - Guidelines For System Management (December 2023)
8 pages
The Poisson Distribution
No ratings yet
The Poisson Distribution
13 pages
Draft - Master Direction On Outsourcing of Information Technology (IT) Services
No ratings yet
Draft - Master Direction On Outsourcing of Information Technology (IT) Services
23 pages
Lecture 2
No ratings yet
Lecture 2
37 pages
Crafting The Methods and Results in Academic Publishing
No ratings yet
Crafting The Methods and Results in Academic Publishing
10 pages
Programming Assignment
No ratings yet
Programming Assignment
6 pages
I. Models Arrius 1A Arrius 2B1 Arrius 2B1A Arrius 2F Arrius 2K1 Arrius 2B2 Arrius 1A1
100% (1)
I. Models Arrius 1A Arrius 2B1 Arrius 2B1A Arrius 2F Arrius 2K1 Arrius 2B2 Arrius 1A1
11 pages
Computerized Enrollment System For Mary
No ratings yet
Computerized Enrollment System For Mary
30 pages
EFI Fuel System
No ratings yet
EFI Fuel System
68 pages
Sample
No ratings yet
Sample
7 pages
WaterShapes - Hydraulics-Hot-Tub-Concrete-Spa-Jets-Hydrotherapy-Venturi-Hartford-Loop
No ratings yet
WaterShapes - Hydraulics-Hot-Tub-Concrete-Spa-Jets-Hydrotherapy-Venturi-Hartford-Loop
7 pages
Cheatsheet
No ratings yet
Cheatsheet
3 pages
VEIT Ironing Technology For TextileCare 06 1219
No ratings yet
VEIT Ironing Technology For TextileCare 06 1219
24 pages
Daftar Harga Produk TIENS
No ratings yet
Daftar Harga Produk TIENS
2 pages
Winterization Checklist Template
No ratings yet
Winterization Checklist Template
1 page
Lecture Ch4 Performance
No ratings yet
Lecture Ch4 Performance
25 pages
Erp Manager
No ratings yet
Erp Manager
2 pages
Activity
No ratings yet
Activity
5 pages
Visa Cashless Cities Report
No ratings yet
Visa Cashless Cities Report
68 pages
Websys
No ratings yet
Websys
1 page
Manual Fmb920
No ratings yet
Manual Fmb920
16 pages
IPR - Quiz 1 2024
No ratings yet
IPR - Quiz 1 2024
1 page
Chapter Shutdown
No ratings yet
Chapter Shutdown
31 pages