0% found this document useful (0 votes)

16 views

loss-functions

Uploaded by

zo63toscrib

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views

loss-functions

Uploaded by

zo63toscrib

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Loss Functions:

Comprehensive Notes
Introduction to Loss Functions
A loss function, also known as a cost function or objective function, measures the difference between predicted values
and actual values in a machine learning model. It quantifies how well a model performs and provides the basis for model
optimization.

Classification Loss Functions

1. Binary Cross-Entropy Loss (Log Loss)
Used for binary classification
Formula:

BCE(y, ŷ) = -[y log(ŷ) + (1-y)log(1-ŷ)]

where:
- y: true label (0 or 1)
- ŷ: predicted probability

Properties:

Range: [0, ∞)
Perfect prediction: 0
Heavily penalizes confident wrong predictions
Requires predicted probabilities

Implementation:

def binary_cross_entropy(y_true, y_pred):

epsilon = 1e-15 # Small constant to avoid log(0)
y_pred = np.clip(y_pred, epsilon, 1 - epsilon)
return -np.mean(y_true * np.log(y_pred) +
(1 - y_true) * np.log(1 - y_pred))

2. Categorical Cross-Entropy Loss

Used for multi-class classification
Formula:

CCE(y, ŷ) = -Σᵢ yᵢlog(ŷᵢ)

where:
- yᵢ: true probability of class i
- ŷᵢ: predicted probability of class i

Properties:

Generalizes binary cross-entropy

Requires one-hot encoded labels
Suitable for softmax outputs
Range: [0, ∞)

Implementation:

def categorical_cross_entropy(y_true, y_pred):

epsilon = 1e-15
y_pred = np.clip(y_pred, epsilon, 1 - epsilon)
return -np.sum(y_true * np.log(y_pred)) / y_true.shape[0]

3. Hinge Loss (Support Vector Machine Loss)

Used in SVMs and margin-based classifiers
Formula:

L(y, ŷ) = max(0, 1 - y * ŷ)
where:
- y: true label (-1 or 1)
- ŷ: predicted score

Properties:

Linear penalty for misclassification

Zero loss for correct predictions with margin
Range: [0, ∞)
Promotes sparsity

Regression Loss Functions

1. Mean Squared Error (MSE)
Most common regression loss
Formula:

MSE = (1/n)Σᵢ(yᵢ - ŷᵢ)²

where:
- n: number of samples
- yᵢ: true value
- ŷᵢ: predicted value

Properties:

Heavily penalizes large errors

Differentiable everywhere
Sensitive to outliers
Range: [0, ∞)

Implementation:

def mse_loss(y_true, y_pred):

return np.mean((y_true - y_pred) ** 2)

2. Mean Absolute Error (MAE)

Also called L1 Loss
Formula:

MAE = (1/n)Σᵢ|yᵢ - ŷᵢ|

Properties:

Less sensitive to outliers than MSE

Linear penalty
Not differentiable at zero
Range: [0, ∞)

Implementation:

def mae_loss(y_true, y_pred):

return np.mean(np.abs(y_true - y_pred))

3. Huber Loss
Combines MSE and MAE
Formula:

L(y, ŷ) = {
0.5(y - ŷ)² if |y - ŷ| ≤ δ
δ|y - ŷ| - 0.5δ² otherwise
}

Properties:

Robust to outliers
Differentiable everywhere
Adjustable sensitivity (δ)
Range: [0, ∞)

Implementation:

def huber_loss(y_true, y_pred, delta=1.0):

error = y_true - y_pred
is_small_error = np.abs(error) <= delta
squared_loss = 0.5 * error ** 2
linear_loss = delta * np.abs(error) - 0.5 * delta ** 2
return np.mean(np.where(is_small_error, squared_loss, linear_loss))

Specialized Loss Functions

1. Focal Loss
Modified cross-entropy for imbalanced data
Formula:

FL(p) = -α(1-p)ᵧ log(p)

where:
- α: balancing factor
- γ: focusing parameter
- p: predicted probability

Properties:

Down-weights easy examples

Focuses on hard negatives
Addresses class imbalance
Range: [0, ∞)
2. Contrastive Loss
Used in siamese networks
Formula:

L(y,d) = (1-y)½d² + y½max(0, m-d)²

where:
- y: binary label (1 for same class)
- d: distance between pairs
- m: margin

3. Triplet Loss
Used in metric learning
Formula:

L = max(d(a,p) - d(a,n) + margin, 0)

where:
- a: anchor
- p: positive
- n: negative

Custom Loss Functions

1. Creating Custom Losses

class CustomLoss:
def __init__(self, weights):
self.weights = weights

def call(self, y_true, y_pred):

return self.forward(y_true, y_pred)

def forward(self, y_true, y_pred):

# Custom loss computation
pass

def backward(self, y_true, y_pred):

# Gradient computation
pass
2. Combining Multiple Losses

def combined_loss(y_true, y_pred, alpha=0.5):

mse = mse_loss(y_true, y_pred)
mae = mae_loss(y_true, y_pred)
return alpha * mse + (1 - alpha) * mae

Loss Function Selection Guidelines

1. Classification Tasks
Binary: Binary Cross-Entropy
Multi-class: Categorical Cross-Entropy
Imbalanced: Focal Loss
Margin-based: Hinge Loss

2. Regression Tasks
General purpose: MSE
Outlier robust: MAE or Huber
Custom requirements: Combined loss

3. Special Cases
Metric learning: Contrastive/Triplet Loss
Generative models: Custom losses
Multi-task learning: Weighted combinations

Practical Considerations
1. Numerical Stability
Add small epsilon to logs
Clip prediction ranges
Use stable implementations
Monitor for NaN values

2. Scaling and Normalization

Normalize inputs
Scale targets appropriately
Consider batch statistics
Use appropriate initializations

3. Gradient Properties
Check gradients magnitude
Monitor gradient flow
Implement gradient clipping
Use appropriate optimizers

Best Practices
1. Loss Function Selection

Consider problem nature

Evaluate data distribution
Test multiple options
Validate assumptions

2. Implementation

Use stable implementations

Add proper testing
Monitor training
Implement early stopping

3. Debugging

Verify loss values

Check gradients
Monitor convergence
Validate predictions

Common Issues and Solutions

1. Vanishing Gradients
Use appropriate activation functions
Implement gradient clipping
Consider loss scaling
Monitor gradient flow

2. Exploding Gradients
Clip gradient norms
Scale loss appropriately
Use stable implementations
Monitor loss values

3. Class Imbalance
Use weighted losses
Implement focal loss
Balance dataset
Adjust class weights

Conclusion
Choosing and implementing appropriate loss functions is crucial for:

1. Model performance
2. Training stability
3. Convergence speed
4. Robustness to outliers
5. Handling specific problem requirements

Case Study - Crystal Pepsi Failure
0% (1)
Case Study - Crystal Pepsi Failure
10 pages
DL Unit-2
No ratings yet
DL Unit-2
24 pages
Geography of Odisha
No ratings yet
Geography of Odisha
20 pages
Critical Capabilities For Property and Casualty Insurance Claims Management Modules
No ratings yet
Critical Capabilities For Property and Casualty Insurance Claims Management Modules
26 pages
Graphic Design
78% (9)
Graphic Design
60 pages
Loss Functions Types
No ratings yet
Loss Functions Types
11 pages
DL Practical 3 Loss Function
No ratings yet
DL Practical 3 Loss Function
6 pages
Loss functions
No ratings yet
Loss functions
29 pages
Loss Functions
No ratings yet
Loss Functions
7 pages
Practical-5_2CEIT606_Artificial Intelligence
No ratings yet
Practical-5_2CEIT606_Artificial Intelligence
14 pages
Assignment 1 - Machine Learning
No ratings yet
Assignment 1 - Machine Learning
9 pages
Detailed Guide 7 Loss Functions Machine Learning Python Code
No ratings yet
Detailed Guide 7 Loss Functions Machine Learning Python Code
16 pages
4-Loss Function
No ratings yet
4-Loss Function
8 pages
Lecture 07
No ratings yet
Lecture 07
29 pages
Module 6_Loss Function
No ratings yet
Module 6_Loss Function
22 pages
Loss Function - Ipynb - Colaboratory
No ratings yet
Loss Function - Ipynb - Colaboratory
6 pages
3 - Loss Functions
No ratings yet
3 - Loss Functions
14 pages
practicalMachineLearning_lecture3
No ratings yet
practicalMachineLearning_lecture3
25 pages
Machine Vesion hw6
No ratings yet
Machine Vesion hw6
18 pages
Lect 8
No ratings yet
Lect 8
117 pages
04 LossFunctions
No ratings yet
04 LossFunctions
22 pages
Losses
No ratings yet
Losses
9 pages
05 AIS302 ANN-Optimization
No ratings yet
05 AIS302 ANN-Optimization
44 pages
Loss Functions
No ratings yet
Loss Functions
37 pages
Lecture 11
No ratings yet
Lecture 11
26 pages
Activation - Loss - Accuracy
No ratings yet
Activation - Loss - Accuracy
16 pages
ml
No ratings yet
ml
10 pages
Types of Neural Networks
No ratings yet
Types of Neural Networks
7 pages
Deep Learning(Part 2). Loss Function and Gradient Function _ by Sumbatilinda _ Medium
No ratings yet
Deep Learning(Part 2). Loss Function and Gradient Function _ by Sumbatilinda _ Medium
30 pages
Linear Classifier: by Dr. Sanjeev Kumar Associate Professor Department of Mathematics IIT Roorkee, Roorkee-247 667, India
No ratings yet
Linear Classifier: by Dr. Sanjeev Kumar Associate Professor Department of Mathematics IIT Roorkee, Roorkee-247 667, India
86 pages
ML Intro Numericals
No ratings yet
ML Intro Numericals
27 pages
Most Influential Data Science Research Papers
No ratings yet
Most Influential Data Science Research Papers
628 pages
2 LossAndOptimization
No ratings yet
2 LossAndOptimization
130 pages
Lect 9- Loss Functions
No ratings yet
Lect 9- Loss Functions
28 pages
Introduction of Machine Learning
No ratings yet
Introduction of Machine Learning
61 pages
DeepLearning Lect2 3
No ratings yet
DeepLearning Lect2 3
89 pages
Loss Function
No ratings yet
Loss Function
9 pages
Loss Functions in Deep Learning - MLearning - Ai
No ratings yet
Loss Functions in Deep Learning - MLearning - Ai
14 pages
03-Linear Classification
No ratings yet
03-Linear Classification
17 pages
A General and Adaptive Robust Loss Function: Jonathan T. Barron Google Research
No ratings yet
A General and Adaptive Robust Loss Function: Jonathan T. Barron Google Research
19 pages
A General and Adaptive Robust Loss Function
No ratings yet
A General and Adaptive Robust Loss Function
9 pages
CHAPTER 3.3 - Activation - Loss - Accuracy
No ratings yet
CHAPTER 3.3 - Activation - Loss - Accuracy
14 pages
A General and Adaptive Robust Loss Function
No ratings yet
A General and Adaptive Robust Loss Function
19 pages
01_lecturenote_SRM
No ratings yet
01_lecturenote_SRM
9 pages
loss function
No ratings yet
loss function
23 pages
Ch2-Training, Optimization and Regularization of DNN-new (1)
No ratings yet
Ch2-Training, Optimization and Regularization of DNN-new (1)
114 pages
Unit 2b
No ratings yet
Unit 2b
11 pages
16-Softmax Regression - Softmax Classifier-19!08!2024
No ratings yet
16-Softmax Regression - Softmax Classifier-19!08!2024
14 pages
HODL Lec 2 Training NNs Intro TF
No ratings yet
HODL Lec 2 Training NNs Intro TF
83 pages
Loss Function
No ratings yet
Loss Function
2 pages
Machine Learning Models
No ratings yet
Machine Learning Models
52 pages
SkriptOptMach
No ratings yet
SkriptOptMach
49 pages
Cross Entropy Loss Intro, Applications
No ratings yet
Cross Entropy Loss Intro, Applications
21 pages
Deep Learning Assignment2 Solutions PDF
No ratings yet
Deep Learning Assignment2 Solutions PDF
16 pages
CS480 6 Linear Models
No ratings yet
CS480 6 Linear Models
68 pages
ML Notes
No ratings yet
ML Notes
14 pages
CS229 Supplemental Lecture Notes: 1 Binary Classification
No ratings yet
CS229 Supplemental Lecture Notes: 1 Binary Classification
7 pages
lecture19
No ratings yet
lecture19
8 pages
chapter02.Background-theory_5e45b9b50ccb12d028c8edf9b332c5e5
No ratings yet
chapter02.Background-theory_5e45b9b50ccb12d028c8edf9b332c5e5
20 pages
DeepLearning Recap
No ratings yet
DeepLearning Recap
104 pages
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Backpropagation: Fundamentals and Applications for Preparing Data for Training in Deep Learning
From Everand
Backpropagation: Fundamentals and Applications for Preparing Data for Training in Deep Learning
Fouad Sabry
No ratings yet
A-level Maths Revision: Cheeky Revision Shortcuts
From Everand
A-level Maths Revision: Cheeky Revision Shortcuts
Scool Revision
3.5/5 (8)
Fundamental Math
From Everand
Fundamental Math
Russell Pead
No ratings yet
Logistic_Regression_Class_Notes
No ratings yet
Logistic_Regression_Class_Notes
3 pages
Whitepaper ISO 26262 Software Compliance With Parasoft
No ratings yet
Whitepaper ISO 26262 Software Compliance With Parasoft
11 pages
ISOTypesDescriptions
No ratings yet
ISOTypesDescriptions
11 pages
1378imguf_Lecture13-14ISO9000-CS19
No ratings yet
1378imguf_Lecture13-14ISO9000-CS19
19 pages
Types of Volcanoes
No ratings yet
Types of Volcanoes
21 pages
Math Lesson Weebly
No ratings yet
Math Lesson Weebly
19 pages
BRAINSTORMING
No ratings yet
BRAINSTORMING
20 pages
2017 Kdigo LD GL PDF
0% (1)
2017 Kdigo LD GL PDF
115 pages
An Inequality For Convex Sets.: G. A. Tsintsifas
100% (1)
An Inequality For Convex Sets.: G. A. Tsintsifas
2 pages
Franchising Activity
No ratings yet
Franchising Activity
2 pages
R
No ratings yet
R
253 pages
A Project Report On Consumer Behavior
No ratings yet
A Project Report On Consumer Behavior
12 pages
OS MCQ Set 5
100% (1)
OS MCQ Set 5
20 pages
3D Lung Models for Regenerating Lung Tissue Gunilla Westergren-Thorsson - The latest ebook version is now available for instant access
100% (1)
3D Lung Models for Regenerating Lung Tissue Gunilla Westergren-Thorsson - The latest ebook version is now available for instant access
60 pages
ARC-100 Product Brochure
No ratings yet
ARC-100 Product Brochure
4 pages
Employment Opportunities For A Biosystems Engineer
No ratings yet
Employment Opportunities For A Biosystems Engineer
2 pages
Annual Ontario Psychology Undergraduate Thesis Conference
100% (3)
Annual Ontario Psychology Undergraduate Thesis Conference
7 pages
The Importance of Photography
100% (1)
The Importance of Photography
1 page
Macleod 1995
No ratings yet
Macleod 1995
6 pages
Delock Audio Adapter USB Type-C™ To Stereo Jack Female 14 CM White
No ratings yet
Delock Audio Adapter USB Type-C™ To Stereo Jack Female 14 CM White
2 pages
Property Digest
No ratings yet
Property Digest
16 pages
Churches of Warren Michigan Year Founded List
No ratings yet
Churches of Warren Michigan Year Founded List
3 pages
Mazda RX-8 2009 Service Highlights
100% (1)
Mazda RX-8 2009 Service Highlights
299 pages
Test Bank Essentials of Business Communication 11th 11E
No ratings yet
Test Bank Essentials of Business Communication 11th 11E
19 pages
Mordheim Editable Roster PDF
No ratings yet
Mordheim Editable Roster PDF
2 pages
18073-EasyLine-23-07 Chave Seccionadora ABB
No ratings yet
18073-EasyLine-23-07 Chave Seccionadora ABB
38 pages
Ancylostoma-Duodenale Nematodes
No ratings yet
Ancylostoma-Duodenale Nematodes
16 pages
MacBook Pro (13-Inch, Mid 2009) - Technical Specifications
No ratings yet
MacBook Pro (13-Inch, Mid 2009) - Technical Specifications
4 pages
Division Memo - LAC Sessions
No ratings yet
Division Memo - LAC Sessions
2 pages
Printable Student Booklet
No ratings yet
Printable Student Booklet
21 pages