0% found this document useful (0 votes)

31 views

(Slide) Multi Task Learning

The document discusses multi-task learning in computer vision. It introduces different multi-task learning architectures, including encoder-focused approaches that share features in the encoding stage like hard parameter sharing, soft parameter sharing, and cross-stitch networks.

Uploaded by

vu.le.bui.quoc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

31 views

(Slide) Multi Task Learning

Uploaded by

vu.le.bui.quoc

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 40

AI VIETNAM

All-in-One Course

Module 10 - Project

Multi-Task Learning

AI VIET NAM
Nguyen Quoc Thai

1
Year 2023
Objectives
! Multi-task Learning for Computer Vision

Task 1 Training Data Model

Generalization

Feature-based MTL
Task 2 Training Data Model
Parameter-based MTL Generalization

Task 3 Training Data Model

Generalization
2
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

3
Introduction
! Single-Task Learning

Ø Image Classification

MODEL Class: CAT

(LeNet, ResNet,…)

4
Introduction
! Single-Task Learning

Ø Image Segmentation

0 0 0 0 0 0 0 0
0 1 1 0 0 0 0 0
0 1 1 1 0 2 2 0

MODEL 0 1 1 1 0 2 2 0

(UNet) 0 1 1 1 2 2 2 0
0 1 1 1 1 2 2 0
1 1 1 1 1 2 2 0
0 0 0 0 0 0 0 0

DOG CAT
5
Introduction
! Single-Task Learning

Ø Object Detection

DOG – 0.98 CAT – 0.87

MODEL
(UNet)

Assign labels, bounding boxes

to objects in the image
6
Introduction
! Single-Task Learning

Task 1 Training Data Model

Training Generalization

Task 2 Training Data Model

Training Generalization

Task 3 Training Data Model

Training Generalization
7
Introduction
! Multi-Task Learning

Task 1 Training Data Model

Generalization

Task 2 Training Data Model

Training Generalization

Task 3 Training Data Model

Generalization
8
Introduction
! Motivation

Ø Learning multiple tasks jointly with the aim of mutual benefit

Ø Improves generalization on other tasks
Caused by the inductive bias provided by the auxiliary task

9
Introduction
! Multi-Task Learning

Task 1 Training Data Model

Generalization

What to Share?
Task 2 Training Data Model
Generalization
How to Share?

Task 3 Training Data Model

Generalization
10
Introduction
! MTL Methods (based on what to share?)

Ø Feature-based MTL
o Aims to learn common features among different tasks
Ø Parameter-based MTL
o Learns model parameters to help learn parameters for other tasks
Ø Instance-based MTL
o Identify useful data instances in a task for other task

11
Introduction
! MTL Methods (based on how to share?)

Ø Feature-based MTL
o Feature learning approach
o Deep learning approach
Ø Parameter-based MTL
o Low-Rank approach

12
Introduction
! Feature Learning Approach

Ø Why need to learn common feature representations?

o Original features may not have enough expressive power
Ø Two sub-categories
o Feature transformation approach
o Feature selection approach

13
Introduction
! Feature Learning Approach

Ø Feature transformation approach

o The learned features are a linear or nonlinear transformation of the original
feature representation
o Multi-task feedforward NN

Input 1 Output for task 1

Input d Output for task 2

14
Introduction
! Feature Learning Approach

Ø Feature selection approach

o Select a subset of the original features as the learned representation
o Eliminates useless features based on different criteria

15
Introduction
! Low-Rank Approach

Ø Assumes the model parameters of different

tasks share a low-rank subspace

16
Introduction
! Deep Learning Approach

Ø Deep Multi-Task Architectures

o Encoder-Focused
o Decoder-Focused
Ø Optimization Strategy Methods
o Task Balancing
o Other: Heuristics, Gradient Sign Dropout

17
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

18
Deep Multi-Task Architectures
! Deep Multi-Task Architectures used in Computer Vision

Deep Multi-Task
Architectures

Encoder-Focused Decoder-Focused Other

MTL Baseline PAD-Net

Cross-Stitch Networks ASTMT
PAP-Net
NDDR-CNN MTI-Net
MTAN

19
Deep Multi-Task Architectures
! Encoder-Focused

Ø Share the task features in the encoding stage

Task A Task B Task C

Task specific

Shared Encoder
(Soft/Hard)

20
Deep Multi-Task Architectures
! Encoder-Focused

Ø Hard Parameter Sharing

o Generally applied by sharing the hidden layers between all tasks
o Keep several task-specific output layers

Task A Task B Task C

Task specific

21
Deep Multi-Task Architectures
! Encoder-Focused

Ø Soft Parameter Sharing

o Each task has its own model with its own parameters
o Uses a linear combination in every layer of the task-specific networks

Task A Task B Task C

Task specific

22
Deep Multi-Task Architectures
! Encoder-Focused

Ø Cross-Stitch Networks
o Shared the activations amongst all single-task networks in the encoder

Task A Task B Task A Task B

+ 𝛼 𝛼 +

Share Parameters

23
Deep Multi-Task Architectures
! Encoder-Focused

Ø Cross-Stitch Networks
o Shared the activations amongst all single-task networks in the encoder
o Cross connection

Task A Task B Task A Task B

+ 𝛼 𝛼 + + Conv Conv +

Conv Conv Conv Conv

24
Deep Multi-Task Architectures
! Encoder-Focused

Ø Multi-Task Attention Networks

o Used a shared backbone network in conjunction with task-specific attention
modules in the encoder
Task B Task C

Task specific

Shared Encoder Attention Module Attention Module

Attention Module Attention Module

25
Deep Multi-Task Architectures
! Decoder-Focused

Task A Task B Task C

Task A Task B Task C Task specific

Shared Encoder
(Soft/Hard)

26
Deep Multi-Task Architectures
! Decoder-Focused

Ø PAD-Net
o Multi-Tasks Guided Prediction-and-Distillation Network for Simultaneous
Depth Estimation and Scene Parsing

27
Deep Multi-Task Architectures
! Decoder-Focused

Ø PAD-Net
o Deep Multimodal Distillation

28
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

29
Optimization Strategy
! Task Balancing Approaches

Ø Set a unique weight for each task

ℒ!"# = # 𝑤$ . ℒ$
$

Ø Use SGD to minimize the objective

𝜕ℒ$
𝑊%&'()* = 𝑊%&'()* − 𝛾 # 𝑤$
𝜕𝑊%&'()*
$

30
Optimization Strategy
! Uncertainty Weighting

Ø Use the homoscedastic uncertainty to balance the single-task losses

Ø Optimize the model weights W and noise parameters

1 1
ℒ W, σ+ , 𝜎, = , ℒ+ 𝑊 + , ℒ, 𝑊 + log 𝜎+ 𝜎,
2𝜎+ 2𝜎,

31
Optimization Strategy
! Dynamic Weight Averaging (DWA)

Ø Learns to average task weighting over time by considering the rate of change of loss
for each task
Training Time Relative Loss Change

r- t − 1
N exp T L.(t − 1)
w- t = , r. t − 1 =
r t−1 L.(t − 2)
∑. exp .
T

Temperature
(Softness of Task Weighting)

32
Optimization Strategy
! Other methods

Ø Gradient Normalization
Ø Dynamic Task Prioritization

33
Quiz

34
Outline
Ø Introduction
Ø Deep Multi-Task Architectures
Ø Optimization Strategy
Ø Experiment

35
Experiment
! NYUD-v2 Dataset

36
Experiment
! Model

Task A Task B Task C Task A Task B Task C

Hard Parameter Sharing Soft Parameter Sharing

37
Experiment
! Code

38
Summary

Deep Multi-Task
Optimization Strategy
Architectures

Encoder-Focused Decoder-Focused Other Task Balancing

MTL Baseline PAD-Net Uncertainty Weighting

Cross-Stitch Networks ASTMT Gradient Normalization
PAP-Net
NDDR-CNN MTI-Net DWA
MTAN DTP

39
Thanks!
Any questions?

SS1 Scheme of Work For First Term
100% (3)
SS1 Scheme of Work For First Term
14 pages
Palworld - Breeding Combinations and Calculator (v1.3-014)
No ratings yet
Palworld - Breeding Combinations and Calculator (v1.3-014)
24 pages
You Gotta Die Sometime by William Finn
No ratings yet
You Gotta Die Sometime by William Finn
11 pages
Feathered Phonics (Parrot Speech Training CD) Torrent - Kickass Torrents
No ratings yet
Feathered Phonics (Parrot Speech Training CD) Torrent - Kickass Torrents
5 pages
2022_Multi-Task Learning for Dense Prediction Tasks - A Survey_Vandenhende et al_IEEE Transactions on Pattern Analysis and Machine Intelligence
No ratings yet
2022_Multi-Task Learning for Dense Prediction Tasks - A Survey_Vandenhende et al_IEEE Transactions on Pattern Analysis and Machine Intelligence
20 pages
2019_End-To-End Multi-Task Learning With Attention_Liu et al_
No ratings yet
2019_End-To-End Multi-Task Learning With Attention_Liu et al_
10 pages
multi-task
No ratings yet
multi-task
11 pages
Cross-Stitch Networks For Multi-Task Learning
No ratings yet
Cross-Stitch Networks For Multi-Task Learning
10 pages
MmAP Multi-Modal Alignment Prompt For Cross-Domain Multi-Task Learning
No ratings yet
MmAP Multi-Modal Alignment Prompt For Cross-Domain Multi-Task Learning
9 pages
2022_MTFormer - Multi-task Learning via Transformer and Cross-Task Reasoning_Xu et al_Springer Nature Switzerland
No ratings yet
2022_MTFormer - Multi-task Learning via Transformer and Cross-Task Reasoning_Xu et al_Springer Nature Switzerland
18 pages
2021_Task Switching Network for Multi-Task Learning_Sun et al_
No ratings yet
2021_Task Switching Network for Multi-Task Learning_Sun et al_
10 pages
Misra et al. - 2016 - Cross-Stitch Networks for Multi-Task Learning
No ratings yet
Misra et al. - 2016 - Cross-Stitch Networks for Multi-Task Learning
10 pages
Multi Task Learning (MTL)
No ratings yet
Multi Task Learning (MTL)
15 pages
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
No ratings yet
Gradnorm: Gradient Normalization For Adaptive Loss Balancing in Deep Multitask Networks
12 pages
Cross Training
No ratings yet
Cross Training
11 pages
Multi-Task Learning On Mnist Image Datasets
No ratings yet
Multi-Task Learning On Mnist Image Datasets
4 pages
Newell Et Al - 2019 - Feature Partitioning For Efficient Multi-Task Architectures
No ratings yet
Newell Et Al - 2019 - Feature Partitioning For Efficient Multi-Task Architectures
10 pages
6 Transformers
No ratings yet
6 Transformers
77 pages
One Model To Learn Them All: Work Performed While at Google Brain
No ratings yet
One Model To Learn Them All: Work Performed While at Google Brain
10 pages
Research Notes
No ratings yet
Research Notes
9 pages
2020_Which Tasks Should Be Learned Together in Multi-task Learning_Standley et al_PMLR
No ratings yet
2020_Which Tasks Should Be Learned Together in Multi-task Learning_Standley et al_PMLR
13 pages
a survey of deep learning - from activations to transformers
No ratings yet
a survey of deep learning - from activations to transformers
12 pages
用于目标检测的视觉Transformer的训练策略
No ratings yet
用于目标检测的视觉Transformer的训练策略
9 pages
Master's Thesis Deep Learning For Visual Recognition: Remi Cadene Supervised by Nicolas Thome and Matthieu Cord
No ratings yet
Master's Thesis Deep Learning For Visual Recognition: Remi Cadene Supervised by Nicolas Thome and Matthieu Cord
58 pages
2021_Efficiently Identifying Task Groupings for Multi-Task Learning_Fifty et al_Curran Associates, Inc.
No ratings yet
2021_Efficiently Identifying Task Groupings for Multi-Task Learning_Fifty et al_Curran Associates, Inc.
14 pages
Adaptive Weight Assignment Scheme For Multi-Task Learning
No ratings yet
Adaptive Weight Assignment Scheme For Multi-Task Learning
6 pages
2021 NeurIPS VAAT Akbari, Yuan, Qian, Chuang, Chang, Cui, Gong
No ratings yet
2021 NeurIPS VAAT Akbari, Yuan, Qian, Chuang, Chang, Cui, Gong
16 pages
Yolor Based Multi Task Learning
No ratings yet
Yolor Based Multi Task Learning
17 pages
DL Unit-5
No ratings yet
DL Unit-5
7 pages
Lecture-28-TransformerIntroductionFinal-1
No ratings yet
Lecture-28-TransformerIntroductionFinal-1
69 pages
6 - Multi - Task - Learning
No ratings yet
6 - Multi - Task - Learning
1 page
Lecture 1a - Introduction
No ratings yet
Lecture 1a - Introduction
38 pages
Introduction to Deep Learning 17th January 2025 (2)
No ratings yet
Introduction to Deep Learning 17th January 2025 (2)
60 pages
ViT Explained
No ratings yet
ViT Explained
15 pages
paper2
No ratings yet
paper2
8 pages
Research on Learning Representations in Computer Vision
No ratings yet
Research on Learning Representations in Computer Vision
52 pages
Conditional Positional Encodings For Vision Transformers
No ratings yet
Conditional Positional Encodings For Vision Transformers
13 pages
Deep Learning in Matlab
No ratings yet
Deep Learning in Matlab
36 pages
Computer Vision 11 Transformers
No ratings yet
Computer Vision 11 Transformers
63 pages
Lec25 Architectures
No ratings yet
Lec25 Architectures
52 pages
Daily Dose of Data Science Full Archive
No ratings yet
Daily Dose of Data Science Full Archive
53 pages
05 CNN 2
No ratings yet
05 CNN 2
92 pages
Atelier2
No ratings yet
Atelier2
2 pages
A Simple Single-Scale Vision Transformer For Object Localization
No ratings yet
A Simple Single-Scale Vision Transformer For Object Localization
12 pages
Rec03 - Deep Architectures
No ratings yet
Rec03 - Deep Architectures
65 pages
A Simple Single-Scale Vision Transformer For Object Detection and Instance Segmentation
No ratings yet
A Simple Single-Scale Vision Transformer For Object Detection and Instance Segmentation
23 pages
Table of Content: (Page Numbers in PDF File)
No ratings yet
Table of Content: (Page Numbers in PDF File)
223 pages
Deep LearningINAF With MATLAB
No ratings yet
Deep LearningINAF With MATLAB
80 pages
anlp-05-transformers
No ratings yet
anlp-05-transformers
40 pages
Chen An Empirical Study of Training Self-Supervised Vision Transformers ICCV 2021 Paper
No ratings yet
Chen An Empirical Study of Training Self-Supervised Vision Transformers ICCV 2021 Paper
10 pages
Project Presentation
No ratings yet
Project Presentation
20 pages
UCS_401_Unit-LV_ Trends in Machine Learning_Model and Symbols- Bagging and Boosting, Multitask
No ratings yet
UCS_401_Unit-LV_ Trends in Machine Learning_Model and Symbols- Bagging and Boosting, Multitask
44 pages
Efﬁcient Training of Visual Transformers with Small Datasets_Liu et al_
No ratings yet
Efﬁcient Training of Visual Transformers with Small Datasets_Liu et al_
13 pages
paper3
No ratings yet
paper3
7 pages
Data Science Guide
No ratings yet
Data Science Guide
275 pages
XXXBetter Plain ViT Baselines for ImageNet-1k
No ratings yet
XXXBetter Plain ViT Baselines for ImageNet-1k
3 pages
Vision Transformer Adapter For Dense Predictions
No ratings yet
Vision Transformer Adapter For Dense Predictions
20 pages
CV Ss16 0609 Deep Learning
No ratings yet
CV Ss16 0609 Deep Learning
91 pages
(DownSub - Com) Stanford CS230 - Deep Learning - Autumn 2018 - Lecture 4 - Adversarial Attacks - GANs
No ratings yet
(DownSub - Com) Stanford CS230 - Deep Learning - Autumn 2018 - Lecture 4 - Adversarial Attacks - GANs
21 pages
2024_GvT_Shan_chen_arXiv
No ratings yet
2024_GvT_Shan_chen_arXiv
9 pages
Multimae: Multi-Modal Multi-Task Masked Autoencoders
No ratings yet
Multimae: Multi-Modal Multi-Task Masked Autoencoders
21 pages
2018_Multi-Task Learning as Multi-Objective Optimization_Sener_Koltun_Advances in Neural Information Processing Systems
No ratings yet
2018_Multi-Task Learning as Multi-Objective Optimization_Sener_Koltun_Advances in Neural Information Processing Systems
12 pages
[Fall 2024] Deep Learning 3
No ratings yet
[Fall 2024] Deep Learning 3
54 pages
AI for Everyone: An Intermediate Guide to Artificial Intelligence
From Everand
AI for Everyone: An Intermediate Guide to Artificial Intelligence
Nova Clarke
No ratings yet
Proakd Transfagarasan v0.8 & v1.2 Traffic Simulation Mod
No ratings yet
Proakd Transfagarasan v0.8 & v1.2 Traffic Simulation Mod
5 pages
Trendline Break With Super Ichimoku Cloud
No ratings yet
Trendline Break With Super Ichimoku Cloud
6 pages
5.ROOT LOCUS Full Chapter)
No ratings yet
5.ROOT LOCUS Full Chapter)
99 pages
Max 800
No ratings yet
Max 800
4 pages
Bca Syallabus i & II Sem (1)
No ratings yet
Bca Syallabus i & II Sem (1)
18 pages
Unit-4 IoT Student Copy
No ratings yet
Unit-4 IoT Student Copy
46 pages
Indian Bank-Recruitment of Specialist Officers
No ratings yet
Indian Bank-Recruitment of Specialist Officers
2 pages
BA 2 Course Handout - E
No ratings yet
BA 2 Course Handout - E
4 pages
MACHINE LEARNING FOUNDATIONS and APPLICATIONS
No ratings yet
MACHINE LEARNING FOUNDATIONS and APPLICATIONS
6 pages
My Resume 2024 IT PDF-compressed
No ratings yet
My Resume 2024 IT PDF-compressed
1 page
resume
No ratings yet
resume
3 pages
MAD V2V NOTES
No ratings yet
MAD V2V NOTES
41 pages
Di B'rite Elevator: Installation Manual
No ratings yet
Di B'rite Elevator: Installation Manual
26 pages
42-51CFDMLReview Updated1 (1)
No ratings yet
42-51CFDMLReview Updated1 (1)
11 pages
SSD Reporting New
No ratings yet
SSD Reporting New
21 pages
Unlock ChatGPT 150 Visual eBook
No ratings yet
Unlock ChatGPT 150 Visual eBook
12 pages
Vorlage Dissertation Tu Wien
100% (2)
Vorlage Dissertation Tu Wien
5 pages
Model Paper of Java 5002 by Shailendra Sir
No ratings yet
Model Paper of Java 5002 by Shailendra Sir
2 pages
Building An Augmented Reality Mobile Application Using React Native For E-Commerce
No ratings yet
Building An Augmented Reality Mobile Application Using React Native For E-Commerce
7 pages
Advanced Design and Analysis of Algorithms: Dr. Hajira Jabeen
No ratings yet
Advanced Design and Analysis of Algorithms: Dr. Hajira Jabeen
36 pages
Hardware-Implemented Lightweight Accelerator For Large Integer Polynomial Multiplication
No ratings yet
Hardware-Implemented Lightweight Accelerator For Large Integer Polynomial Multiplication
4 pages
Datum Technologies: D-30, 2 Floor, SECTOR 10, NOIDA - 201 301. Tel: +91-120-4545354 Website: WWW - Datumtech.in
No ratings yet
Datum Technologies: D-30, 2 Floor, SECTOR 10, NOIDA - 201 301. Tel: +91-120-4545354 Website: WWW - Datumtech.in
6 pages
SLG8SP510: Clock Synthesizer For Intel Mobile PCI-Express Chipset
No ratings yet
SLG8SP510: Clock Synthesizer For Intel Mobile PCI-Express Chipset
24 pages
Himanshu Sharma
No ratings yet
Himanshu Sharma
5 pages
Citrix External User Access Guide (002)
No ratings yet
Citrix External User Access Guide (002)
6 pages
Feature_Extraction_and_Selection_Techniques_for_Time_Series_Data_Classification_A_Comparative_Analysis
No ratings yet
Feature_Extraction_and_Selection_Techniques_for_Time_Series_Data_Classification_A_Comparative_Analysis
6 pages