0% found this document useful (0 votes)

8 views

Debugging

This document contains code for training a siamese neural network model for audio-visual matching. It loads audio and image embeddings, creates training/test/validation datasets, defines the siamese network architecture, trains the model using triplet loss, and evaluates the trained model on a validation set.

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views

Debugging

Uploaded by

heat mass

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 9

# %%

from classes import *

from functions import *
import pickle
import pandas as pd
import numpy as np
import os
from sklearn.model_selection import train_test_split
import random
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt

# %%
from unidecode import unidecode

# %%
audio_files = os.listdir('datasets/audio')

with open('datasets/audio_embeddings.pickle', 'rb') as file:

audio_embeddings = pickle.load(file)

audio_names = [key.split('/')[0] for key in audio_embeddings.keys()]

audio_df = pd.DataFrame([{'name': key.split('/')[0], 'audio_embedding': value} for

key, value in audio_embeddings.items()])

audio_df['name'] = audio_df['name'].apply(unidecode)

audio_df['audio_embedding'] = audio_df['audio_embedding'].apply(lambda x:
x/np.linalg.norm(x))

# %%
with open('datasets/image_embeddings.pickle', 'rb') as file:
image_embeddings = pickle.load(file)

image_df = pd.DataFrame([{'name': key.split('/')[0], 'image_embedding': value} for

key, value in image_embeddings.items()])

image_df['name'] = image_df['name'].apply(unidecode)

# %%
matches_df = pd.merge(image_df, audio_df, on='name', how='outer')

matches_df.columns = ['name', 'anchor', 'positive']

# %%
coincidences = 0
negatives = []
for i, row in matches_df.iterrows():
while True:
sample = matches_df.sample(n=1)
sample.reset_index(inplace=True, drop=True)
if sample['name'][0] != row['name']:
negatives.append(sample['positive'][0])
break
else:
coincidences += 1

matches_df['negative'] = negatives

# %%
train_set, test_set , _, _2 = train_test_split(matches_df, matches_df['name'],
test_size=0.2)
test_set, validation_set, _, _2 = train_test_split(test_set, test_set['name'],
test_size=0.5)

# %%

# %% [markdown]
# ### Siamese Network Model With Triplet Loss Training

# %%
siamese_model = SiameseNetwork([512, 192], [[256, 512, 256], [256, 512, 256]], 256)

# %%
training_triplet_dataset = TripletDataset(train_set)
testing_triplet_dataset = TripletDataset(test_set)
validation_triplet_dataset = TripletDataset(validation_set)

# %%
train_triplet_dataloader = DataLoader(training_triplet_dataset, batch_size=32,
shuffle=True)
test_triplet_dataloader = DataLoader(testing_triplet_dataset, batch_size=32,
shuffle=True)
validation_triplet_dataloader = DataLoader(validation_triplet_dataset,
batch_size=32, shuffle=True)

# %% [markdown]
# ##### Training with Early Stopping

# %%
optimizer = optim.SGD(siamese_model.parameters(), lr=0.1)
# optimizer = optim.Adam(siamese_model.parameters(), lr=0.001)
epochs = 150

# %%
training_losses = []
testing_losses = []
early_stopping_indicators = 0
for epoch in range(epochs):

total_loss = 0.0
total_testing_loss = 0.0
training_batches = 0
testing_batches = 0
for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
training_batches += 1
optimizer.zero_grad()
loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
loss.backward()
optimizer.step()
total_loss += loss.item()

# validation_losses.append(validation_loss)

for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

testing_batches += 1
testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
total_testing_loss += testing_loss.item()

total_training_loss_per_batch = total_loss/training_batches
training_losses.append(total_training_loss_per_batch)
total_testing_loss_per_batch = total_testing_loss/testing_batches
testing_losses.append(total_testing_loss_per_batch)
print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
if (epoch > 20) and (np.mean(testing_losses[-20:-10] < np.mean(testing_losses[-
10:]))):
print('Early stopping')
break

# %% [markdown]
# ##### A little extra training

# %%
# for epoch in range(epochs):
# for epoch in range(50, 100):
# total_loss = 0.0
# total_testing_loss = 0.0
# training_batches = 0
# testing_batches = 0
# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
# training_batches += 1
# optimizer.zero_grad()
# loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
# loss.backward()
# optimizer.step()
# total_loss += loss.item()

# # validation_losses.append(validation_loss)

# for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

# testing_batches += 1
# testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
# total_testing_loss += testing_loss.item()

# total_training_loss_per_batch = total_loss/training_batches
# training_losses.append(total_training_loss_per_batch)
# total_testing_loss_per_batch = total_testing_loss/testing_batches
# testing_losses.append(total_testing_loss_per_batch)
# print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
# if (epoch > 20) and (np.mean(testing_losses[-20:-10] <
np.mean(testing_losses[-10:]))):
# print('Early stopping')
# break

# # %%

# %%

epoch_list = [i+1 for i in range(epoch + 1)]

# %%
plt.plot(epoch_list, training_losses, label='Training Loss')
plt.plot(epoch_list, testing_losses, label='Testing Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()

ia = identification_accuracy(siamese_model, validation_triplet_dataloader)
# %%
print()
# %% [markdown]
# ### 1:2 Identification Accuracy

# %%
# i = 0
# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:

# ab = anchor_batch
# break

# %%
# ab

# %%
# siamese_model(anchor_batch, )

# # %%

# # %% [markdown]
# # ### Building A Classifier On Top Of The Siamese Network

# # %%
# class SimpleBinaryClassifier(nn.Module):
# def __init__(self):
# super(BinaryClassifier, self).__init__()
# self.fc = nn.Linear(1, 1) # Input size and output size are both 1 for a
single number input

# def forward(self, x):

# x = self.fc(x)
# return x

# # %%
# binary_classifier = SimpleBinaryClassifier(input_size=256, hidden_size=64)

# # %%
# optimizer = optim.Adam(binary_classifier.parameters(), lr=0.001)

# # %%
# criterion = nn.BCEWithLogitsLoss()

# # %%

# # %%
# # %%

# # %%

# # %%
# # %%

# # %%

# # %%
# # freezing the trained siamese model
# for param in siamese_model.parameters():
# param.requires_grad = False

# # %%
# binary_classifier = SiameseBinaryClassifier(siamese_model)

# # %%
# total_params = sum([param.numel() for param in binary_classifier.parameters()])

# # %%
# total_params

# # %%
# trainable_params = sum([param.numel() for param in binary_classifier.parameters()
if param.requires_grad])

# # %%
# trainable_params

# # %% [markdown]
# # ### Training The Classifier

# # %%
# optimizer = optim.Adam(binary_classifier.parameters(), lr=0.001)
# criterion = nn.BCEWithLogitsLoss()
# epochs = 50

# # %%

# for epoch in range(epochs):

# total_loss = 0.0
# total_correct = 0
# total_samples = 0

# for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:

# optimizer.zero_grad()

# # anchor_positive_pairs = torch.cat((anchor_batch, positive_batch),

dim=0)
# # anchor_negative_pairs = torch.cat((anchor_batch, negative_batch),
dim=0)
# # positive_outputs = siamese_model(anchor_batch, positive_batch)
# # negative_outputs = siamese_model(anchor_batch, negative_batch)
# # outputs = torch.cat((positive_outputs, negative_outputs), dim=0)
# # outputs = outputs.detach()
# # positive_labels = torch.ones(anchor_batch.size(0), 1)
# # negative_labels = torch.zeros(anchor_batch.size(0), 1)
# # labels = torch.cat((positive_labels, negative_labels), dim=0)
# anchor_positive_outputs = siamese_model(anchor_batch, positive_batch)

# # Forward pass for anchor and negative pairs

# anchor_negative_outputs = siamese_model(anchor_batch, negative_batch)

# # Combine outputs
# inputs = torch.cat((anchor_positive_outputs, anchor_negative_outputs),
dim=0)

# # Create labels
# positive_labels = torch.ones(anchor_batch.size(0), 1) # Labels for
positive pairs
# negative_labels = torch.zeros(anchor_batch.size(0), 1) # Labels for
negative pairs
# labels = torch.cat((positive_labels, negative_labels), dim=0)

# # Detach anchor-positive and anchor-negative outputs

# anchor_positive_outputs_detached = anchor_positive_outputs.detach()
# anchor_negative_outputs_detached = anchor_negative_outputs.detach()

# # Combine detached outputs

# outputs = torch.cat((anchor_positive_outputs_detached,
anchor_negative_outputs_detached), dim=0)

# # Compute loss
# loss = criterion(outputs.squeeze(), labels.squeeze())
# # loss = criterion(outputs.squeeze(), labels.squeeze())
# loss.backward()

# optimizer.step()

# total_loss += loss.item()

# predicted_labels = (outputs > 0.5).float()

# total_correct += (predicted_labels == labels).sum().item()
# total_samples += labels.size(0)

# print(f"Epoch [{epoch+1}/{epochs}], Loss: {total_loss /

len(train_triplet_dataloader)}, Accuracy: {total_correct / total_samples}")

# # %%

LSTM From Scratch in Python
No ratings yet
LSTM From Scratch in Python
11 pages
Siamese Network Assignment
No ratings yet
Siamese Network Assignment
3 pages
bldd_VIT_ResNet50v2_CustomCNN
No ratings yet
bldd_VIT_ResNet50v2_CustomCNN
38 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
No ratings yet
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
8 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
Train Py
No ratings yet
Train Py
4 pages
mlp-fromscratch__sigmoid-mse
No ratings yet
mlp-fromscratch__sigmoid-mse
13 pages
Nibedita Dehury^J 123CE0079^J ASSIGNMENT 8
No ratings yet
Nibedita Dehury^J 123CE0079^J ASSIGNMENT 8
20 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Mlp Pytorch Sigmoid Mse
No ratings yet
Mlp Pytorch Sigmoid Mse
20 pages
SC Lab File Fayiz PDF
No ratings yet
SC Lab File Fayiz PDF
29 pages
Lab Manual DL (New)
No ratings yet
Lab Manual DL (New)
89 pages
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
No ratings yet
Autoencoder - MPL - Basic - Ipynb - Colaboratory PDF
21 pages
Null 0
No ratings yet
Null 0
6 pages
C2 W2ok
No ratings yet
C2 W2ok
109 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
5 pages
Adaline Sgd
No ratings yet
Adaline Sgd
4 pages
Mlp Pytorch Softmax Crossentr
No ratings yet
Mlp Pytorch Softmax Crossentr
20 pages
新建文本文档
No ratings yet
新建文本文档
6 pages
Kolmogorov-Arnold-Networks in Python
No ratings yet
Kolmogorov-Arnold-Networks in Python
8 pages
Fibercablelength Understanding
No ratings yet
Fibercablelength Understanding
5 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
Notebook - Deep Neural Networks
No ratings yet
Notebook - Deep Neural Networks
28 pages
keras
No ratings yet
keras
4 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
AI Medical Diagnosis Week 02
No ratings yet
AI Medical Diagnosis Week 02
3 pages
Effects of Batches - Jupyter Notebook
No ratings yet
Effects of Batches - Jupyter Notebook
73 pages
Ex 1 D
No ratings yet
Ex 1 D
2 pages
Linear Regr Gd
No ratings yet
Linear Regr Gd
3 pages
Dl 5 Excuted
No ratings yet
Dl 5 Excuted
13 pages
Bert
No ratings yet
Bert
2 pages
deeplg3
No ratings yet
deeplg3
8 pages
EncoderDecoderSeq2Seq DeepLSTM
No ratings yet
EncoderDecoderSeq2Seq DeepLSTM
7 pages
train
No ratings yet
train
13 pages
Big Data Assignment - 7
No ratings yet
Big Data Assignment - 7
7 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Deep Learning Assignments
No ratings yet
Deep Learning Assignments
6 pages
Training Code
No ratings yet
Training Code
27 pages
PINN_1DBurgers
No ratings yet
PINN_1DBurgers
19 pages
IBest_DeepLearning
No ratings yet
IBest_DeepLearning
123 pages
logistic-regression
No ratings yet
logistic-regression
4 pages
Experiment 2.4 DL
No ratings yet
Experiment 2.4 DL
4 pages
C1 W1 Lab 3 Siamese-Network
No ratings yet
C1 W1 Lab 3 Siamese-Network
13 pages
lab-report-03
No ratings yet
lab-report-03
14 pages
Deep Learning With PyTorch 1
No ratings yet
Deep Learning With PyTorch 1
1 page
Recurrent Neural Networks: Pytorch
No ratings yet
Recurrent Neural Networks: Pytorch
6 pages
PyTorch Made Easy A Quick Overview
No ratings yet
PyTorch Made Easy A Quick Overview
55 pages
dl lab_merged (2)
No ratings yet
dl lab_merged (2)
60 pages
Assignment 1: Q1. Task Description
No ratings yet
Assignment 1: Q1. Task Description
12 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
Intro To Pytorch
No ratings yet
Intro To Pytorch
12 pages
Code
No ratings yet
Code
4 pages
Softmax Regression Scratch
No ratings yet
Softmax Regression Scratch
5 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
Chinese Character Recognition BN
No ratings yet
Chinese Character Recognition BN
7 pages
Assignment Ai Paltforms Mostafa Hazem
No ratings yet
Assignment Ai Paltforms Mostafa Hazem
5 pages
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Geographic Information System - ArcGIS 10.3
20% (5)
Geographic Information System - ArcGIS 10.3
4 pages
Applied Calculus - Exercises
No ratings yet
Applied Calculus - Exercises
2 pages
Key System Log
No ratings yet
Key System Log
12 pages
Weigh-In-Motion Technology
100% (1)
Weigh-In-Motion Technology
50 pages
Обод
No ratings yet
Обод
52 pages
Mod Menu Log - Abandoned - City.survival
No ratings yet
Mod Menu Log - Abandoned - City.survival
8 pages
CSC 2105: D S I: ATA Tructure Ntroduction
No ratings yet
CSC 2105: D S I: ATA Tructure Ntroduction
22 pages
Mputer Engineering - Semester 4 - 2023 - December - Database Management Systemrev 2019 C Scheme
No ratings yet
Mputer Engineering - Semester 4 - 2023 - December - Database Management Systemrev 2019 C Scheme
2 pages
Enhancing Deep Learning Models With Neurosymbolic Reasoning For Explainable AI
No ratings yet
Enhancing Deep Learning Models With Neurosymbolic Reasoning For Explainable AI
2 pages
Sri Chaitanya Techno School: Computer Science
No ratings yet
Sri Chaitanya Techno School: Computer Science
37 pages
Free CV Template Layout
100% (1)
Free CV Template Layout
6 pages
Building Vector Databases With FastAPI and ChromaDB - by Om Kamath - May, 2024 - Level Up Coding
No ratings yet
Building Vector Databases With FastAPI and ChromaDB - by Om Kamath - May, 2024 - Level Up Coding
25 pages
RHCSA Exam Prep - RHEL9-1
No ratings yet
RHCSA Exam Prep - RHEL9-1
4 pages
Use of E-Learning in Uttarakhand School Education System: Case Study of Open Source E-Learning Tools For Fundamental Mathematics and Sciences
No ratings yet
Use of E-Learning in Uttarakhand School Education System: Case Study of Open Source E-Learning Tools For Fundamental Mathematics and Sciences
4 pages
Ipplan Installation and Configuration Guideline Centos 6
No ratings yet
Ipplan Installation and Configuration Guideline Centos 6
19 pages
Communication Satellites in Computer Networks PDF
No ratings yet
Communication Satellites in Computer Networks PDF
2 pages
Vital Area Identification Approach
No ratings yet
Vital Area Identification Approach
20 pages
Pc-Arrears-Pb1and2 PAY COMMISSION CALCULATOR
100% (14)
Pc-Arrears-Pb1and2 PAY COMMISSION CALCULATOR
4 pages
CMA Unit 4 Canvas (Complete)
No ratings yet
CMA Unit 4 Canvas (Complete)
43 pages
Stephen Beutel Resume
No ratings yet
Stephen Beutel Resume
2 pages
IOT Based Automatic Vehicle Accident Alert System: October 2020
No ratings yet
IOT Based Automatic Vehicle Accident Alert System: October 2020
5 pages
Mark Scheme (Results) June 2011: International GCSE
No ratings yet
Mark Scheme (Results) June 2011: International GCSE
24 pages
CN Unit-5 Notes
No ratings yet
CN Unit-5 Notes
73 pages
BeyondInsight and Password Safe API Guide
No ratings yet
BeyondInsight and Password Safe API Guide
140 pages
Financial Controller
No ratings yet
Financial Controller
2 pages
An Introduction To GoldSrc Programming - Setting Up Visual Studio
No ratings yet
An Introduction To GoldSrc Programming - Setting Up Visual Studio
12 pages
An Introduction To Python For Scientific Computing: © 2019 M. Scott Shell Last Modified 9/24/2019
No ratings yet
An Introduction To Python For Scientific Computing: © 2019 M. Scott Shell Last Modified 9/24/2019
62 pages
PostgreSQL Terminal Commands Windows
No ratings yet
PostgreSQL Terminal Commands Windows
2 pages
Bank Copy Candidate
No ratings yet
Bank Copy Candidate
1 page
Ahmed Mustafa Resume
No ratings yet
Ahmed Mustafa Resume
1 page