0% found this document useful (0 votes)

5 views5 pages

Data Science & Python Session GTBIT

The document outlines a 5-day Data Science and Python workshop scheduled from June 30 to July 4, 2025, covering topics such as Python fundamentals, data cleaning, machine learning algorithms, and real-world ML pipelines. Participants will use tools like Google Colab and GitHub, with the goal of building and pushing a complete ML project by the end of the workshop. Each day includes hands-on activities, deliverables, and opportunities for Q&A and career guidance.

Uploaded by

keshavkumar88630

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views5 pages

Data Science & Python Session GTBIT

Uploaded by

keshavkumar88630

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

Data Science and Python Session

Date Time Topic

Mon, 30 11:00 AM – 1:00 PM Python for Data Science – The Groundwork

June

Tue, 1 July 11:00 AM – 1:00 PM Data Cleaning, Wrangling & Visualization

Wed, 2 July 11:00 AM – 1:00 PM Core Machine Learning Algorithms & Metrics

Thu, 3 July 11:00 AM – 1:00 PM Real-World ML Pipelines + GitHub + Project

Workflow

Fri, 4 July 11:00 AM – 1:00 PM Industry Skills, Career Tips & MDPI Paper Showcase

● Tools used: Google Colab, Pandas, Scikit-learn, Seaborn, GitHub

● Outcome: Students build and push a complete ML project to GitHub by Day 5

● Extras: GitHub starter repo, and open Q&A on internships & freelance tips

Detailed Schedule

📍 Date: 30 June – 4 July 2025

🕚 Time: 11:00 AM to 1:00 PM (2 hours daily)
🔵 Day 1: Python for Data Science – The Groundwork
🧭 Objective:
Equip students with Python fundamentals and introduce them to data structures and
basic libraries (NumPy, Pandas).
⏰ Agenda (11:00 AM – 1:00 PM)
Time Activity

11:00–11:10 Welcome, goals of the workshop, what to expect

11:10–11:40 Python basics (variables, loops, functions)

11:40–12:00 Intro to Jupyter/Colab & Python data structures

12:00–12:30 Numpy & Pandas overview: arrays, series,

dataframes

12:30–12:50 Hands-on: Load the Titanic dataset

12:50–1:00 Q&A + Assignment: Explore the dataset

independently

🎯 Deliverables:
● Colab notebook for Day 1

● Assignment to calculate survival stats using .groupby() and visual exploration

🟢 Day 2: Data Cleaning, Wrangling & Visualization

🧭 Objective:
Teach students to clean messy data and explore insights visually using Matplotlib and
Seaborn.

⏰ Agenda (11:00 AM – 1:00 PM)

Time Activity

11:00–11:20 Data cleaning: missing values, outliers, duplicates

11:20–11:50 Hands-on with Pandas (dropna(), fillna(),
filters)

11:50–12:30 Visualizations: Histograms, Boxplots, Pairplots

12:30–12:50 EDA mini-project: Visualize Titanic or new dataset

12:50–1:00 Q&A + GitHub intro + notebook submission

guidance

🎯 Deliverables:
● Colab notebook with 4 types of visualizations + short summary

● GitHub push of notebook (can be assisted live)

🔴 Day 3: Core ML Algorithms & Model Evaluation

🧭 Objective:
Introduce essential ML algorithms, training/testing logic, and model evaluation metrics.

⏰ Agenda (11:00 AM – 1:00 PM)

Time Activity

11:00–11:30 Overview of Machine Learning & real-life examples

11:30–12:10 Hands-on: Linear Regression (exam scores

prediction)

12:10–12:40 Hands-on: Logistic Regression (Titanic

classification)

12:40–12:50 Confusion Matrix, Accuracy, Precision, Recall

12:50–1:00 Assignment: Try KNN or Decision Tree on same

dataset
🎯 Deliverables:
● Notebook with two working models (regression + classification)

● Evaluation metrics output

● Homework: experiment with KNN or SVM

🟠 Day 4: Real-World ML Pipeline + GitHub Integration

🧭 Objective:
Demonstrate industry-style pipeline, preprocessing, hyperparameter tuning, and using
GitHub effectively.

⏰ Agenda (11:00 AM – 1:00 PM)

Time Activity

11:00–11:30 Preprocessing: Label Encoding, Scaling, Train-Test

Split

11:30–12:00 Using Pipelines in scikit-learn

12:00–12:30 GridSearchCV: tuning model hyperparameters

12:30–12:50 Live: Git basics + Pushing project notebook to

GitHub

12:50–1:00 Bonus Tips: How to present a project professionally

🎯 Deliverables:
● Full pipeline notebook on GitHub

● Template README.md for showcasing project

● PDF of evaluation metrics (optional)

🟣 Day 5: Industry Use-Cases + Research Showcase

🧭 Objective:
Highlight career paths, portfolio development, and showcase your research paper as
inspiration.

⏰ Agenda (11:00 AM – 1:00 PM)

Time Activity

11:00–11:30 Industry Use Cases: ML in Finance, Health, Retail,

Startups

11:30–11:50 How to build a DS career: Resume, GitHub, LinkedIn

11:50–12:20 Showcase your MDPI paper: simplified

12:20–12:40 Walkthrough of a model from your paper

(non-technical)

12:40–1:00 Open Q&A + Feedback

🎯 Deliverables:
● A GitHub repo containing all 5-day notebooks

● Career guidance doc

HAZAN Analysis Full Project Report
50% (2)
HAZAN Analysis Full Project Report
53 pages
Data Science Detailed Notes
No ratings yet
Data Science Detailed Notes
7 pages
Machine Learning Course Handbook - RMA
No ratings yet
Machine Learning Course Handbook - RMA
12 pages
Boot Camp OutLine
No ratings yet
Boot Camp OutLine
4 pages
Data Science Training Program Gynosis
No ratings yet
Data Science Training Program Gynosis
6 pages
Data Science
No ratings yet
Data Science
24 pages
Data Science Analytics Notes
No ratings yet
Data Science Analytics Notes
3 pages
Data Science Student Schedule
No ratings yet
Data Science Student Schedule
7 pages
Ai For IT Coders
No ratings yet
Ai For IT Coders
18 pages
Data - Science and AI Program - 21 Days
No ratings yet
Data - Science and AI Program - 21 Days
2 pages
Roadmap
No ratings yet
Roadmap
6 pages
ML Plan
No ratings yet
ML Plan
6 pages
Ai For IT Non Coders
No ratings yet
Ai For IT Non Coders
14 pages
Week 1: Python Basics: Class 1: Getting Started With Python
No ratings yet
Week 1: Python Basics: Class 1: Getting Started With Python
6 pages
8 Weeks Main ML Plan
No ratings yet
8 Weeks Main ML Plan
11 pages
AI PathShala Summer Training Program
No ratings yet
AI PathShala Summer Training Program
4 pages
Scaler Curriculum
No ratings yet
Scaler Curriculum
16 pages
Machine Learning Timetable
No ratings yet
Machine Learning Timetable
4 pages
Interview Preparation For Data Scientists
No ratings yet
Interview Preparation For Data Scientists
5 pages
The Complete Data Science Course
No ratings yet
The Complete Data Science Course
5 pages
Data Science For Starters - Course Outline
No ratings yet
Data Science For Starters - Course Outline
3 pages
Machine Learning Online Bootcamp Beginners Track Curriculum
No ratings yet
Machine Learning Online Bootcamp Beginners Track Curriculum
9 pages
Complete Chapter
No ratings yet
Complete Chapter
6 pages
Road Map
No ratings yet
Road Map
3 pages
Data Science Roadmap
No ratings yet
Data Science Roadmap
4 pages
MIT-PE ADSP Delivery Schedule 2023 - July'23
No ratings yet
MIT-PE ADSP Delivery Schedule 2023 - July'23
1 page
Internn
No ratings yet
Internn
9 pages
Action PlanJournaling
No ratings yet
Action PlanJournaling
7 pages
IEC Artificial Intelligence Syllabus
No ratings yet
IEC Artificial Intelligence Syllabus
8 pages
Applied Machine Learning, Deep Learning & NLP With Python
No ratings yet
Applied Machine Learning, Deep Learning & NLP With Python
4 pages
AI ML 5day Learning Plan
No ratings yet
AI ML 5day Learning Plan
3 pages
Data Science & Machine Learning 2024
No ratings yet
Data Science & Machine Learning 2024
2 pages
AI - ML Beginner-Friendly Resources For Cs
No ratings yet
AI - ML Beginner-Friendly Resources For Cs
9 pages
Data Science Roadmap From Beginner to Expert in a Structured Format
No ratings yet
Data Science Roadmap From Beginner to Expert in a Structured Format
4 pages
Data Science
No ratings yet
Data Science
16 pages
Ai & ML FDP
No ratings yet
Ai & ML FDP
7 pages
Ai - Introduction: FDP / Short Term Training On Artificial Intelligence & Deep Learning Applications
No ratings yet
Ai - Introduction: FDP / Short Term Training On Artificial Intelligence & Deep Learning Applications
6 pages
Course Content
No ratings yet
Course Content
72 pages
Weekend Schedule Weekday Schedule Topic Sub Topic
No ratings yet
Weekend Schedule Weekday Schedule Topic Sub Topic
1 page
Day Wise Agenda
No ratings yet
Day Wise Agenda
1 page
? Phase 1
No ratings yet
? Phase 1
3 pages
90 Days
No ratings yet
90 Days
2 pages
ML Engineer 12 Week Roadmap
No ratings yet
ML Engineer 12 Week Roadmap
12 pages
Data Science Detaiuls of Course
No ratings yet
Data Science Detaiuls of Course
5 pages
7-Day Intensive Machine Learning Roadmap
No ratings yet
7-Day Intensive Machine Learning Roadmap
5 pages
Data Science and Machine Learning
No ratings yet
Data Science and Machine Learning
2 pages
10000coders Data Science Curriculum
No ratings yet
10000coders Data Science Curriculum
16 pages
Road To ML Engineer
No ratings yet
Road To ML Engineer
4 pages
Syl3 ML
No ratings yet
Syl3 ML
5 pages
AI Roadmap
No ratings yet
AI Roadmap
45 pages
Syllabus - Introduction To Machine Learning
No ratings yet
Syllabus - Introduction To Machine Learning
3 pages
AIML Weekly Report
No ratings yet
AIML Weekly Report
5 pages
ML 5 Days
No ratings yet
ML 5 Days
7 pages
AI ML Training Outline (1)
No ratings yet
AI ML Training Outline (1)
2 pages
Dhaapps Datascience With Gen AI-1
No ratings yet
Dhaapps Datascience With Gen AI-1
23 pages
? Ultimate Data Science Topic List - (Beginner To ...
No ratings yet
? Ultimate Data Science Topic List - (Beginner To ...
4 pages
Machine Learning Roadmap
No ratings yet
Machine Learning Roadmap
4 pages
Data Science
No ratings yet
Data Science
16 pages
Artificial Intelligence & Machine Learning Curriculum Pregrad
No ratings yet
Artificial Intelligence & Machine Learning Curriculum Pregrad
12 pages
Data Science Masters 2.0 - PW Skills
No ratings yet
Data Science Masters 2.0 - PW Skills
15 pages
Hadoop Engineering
From Everand
Hadoop Engineering
Jaxon Vyas
No ratings yet
OLS Regression
No ratings yet
OLS Regression
24 pages
Business Intelligence Nep-1
No ratings yet
Business Intelligence Nep-1
21 pages
Peningkatan Hasil Klasifikasi Pada Algoritma Random Forest Untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi
No ratings yet
Peningkatan Hasil Klasifikasi Pada Algoritma Random Forest Untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi
9 pages
Univariate Analysis of Variance: Notes
No ratings yet
Univariate Analysis of Variance: Notes
4 pages
The Purpose of This Feasibility Study Is To Forecast The Sales of Renewable Stationary Generators Over The Next Three Years
No ratings yet
The Purpose of This Feasibility Study Is To Forecast The Sales of Renewable Stationary Generators Over The Next Three Years
2 pages
Data Science Road Map
No ratings yet
Data Science Road Map
47 pages
Mini Project
No ratings yet
Mini Project
46 pages
WEEK 7 - Two Sample Mean Test
No ratings yet
WEEK 7 - Two Sample Mean Test
26 pages
3 Lecture03
No ratings yet
3 Lecture03
30 pages
Working Capital Management and Profitability: Evidence From Indian Manufacturing Companies
No ratings yet
Working Capital Management and Profitability: Evidence From Indian Manufacturing Companies
14 pages
Abdulrafiu Aishat Omolara
No ratings yet
Abdulrafiu Aishat Omolara
65 pages
IEOR E4525 Logistics 2017
No ratings yet
IEOR E4525 Logistics 2017
3 pages
Unit III Iml Final
No ratings yet
Unit III Iml Final
36 pages
Research Proposal Sample 1
100% (1)
Research Proposal Sample 1
12 pages
Final UTS Report For Data Science Institute 2017-1-3
100% (3)
Final UTS Report For Data Science Institute 2017-1-3
39 pages
SPPU TE Question Papers Insem Endsem 2019-2023
No ratings yet
SPPU TE Question Papers Insem Endsem 2019-2023
1 page
Development of English Language Teaching PDF
No ratings yet
Development of English Language Teaching PDF
17 pages
(Ebook PDF) Business Statistics in Practice 3rd Canadian Editioninstant Download
100% (3)
(Ebook PDF) Business Statistics in Practice 3rd Canadian Editioninstant Download
44 pages
CQA Practical Manual 2018 - V5 PDF
No ratings yet
CQA Practical Manual 2018 - V5 PDF
30 pages
Stata Lecture2
No ratings yet
Stata Lecture2
134 pages
Advanced Regression Assignment
No ratings yet
Advanced Regression Assignment
5 pages
BAD601 Module 1 PDF
No ratings yet
BAD601 Module 1 PDF
64 pages
Sudhir Kumar Ranwa OPS CV
No ratings yet
Sudhir Kumar Ranwa OPS CV
1 page
Chapter 1 and 2 - v2
No ratings yet
Chapter 1 and 2 - v2
9 pages
3382-Article Text-13892-1-10-20230731
No ratings yet
3382-Article Text-13892-1-10-20230731
24 pages
1499153291Module11Q1Univariateanalysis PDF
No ratings yet
1499153291Module11Q1Univariateanalysis PDF
11 pages
A Project Report ON: Consumer Protection Act
No ratings yet
A Project Report ON: Consumer Protection Act
6 pages
Glossaryof Research Termsby Abdullah Noori
No ratings yet
Glossaryof Research Termsby Abdullah Noori
56 pages
Day 1 - Part I - 18EPG304 Research Methodology 2.0 - DSU - RVMREDDY
No ratings yet
Day 1 - Part I - 18EPG304 Research Methodology 2.0 - DSU - RVMREDDY
73 pages

Data Science & Python Session GTBIT

Uploaded by

Data Science & Python Session GTBIT

Uploaded by

Data Science and Python Session

Date Time Topic

Mon, 30 11:00 AM – 1:00 PM Python for Data Science – The Groundwork

Tue, 1 July 11:00 AM – 1:00 PM Data Cleaning, Wrangling & Visualization

Thu, 3 July 11:00 AM – 1:00 PM Real-World ML Pipelines + GitHub + Project

●​ Tools used: Google Colab, Pandas, Scikit-learn, Seaborn, GitHub​

●​ Outcome: Students build and push a complete ML project to GitHub by Day 5​

📍 Date: 30 June – 4 July 2025​

11:00–11:10 Welcome, goals of the workshop, what to expect

11:10–11:40 Python basics (variables, loops, functions)

11:40–12:00 Intro to Jupyter/Colab & Python data structures

12:00–12:30 Numpy & Pandas overview: arrays, series,

12:30–12:50 Hands-on: Load the Titanic dataset

12:50–1:00 Q&A + Assignment: Explore the dataset

●​ Assignment to calculate survival stats using .groupby() and visual exploration​

🟢 Day 2: Data Cleaning, Wrangling & Visualization

⏰ Agenda (11:00 AM – 1:00 PM)

11:00–11:20 Data cleaning: missing values, outliers, duplicates

11:50–12:30 Visualizations: Histograms, Boxplots, Pairplots

12:30–12:50 EDA mini-project: Visualize Titanic or new dataset

12:50–1:00 Q&A + GitHub intro + notebook submission

●​ GitHub push of notebook (can be assisted live)​

🔴 Day 3: Core ML Algorithms & Model Evaluation

⏰ Agenda (11:00 AM – 1:00 PM)

11:00–11:30 Overview of Machine Learning & real-life examples

11:30–12:10 Hands-on: Linear Regression (exam scores

12:10–12:40 Hands-on: Logistic Regression (Titanic

12:40–12:50 Confusion Matrix, Accuracy, Precision, Recall

12:50–1:00 Assignment: Try KNN or Decision Tree on same

●​ Evaluation metrics output​

●​ Homework: experiment with KNN or SVM​

🟠 Day 4: Real-World ML Pipeline + GitHub Integration

⏰ Agenda (11:00 AM – 1:00 PM)

11:00–11:30 Preprocessing: Label Encoding, Scaling, Train-Test

11:30–12:00 Using Pipelines in scikit-learn

12:00–12:30 GridSearchCV: tuning model hyperparameters

12:30–12:50 Live: Git basics + Pushing project notebook to

12:50–1:00 Bonus Tips: How to present a project professionally

●​ Template README.md for showcasing project​

🟣 Day 5: Industry Use-Cases + Research Showcase

⏰ Agenda (11:00 AM – 1:00 PM)

11:00–11:30 Industry Use Cases: ML in Finance, Health, Retail,

11:30–11:50 How to build a DS career: Resume, GitHub, LinkedIn

11:50–12:20 Showcase your MDPI paper: simplified

12:20–12:40 Walkthrough of a model from your paper

12:40–1:00 Open Q&A + Feedback

●​ Career guidance doc​

You might also like

● Tools used: Google Colab, Pandas, Scikit-learn, Seaborn, GitHub

● Outcome: Students build and push a complete ML project to GitHub by Day 5

📍 Date: 30 June – 4 July 2025

● Assignment to calculate survival stats using .groupby() and visual exploration

● GitHub push of notebook (can be assisted live)

● Evaluation metrics output

● Homework: experiment with KNN or SVM

● Template README.md for showcasing project

● Career guidance doc