0% found this document useful (0 votes)

7 views

Data Science Notes

The document outlines a 3-month learning plan for Data Science and Machine Learning, detailing weekly topics and resources such as Python, statistics, machine learning algorithms, and deep learning. It includes links to online courses and projects on platforms like EdX, Khan Academy, and Kaggle. Additionally, it emphasizes practical applications, feature engineering, and coding libraries in Python.

Uploaded by

Daniel Wu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views

Data Science Notes

Uploaded by

Daniel Wu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

Learn Data Science in 3 Months

6/24

Week 1 - Learn Python - EdX https://www.edx.org/course/introducti...

- Siraj Raval https://www.youtube.com/watch?v=T5pRl...

Week 2 - Statistics & Probability - KhanAcademy https://www.khanacademy.org/math/stat...

Week 3 - Data Pre-processing, Data Vis, Exploratory Data Analysis - EdX

https://www.edx.org/course/introducti...

Week 4 - Kaggle Project #1

Week 5-6 - Algorithms & Machine Learning - Columbia https://courses.edx.org/courses/cours...

Week 7 - Deep Learning - Part 1 and 2 of DL Book https://www.deeplearningbook.org/

- Siraj Raval https://www.youtube.com/watch?v=vOppz...

Week 8 - Kaggle Project #2 Week 9 - Databases (SQL + NoSQL) - Udacity

https://www.udacity.com/course/intro-...
- EdX https://www.edx.org/course/introducti...

Week 10 - Hadoop & Map Reduce + Spark - Udacity https://www.udacity.com/course/intro-...

- Spark Workshop https://stanford.edu/~rezab/sparkclas...

Week 11 - Data Storytelling - Edx https://www.edx.org/course/analytics-...

Week 12- Kaggle Project #3

Learn Machine Learning in 3 Months
第 1 个月

第一周线性代数 https://ocw.mit.edu/courses/mathemati...

第二周微积分 https://www.youtube.com/playlist?list...

第三周 https://www.edx.org/course/introducti...

第四周算法 https://www.coursera.org/courses?lang...

第 2 个月

第一周 learn python for data science https://www.youtube.com/watch?v=T5pRl...

Math of Intelligence https://www.youtube.com/watch?v=xRJCO...

Intro to Tensorflow https://www.youtube.com/watch?v=2FmcH...

第二周 Intro to ML (Udacity) https://eu.udacity.com/course/intro-t...

第三四周 ML Project Ideas https://github.com/NirantK/awesome-pr...

第 3 个月（深度学习）

第一周 Intro to Deep Learning https://www.youtube.com/watch?v=vOppz... 第二周 Deep Learning by

Fast.AI http://course.fast.ai/

第三四周按照我的 github 重新实现深度学习项目 https://github.com/llSourcell?tab=rep..

 Linear regression
 Logistic regression
 Random forest
 Gradient boosting
 PCA
 k-mean clustering
 k nearest neighbors
 Natural language processing (2 sessions)
 Exploratory data analysis
 Python web APIs
 Feature engineering (2 sessions)
 Object-oriented programming
 Forecasting
 Linear regression
 Logistic regression
 SVM
 Random forest
 Gradient boosting
 PCA
 k-means
 Collaborative filtering
 kNN
 ARIMA

Business use case -> Domain expertise

Data gathering from vary data source (balance vs. unbalance dataset)

Whether the data is in the right format cleansing, wrangling, exploring EDA and how to handle the
missing value, to better put into ML algorithm. (Feature Engineering -> also apply some stats knowledge
to check Mean, Median, Mode)

Feature selection (regression back elimination, p-value)

Modeling (ML, DL algorithm select 1. accuracy. 2. Confusion matrix. 3. Cross validation

Coding library
Python:
The Inplace parameter

The inplace parameter is commonly used with the following methods:

 dropna()

 drop_duplicates()

 fillna()

 query()

 rename()

 reset_index()

 sort_index()

 sort_values()

import itertools
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

import warnings
warnings.filterwarnings("ignore")

plt.style.use('fivethirtyeight')

import statsmodels.api as sm
import matplotlibmatplotlib.rcParams['axes.labelsize'] = 14
matplotlib.rcParams['xtick.labelsize'] = 12
matplotlib.rcParams['ytick.labelsize'] = 12
matplotlib.rcParams['text.color'] = 'k'

for p in p_values:

for d in d_values:

for q in q_values:

order = (p,d,q)

train, test = shampoo [0:25], shampoo[25:36]

prediction = list()

for i in range(len(test)):

try:

model = ARIMA(train, order)

model_fit = model.fit(disp=0)

pred_y = model_fit.forecast()[0]

predictions.append(pred_y)

error = mean_squared_error(test,predictions)

print('ARIMA%s MSE = %.2f'%(order,error))

except:

continue

Grade 8 Summative Test
No ratings yet
Grade 8 Summative Test
5 pages
Dhaapps Datascience With Gen AI-1
No ratings yet
Dhaapps Datascience With Gen AI-1
23 pages
Data Science Course in Hyderabad - Innomatics
No ratings yet
Data Science Course in Hyderabad - Innomatics
10 pages
Machine learning with pythone_syllabus
No ratings yet
Machine learning with pythone_syllabus
13 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
Data Science With Python-Sasmita PDF
67% (3)
Data Science With Python-Sasmita PDF
9 pages
APS1070 Lecture (3) Slides
No ratings yet
APS1070 Lecture (3) Slides
70 pages
Machine Learning Advanced
100% (2)
Machine Learning Advanced
12 pages
Road Map
No ratings yet
Road Map
3 pages
Data Science Content
No ratings yet
Data Science Content
11 pages
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
No ratings yet
Machine Learning, AI & Its Applications: Live Online Instructor-Led Training On
6 pages
ML Plan
No ratings yet
ML Plan
6 pages
Short Details of Business Analyst Course
No ratings yet
Short Details of Business Analyst Course
4 pages
AI-ML Syllabus
100% (1)
AI-ML Syllabus
8 pages
ML
No ratings yet
ML
8 pages
PGP-Data Science - Course Module With Internship Module
No ratings yet
PGP-Data Science - Course Module With Internship Module
16 pages
DL RoadMap
No ratings yet
DL RoadMap
9 pages
ML roadmap
No ratings yet
ML roadmap
7 pages
Data Science Deep Learning & Artificial Intelligence
No ratings yet
Data Science Deep Learning & Artificial Intelligence
9 pages
DS g4g
No ratings yet
DS g4g
7 pages
Core-Machine-Learning-Course-Modules.docx
No ratings yet
Core-Machine-Learning-Course-Modules.docx
14 pages
WIP - ML-22-DEC Weekend
No ratings yet
WIP - ML-22-DEC Weekend
40 pages
T3 Bda
No ratings yet
T3 Bda
27 pages
Machine Learning Course Content For Classroomdocx - 240504 - 163403
No ratings yet
Machine Learning Course Content For Classroomdocx - 240504 - 163403
6 pages
AI ML Course Content
No ratings yet
AI ML Course Content
3 pages
ML LAB
No ratings yet
ML LAB
23 pages
Data Science and Machine Learning With Python
No ratings yet
Data Science and Machine Learning With Python
11 pages
Machine Learning Mathematics in Python -- Jamie Flux -- 2024
No ratings yet
Machine Learning Mathematics in Python -- Jamie Flux -- 2024
238 pages
Ai - Introduction: FDP / Short Term Training On Artificial Intelligence & Deep Learning Applications
No ratings yet
Ai - Introduction: FDP / Short Term Training On Artificial Intelligence & Deep Learning Applications
6 pages
Chapter 02 Overview - 4
No ratings yet
Chapter 02 Overview - 4
43 pages
Index: Name - JINESH PRAJAPAT Class - B. Tech, III Year Branch - AI & DS Sem - V
No ratings yet
Index: Name - JINESH PRAJAPAT Class - B. Tech, III Year Branch - AI & DS Sem - V
35 pages
Data Science Roadmap
No ratings yet
Data Science Roadmap
4 pages
Course Contents: Study Group - 1 (Concept Focused)
No ratings yet
Course Contents: Study Group - 1 (Concept Focused)
9 pages
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
No ratings yet
AnalytixLabs - Data Science & Machine Learning With Python-1601625377114-1
16 pages
Course Code Course Title Course Planner: Through This Course Students Should Be Able To
No ratings yet
Course Code Course Title Course Planner: Through This Course Students Should Be Able To
4 pages
Deep Learning
No ratings yet
Deep Learning
25 pages
Machine Learning & Deep Learning Prodegree
No ratings yet
Machine Learning & Deep Learning Prodegree
6 pages
LN ML Rug
No ratings yet
LN ML Rug
283 pages
Syllabus - Introduction To Machine Learning
No ratings yet
Syllabus - Introduction To Machine Learning
3 pages
ML RECORD - Merged
No ratings yet
ML RECORD - Merged
33 pages
Data Science Skills Part 2
No ratings yet
Data Science Skills Part 2
1 page
ml_syllabus
No ratings yet
ml_syllabus
10 pages
Data Science For Starters - Course Outline
No ratings yet
Data Science For Starters - Course Outline
3 pages
d2l en
No ratings yet
d2l en
981 pages
d2l en PDF
No ratings yet
d2l en PDF
995 pages
PGPAIML Curriculum Overview
No ratings yet
PGPAIML Curriculum Overview
15 pages
0bcd05c31fafcaea376ca1edacfa7eb9
No ratings yet
0bcd05c31fafcaea376ca1edacfa7eb9
6 pages
221421601049 - MLA Lab Record [2024]
No ratings yet
221421601049 - MLA Lab Record [2024]
47 pages
AIML Curriculum
No ratings yet
AIML Curriculum
25 pages
Data+Analytics+Detailed+Syllabus
No ratings yet
Data+Analytics+Detailed+Syllabus
26 pages
Data Science Master
No ratings yet
Data Science Master
11 pages
1) Introduction To Numpy, Pandas and Matplotlib
No ratings yet
1) Introduction To Numpy, Pandas and Matplotlib
11 pages
Untitled Notebook
No ratings yet
Untitled Notebook
19 pages
26 Ads Expt9
No ratings yet
26 Ads Expt9
7 pages
Artificial Intelligence (1 Day)
No ratings yet
Artificial Intelligence (1 Day)
3 pages
Data Science and Machine Learning With Python (New Module)
No ratings yet
Data Science and Machine Learning With Python (New Module)
16 pages
Data Science & AIML Coursework
No ratings yet
Data Science & AIML Coursework
10 pages
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
No ratings yet
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
10 pages
Reflective Journal Writing 6_1733814927 (1)
No ratings yet
Reflective Journal Writing 6_1733814927 (1)
4 pages
d2l en PDF
No ratings yet
d2l en PDF
996 pages
Data Science Course Syllabus 01
100% (1)
Data Science Course Syllabus 01
20 pages
Effective data-driven campaigning for credit cards target, attract, retain and engage
No ratings yet
Effective data-driven campaigning for credit cards target, attract, retain and engage
7 pages
Python Code Library
No ratings yet
Python Code Library
8 pages
Data Science Product Questions
No ratings yet
Data Science Product Questions
92 pages
Git Editor Change
No ratings yet
Git Editor Change
1 page
Manulife-Wellness-account-List-of-expenses
No ratings yet
Manulife-Wellness-account-List-of-expenses
1 page
Near_real_time_fraud_detection_with_Apac
No ratings yet
Near_real_time_fraud_detection_with_Apac
87 pages
数据科学 Sharon
No ratings yet
数据科学 Sharon
22 pages
Strata Stratch SQL Question - Hard
No ratings yet
Strata Stratch SQL Question - Hard
9 pages
The Liberation of Emilia
No ratings yet
The Liberation of Emilia
6 pages
Latin Influence on the English Language
No ratings yet
Latin Influence on the English Language
2 pages
Ai Li Industrial Company LTD Hoja de Preparacion
No ratings yet
Ai Li Industrial Company LTD Hoja de Preparacion
1 page
Project ME Systems
No ratings yet
Project ME Systems
6 pages
10 - Chapter 3 PDF
No ratings yet
10 - Chapter 3 PDF
34 pages
Two Sample Updated Test
No ratings yet
Two Sample Updated Test
35 pages
Test Bank for Introduction to Clinical Psychology 8/E 8th Edition Geoffrey P. Kramer, Douglas A. Bernstein, Vicky Phares - Download The Complete Set In PDF DOCX Format
100% (6)
Test Bank for Introduction to Clinical Psychology 8/E 8th Edition Geoffrey P. Kramer, Douglas A. Bernstein, Vicky Phares - Download The Complete Set In PDF DOCX Format
51 pages
APIS IQ-Software - Version 6.5: Date: 2014-07-18 Additional Mouse Pad Inserts Can Be Obtained From WWW - APIS.de
No ratings yet
APIS IQ-Software - Version 6.5: Date: 2014-07-18 Additional Mouse Pad Inserts Can Be Obtained From WWW - APIS.de
1 page
History of The Development of Education in The Philippines (Pre-Spanish To The Present)
No ratings yet
History of The Development of Education in The Philippines (Pre-Spanish To The Present)
3 pages
Digital Negatives With Quadtone RIP, Step by Step
100% (3)
Digital Negatives With Quadtone RIP, Step by Step
22 pages
History: Alta Velocidad Española (AVE)
No ratings yet
History: Alta Velocidad Española (AVE)
32 pages
Professional Development Plan
No ratings yet
Professional Development Plan
3 pages
Tutorial 7-Bank Reconcilliation
No ratings yet
Tutorial 7-Bank Reconcilliation
2 pages
Invitation Exun 2022
No ratings yet
Invitation Exun 2022
1 page
Am2 To Sii 413
No ratings yet
Am2 To Sii 413
18 pages
Christina Zapatero Resume
No ratings yet
Christina Zapatero Resume
2 pages
Abominations Spreads
No ratings yet
Abominations Spreads
10 pages
Principles of Communication
No ratings yet
Principles of Communication
24 pages
(Ebook) Observational Astronomy: Techniques and Instrumentation by Edmund C. Sutton ISBN 9781107010468, 1107010462 all chapter instant download
100% (2)
(Ebook) Observational Astronomy: Techniques and Instrumentation by Edmund C. Sutton ISBN 9781107010468, 1107010462 all chapter instant download
67 pages
Anjan CV
No ratings yet
Anjan CV
7 pages
Lecture 1 The Position of Grammar in The Structure of The Language
No ratings yet
Lecture 1 The Position of Grammar in The Structure of The Language
60 pages
MM Project - Team 2 - Section C - Pottery Barn
No ratings yet
MM Project - Team 2 - Section C - Pottery Barn
16 pages
PEOPLE VS JALOSJOS, G.R. No. 132875-76
No ratings yet
PEOPLE VS JALOSJOS, G.R. No. 132875-76
7 pages
Da Hood Script
0% (1)
Da Hood Script
3 pages
Cooltec EQP-1 Program Equalizer Plug-In Suite - User Guide v0.2
No ratings yet
Cooltec EQP-1 Program Equalizer Plug-In Suite - User Guide v0.2
17 pages
OOP - Lab Task-5 - Methods - UML To JAVA Code
No ratings yet
OOP - Lab Task-5 - Methods - UML To JAVA Code
3 pages
Covid Threatens Female Airline Pilots
No ratings yet
Covid Threatens Female Airline Pilots
6 pages
Foundations of Education
100% (1)
Foundations of Education
29 pages
Anh 6 Kim Hien Key Kì 2
No ratings yet
Anh 6 Kim Hien Key Kì 2
18 pages