0% found this document useful (0 votes)

4 views2 pages

Python Cheatsheet For Data Scientists

This document is a Python cheatsheet for data scientists, covering core Python syntax, NumPy, Pandas, Matplotlib, Seaborn, and Scikit-learn basics. It includes examples of data manipulation, visualization techniques, and machine learning model training. Additionally, it lists essential libraries for data handling, visualization, machine learning, and deep learning.

Uploaded by

sundarksp

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views2 pages

Python Cheatsheet For Data Scientists

Uploaded by

sundarksp

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Python Cheatsheet for Data Scientists

Core Python for Data Science

x = 10 # int
y = 3.14 # float
name = "AI" # str
flag = True # bool

lst = [1, 2, 3]
tpl = (1, 2, 3)
dct = {"a": 1, "b": 2}
st = {1, 2, 3}

squares = [x**2 for x in range(10)]

def square(x): return x**2

f = lambda x: x**2

NumPy

import numpy as np

a = np.array([1, 2, 3])
b = np.zeros((2, 3))
c = np.ones(5)
d = np.eye(3)
e = np.linspace(0, 1, 5)

a.mean(), a.std(), a.sum()

a.reshape(3, 1)
np.dot(a, a)

Pandas

import pandas as pd

df = pd.read_csv("data.csv")
df.head(), df.info(), df.describe()
df["col"], df[["col1", "col2"]]
df[df["col"] > 5]
df.groupby("group_col").mean()
df.isnull().sum()
df.fillna(0), df.dropna()

Matplotlib & Seaborn

Python Cheatsheet for Data Scientists

import matplotlib.pyplot as plt

import seaborn as sns

plt.plot([1,2,3], [4,5,6])
plt.hist([1,2,2,3])
plt.show()

sns.boxplot(x="col", data=df)
sns.heatmap(df.corr(), annot=True)

Scikit-learn (ML Basics)

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

X = df[["feature1", "feature2"]]
y = df["target"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = LinearRegression()
model.fit(X_train, y_train)

preds = model.predict(X_test)
mse = mean_squared_error(y_test, preds)

Common Data Science Tasks

pd.get_dummies(df["category"])

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier().fit(X, y)
importances = rf.feature_importances_

Bonus: Libraries to Know

- numpy, pandas: Data handling

- matplotlib, seaborn, plotly: Visualization
- scikit-learn: Machine learning
- xgboost, lightgbm: Gradient boosting
- statsmodels: Statistical modeling
- tensorflow, pytorch: Deep learning

Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Lisp Interpreter in Rust
From Everand
Lisp Interpreter in Rust
Vishal Patil
1/5 (1)
Python Cheatsheet
No ratings yet
Python Cheatsheet
3 pages
Data Science Cheat Sheet
No ratings yet
Data Science Cheat Sheet
2 pages
Python Data Science Cheat Sheet
No ratings yet
Python Data Science Cheat Sheet
2 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Python For DS Cheat Sheet
100% (2)
Python For DS Cheat Sheet
6 pages
Data Analysis W Pandas
No ratings yet
Data Analysis W Pandas
4 pages
Eda Code Snippets
No ratings yet
Eda Code Snippets
17 pages
External
No ratings yet
External
11 pages
Class Xii PDF For Practical
No ratings yet
Class Xii PDF For Practical
24 pages
Data Science Python Cheat Sheet
No ratings yet
Data Science Python Cheat Sheet
25 pages
Python in Research
No ratings yet
Python in Research
18 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
Data Cleaning
No ratings yet
Data Cleaning
7 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
66 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
EXP1-siddhant Gupta (23 - SE - 148)
No ratings yet
EXP1-siddhant Gupta (23 - SE - 148)
17 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
EDA+Cheatsheet+ +Class+Note
No ratings yet
EDA+Cheatsheet+ +Class+Note
29 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Data Analysis Lab - Final - 23-24
No ratings yet
Data Analysis Lab - Final - 23-24
11 pages
Cheat Sheet: Python For Data Science
No ratings yet
Cheat Sheet: Python For Data Science
4 pages
Cheat Sheet: Python For Data Science
No ratings yet
Cheat Sheet: Python For Data Science
4 pages
Rimjhim
No ratings yet
Rimjhim
21 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
CRAI AI BOOTCAMP week two 2025
No ratings yet
CRAI AI BOOTCAMP week two 2025
29 pages
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
No ratings yet
Know Your Dataset: Season Holiday Weekday Workingday CNT 726 727 728 729 730
1 page
ML Lab Manual 1-10
No ratings yet
ML Lab Manual 1-10
58 pages
Beginner's Guide to Python for Data Science Rodriguez Special
No ratings yet
Beginner's Guide to Python for Data Science Rodriguez Special
7 pages
EDA+Cheatsheet+ +Class+Note
No ratings yet
EDA+Cheatsheet+ +Class+Note
29 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
Data Science
No ratings yet
Data Science
42 pages
Ilovepdf Merged (2) Merged
No ratings yet
Ilovepdf Merged (2) Merged
65 pages
Ai Programs
No ratings yet
Ai Programs
22 pages
EDA Cheatsheet - Class Note
No ratings yet
EDA Cheatsheet - Class Note
29 pages
Data Clearning
No ratings yet
Data Clearning
7 pages
CO-367 Machine Learning Lab File: Submitted To: Submitted by
No ratings yet
CO-367 Machine Learning Lab File: Submitted To: Submitted by
12 pages
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
No ratings yet
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
12 pages
ML Manual
No ratings yet
ML Manual
21 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Tool and Lib in Data Science
No ratings yet
Tool and Lib in Data Science
32 pages
Set-D CT2 Answerkey
No ratings yet
Set-D CT2 Answerkey
11 pages
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
No ratings yet
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
7 pages
NumPy and Pandas Tutorial
No ratings yet
NumPy and Pandas Tutorial
8 pages
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
No ratings yet
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
12 pages
Pandas Cheat Sheet
85% (13)
Pandas Cheat Sheet
2 pages
Pandas Cheat Sheet
100% (4)
Pandas Cheat Sheet
2 pages
Pandas Cheat Sheet CN
No ratings yet
Pandas Cheat Sheet CN
4 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
PR Final File
No ratings yet
PR Final File
70 pages
Part A Assignment - No - 1
No ratings yet
Part A Assignment - No - 1
7 pages
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet

Python Cheatsheet For Data Scientists

Uploaded by

Python Cheatsheet For Data Scientists

Uploaded by

Python Cheatsheet for Data Scientists

Core Python for Data Science

squares = [x**2 for x in range(10)]

def square(x): return x**2

a.mean(), a.std(), a.sum()

Matplotlib & Seaborn

import matplotlib.pyplot as plt

Scikit-learn (ML Basics)

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

Common Data Science Tasks

from sklearn.preprocessing import StandardScaler

from sklearn.ensemble import RandomForestClassifier

Bonus: Libraries to Know

- numpy, pandas: Data handling

You might also like