Pandas Notes

Pandas is a Python library used for manipulating and analyzing data. It provides two main data structures - Series for one-dimensional data and DataFrame for two-dimensional tabular data. DataFrame can be created from lists, dictionaries, NumPy arrays, or other DataFrames. It allows fast and efficient operations on data like loading from different sources, handling missing data, merging, reshaping, and grouping.

Uploaded by

Rajesh T

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

82 views

Pandas Notes

Uploaded by

Rajesh T

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Pandas

History:
Pandas were initially developed by Wes McKinney in 2008 while he was working at
AQR Capital Management. He convinced the AQR to allow him to open source the
Pandas. Another AQR employee, Chang She, joined as the second major contributor
to the library in 2012. Over time many versions of pandas have been released.

The latest version of the pandas is 1.0.1

Advantages of pandas:-

• Fast and efficient for manipulating and analyzing data.

• Data from different file objects can be loaded.
• Easy handling of missing data (represented as NaN) in floating point as well
• Size mutability: columns can be inserted and deleted from DataFrame and
higher
dimensional objects
• Data set merging and joining.
• Flexible reshaping and pivoting of data sets
• Powerful group by functionality for performing split-apply-combine operations
on data sets.

Pandas generally provide two data structures for manipulating data, They are:

1.Series --->Single dimensional data

2.DataFrame--->Two dimensional data
Series:
A series can be created using various inputs like −

• Array
• Dict
• Scalar value or constant

Example:
import pandas as pd
import numpy as np

data = np.array(['chicken','mutton','fish'])
ser = pd.Series(data)
print(ser)
DataFrame:
A Data frame is a two-dimensional data structure, i.e., data is aligned in a tabular
fashion in rows and columns. You can think of it as an SQL table or a spreadsheet
data representation.

Features of DataFrame
• Potentially columns are of different types
• Size – Mutable
• Labeled axes (rows and columns)
• Can Perform Arithmetic operations on rows and columns

Create DataFrame
A pandas DataFrame can be created using various inputs like −

• Lists
• dict
• Series
• Numpy ndarrays
• Another DataFrame

Create an Empty DataFrame

A basic DataFrame, which can be created is an Empty Dataframe.
import pandas as pd
df = pd.DataFrame()
print(df).

Create a DataFrame from Lists

The DataFrame can be created using a single list or a list of lists.
Ex:1
import pandas as pd
data = [1,2,3,4,5]
df = pd.DataFrame(data)
print(df)

Ex:2
import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'])
print(df)

Handle csv files:

df=pd.read_csv('E:\python batch\car_data.csv')
Record count:
len(df) or df.shape
select specific columns:
df.loc[;,[‘owner’,’transmission’]]
df.sort_values(‘Year’)
filter the data:
df[df['Year']>2013]
df[(df.val > 0.5) & (df.val2 == 1)]
Replace nulls with default values

nba["College"].fillna("No College", inplace = True)

Grouping the data:

df.groupby('Team').groups -----grouping
Joins:
--------
import pandas as pd
left = pd.DataFrame({
'id':[1,2,3,4,5],
'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'],
'subject_id':['sub1','sub2','sub4','sub6','sub5']})
right = pd.DataFrame(
{'id':[1,2,3,4,5],
'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
'subject_id':['sub2','sub4','sub3','sub6','sub5']})
pd.merge(left,right,on='id')

pd.merge(left,right,on=['id','subject_id'])
pd.merge(left, right, on='subject_id', how='left')

Pandas Basics
No ratings yet
Pandas Basics
84 pages
All Document Reader 1715619870900
No ratings yet
All Document Reader 1715619870900
6 pages
Pandas
No ratings yet
Pandas
11 pages
Python Pandas
No ratings yet
Python Pandas
13 pages
Pandas
No ratings yet
Pandas
3 pages
Python Pandas Module - Introduction-07-11-2023
No ratings yet
Python Pandas Module - Introduction-07-11-2023
84 pages
Pandas
No ratings yet
Pandas
16 pages
Class Notes: Class: XII Date: 7-Apr-2020 Subject: Informatics Practices Topic: 2. Python Pandas
No ratings yet
Class Notes: Class: XII Date: 7-Apr-2020 Subject: Informatics Practices Topic: 2. Python Pandas
4 pages
18_Pandas
No ratings yet
18_Pandas
33 pages
Unit 4
No ratings yet
Unit 4
36 pages
Pandas
No ratings yet
Pandas
82 pages
Pandas python
No ratings yet
Pandas python
11 pages
Loki Temp PPT Pandas 2
No ratings yet
Loki Temp PPT Pandas 2
31 pages
Pandas Dataframe Export The CSV File
No ratings yet
Pandas Dataframe Export The CSV File
9 pages
The Pandas Library
No ratings yet
The Pandas Library
39 pages
Class 12 Panda Project
No ratings yet
Class 12 Panda Project
13 pages
Python Pandas ch-2
No ratings yet
Python Pandas ch-2
56 pages
UNIT - 3 Pandas
No ratings yet
UNIT - 3 Pandas
21 pages
2_Pandas
No ratings yet
2_Pandas
22 pages
Ii Unit Pandas
No ratings yet
Ii Unit Pandas
30 pages
Python Pandas New Sylabus
No ratings yet
Python Pandas New Sylabus
53 pages
Python Data Frame New
No ratings yet
Python Data Frame New
32 pages
Pandas
No ratings yet
Pandas
41 pages
Exp1 - Manipulating Datasets Using Pandas
No ratings yet
Exp1 - Manipulating Datasets Using Pandas
15 pages
Python 3rd unit question and answer
No ratings yet
Python 3rd unit question and answer
25 pages
Introduction To Pandas For Data Analysis
No ratings yet
Introduction To Pandas For Data Analysis
6 pages
Pandas
No ratings yet
Pandas
21 pages
Pandas DataFrame
No ratings yet
Pandas DataFrame
70 pages
Pandas
No ratings yet
Pandas
25 pages
practical-7
No ratings yet
practical-7
8 pages
Data Analysis with Pandas
No ratings yet
Data Analysis with Pandas
122 pages
Pandas
No ratings yet
Pandas
9 pages
DevOps Session 3 Pandas.pptx
No ratings yet
DevOps Session 3 Pandas.pptx
33 pages
Unit-4Introduction To Pandas
No ratings yet
Unit-4Introduction To Pandas
44 pages
Python Pandas Tutorial For Beginners
No ratings yet
Python Pandas Tutorial For Beginners
203 pages
Data Aggregation and Group Operations
No ratings yet
Data Aggregation and Group Operations
34 pages
Python Pandas - DataFrame
No ratings yet
Python Pandas - DataFrame
12 pages
Pandas ClassXII IP
No ratings yet
Pandas ClassXII IP
2 pages
14_Pandas
No ratings yet
14_Pandas
25 pages
Python Pandas Tutorial
No ratings yet
Python Pandas Tutorial
6 pages
Class 6 Pandas
No ratings yet
Class 6 Pandas
13 pages
Python pandas
No ratings yet
Python pandas
34 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
Pandas Questions
No ratings yet
Pandas Questions
11 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Pandas
No ratings yet
Pandas
4 pages
Python Pandas
100% (1)
Python Pandas
35 pages
IP Practical File - Reference
No ratings yet
IP Practical File - Reference
98 pages
Pandas 1705297450
No ratings yet
Pandas 1705297450
21 pages
P Unit-4 NP
No ratings yet
P Unit-4 NP
30 pages
Pandas
No ratings yet
Pandas
12 pages
Pandas Notes(1)
No ratings yet
Pandas Notes(1)
44 pages
Pandas (Ziad)
No ratings yet
Pandas (Ziad)
38 pages
Lab 9
No ratings yet
Lab 9
9 pages
JOINS (1)
No ratings yet
JOINS (1)
10 pages
SBLC 1
No ratings yet
SBLC 1
23 pages
4a Introduction To Pandas - PPTX - Lyst5943
No ratings yet
4a Introduction To Pandas - PPTX - Lyst5943
11 pages
Unit 2
No ratings yet
Unit 2
81 pages
2.1 Pandas Objects
No ratings yet
2.1 Pandas Objects
10 pages
Mastering Pandas in Python: Course Book
From Everand
Mastering Pandas in Python: Course Book
Pedro Martins
No ratings yet
Currently, A Task Can Execute A Single SQL Statement, Including A Call To A Stored Procedure
No ratings yet
Currently, A Task Can Execute A Single SQL Statement, Including A Call To A Stored Procedure
7 pages
Cloning Document
No ratings yet
Cloning Document
7 pages
List Data Structure: Creation of List Objects
No ratings yet
List Data Structure: Creation of List Objects
44 pages
Options Buy Strategy
No ratings yet
Options Buy Strategy
1 page
ALVProgramming Guide
100% (1)
ALVProgramming Guide
46 pages
CAD101 Introduction To Web Development With HTML 5 Css3 and JavaScript
No ratings yet
CAD101 Introduction To Web Development With HTML 5 Css3 and JavaScript
1 page
Lab Rep - 3 - 4
No ratings yet
Lab Rep - 3 - 4
15 pages
PYTHON Learn Python Programming in 90 Minutes or Less Python Learning Python Python Programming Python Tutorial Python Programming For Beginners Python For Dummies Book 1 PDF
90% (10)
PYTHON Learn Python Programming in 90 Minutes or Less Python Learning Python Python Programming Python Tutorial Python Programming For Beginners Python For Dummies Book 1 PDF
161 pages
Manual Testing
No ratings yet
Manual Testing
36 pages
Cognitive Metrics For The Management of Model-Based Software Development
No ratings yet
Cognitive Metrics For The Management of Model-Based Software Development
41 pages
Dynamics CRM 2013 Training
No ratings yet
Dynamics CRM 2013 Training
140 pages
02 JavaScript Language Basics
100% (2)
02 JavaScript Language Basics
28 pages
(5561) - 692 B.E. (Computer Engineering) Embedded and Real Time Operating System (2015 Course) (Elective - III) (Semester - II) (410252 (C) )
No ratings yet
(5561) - 692 B.E. (Computer Engineering) Embedded and Real Time Operating System (2015 Course) (Elective - III) (Semester - II) (410252 (C) )
2 pages
How To Execute A Shell Script From C in Linux - Stack Overflow
No ratings yet
How To Execute A Shell Script From C in Linux - Stack Overflow
3 pages
Java Platform Standard Edition 8 Documentation
No ratings yet
Java Platform Standard Edition 8 Documentation
1 page
Free Common Space v1.7 Readme
No ratings yet
Free Common Space v1.7 Readme
3 pages
Project Report Cricket20 20 Analysis
No ratings yet
Project Report Cricket20 20 Analysis
22 pages
Spring Boot Token Based Authentication With Spring Security and JWT
No ratings yet
Spring Boot Token Based Authentication With Spring Security and JWT
30 pages
Choosing Right Automation Tool
No ratings yet
Choosing Right Automation Tool
8 pages
Developing Integrations in Mulesoft (Pdfdrive)
No ratings yet
Developing Integrations in Mulesoft (Pdfdrive)
68 pages
Spring Boot Tutorial Part 1
No ratings yet
Spring Boot Tutorial Part 1
88 pages
Textbook Syllabus
No ratings yet
Textbook Syllabus
2 pages
Formatting Gridview Based On Row Data - Part 9: Support Us C# Programs Subscribe Buy DVD
No ratings yet
Formatting Gridview Based On Row Data - Part 9: Support Us C# Programs Subscribe Buy DVD
3 pages
Notes On Lesson
No ratings yet
Notes On Lesson
157 pages
11 Create Netcdf Python
No ratings yet
11 Create Netcdf Python
22 pages
Oracle Application - How To Resolve BIP Report Excel Output Column Shrinkage Issue
No ratings yet
Oracle Application - How To Resolve BIP Report Excel Output Column Shrinkage Issue
4 pages
Orphanage Management System Use Case Diagram
No ratings yet
Orphanage Management System Use Case Diagram
1 page
Unit-2 Array, Function and String
No ratings yet
Unit-2 Array, Function and String
60 pages
MCQ and T (Or) F C++
No ratings yet
MCQ and T (Or) F C++
10 pages
Ply Talk
100% (2)
Ply Talk
87 pages
SQL Boot Camp
No ratings yet
SQL Boot Camp
18 pages
Database System I Final
No ratings yet
Database System I Final
5 pages
Optimizing Stored Procedure Performance: Kimberly L. Tripp Solid Quality Learning
No ratings yet
Optimizing Stored Procedure Performance: Kimberly L. Tripp Solid Quality Learning
38 pages
Cat 2 STS
No ratings yet
Cat 2 STS
424 pages