0% found this document useful (0 votes)

460 views

Data Analytics Lab

The document outlines an index for a lab file on data analytics submitted by a student named Amit Singh to their professors at NOIDA INSTITUE OF ENGINEERING & TECHNOLOGY, listing topics like performing numerical operations, data import/export, matrix operations, statistical analysis, and simple linear and logistic regression using Python/R. The aims demonstrate how to handle data preprocessing tasks, fit regression models, and evaluate their performance on test data.

Uploaded by

Amit Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

460 views

Data Analytics Lab

Uploaded by

Amit Singh

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 14

NOIDA INSTITUE OF ENGINEERING & TECHNOLOGY,

GREATER NOIDA

Department of Information Technology

LAB FILE
ON
DATA ANALYTICS LAB
KIT-651
(6th Semester)
(2020 – 2021)

Submitted To: Submitted by:

Ms. Tanya Name: Amit Singh

Dr. Vivek Kumar Roll: 1813313019

Affiliated to Dr. A.P.J Abdul Kalam Technical University, Uttar Pradesh, Lucknow.
Data ANALYTICS LAB
KIT-651
INDEX
S.NO TOPIC DATE GRADE SIGNATURE

To get the input from user and perform numerical

1 operations (MAX, MIN, AVG, SUM, SQRT, ROUND)
using in R/Python.
To perform data import/export (.CSV, .XLS, TXT)
2
operations using data frames in R/Python.
To get the input matrix from user and perform Matrix
addition, subtraction, multiplication, inverse transpose
3
and division operations using vector concept in
R/Python.
To perform statistical operations (Mean, Median, Mode
4
and Standard deviation) using R/Python.
To perform data pre-processing operations i) Handling
5
Missing data ii) Min-Max normalization.
6 To perform Simple Linear Regression with R/Python.

7 To perform Simple Logistic Regression with R/Python.

16
Aim -1. To get the input from user and perform numerical operations (MAX,
MIN, AVG, SUM, SQRT, ROUND) using in R/Python.

import math
list1 = []

n = int(input("Enter number of elements : "))

for i in range(0, n):
  ele = int(input())
  list1.append(ele)

print("Sum = ",sum(list1))
print("Maximum element = ",max(list1))
print("Minimum element = ",min(list1))
print("Square root =" ,math.sqrt(list1[1]))
print("Round =",round(5.56))
print("Average = ", sum(list1)/len(list1))

OUTPUT: -
Enter number of elements : 5
1
6
2
8
7
Sum = 24
Maximum element = 8
Minimum element = 1
Square root = 2.449489742783178
Round = 6
Average = 4.8
Aim - 2. To perform data import/export (.CSV, .XLS, TXT) operations using
data frames in R/Python.

from google.colab import drive

drive.mount("/content/drive")

import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/Da-Lab/ITUR_rain1.csv')

print(df.Frequency)

OUTPUT: -

0 1.0
1 1.5
2 2.0
3 2.5
4 3.0
...
99 96.0
100 97.0
101 98.0
102 99.0
103 100.0
Name: Frequency, Length: 104, dtype: float64
Aim - 3. To get the input matrix from user and perform Matrix addition,
subtraction, multiplication, inverse transpose and division operations using
vector concept in R/Python.

import numpy
r = int(input("Enter  no of row of matrix1 "))
c = int(input("Enter no of cloumns of matrix1 "))
m = []
print("Enter elements")
for i in range(r):
    a =[]
    for j in range(c):
         a.append(int(input()))
    m.append(a)
r1 = int(input("Enter the number of rows of matrix 2 "))
c1 = int(input("Enter the number of columns of matrix 2 "))
m1 = []
print("Enter elements")
for i in range(r1):
    a1 =[]
    for j in range(c1):
         a1.append(int(input()))
    m1.append(a1)
m2=[]
for i in range(r):
  a3=[]
  for j in range(c):
    a3.append(m[i][j]+m1[i][j])
  m2.append(a3)
print("Sum pf matrix is:")
for i in range (r):
  for j in range(c):
    print(m2[i][j],end=" ")
  print()
pm=[]
for i in range (r):
  sm=[]
  for j in range (c):
    s=0

    for k in range (c):
      s=s+m[i][k]*m1[k][j]
    sm.append(s)
  pm.append(sm)
print("Product of matrix:")
for i in range( r):
  for j in range (c):
    print(pm[i][j],end =" ")
  print()
print("Transpose of multiplication matrix is :")
print(numpy.transpose(pm))

OUTPUT: -

Enter no of row of matrix1 2

Enter no of cloumns of matrix1 2
Enter elements
1
2
3
4
Enter the number of rows of matrix 2 2
Enter the number of columns of matrix 2 2
Enter elements
4
5
6
7
Sum pf matrix is:
57
9 11
Product of matrix:
16 19
36 43
Transpose of multiplication matrix is :
[[16 36]
[19 43]]
Aim -4. To perform statistical operations (Mean, Median, Mode and Standard
deviation) using R/Python.

import statistics as st
lst = []

n = int(input("Enter number of elements : "))

for i in range(0, n):
    ele = int(input())

    lst.append(ele)

print("Mean value is:",st.mean(lst))
print("Meadian is:",st.median(lst))
print("Mode value is :",st.mode(lst))
print("Standard deviation is :",statistics.stdev(lst))

OUTPUT :-

Enter number of elements : 5

1
2
3
4
5
Mean value is: 3
Meadian is: 3
Mode is: 0
Standard deviation is: 1.414
Aim - 5. To perform data pre-processing operations i) Handling Missing data
ii) Min-Max normalization.

import pandas as pd
import numpy as np
df = pd.read_csv("/content/drive/MyDrive/Da-Lab/titanic.csv")
df.head()

df.drop(['PassengerId','Name','SibSp','Parch','Ticket','Cabin','Embarked'],axis='columns',inplace=
True)
df.head()
target = df.Survived
inputs = df.drop('Survived',axis='columns')

#One-hot encoding
dummies = pd.get_dummies(inputs.Sex)
dummies.head(3)

inputs = pd.concat([inputs,dummies],axis='columns')
inputs.head(3)

inputs.drop(['Sex','male'],axis='columns',inplace=True)
inputs.head(3)
inputs.columns[inputs.isna().any()]

OUTPUT: -

Index(['Age'], dtype='object')

inputs.Age = inputs.Age.fillna(inputs.Age.mean())
inputs.head()

inputs.Age[:10]

OUTPUT: -

0 22.000000
1 38.000000
2 26.000000
3 35.000000
4 35.000000
5 29.699118
6 54.000000
7 2.000000
8 27.000000
9 14.000000
Name: Age, dtype: float64
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(inputs,target,test_size=0.3)

from sklearn.naive_bayes import GaussianNB
model = GaussianNB()

model.fit(X_train,y_train)

OUTPUT: -
GaussianNB(priors=None, var_smoothing=1e-09)

model.score(X_test,y_test)

OUTPUT: -

0.7574626865671642

model.predict(X_test[0:10])

OUTPUT: -

array([0, 1, 1, 1, 0, 1, 1, 0, 0, 1])
Aim - 6. To perform Simple Linear Regression with R/Python.

import numpy as np

import pandas as pd
import matplotlib.pyplot as plt

from google.colab import files
uploaded = files.upload()

data = pd.read_csv("area.csv")
X = data.Area.values.astype(float)

y = data.Price.values.astype(float)

plt.scatter(X,y)
plt.xlabel("Area")
plt.ylabel("Price")
plt.show()
from sklearn import linear_model
from sklearn.linear_model import LinearRegression
reg = linear_model.LinearRegression()
reg.fit(data[['Area']],data.Price)

OUTPUT: -

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

reg.predict([[100]])

OUTPUT: -

array([9229.8328887])

reg.coef_

OUTPUT: -

array([40.46056658])

reg.intercept_

OUTPUT: -

5183.7762302371

100.6691978*100+1118.140232700558

OUTPUT: -

11185.060012700558
Aim - 7. To perform Simple Logistic Regression with R/Python.

ML LAB MANNUAL R22 CSE(DS)
No ratings yet
ML LAB MANNUAL R22 CSE(DS)
46 pages
Big Data Analytics From Strategic Planning To Enterprise Integration With Tools Techniques Nosql and Graph by David Loshin 0124173195
No ratings yet
Big Data Analytics From Strategic Planning To Enterprise Integration With Tools Techniques Nosql and Graph by David Loshin 0124173195
5 pages
Business Intelligence
No ratings yet
Business Intelligence
41 pages
100 Data Scientist Interview Questions by DataInterview 1688929352
No ratings yet
100 Data Scientist Interview Questions by DataInterview 1688929352
7 pages
Data Science Solutions Sample
100% (6)
Data Science Solutions Sample
53 pages
Association Rule Mining Lesson PDF
No ratings yet
Association Rule Mining Lesson PDF
9 pages
Big Data Research Paper
No ratings yet
Big Data Research Paper
10 pages
Clouds and Big Data Computing
No ratings yet
Clouds and Big Data Computing
13 pages
Tutorial On "R" Programming Language
No ratings yet
Tutorial On "R" Programming Language
25 pages
3 - Big Data Insight V.2019 PDF
No ratings yet
3 - Big Data Insight V.2019 PDF
28 pages
Data Science Resource Package!
No ratings yet
Data Science Resource Package!
14 pages
Statistics With R
No ratings yet
Statistics With R
41 pages
Microsoft Business Intelligence (Msbi)
No ratings yet
Microsoft Business Intelligence (Msbi)
8 pages
Data Scientist - KD PDF
No ratings yet
Data Scientist - KD PDF
1 page
Big Data in E-Commerce
100% (2)
Big Data in E-Commerce
21 pages
Bahria University, Islamabad Campus: Department of Computer Science
No ratings yet
Bahria University, Islamabad Campus: Department of Computer Science
3 pages
Machine Learning
No ratings yet
Machine Learning
29 pages
Data Mining Slides
No ratings yet
Data Mining Slides
43 pages
Implementing Data Science Projects PDF
No ratings yet
Implementing Data Science Projects PDF
2 pages
Data Science in E-Commerce - Report - Writing
No ratings yet
Data Science in E-Commerce - Report - Writing
18 pages
Business Intelligence & Business Analytics
No ratings yet
Business Intelligence & Business Analytics
8 pages
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
No ratings yet
000+ +curriculum+ +Complete+Data+Science+and+Machine+Learning+Using+Python
10 pages
Big Data Analytics
100% (1)
Big Data Analytics
11 pages
Data Analytics
75% (4)
Data Analytics
45 pages
Data Scientist Interview Questions
No ratings yet
Data Scientist Interview Questions
2 pages
Data Science Course Content
No ratings yet
Data Science Course Content
8 pages
Tablue
0% (1)
Tablue
2 pages
Uber Data Analysis Using Python
No ratings yet
Uber Data Analysis Using Python
24 pages
Data Science A Beginner S Guide 1668243666
100% (1)
Data Science A Beginner S Guide 1668243666
26 pages
Big Data Technology
100% (1)
Big Data Technology
10 pages
Download full Text Analytics with Python A Practical Real World Approach to Gaining Actionable Insights from Your Data 1st Edition Dipanjan Sarkar ebook all chapters
100% (1)
Download full Text Analytics with Python A Practical Real World Approach to Gaining Actionable Insights from Your Data 1st Edition Dipanjan Sarkar ebook all chapters
55 pages
Data Science With Python PDF
0% (1)
Data Science With Python PDF
7 pages
Big Data Analysis
100% (1)
Big Data Analysis
30 pages
A Brief Introduction To Data Mining (DM) : Bs Cs - V Iii BY Sanianayab
No ratings yet
A Brief Introduction To Data Mining (DM) : Bs Cs - V Iii BY Sanianayab
23 pages
DexLab Analytics Business Analytics - Data Science - Study Material
No ratings yet
DexLab Analytics Business Analytics - Data Science - Study Material
169 pages
Informatica Power Center Best Practices
No ratings yet
Informatica Power Center Best Practices
8 pages
Data Science: Concepts and Practice: Course Slides
No ratings yet
Data Science: Concepts and Practice: Course Slides
9 pages
Data Science Project Ideas
No ratings yet
Data Science Project Ideas
6 pages
Alert Based Monitoring of Stock Trading Systems
No ratings yet
Alert Based Monitoring of Stock Trading Systems
3 pages
Future of Business Analytics PDF
No ratings yet
Future of Business Analytics PDF
14 pages
Decision Tree Algorithm: Comp328 Tutorial 1 Kai Zhang
No ratings yet
Decision Tree Algorithm: Comp328 Tutorial 1 Kai Zhang
25 pages
SAS Presentation
No ratings yet
SAS Presentation
49 pages
Chapter 2 - NumPy and Pandas
No ratings yet
Chapter 2 - NumPy and Pandas
26 pages
DS Mod 1 To 2 Complete Notes
No ratings yet
DS Mod 1 To 2 Complete Notes
63 pages
Data Science Course Syllabus
No ratings yet
Data Science Course Syllabus
37 pages
Quantitative Techniques & Operations Research: Ankit Sharma Neha Rathod Suraj Bairagi Vaibhav Thamman
No ratings yet
Quantitative Techniques & Operations Research: Ankit Sharma Neha Rathod Suraj Bairagi Vaibhav Thamman
12 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
19 pages
Top Data Analyst Interview Questions
No ratings yet
Top Data Analyst Interview Questions
28 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
6 pages
Why R Programming
No ratings yet
Why R Programming
25 pages
7 - Classification
No ratings yet
7 - Classification
71 pages
Advanced Certification in Data Science and Artificial Intelligence
No ratings yet
Advanced Certification in Data Science and Artificial Intelligence
18 pages
Faster Python Programs Through Optimization PDF
No ratings yet
Faster Python Programs Through Optimization PDF
2 pages
Data Mart Info
No ratings yet
Data Mart Info
5 pages
What Is Data Science GDI
0% (1)
What Is Data Science GDI
24 pages
2nd Unit - 2.2 - Data Analytics
No ratings yet
2nd Unit - 2.2 - Data Analytics
22 pages
Data Preparation and Exploration: Applied to Healthcare Data
From Everand
Data Preparation and Exploration: Applied to Healthcare Data
Robert Hoyt
No ratings yet
Hadoop For Dummies
From Everand
Hadoop For Dummies
Dirk deRoos
3/5 (2)
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
From Everand
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Janet Laane Effron
No ratings yet
Machine Learning with Python: Design and Develop Machine Learning and Deep Learning Technique using real world code examples
From Everand
Machine Learning with Python: Design and Develop Machine Learning and Deep Learning Technique using real world code examples
Abhishek Vijayvargia
No ratings yet
Fundamentals of Analytics Engineering: An introduction to building end-to-end analytics solutions
From Everand
Fundamentals of Analytics Engineering: An introduction to building end-to-end analytics solutions
Dumky De Wilde
No ratings yet
PIPE NETWORK ANALYSIS USING PYTHON (HARDY-CROSS METHOD)
No ratings yet
PIPE NETWORK ANALYSIS USING PYTHON (HARDY-CROSS METHOD)
4 pages
501970592-docdownloader-com-pdf-to-study-fake-news-detection-in-online-social-media-in-context-of-machine-dd-4c0db34748aee9bf806ea5aa67d1d9a5
No ratings yet
501970592-docdownloader-com-pdf-to-study-fake-news-detection-in-online-social-media-in-context-of-machine-dd-4c0db34748aee9bf806ea5aa67d1d9a5
78 pages
DSBDA Lab Manual
No ratings yet
DSBDA Lab Manual
167 pages
Python - How To Compute Jaccard Similarity From A Pandas Dataframe - Stack Overflow
No ratings yet
Python - How To Compute Jaccard Similarity From A Pandas Dataframe - Stack Overflow
4 pages
Machine Learning Lab 1
No ratings yet
Machine Learning Lab 1
9 pages
OceanofPDF - Com Python - Andy Vickler
No ratings yet
OceanofPDF - Com Python - Andy Vickler
177 pages
Dhrumil Aml
No ratings yet
Dhrumil Aml
14 pages
Data Analyst Roadmap by Shakra Shamim
0% (1)
Data Analyst Roadmap by Shakra Shamim
13 pages
MLPrograma1-5 Py
No ratings yet
MLPrograma1-5 Py
17 pages
Python Statistics
No ratings yet
Python Statistics
6 pages
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
No ratings yet
Cheat Sheet: The Pandas Dataframe Object I: Preliminaries Get Your Data Into A Dataframe
12 pages
IP Practical
No ratings yet
IP Practical
28 pages
Numpy
No ratings yet
Numpy
9 pages
Search Creators CG LAB Program-07
No ratings yet
Search Creators CG LAB Program-07
4 pages
2 Assignment 2 DSF LS Nov
No ratings yet
2 Assignment 2 DSF LS Nov
1 page
Computer Vision With Python (Answer)
No ratings yet
Computer Vision With Python (Answer)
11 pages
ML Lab Final R22
No ratings yet
ML Lab Final R22
67 pages
CS3361 - Data Science Lab Record
No ratings yet
CS3361 - Data Science Lab Record
76 pages
DSPA - ET22BTEC046 - LAB3.ipynb - Colab
No ratings yet
DSPA - ET22BTEC046 - LAB3.ipynb - Colab
7 pages
MDA File
No ratings yet
MDA File
37 pages
Pandas: Powerful Python Data Analysis Toolkit: Release 0.7.1
No ratings yet
Pandas: Powerful Python Data Analysis Toolkit: Release 0.7.1
283 pages
Data Science: Sales Forecasting For Marketing
No ratings yet
Data Science: Sales Forecasting For Marketing
52 pages
Python - Draw Polygons More Efficiently With Matplotlib - Stack Overflow
No ratings yet
Python - Draw Polygons More Efficiently With Matplotlib - Stack Overflow
5 pages
Mini Project Report
No ratings yet
Mini Project Report
21 pages
Ai-Ml 2024
No ratings yet
Ai-Ml 2024
45 pages
Practice Problems in Python
No ratings yet
Practice Problems in Python
2 pages
Calculate The Confidence Intervals
No ratings yet
Calculate The Confidence Intervals
4 pages
Advanced Programming With Python
No ratings yet
Advanced Programming With Python
9 pages
Lab6
No ratings yet
Lab6
2 pages