Phase 4

Uploaded by

rajirk2022

The document discusses customer segmentation using data science. It outlines steps to import data, create a dataset, perform data visualization with plots, develop a k-means clustering model, and analyze customer frequency.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Phase 4

Uploaded by

rajirk2022

0% found this document useful (0 votes)

5 views5 pages

Original Title

phase 4

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

5 views5 pages

Phase 4

Uploaded by

rajirk2022

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 5

Search inside document

IBM NAAN MUDHALVAN – PHASE 4

DOMAIN : DATA SCIENCE

TITLE : CUSTOMER SEGMENTATION USING DATA SCIENCE

PROGRAM :
1,import the libraries
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px
import numpy as np
from scipy.stats import iqr
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans

2,import the dataset

import pandas as pd
data = pd.read_csv('Customer_segmentation.csv',
encoding='unicode_escape')

data.head()

Output:

3.create a dataset
df_s = df.sample(10000, random_state=42)
df_s["InvoiceDate"] = df_s["InvoiceDate"].dt.date
df_s["TotalSum"] = df_s["Quantity"] * df_s["UnitPrice"]
snapshot_date = max(df_s.InvoiceDate) + datetime.timedelta(days=1)
customers = df_s.groupby(['CustomerID']).agg({'InvoiceDate': lambda x:
(snapshot_date - x.max()).days,
'InvoiceNo':
'count','TotalSum': 'sum'})
customers.rename(columns = {'InvoiceDate': 'Recency','InvoiceNo':
'Frequency',
'TotalSum': 'MonetaryValue'}, inplace=True)

display(customers.head())

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv("../input/customer-segmentation-tutorial-in-
python/Mall_Customers.csv")
df.head()
4
.DATA VISUALIZATION:
age18_25 = df.Age[(df.Age <= 25) & (df.Age >= 18)]
age26_35 = df.Age[(df.Age <= 35) & (df.Age >= 26)]
age36_45 = df.Age[(df.Age <= 45) & (df.Age >= 36)]
age46_55 = df.Age[(df.Age <= 55) & (df.Age >= 46)]
age55above = df.Age[df.Age >= 56]

x = ["18-25","26-35","36-45","46-55","55+"]
y =
[len(age18_25.values),len(age26_35.values),len(age36_45.values),len(age
46_55.values),len(age55above.values)]

plt.figure(figsize=(15,6))
sns.barplot(x=x, y=y, palette="rocket")
plt.title("Number of Customer and Ages")
plt.xlabel("Age")
plt.ylabel("Number of Customer")
plt.show()

x_axis = df_std['Age']
y_axis = df_std['Income']
plt.figure(figsize = (10, 8))
sns.scatterplot(x_axis, y_axis, hue = df_std['Labels'], palette = ['g',
'r', 'c', 'm'])
plt.title('Segmentation K-means')
plt.show()
5.MODEL DEVELOPING:
df = pd.read_csv('Mall_Customers.csv')
df = df.drop(['CustomerID'],axis=1
pred = model.predict(PCA_components.iloc[:,:2])
frame = pd.DataFrame(df)
frame['cluster'] = pred
frame.head()
6.FREQUENCY:
freq = df_rec.groupby('CustomerID')['Date'].count()
df_freq = pd.DataFrame(freq).reset_index()
df_freq.columns = ['CustomerID','frequency']

rec_freq = df_freq.merge(df_rec,on='CustomerID')

035 Assignment PDF
Document14 pages
035 Assignment PDF
Tman Letswalo
No ratings yet
Garmin G600 TXI IM 190-01717-00 - 12
Document449 pages
Garmin G600 TXI IM 190-01717-00 - 12
Alfredo Castellanos
0% (1)
ISPF Training by EDS
Document63 pages
ISPF Training by EDS
Satyabrata Dash
No ratings yet
Creation of Series Using List, Dictionary & Ndarray
Document65 pages
Creation of Series Using List, Dictionary & Ndarray
rizwana fathima
No ratings yet
Abhiml ML File
Document74 pages
Abhiml ML File
Bhawna Chandla
No ratings yet
DWDM Lab Report
Document26 pages
DWDM Lab Report
Simran Shrestha
No ratings yet
Da Program
Document18 pages
Da Program
alishacalista238
No ratings yet
Untitled Document
Document19 pages
Untitled Document
s14utkarsh2111019
No ratings yet
Programs of Python Pandas
Document15 pages
Programs of Python Pandas
suryanshvarshney05
No ratings yet
Python Note 3
Document11 pages
Python Note 3
Coding Knowledge
No ratings yet
DATA MINING EX1
Document10 pages
DATA MINING EX1
20bel513
No ratings yet
Data Science Lab Manual
Document32 pages
Data Science Lab Manual
Ravishankar Gautam
No ratings yet
IP Practical PRGM
Document41 pages
IP Practical PRGM
Jeya Ishwarya
No ratings yet
ip-practical-2024-25-1-to-34
Document32 pages
ip-practical-2024-25-1-to-34
Aryan Patial
No ratings yet
Experiment No.:1: Program
Document7 pages
Experiment No.:1: Program
Dhiraj Shah
No ratings yet
DWDM Lab All
Document20 pages
DWDM Lab All
PoojaDevi Sharma
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Document20 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Saloni Tuli
No ratings yet
Stock Pred
Document2 pages
Stock Pred
Srijeeta Sen
No ratings yet
Pandas Practicals - Term-1
Document18 pages
Pandas Practicals - Term-1
Rudra Dewangan
100% (1)
Final Class 12 Commerce Practical File
Document19 pages
Final Class 12 Commerce Practical File
Snehil Chundawat
No ratings yet
Correction
Document3 pages
Correction
bougmazisoufyane
No ratings yet
IP_Lab_record[1]
Document23 pages
IP_Lab_record[1]
RAZER GAMING
No ratings yet
Prototype 13
Document1 page
Prototype 13
Yemi Towobola
No ratings yet
BDA Lab 4: Python Data Visualization: Your Name: Mohamad Salehuddin Bin Zulkefli Matric No: 17005054
Document10 pages
BDA Lab 4: Python Data Visualization: Your Name: Mohamad Salehuddin Bin Zulkefli Matric No: 17005054
Saleh Zul
No ratings yet
DBMS_Lab_Exercise
Document5 pages
DBMS_Lab_Exercise
24priyanka02
No ratings yet
Aiml Ex 5
Document3 pages
Aiml Ex 5
Tasmiya Dz
No ratings yet
Suryadatta National School Class 12 CBSE Informatics Practices Practicals List
Document19 pages
Suryadatta National School Class 12 CBSE Informatics Practices Practicals List
Om Jagdeesh
No ratings yet
Cluster Australia: 1 Strategy
Document5 pages
Cluster Australia: 1 Strategy
Steven Truong
No ratings yet
IP Record Python 23-24 Aryan
Document42 pages
IP Record Python 23-24 Aryan
cehsp7725
No ratings yet
B2a018029 - Iffah Norma H. - Kuis Datmin
Document7 pages
B2a018029 - Iffah Norma H. - Kuis Datmin
Iffah
No ratings yet
Payroll Management System Vishal Yadav Project Class 12e-Converted - Vishal Yadav (1) (1) (1)_copy (1) (1) (1) (1) (1) (2) (1)
Document23 pages
Payroll Management System Vishal Yadav Project Class 12e-Converted - Vishal Yadav (1) (1) (1)_copy (1) (1) (1) (1) (1) (2) (1)
ansarinishabi9
No ratings yet
m08 v01 Store Sales Prediction
Document39 pages
m08 v01 Store Sales Prediction
May
No ratings yet
XII - Informatics Practices (LAB MANUAL)
Document42 pages
XII - Informatics Practices (LAB MANUAL)
ghun assudani
100% (1)
Script Unit2
Document6 pages
Script Unit2
vemizadefitri123
No ratings yet
LAB FILE-Shelly Sharma
Document47 pages
LAB FILE-Shelly Sharma
Shelly Sharma
No ratings yet
ML Practicals
Document11 pages
ML Practicals
05. Yash Darole
No ratings yet
Intro To Py and ML - Part 2
Document10 pages
Intro To Py and ML - Part 2
KAORU Amane
No ratings yet
Python Notes by Prof T
Document10 pages
Python Notes by Prof T
ruv.asn17
No ratings yet
Practical Record 2 PYTHON AND SQL PROGRAMS - 2023
Document76 pages
Practical Record 2 PYTHON AND SQL PROGRAMS - 2023
isnprincipal2020
No ratings yet
Grade 12 - IP Practicals (1 To 9)
Document12 pages
Grade 12 - IP Practicals (1 To 9)
Milan Laddha
No ratings yet
ML Report Miniproject
Document11 pages
ML Report Miniproject
sablemadhav18
No ratings yet
Ip HHW
Document32 pages
Ip HHW
tanmaythoughts2624
No ratings yet
Class 12 IP Final Practical
Document21 pages
Class 12 IP Final Practical
charul sahu
No ratings yet
Appendix PDF
Document5 pages
Appendix PDF
Rama
No ratings yet
ModuleAr Merged
Document42 pages
ModuleAr Merged
gopivijaykumar66
No ratings yet
ML Record
Document18 pages
ML Record
harshitsr1234
No ratings yet
Ip Project (Ekagra & Naman)
Document23 pages
Ip Project (Ekagra & Naman)
satpal singh
No ratings yet
ip practical file
Document18 pages
ip practical file
mathi
No ratings yet
National Public School: Name-Karan Choudhary Class-XII Subject - Informatics Practices (065) Board Roll No.
Document24 pages
National Public School: Name-Karan Choudhary Class-XII Subject - Informatics Practices (065) Board Roll No.
rajesh
No ratings yet
IP Practical File - Reference
Document98 pages
IP Practical File - Reference
purvirk23
No ratings yet
IP Practical 2023-24 (1 To 34)
Document32 pages
IP Practical 2023-24 (1 To 34)
Epic Person
100% (1)
Data Mining & Data Science Practical Slips
Document45 pages
Data Mining & Data Science Practical Slips
ag8411877
No ratings yet
Week 3 GGG
Document17 pages
Week 3 GGG
Shreyas bhagoji
No ratings yet
Machine Learning with PySpark and MLlib — Solving a Binary Classification Problem _ by Susan Li _ Towards Data Science
Document10 pages
Machine Learning with PySpark and MLlib — Solving a Binary Classification Problem _ by Susan Li _ Towards Data Science
largeminkyu
No ratings yet
Informatics Practices Practical List22-2323
Document7 pages
Informatics Practices Practical List22-2323
Shivam Goswami
100% (1)
MACHINE LEARNING manual
Document36 pages
MACHINE LEARNING manual
manda.ashok
No ratings yet
ST Joseph'S Convent Senior Secondary School: Name:-Shatakshi Gaur Class:-Xii Sec:-A Board Roll No.
Document65 pages
ST Joseph'S Convent Senior Secondary School: Name:-Shatakshi Gaur Class:-Xii Sec:-A Board Roll No.
Navjeet Singh
No ratings yet
AI Lab Final - 2
Document9 pages
AI Lab Final - 2
Smk Nabil
No ratings yet
Practical
Document29 pages
Practical
jahnvis102
No ratings yet
panda
Document39 pages
panda
yogeshkapoor20024
No ratings yet
Ip Practical File
Document20 pages
Ip Practical File
ayanspartan3536
No ratings yet
Hands-On AI: Building ML Models with Python
From Everand
Hands-On AI: Building ML Models with Python
Anand Vemula
No ratings yet
Oose Lab Manual
Document79 pages
Oose Lab Manual
rajirk2022
No ratings yet
Report
Document4 pages
Report
rajirk2022
No ratings yet
Rajeswari .Chapter Book
Document41 pages
Rajeswari .Chapter Book
rajirk2022
No ratings yet
Datacience Phase 2
Document4 pages
Datacience Phase 2
rajirk2022
No ratings yet
CCBT Lab
Document57 pages
CCBT Lab
rajirk2022
No ratings yet
Crypto Currency Lab Manual
Document58 pages
Crypto Currency Lab Manual
rajirk2022
No ratings yet
NN&DP Unit3
Document41 pages
NN&DP Unit3
rajirk2022
No ratings yet
Training Document Openwells - Final
Document87 pages
Training Document Openwells - Final
Prasanth U
100% (1)
NODE2 Lsinventory Detail
Document65 pages
NODE2 Lsinventory Detail
balajithriller
No ratings yet
BIORADIO PG Contribution - Bci2000.org BBS
Document3 pages
BIORADIO PG Contribution - Bci2000.org BBS
generation
No ratings yet
SRS - Resume Builder
Document26 pages
SRS - Resume Builder
Himanshu Singh
No ratings yet
Check Files
Document214 pages
Check Files
Emmanuel Vandyck Mensah
No ratings yet
Trading View
Document75 pages
Trading View
yashc
No ratings yet
Module 1
Document110 pages
Module 1
nzoom1734712
No ratings yet
Palak Chaturvedi 2K20MC90 Assignment 1
Document10 pages
Palak Chaturvedi 2K20MC90 Assignment 1
Palak
No ratings yet
User Guide Nokia 2 4 User Guide
Document47 pages
User Guide Nokia 2 4 User Guide
Nephites Talent
No ratings yet
Cannot Play Sound From Another Application When ASIO4ALL Is Active
Document1 page
Cannot Play Sound From Another Application When ASIO4ALL Is Active
to_abhinav1069
No ratings yet
C Arrays (1D) - Answers
Document7 pages
C Arrays (1D) - Answers
Irtaza Rizvi
No ratings yet
DSE892 Data Sheet (USA) PDF
Document2 pages
DSE892 Data Sheet (USA) PDF
jorge
No ratings yet
Title:-Plant Leaf Diseases Detection System and Fabrication of Agri Bot Abstract
Document9 pages
Title:-Plant Leaf Diseases Detection System and Fabrication of Agri Bot Abstract
Dreamer Jaya
No ratings yet
SQL Server Reporting Services
Document3 pages
SQL Server Reporting Services
Abhishek Mitra
No ratings yet
Installing Windows Vista: Installation Instructions
Document12 pages
Installing Windows Vista: Installation Instructions
Bob Caron
No ratings yet
ST3000 User Manual en HART
Document234 pages
ST3000 User Manual en HART
mu khaled
No ratings yet
Orphic Ankleshwer - Google Search
Document1 page
Orphic Ankleshwer - Google Search
jay parekh
No ratings yet
internship-PPT (Pradip Pokharel 1HM17CS023)
Document23 pages
internship-PPT (Pradip Pokharel 1HM17CS023)
pradip pokharel
No ratings yet
Computer Graphics and Visualization: Module-1
Document42 pages
Computer Graphics and Visualization: Module-1
PlayIt All
No ratings yet
Client Needs and Software Requirements - Course Map PDF
Document1 page
Client Needs and Software Requirements - Course Map PDF
Hahne Mann
No ratings yet
ABAP Development For SAP Business Workflow - Copy Yadp-82bf-q76m-Iuzh
Document199 pages
ABAP Development For SAP Business Workflow - Copy Yadp-82bf-q76m-Iuzh
Luiz Felipe Martins Passos
100% (1)
NLP Nanodegree Syllabus
Document11 pages
NLP Nanodegree Syllabus
balthazar shrestha
No ratings yet
digital electronics and software enggc 3rd semester btech short notes
Document10 pages
digital electronics and software enggc 3rd semester btech short notes
jatbadal01
No ratings yet
15-QoS Configuration Commands
Document9 pages
15-QoS Configuration Commands
alexu
No ratings yet
M2L2 Mte 325
Document32 pages
M2L2 Mte 325
TOREMONIA, JULIET
No ratings yet
Resume Shiwam Singh
Document2 pages
Resume Shiwam Singh
aparna tiwari
No ratings yet
Commands To Setup Nginx and Phpmyadmin in Ubuntu Ec2 Instance
Document9 pages
Commands To Setup Nginx and Phpmyadmin in Ubuntu Ec2 Instance
Đoàn Trường
No ratings yet
Get Started With Google Calendar - Computer - Calendar Help-Merged-Compressed
Document30 pages
Get Started With Google Calendar - Computer - Calendar Help-Merged-Compressed
m_suhaila07
No ratings yet