Welcome to Scribd!

0% found this document useful (0 votes)

5 views

INTRO TO ML ASS

Uploaded by

gayukalai67

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

INTRO TO ML ASS

Uploaded by

gayukalai67

0% found this document useful (0 votes)

5 views3 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

5 views3 pages

INTRO TO ML ASS

Uploaded by

gayukalai67

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 3

Search inside document

INTRODUCTION TO MACHINE LEARNING

NAME:GAYATHRI.K
REG NO:212223230061

Assignment: K-Means Clustering

1. Introduction to Clustering:

Clustering is a form of unsupervised learning where data is grouped based on similarities.

Unlike supervised learning, there are no predefined labels in clustering. Instead, the algorithm
identifies patterns or groupings within the data.

K-Means clustering is a popular clustering algorithm that divides a dataset into kkk distinct
non-overlapping clusters. Each cluster is defined by its centroid, and data points are assigned to
the cluster with the closest centroid.

2. Applications of K-Means Clustering:

1. Market Segmentation: Group customers based on purchasing behavior.

2. Image Compression: Reduce the number of colors in images by grouping similar
colors.
3. Document Clustering: Group similar documents or articles for better organization.
4. Anomaly Detection: Identify outliers in datasets for fraud detection or security.

3. K-Means Algorithm Steps:

1. Initialize kkk centroids randomly or using a specific method.

2. Assign each data point to the nearest centroid based on a distance metric (e.g.,
Euclidean distance).
3. Update the centroids by calculating the mean of the points assigned to each cluster.
4. Repeat steps 2 and 3 until:
○ Centroids no longer change, or
○ A predefined number of iterations is reached.
4. Advantages and Disadvantages:

Advantages:

● Simple and easy to implement.

● Efficient with large datasets.
● Works well when clusters are distinct and well-separated.

Disadvantages:

● Sensitive to the initial placement of centroids.

● Struggles with clusters of varying sizes and densities.
● Requires the number of clusters (kkk) to be specified beforehand.

5. Python Implementation:

The dataset consists of 2D points:

Points: (2,3),(3,3),(6,7),(8,8),(3,5),(7,6)\text{Points: } (2, 3), (3, 3), (6, 7), (8, 8), (3, 5), (7,
6)Points: (2,3),(3,3),(6,7),(8,8),(3,5),(7,6)

Code:
import numpy as np

# Example dataset
data = np.array([[2, 3], [3, 3], [6, 7], [8, 8], [3, 5], [7, 6]])
k = 2 # Number of clusters

# Initialize centroids randomly

centroids = data[np.random.choice(data.shape[0], k, replace=False)]

# K-Means algorithm
for _ in range(100): # Max iterations
clusters = [[] for _ in range(k)]
for point in data:
# Assign points to the nearest centroid
idx = np.argmin([np.linalg.norm(point - c) for c in centroids])
clusters[idx].append(point)

# Update centroids
new_centroids = [np.mean(cluster, axis=0) if cluster else centroids[i]
for i, cluster in enumerate(clusters)]
if np.allclose(new_centroids, centroids): # Check for convergence
break
centroids = new_centroids

# Display results
for i, cluster in enumerate(clusters):
print(f"Cluster {i+1}: {cluster}")
print(f"Final Centroids: {centroids}")

7. Conclusion:

The K-Means algorithm is a powerful clustering technique for grouping similar data. Its simplicity
and scalability make it a popular choice for many practical applications. However, understanding
its limitations and choosing kkk wisely are critical for optimal performance.

Assignment 4 A
Document15 pages
Assignment 4 A
sahilmukund.awasarkar
No ratings yet
K Mean
Document7 pages
K Mean
Deergha Tiwari
No ratings yet
Assignment 5
Document3 pages
Assignment 5
Pujan Patel
No ratings yet
K-Means Clustering
Document5 pages
K-Means Clustering
Mani
No ratings yet
ML-12
Document19 pages
ML-12
adnanriaz2024
No ratings yet
Welcome To International Journal of Engineering Research and Development (IJERD)
Document5 pages
Welcome To International Journal of Engineering Research and Development (IJERD)
IJERD
No ratings yet
DWM Experiment5 E059
Document15 pages
DWM Experiment5 E059
Shubham Gupta
No ratings yet
Clustering in Python
Document31 pages
Clustering in Python
aman38402
No ratings yet
K.means Clustering
Document8 pages
K.means Clustering
lokeshkumaar3421
No ratings yet
ML 5 (1)
Document61 pages
ML 5 (1)
siddheshwar bali
No ratings yet
DWM Exp7 C49
Document11 pages
DWM Exp7 C49
yadneshshende2223
No ratings yet
ML - Unit - 2
Document13 pages
ML - Unit - 2
Dr D S Naga Malleswara Rao
No ratings yet
Unit-4 (2)
Document29 pages
Unit-4 (2)
Krishna Rao
No ratings yet
ML Minors Exp7
Document6 pages
ML Minors Exp7
Deep Prajapati
No ratings yet
ML Application in Signal Processing and Communication Engineering
Document27 pages
ML Application in Signal Processing and Communication Engineering
aniruddh nain
No ratings yet
Assignment 3 B
Document7 pages
Assignment 3 B
sahilmukund.awasarkar
No ratings yet
Text Analytics Unit-3
Document11 pages
Text Analytics Unit-3
aathyukthas.ai20001
No ratings yet
6 - Into To Data Science Techniques and Clustering
Document16 pages
6 - Into To Data Science Techniques and Clustering
Niranjan Herwadkar
No ratings yet
Assignment 6 ML
Document4 pages
Assignment 6 ML
Mansi Todmal
No ratings yet
Jaipur National University: Project Design With Seminar
Document26 pages
Jaipur National University: Project Design With Seminar
Faizan Shaikh
100% (1)
AdityaGaur BDA Exp8
Document4 pages
AdityaGaur BDA Exp8
reverentkowalevski1
No ratings yet
CLUSTERING
Document11 pages
CLUSTERING
Swarnlata
No ratings yet
20bcs7635-EXP 10
Document5 pages
20bcs7635-EXP 10
sameer
No ratings yet
K-Means_Clustering_Report
Document2 pages
K-Means_Clustering_Report
Vishnu Prasad Prasad
No ratings yet
K Means Clustering - Experiment 12
Document3 pages
K Means Clustering - Experiment 12
Prateek Verma
No ratings yet
476 emt abstract
Document3 pages
476 emt abstract
kancharanakeerthi
No ratings yet
K Means Clustering - Introduction
Document19 pages
K Means Clustering - Introduction
dakc.cse
No ratings yet
Unit4 Datascience
Document43 pages
Unit4 Datascience
drsaranyarcw
No ratings yet
Experiment No 07: Mihir Patel Teit 2
Document5 pages
Experiment No 07: Mihir Patel Teit 2
MIHIR PATEL
No ratings yet
K Means Clustering
Document11 pages
K Means Clustering
Shobha Kumari Choudhary
No ratings yet
K-Means in Python - Solution
Document6 pages
K-Means in Python - Solution
Rodrigo Violante
No ratings yet
ML UNIT 4 Sir
Document42 pages
ML UNIT 4 Sir
sampathmandru18
No ratings yet
Aiml 8
Document7 pages
Aiml 8
kushnayade
No ratings yet
Assignment ML
Document3 pages
Assignment ML
Ramaadyuti Battabyal
No ratings yet
DS - ML - 7 - 60019210046 1
Document6 pages
DS - ML - 7 - 60019210046 1
Deep Prajapati
No ratings yet
Module 5.Docx Aiml
Document28 pages
Module 5.Docx Aiml
gbmadeshkumar
No ratings yet
Task 22
Document5 pages
Task 22
syedafatimasajid23
No ratings yet
A Novel Approach For Data Clustering Using Improved K-Means Algorithm PDF
Document6 pages
A Novel Approach For Data Clustering Using Improved K-Means Algorithm PDF
Ninad Samel
No ratings yet
Mokani Aiml-8
Document6 pages
Mokani Aiml-8
Aakash Mokani
No ratings yet
21BEC505 Exp2
Document7 pages
21BEC505 Exp2
jay
No ratings yet
ML Exp 10
Document5 pages
ML Exp 10
ananyahc12
No ratings yet
4 Clustering With K-Means - Kaggle
Document9 pages
4 Clustering With K-Means - Kaggle
Prujith Muthu Ram
No ratings yet
Unsupervisd Learning Algorithm
Document6 pages
Unsupervisd Learning Algorithm
Shrey Dixit
No ratings yet
CV UNIT 4
Document60 pages
CV UNIT 4
jayalakshmi.mca staff
No ratings yet
An Efficient Incremental Clustering Algorithm
Document3 pages
An Efficient Incremental Clustering Algorithm
World of Computer Science and Information Technology Journal
No ratings yet
The International Journal of Engineering and Science (The IJES)
Document4 pages
The International Journal of Engineering and Science (The IJES)
theijes
No ratings yet
U1 - KMeans - 5th Sem - DS
Document14 pages
U1 - KMeans - 5th Sem - DS
subbumail051
No ratings yet
Dynamicclustering
Document6 pages
Dynamicclustering
kasun prabhath
No ratings yet
Unit-5
Document33 pages
Unit-5
Nandita
No ratings yet
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 4 Notes
Document23 pages
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 4 Notes
sai753638
No ratings yet
Unsupervised Learning - Clustering Cheatsheet - Codecademy
Document5 pages
Unsupervised Learning - Clustering Cheatsheet - Codecademy
Imane Loukili
No ratings yet
ML Assign4
Document7 pages
ML Assign4
hrr601097
No ratings yet
unsupervised learning
Document23 pages
unsupervised learning
shaukeenkha3606
No ratings yet
ML0101EN Clus K Means Customer Seg Py v1
Document8 pages
ML0101EN Clus K Means Customer Seg Py v1
Rajat Solanki
100% (1)
DSV_Unit 3_Data Analysis in Depth
Document53 pages
DSV_Unit 3_Data Analysis in Depth
27 03
No ratings yet
Unit 5 - Cluster Analysis
Document14 pages
Unit 5 - Cluster Analysis
eskpg066
No ratings yet
Unit 4 Descriptive Modeling
Document18 pages
Unit 4 Descriptive Modeling
Atul Gaur
No ratings yet
Exp 4
Document2 pages
Exp 4
Lalitha Abhigna
No ratings yet
Image Segmentation in Python- Practical Hands-On (3)
Document24 pages
Image Segmentation in Python- Practical Hands-On (3)
Chloe Tee
No ratings yet
Machine Learning with Python for Beginners
From Everand
Machine Learning with Python for Beginners
Saimon Carrie
No ratings yet
software
Document37 pages
software
gayukalai67
No ratings yet
ML_Unit_1_Certificate[1]
Document1 page
ML_Unit_1_Certificate[1]
gayukalai67
No ratings yet
ML REC 2
Document6 pages
ML REC 2
gayukalai67
No ratings yet
19AI305 -Advanced c programming-nov 2024updated (1)
Document21 pages
19AI305 -Advanced c programming-nov 2024updated (1)
gayukalai67
No ratings yet
TOPIC WISE DSA QUESTIONS
Document15 pages
TOPIC WISE DSA QUESTIONS
Surabhi Raj
No ratings yet
10 1016@j Jaci 2020 04 018
Document69 pages
10 1016@j Jaci 2020 04 018
Okki Wahyu Atikasari
No ratings yet
Kaspersky Lab Whitepaper Machine Learning
Document17 pages
Kaspersky Lab Whitepaper Machine Learning
Mochamad Beta Auditama
No ratings yet
Tibco Spot Miner 8.2 Uguide
Document756 pages
Tibco Spot Miner 8.2 Uguide
ikeyada
No ratings yet
Optimized Machine Learning Based Collaborative Filtering (OMLCF) Recommendation System in e Commerce
Document12 pages
Optimized Machine Learning Based Collaborative Filtering (OMLCF) Recommendation System in e Commerce
TimeTable Management
No ratings yet
Cluster Analysis
Document13 pages
Cluster Analysis
Atiqah Ismail
100% (1)
Automated Marketing Research Using Online Customer Reviews
Document62 pages
Automated Marketing Research Using Online Customer Reviews
amazaira
No ratings yet
Compulsory.: Techniques
Document2 pages
Compulsory.: Techniques
171-2022 Pranav Mhalsekar
No ratings yet
(22AR1F0041) Criminal Identification Using ML Final Documentation
Document81 pages
(22AR1F0041) Criminal Identification Using ML Final Documentation
d.sivanjaneyulu917
No ratings yet
Data Mining
Document89 pages
Data Mining
Maruf
No ratings yet
Mapping Research Themes and Future Directions in Learning Style
Document12 pages
Mapping Research Themes and Future Directions in Learning Style
Mauricio Henning
No ratings yet
Cluster Analysis - Approach 1
Document28 pages
Cluster Analysis - Approach 1
Charan Naidu
No ratings yet
DBSCAN Clustering
Document22 pages
DBSCAN Clustering
movie download
No ratings yet
Machine Learning
Document3 pages
Machine Learning
ATTIQUE
No ratings yet
(Artigo) What We Instagram - A First Analysis of Instagram Photo Content and User Types PDF
Document4 pages
(Artigo) What We Instagram - A First Analysis of Instagram Photo Content and User Types PDF
Caio Saldanha
No ratings yet
MCA-SEM-III-Syllabus Mobile Computing
Document12 pages
MCA-SEM-III-Syllabus Mobile Computing
cnabhilash2
No ratings yet
CIS Theory - MachineLearning
Document13 pages
CIS Theory - MachineLearning
Gayathri R HICET CSE STAFF
No ratings yet
Romi DM Aug2020
Document722 pages
Romi DM Aug2020
Novera Meylinda
No ratings yet
Unit 4
Document23 pages
Unit 4
Nivetha Selvamurugan
No ratings yet
CSE R22 08 NOV 2022-Course Structure
Document52 pages
CSE R22 08 NOV 2022-Course Structure
Dr.rashmi
No ratings yet
1Z0-1041-21 Oracle Cloud Platform Enterprise Analytics 2021 Specialist Part 1
Document10 pages
1Z0-1041-21 Oracle Cloud Platform Enterprise Analytics 2021 Specialist Part 1
Aqeel Nawaz
No ratings yet
A Wavelet-Based Anytime Algorithm For K-Means Clustering of Time Series
Document12 pages
A Wavelet-Based Anytime Algorithm For K-Means Clustering of Time Series
Yaseen Hussain
No ratings yet
Tea 20225
Document26 pages
Tea 20225
Emmanuel Ore Martinez
No ratings yet
Vdoc - Pub - Random Geometric Graphs Oxford Studies in Probability 5
Document345 pages
Vdoc - Pub - Random Geometric Graphs Oxford Studies in Probability 5
Đệ Bùi
No ratings yet
Cs8080 Information Retrieval Techniques
Document10 pages
Cs8080 Information Retrieval Techniques
senthil
No ratings yet
Husnain, 2023
Document21 pages
Husnain, 2023
Faisal Ali
No ratings yet
DA517 Machine Learning II: Syllabus (Spring 2020-2021)
Document3 pages
DA517 Machine Learning II: Syllabus (Spring 2020-2021)
Hakan
No ratings yet
Clustering - The Data Ensemble
Document4 pages
Clustering - The Data Ensemble
Daniel N Sherine Foo
No ratings yet
Data Warehousing & Data Mining PUT Solution
Document38 pages
Data Warehousing & Data Mining PUT Solution
NXT LVL GAMER
No ratings yet
MLT Quantum
Document138 pages
MLT Quantum
kumarsharma74092
No ratings yet