0% found this document useful (0 votes)
44 views30 pages

10 Heatmap

Heat map - Data visualization

Uploaded by

dangttan03
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
44 views30 pages

10 Heatmap

Heat map - Data visualization

Uploaded by

dangttan03
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 30

Heatmap chart

Lecturer: Dang Thi Thuy An


1. Khái niệm
Định nghĩa: Heatmap là một loại biểu đồ biểu diễn dữ
liệu trong ma trận 2D, trong đó mỗi giá trị trong ma trận
được biểu diễn bằng một ô màu. Màu sắc phản ánh
cường độ hoặc giá trị của các dữ liệu.

Mục đích: Heatmap giúp trực quan hóa mối quan hệ


giữa các biến hoặc so sánh giá trị của các dữ liệu
trong một không gian có kích thước cố định.

Ứng dụng: Thường được dùng để phân tích dữ liệu


lớn, ma trận tương quan, phân tích nhiệt độ, mật độ dữ
liệu.
2. Cấu trúc
Trục X và Y: Biểu diễn hai biến số hoặc các danh mục khác nhau.

Ô vuông (Cell): Mỗi ô trong biểu đồ đại diện cho một cặp giá trị giữa hai biến.

Màu sắc: Màu của mỗi ô phản ánh giá trị tương ứng. Thông thường, màu sắc đậm hơn hoặc nhạt
hơn biểu thị các giá trị lớn hơn hoặc nhỏ hơn.

Thang màu (Color Scale): Để biểu diễn các giá trị số theo dải màu liên tục hoặc phân đoạn.
3. Ưu và nhược điểm
4. Các loại heatmap phổ biến
4.1 Ma trận tương quan
4.2 Bản đồ mật độ
4.2 Bản đồ mật độ
4.3 Bản đồ nhiệt độ
4.3 Bản đồ nhiệt độ
4.4 Website heatmap
4.4 Website heatmap
5. Ứng dụng thực tế của heatmap
6. Cách đọc và phân tích heatmap
6. Nhận xét và phân tích heatmap
Nhận diện các giá trị lớn nhất và nhỏ nhất

Phát hiện xu hướng và mô hình

Xác định mối tương quan giữa các biến

Phát hiện các cụm giá trị (Clustering)

So sánh hiệu suất của nhiều đối tượng

Phát hiện khu vực dữ liệu thiếu hoặc không nhất quán

Sự phân bố giá trị trong dữ liệu

Hiệu quả trong so sánh dữ liệu theo thời gian hoặc không gian
6.1 Nhận diện các giá trị lớn nhất và nhỏ
nhất
Nhận xét: Các ô có giá trị lớn nhất (thường có
màu đậm) và nhỏ nhất (thường có màu nhạt).

🡺 Dễ dàng xác định cực trị

🡺 Hữu ích khi tìm điểm outliers trong dữ liệu,


hoặc các giá trị cao/thấp nhất để đưa ra hành
động.
6.2 Phát hiện xu hướng và mô hình
Nhận xét: Dễ thấy được xu hướng tăng/giảm, sự phụ thuộc hoặc mối quan hệ giữa các biến. Ví dụ,
nếu dải màu chuyển dần từ màu nhạt sang màu đậm theo một hướng (trái sang phải, hoặc trên xuống
dưới), điều này có thể chỉ ra sự tăng trưởng hoặc biến đổi tích cực giữa các biến số.
6.3 Xác định mối tương quan giữa các
biến
Nhận xét: Heatmap ma trận tương quan 🡺 Màu đậm biểu thị sự tương quan mạnh (dương hoặc âm),
còn ô màu nhạt hơn biểu thị sự tương quan yếu hoặc không có tương quan.

Insight: Nếu hai biến có mối quan hệ tương quan mạnh, các ô tương ứng sẽ có màu sắc tương đồng,
điều này giúp ta hiểu rõ hơn về sự liên hệ giữa chúng.
6.4 Phát hiện cụm giá trị (clustering)
Nhận xét: Một số khu vực tập trung nhiều ô với màu sắc tương tự 🡺 Các cụm dữ liệu.

Insight: Phát hiện cụm giá trị 🡺 nhận ra các nhóm đối tượng hoặc các phân lớp trong dữ liệu. Hữu ích
trong phân tích phân cụm hoặc nhận diện các nhóm đối tượng tiềm năng.
6.5 So sánh hiệu suất của nhiều đối tượng
Heatmap giúp bạn phát hiện đối tượng nào có hiệu suất tốt nhất hoặc kém nhất, hoặc nhận diện các
biến có sự thay đổi lớn giữa các nhóm.
6.6 Phát hiện dữ liệu thiếu hoặc không nhất quán
Nhận xét: Nếu có ô không có dữ liệu (null) hoặc giá trị không đáng tin cậy 🡺 Biểu diễn bằng màu sắc
đặc biệt hoặc bỏ trống.

Insight: Phát hiện ra dữ liệu thiếu 🡺 Cải tiến chất lượng dữ liệu bằng cách tiền xứ lý hoặc thu thập
thêm.
6.7 Sự phân bố giá trị của dữ liệu
Nhận xét: Heatmap cho thấy phân bố đều hay có sự tập trung cao ở một số khu vực nhất định.

Insight: Giúp đánh giá mức độ cân bằng trong dữ liệu, chẳng hạn như phân tích độ phân tán của điểm
số hoặc đánh giá mật độ trong không gian địa lý.
6.8 So sánh dữ liệu theo thời gian hoặc không gian
Nhận xét: Khi các biến được sắp xếp theo thời gian hoặc không gian 🡺 theo dõi sự thay đổi của các
giá trị theo thời gian hoặc theo khu vực địa lý.

Insight: Thấy được giai đoạn hoặc khu vực có biến động lớn 🡺 Nguyên nhân và tác động.
7. Vẽ biểu đồ heatmap

Matplotlib
Seaborn
Plotly
7.1 Heatmap với matplotlib
7.2 Heatmap với seaborn
7.3 Heatmap với plotly
7.3 Heatmap với plotly
7.4 Tự thực hành heatmap trong plotly
Tự thực hành heatmap trong plotly theo cả 2 cách lập trình hướng đối tượng (sử
dụng graph objects) và lập trình hướng hàm (sử dụng plotly express)

https://plotly.com/python/heatmaps/

https://plotly.com/python/annotated-heatmap/
8. Bài tập
1) Sử dụng tập dữ liệu “emotion.csv”. Vẽ hình heatmap thể hiện mối tương quan
giữa các cột và đánh giá nội dung của hình vẽ.

2) Sử dụng tập dữ liệu “company_sales_data.csv”. Vẽ hình heatmap thể hiện số


lượng các sản phẩm bán ra theo tháng của các loại sản phẩm và đánh giá nhận xét
nội dung của hình vẽ.

You might also like