10 Heatmap
10 Heatmap
Ô vuông (Cell): Mỗi ô trong biểu đồ đại diện cho một cặp giá trị giữa hai biến.
Màu sắc: Màu của mỗi ô phản ánh giá trị tương ứng. Thông thường, màu sắc đậm hơn hoặc nhạt
hơn biểu thị các giá trị lớn hơn hoặc nhỏ hơn.
Thang màu (Color Scale): Để biểu diễn các giá trị số theo dải màu liên tục hoặc phân đoạn.
3. Ưu và nhược điểm
4. Các loại heatmap phổ biến
4.1 Ma trận tương quan
4.2 Bản đồ mật độ
4.2 Bản đồ mật độ
4.3 Bản đồ nhiệt độ
4.3 Bản đồ nhiệt độ
4.4 Website heatmap
4.4 Website heatmap
5. Ứng dụng thực tế của heatmap
6. Cách đọc và phân tích heatmap
6. Nhận xét và phân tích heatmap
Nhận diện các giá trị lớn nhất và nhỏ nhất
Phát hiện khu vực dữ liệu thiếu hoặc không nhất quán
Hiệu quả trong so sánh dữ liệu theo thời gian hoặc không gian
6.1 Nhận diện các giá trị lớn nhất và nhỏ
nhất
Nhận xét: Các ô có giá trị lớn nhất (thường có
màu đậm) và nhỏ nhất (thường có màu nhạt).
Insight: Nếu hai biến có mối quan hệ tương quan mạnh, các ô tương ứng sẽ có màu sắc tương đồng,
điều này giúp ta hiểu rõ hơn về sự liên hệ giữa chúng.
6.4 Phát hiện cụm giá trị (clustering)
Nhận xét: Một số khu vực tập trung nhiều ô với màu sắc tương tự 🡺 Các cụm dữ liệu.
Insight: Phát hiện cụm giá trị 🡺 nhận ra các nhóm đối tượng hoặc các phân lớp trong dữ liệu. Hữu ích
trong phân tích phân cụm hoặc nhận diện các nhóm đối tượng tiềm năng.
6.5 So sánh hiệu suất của nhiều đối tượng
Heatmap giúp bạn phát hiện đối tượng nào có hiệu suất tốt nhất hoặc kém nhất, hoặc nhận diện các
biến có sự thay đổi lớn giữa các nhóm.
6.6 Phát hiện dữ liệu thiếu hoặc không nhất quán
Nhận xét: Nếu có ô không có dữ liệu (null) hoặc giá trị không đáng tin cậy 🡺 Biểu diễn bằng màu sắc
đặc biệt hoặc bỏ trống.
Insight: Phát hiện ra dữ liệu thiếu 🡺 Cải tiến chất lượng dữ liệu bằng cách tiền xứ lý hoặc thu thập
thêm.
6.7 Sự phân bố giá trị của dữ liệu
Nhận xét: Heatmap cho thấy phân bố đều hay có sự tập trung cao ở một số khu vực nhất định.
Insight: Giúp đánh giá mức độ cân bằng trong dữ liệu, chẳng hạn như phân tích độ phân tán của điểm
số hoặc đánh giá mật độ trong không gian địa lý.
6.8 So sánh dữ liệu theo thời gian hoặc không gian
Nhận xét: Khi các biến được sắp xếp theo thời gian hoặc không gian 🡺 theo dõi sự thay đổi của các
giá trị theo thời gian hoặc theo khu vực địa lý.
Insight: Thấy được giai đoạn hoặc khu vực có biến động lớn 🡺 Nguyên nhân và tác động.
7. Vẽ biểu đồ heatmap
Matplotlib
Seaborn
Plotly
7.1 Heatmap với matplotlib
7.2 Heatmap với seaborn
7.3 Heatmap với plotly
7.3 Heatmap với plotly
7.4 Tự thực hành heatmap trong plotly
Tự thực hành heatmap trong plotly theo cả 2 cách lập trình hướng đối tượng (sử
dụng graph objects) và lập trình hướng hàm (sử dụng plotly express)
https://plotly.com/python/heatmaps/
https://plotly.com/python/annotated-heatmap/
8. Bài tập
1) Sử dụng tập dữ liệu “emotion.csv”. Vẽ hình heatmap thể hiện mối tương quan
giữa các cột và đánh giá nội dung của hình vẽ.