[NVPTX] Limit a sparsity selector in sparse MMA intrinsics. #154984

kvederni · 2025-08-22T16:51:09Z

This PR fixes NVPTX tests in LLVM testing by adding more limitations for a sparsity selector in sparse MMA intrinsics.
The previous PR that is merged to llvm:main is PR150950. The merge to llvm:main is d9c6b7b.

sparsity selector in sparse MMA intrinsics.

llvmbot · 2025-08-22T16:51:38Z

@llvm/pr-subscribers-backend-nvptx

Author: Kirill Vedernikov (kvederni)

Changes

This PR fixes NVPTX tests in LLVM testing by adding more limitations for a sparsity selector in sparse MMA intrinsics.

Full diff: https://github.com/llvm/llvm-project/pull/154984.diff

2 Files Affected:

(modified) llvm/include/llvm/IR/IntrinsicsNVVM.td (+6-1)
(modified) llvm/test/CodeGen/NVPTX/wmma.py (+6)

diff --git a/llvm/include/llvm/IR/IntrinsicsNVVM.td b/llvm/include/llvm/IR/IntrinsicsNVVM.td
index cd7a0bc9c4b48..130fa27e4f870 100644
--- a/llvm/include/llvm/IR/IntrinsicsNVVM.td
+++ b/llvm/include/llvm/IR/IntrinsicsNVVM.td
@@ -2161,6 +2161,7 @@ class NVVM_MMA_SP<WMMA_REGS A, WMMA_REGS B, WMMA_REGS C, WMMA_REGS D>
     // The range [0;num_threads) is for the sparsity selector that indicates the threads
     // which contribute metadata.
     int num_threads = !if(!or(!and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "bf16")),
+                              !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "f16")),
                               !and(!eq(A.geom, "m16n8k16"), !eq(A.ptx_elt_type, "tf32")),
                               !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "u8")),
                               !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "s8")),
@@ -2175,7 +2176,11 @@ class NVVM_MMA_SP<WMMA_REGS A, WMMA_REGS B, WMMA_REGS C, WMMA_REGS D>
                                       !eq(A.ptx_elt_type, "e3m2"),
                                       !eq(A.ptx_elt_type, "e2m3"),
                                       !eq(A.ptx_elt_type, "e2m1"))),
-                              1, 4));
+                              1,
+                              !if(!and(!eq(A.geom, "m16n8k128"),
+                                       !or(!eq(A.ptx_elt_type, "s4"),
+                                           !eq(A.ptx_elt_type, "u4"))),
+                                  1, 4)));
     let IntrProperties = [IntrNoMem, IntrNoCallback, ImmArg<ArgIndex<pos>>,
                           Range<ArgIndex<pos>, 0, num_threads>];
 }
diff --git a/llvm/test/CodeGen/NVPTX/wmma.py b/llvm/test/CodeGen/NVPTX/wmma.py
index f4f166c4018d0..6d73bce46da7c 100644
--- a/llvm/test/CodeGen/NVPTX/wmma.py
+++ b/llvm/test/CodeGen/NVPTX/wmma.py
@@ -1135,6 +1135,7 @@ def sp_selector_gen(op):
     # (geom, type) -> allowed selector range
     range_01 = {
         ("m16n8k32", "bf16"),
+        ("m16n8k32", "f16"),
         ("m16n8k16", "tf32"),
         ("m16n8k32", "u8"),
         ("m16n8k32", "s8"),
@@ -1154,6 +1155,11 @@ def sp_selector_gen(op):
         "e2m1",
     ]:
         return range(1)
+    if op.a.geom == "m16n8k128" and op.a.mma_type.ptx_type in [
+        "u4",
+        "s4",
+    ]:
+        return range(1)
     return range(4)

llvmbot · 2025-08-22T16:51:39Z

@llvm/pr-subscribers-llvm-ir

Author: Kirill Vedernikov (kvederni)

Changes

This PR fixes NVPTX tests in LLVM testing by adding more limitations for a sparsity selector in sparse MMA intrinsics.

Full diff: https://github.com/llvm/llvm-project/pull/154984.diff

2 Files Affected:

(modified) llvm/include/llvm/IR/IntrinsicsNVVM.td (+6-1)
(modified) llvm/test/CodeGen/NVPTX/wmma.py (+6)

diff --git a/llvm/include/llvm/IR/IntrinsicsNVVM.td b/llvm/include/llvm/IR/IntrinsicsNVVM.td
index cd7a0bc9c4b48..130fa27e4f870 100644
--- a/llvm/include/llvm/IR/IntrinsicsNVVM.td
+++ b/llvm/include/llvm/IR/IntrinsicsNVVM.td
@@ -2161,6 +2161,7 @@ class NVVM_MMA_SP<WMMA_REGS A, WMMA_REGS B, WMMA_REGS C, WMMA_REGS D>
     // The range [0;num_threads) is for the sparsity selector that indicates the threads
     // which contribute metadata.
     int num_threads = !if(!or(!and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "bf16")),
+                              !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "f16")),
                               !and(!eq(A.geom, "m16n8k16"), !eq(A.ptx_elt_type, "tf32")),
                               !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "u8")),
                               !and(!eq(A.geom, "m16n8k32"), !eq(A.ptx_elt_type, "s8")),
@@ -2175,7 +2176,11 @@ class NVVM_MMA_SP<WMMA_REGS A, WMMA_REGS B, WMMA_REGS C, WMMA_REGS D>
                                       !eq(A.ptx_elt_type, "e3m2"),
                                       !eq(A.ptx_elt_type, "e2m3"),
                                       !eq(A.ptx_elt_type, "e2m1"))),
-                              1, 4));
+                              1,
+                              !if(!and(!eq(A.geom, "m16n8k128"),
+                                       !or(!eq(A.ptx_elt_type, "s4"),
+                                           !eq(A.ptx_elt_type, "u4"))),
+                                  1, 4)));
     let IntrProperties = [IntrNoMem, IntrNoCallback, ImmArg<ArgIndex<pos>>,
                           Range<ArgIndex<pos>, 0, num_threads>];
 }
diff --git a/llvm/test/CodeGen/NVPTX/wmma.py b/llvm/test/CodeGen/NVPTX/wmma.py
index f4f166c4018d0..6d73bce46da7c 100644
--- a/llvm/test/CodeGen/NVPTX/wmma.py
+++ b/llvm/test/CodeGen/NVPTX/wmma.py
@@ -1135,6 +1135,7 @@ def sp_selector_gen(op):
     # (geom, type) -> allowed selector range
     range_01 = {
         ("m16n8k32", "bf16"),
+        ("m16n8k32", "f16"),
         ("m16n8k16", "tf32"),
         ("m16n8k32", "u8"),
         ("m16n8k32", "s8"),
@@ -1154,6 +1155,11 @@ def sp_selector_gen(op):
         "e2m1",
     ]:
         return range(1)
+    if op.a.geom == "m16n8k128" and op.a.mma_type.ptx_type in [
+        "u4",
+        "s4",
+    ]:
+        return range(1)
     return range(4)

[NVPTX] A fix for LLVM testing. More limitations were added for a

7952c8d

sparsity selector in sparse MMA intrinsics.

llvmbot added backend:NVPTX llvm:ir labels Aug 22, 2025

kvederni changed the title ~~[NVPTX] A fix for LLVM testing. More limitations were added for a sparsity selector in sparse MMA intrinsics.~~ [NVPTX] Limits were added for a sparsity selector in sparse MMA intrinsics. Aug 22, 2025

kvederni changed the title ~~[NVPTX] Limits were added for a sparsity selector in sparse MMA intrinsics.~~ [NVPTX] Limits were added for a sparsity selector in MMA.SP intrinsics. Aug 22, 2025

kvederni changed the title ~~[NVPTX] Limits were added for a sparsity selector in MMA.SP intrinsics.~~ [NVPTX] Limit a sparsity selector in sparse MMA intrinsics. Aug 22, 2025

schwarzschild-radius requested review from Artem-B and durga4github August 22, 2025 17:04

schwarzschild-radius mentioned this pull request Aug 22, 2025

[NVPTX] Add sparse MMA intrinsics #150950

Merged

schwarzschild-radius self-requested a review August 22, 2025 19:21

durga4github approved these changes Aug 22, 2025

View reviewed changes

schwarzschild-radius merged commit 533cc9a into llvm:main Aug 22, 2025
12 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[NVPTX] Limit a sparsity selector in sparse MMA intrinsics. #154984

[NVPTX] Limit a sparsity selector in sparse MMA intrinsics. #154984

Uh oh!

kvederni commented Aug 22, 2025 •

edited

Loading

Uh oh!

llvmbot commented Aug 22, 2025

Uh oh!

llvmbot commented Aug 22, 2025

Uh oh!

Uh oh!

Uh oh!

[NVPTX] Limit a sparsity selector in sparse MMA intrinsics. #154984

[NVPTX] Limit a sparsity selector in sparse MMA intrinsics. #154984

Uh oh!

Conversation

kvederni commented Aug 22, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

llvmbot commented Aug 22, 2025

Uh oh!

llvmbot commented Aug 22, 2025

Uh oh!

Uh oh!

Uh oh!

kvederni commented Aug 22, 2025 •

edited

Loading