Add decompositions for median and nonmedian

isuruf · isuruf · commit cee1ff47cf3f · 2024-09-03T16:40:19.000Z
ghstack-source-id: 12b12d2 Pull Request resolved: #134881
diff --git a/test/expect/HasDecompTest.test_has_decomposition.expect b/test/expect/HasDecompTest.test_has_decomposition.expect
@@ -928,10 +928,6 @@ aten::max_unpool2d
 aten::max_unpool2d.out
 aten::max_unpool3d
 aten::max_unpool3d.out
-aten::median
-aten::median.dim
-aten::median.dim_values
-aten::median.out
 aten::min
 aten::min.dim
 aten::min.dim_min
@@ -994,10 +990,6 @@ aten::multilabel_margin_loss_backward
 aten::multilabel_margin_loss_backward.grad_input
 aten::multinomial
 aten::multinomial.out
-aten::nanmedian
-aten::nanmedian.dim
-aten::nanmedian.dim_values
-aten::nanmedian.out
 aten::native_group_norm.out
 aten::native_norm
 aten::native_norm.ScalarOpt_dim_dtype
diff --git a/torch/_decomp/__init__.py b/torch/_decomp/__init__.py
@@ -357,6 +357,7 @@ def core_aten_decompositions() -> Dict[torch._ops.OperatorBase, Callable]:
             aten.logsumexp.default,
             aten.masked_fill,
             aten.masked_fill_,
+            aten.median,
             aten.mish,
             aten.mish_,
             aten.mse_loss,
@@ -366,6 +367,7 @@ def core_aten_decompositions() -> Dict[torch._ops.OperatorBase, Callable]:
             aten.mv,
             aten.mvlgamma,
             aten.mvlgamma_,
+            aten.nanmedian,
             aten.nansum,
             aten.nan_to_num,
             aten.nan_to_num_,
diff --git a/torch/_decomp/decompositions.py b/torch/_decomp/decompositions.py
@@ -5088,6 +5088,95 @@ def resize_as(self, other, memory_format=None):
     return aten.resize(self, other.shape, memory_format=memory_format)
 
 
+@register_decomposition([aten.median.default, aten.median.out])
+@out_wrapper()
+def median(x):
+    if x.numel() == 0:
+        return x.new_full([], float("nan")).to(x.dtype)
+
+    return median_impl(x.flatten(), dim=0, keepdim=False, ignore_nan=False)[0]
+
+
+@register_decomposition([aten.nanmedian.default, aten.nanmedian.out])
+@out_wrapper()
+def nanmedian(x):
+    if x.numel() == 0:
+        return x.new_full([], float("nan")).to(x.dtype)
+
+    return median_impl(x.flatten(), dim=0, keepdim=False, ignore_nan=True)[0]
+
+
+@register_decomposition([aten.median.dim, aten.median.dim_values])
+@out_wrapper("values", "indices")
+def median_dim(x, dim, keepdim=False):
+    utils.alert_not_deterministic("median with indices output")
+    return median_impl(x, dim=dim, keepdim=keepdim, ignore_nan=False)
+
+
+@register_decomposition([aten.nanmedian.dim, aten.nanmedian.dim_values])
+@out_wrapper("values", "indices")
+def nanmedian_dim(x, dim, keepdim=False):
+    utils.alert_not_deterministic("median with indices output")
+    return median_impl(x, dim=dim, keepdim=keepdim, ignore_nan=True)
+
+
+def median_impl(x, dim, keepdim=False, ignore_nan=True):
+    dim = utils.canonicalize_dim(x.dim(), dim)
+
+    if x.ndim == 0:
+        return x.clone(), x.new_full(x.shape, 0, dtype=torch.int64)
+
+    size = x.shape[dim]
+    torch._check(
+        size != 0,
+        lambda: f"median(): Expected reduction dim {dim} to have non-zero size.",
+    )
+
+    result_shape = list(x.shape)
+    if keepdim:
+        result_shape[dim] = 1
+    else:
+        del result_shape[dim]
+
+    if x.numel() == 0:
+        return x.new_empty(result_shape), x.new_empty(result_shape, dtype=torch.int64)
+
+    sorted_vals, sorted_idxs = aten.sort(x, dim=dim)
+
+    if ignore_nan:
+        k = ((size - 1) - x.isnan().sum(dim=dim, keepdim=True)) // 2
+        strides = sorted_vals.stride()
+        indices = k * strides[dim]
+        for d in range(x.ndim):
+            if d == dim:
+                continue
+            idx_shape = [1] * x.ndim
+            idx_shape[d] = -1
+            indices = indices + strides[d] * torch.arange(
+                x.shape[d], device=x.device
+            ).view(idx_shape)
+
+        result_val = aten._unsafe_index(sorted_vals.flatten(), [indices.flatten()])
+        result_ind = aten._unsafe_index(sorted_idxs.flatten(), [indices.flatten()])
+    else:
+        k = (size - 1) // 2
+        val_indices: List[Optional[TensorLike]] = [None] * x.ndim
+        val_indices[dim] = torch.tensor([k], device=x.device)
+        mask_indices: List[Optional[TensorLike]] = [None] * x.ndim
+        mask_indices[dim] = torch.tensor([x.shape[dim] - 1], device=x.device)
+
+        result_val = aten._unsafe_index(sorted_vals, val_indices)
+        result_ind = aten._unsafe_index(sorted_idxs, val_indices)
+
+        last_val = aten._unsafe_index(sorted_vals, mask_indices)
+        last_ind = aten._unsafe_index(sorted_idxs, mask_indices)
+
+        result_val = torch.where(last_val.isnan(), last_val, result_val)
+        result_ind = torch.where(last_val.isnan(), last_ind, result_ind)
+
+    return result_val.view(result_shape), result_ind.view(result_shape)
+
+
 register_inplace(aten.addbmm_, aten.addbmm)
 register_inplace(aten.addmm_, aten.addmm)
 register_inplace(aten.addmv_, aten.addmv)
diff --git a/torch/_inductor/lowering.py b/torch/_inductor/lowering.py
@@ -2254,8 +2254,6 @@ def is_aligned(x):
 make_fallback(aten.kthvalue)
 make_fallback(aten.topk)
 make_fallback(aten.mode)
-make_fallback(aten.median)
-make_fallback(aten.nanmedian)
 make_fallback(aten.randperm)
 # see: https://github.com/pytorch/pytorch/pull/121354
 make_fallback(aten.resize_)
diff --git a/torch/testing/_internal/common_methods_invocations.py b/torch/testing/_internal/common_methods_invocations.py
@@ -4967,6 +4967,19 @@ def sample_inputs_reduction_count_nonzero(*args, **kwargs):
         sample.kwargs.pop('keepdim', None)
         yield sample
 
+
+def sample_inputs_reduction_unique(*args, **kwargs):
+    # for median with indices, the index might not be unique
+    # and depends on the device and the kernel. We return samples with unique
+    # values if `unique_values` is true and we return samples with non-unique
+    # value if `unique_values` is false.
+    unique_values = kwargs.pop('unique_values', False)
+    for sample in sample_inputs_reduction(*args, **kwargs):
+        is_nonunique = 'dim' in sample.kwargs and sample.args and sample.args[0].unique().numel() != sample.args[0].numel()
+        if is_nonunique == unique_values:
+            yield sample
+
+
 def sample_inputs_leaky_relu(op_info, device, dtype, requires_grad, **kwargs):
     N = 10
     make_arg = partial(make_tensor, device=device, dtype=dtype, requires_grad=requires_grad)
@@ -14002,20 +14015,47 @@ def sample_inputs_alias_copy(op_info, device, dtype, requires_grad, **kwargs):
            skips=(
            )),
     OpInfo('median',
+           variant_test_name='nonunique',
+           dtypes=all_types_and(torch.bfloat16, torch.float16),
+           # TODO: some signatures of median do support out
+           supports_out=False,
+           supports_forward_ad=True,
+           supports_fwgrad_bwgrad=True,
+           error_inputs_func=error_inputs_median,
+           sample_inputs_func=partial(sample_inputs_reduction_unique, supports_multiple_dims=False, unique_values=False),
+           skips=(
+               DecorateInfo(unittest.skip("Non-deterministic when non-unique values present"), 'TestDecomp', 'test_comprehensive'),
+               DecorateInfo(unittest.skip("Non-deterministic when non-unique values present"), 'TestDecomp', 'test_quick'),
+           )),
+    OpInfo('median',
+           variant_test_name='unique',
            dtypes=all_types_and(torch.bfloat16, torch.float16),
            # TODO: some signatures of median do support out
            supports_out=False,
            supports_forward_ad=True,
            supports_fwgrad_bwgrad=True,
            error_inputs_func=error_inputs_median,
-           sample_inputs_func=partial(sample_inputs_reduction, supports_multiple_dims=False)),
+           sample_inputs_func=partial(sample_inputs_reduction_unique, supports_multiple_dims=False, unique_values=True)),
+    OpInfo('nanmedian',
+           variant_test_name='nonunique',
+           dtypes=all_types_and(torch.bfloat16, torch.float16),
+           # TODO: some signatures of nanmedian do support out
+           supports_out=False,
+           supports_forward_ad=True,
+           supports_fwgrad_bwgrad=True,
+           sample_inputs_func=partial(sample_inputs_reduction_unique, supports_multiple_dims=False, unique_values=False),
+           skips=(
+               DecorateInfo(unittest.skip("Non-deterministic when non-unique values present"), 'TestDecomp', 'test_comprehensive'),
+               DecorateInfo(unittest.skip("Non-deterministic when non-unique values present"), 'TestDecomp', 'test_quick'),
+           )),
     OpInfo('nanmedian',
+           variant_test_name='unique',
            dtypes=all_types_and(torch.bfloat16, torch.float16),
            # TODO: some signatures of nanmedian do support out
            supports_out=False,
            supports_forward_ad=True,
            supports_fwgrad_bwgrad=True,
-           sample_inputs_func=partial(sample_inputs_reduction, supports_multiple_dims=False)),
+           sample_inputs_func=partial(sample_inputs_reduction_unique, supports_multiple_dims=False, unique_values=True)),
     OpInfo('var_mean',
            dtypes=floating_and_complex_types_and(torch.half, torch.bfloat16),
            sample_inputs_func=sample_inputs_std_var,
diff --git a/torch/testing/_internal/opinfo/definitions/_masked.py b/torch/testing/_internal/opinfo/definitions/_masked.py
@@ -334,7 +334,8 @@ def masked_samples():
 def sample_inputs_masked_softmax(
     op_info, device, dtype, requires_grad, with_dtype=False, **kwargs
 ):
-    """Sample inputs for masked softmax, log_softmax, and softmin.
+    """Sample inputs for masked softmax, log_softmax, softmin, median,
+    and nanmedian.
 
     Masked normalization operator is a reduction operator with
     trailing mask optional argument. A mask is a bool tensor with the
@@ -856,9 +857,21 @@ def sample_inputs_masked_normalize(op_info, device, dtype, requires_grad, **kwar
             DecorateInfo(
                 unittest.skip("Skipped!"), "TestJit", "test_variant_consistency_jit"
             ),
+            DecorateInfo(
+                unittest.skip("Non-deterministic when non-unique values present"),
+                "TestDecomp",
+                "test_comprehensive",
+            ),
+            DecorateInfo(
+                unittest.skip("Non-deterministic when non-unique values present"),
+                "TestDecomp",
+                "test_quick",
+            ),
         ),
         sample_inputs_func=partial(
-            sample_inputs_masked_softmax, use_zero_dimensions=False
+            sample_inputs_masked_softmax,
+            use_zero_dimensions=False,
+            unique_values=True,
         ),
         gradcheck_wrapper=gradcheck_wrapper_masked_operation,
     ),