TST better PassiveAggressive test against simple implementation (#31857)

lorentzenchr · web-flow · commit 3d35e02d762e · 2025-07-31T14:32:17.000Z
diff --git a/sklearn/linear_model/tests/test_passive_aggressive.py b/sklearn/linear_model/tests/test_passive_aggressive.py
@@ -1,13 +1,16 @@
 import numpy as np
 import pytest
+from numpy.testing import assert_allclose
+from scipy.sparse import issparse
 
 from sklearn.base import ClassifierMixin
 from sklearn.datasets import load_iris
 from sklearn.linear_model import PassiveAggressiveClassifier, PassiveAggressiveRegressor
+from sklearn.linear_model._base import SPARSE_INTERCEPT_DECAY
+from sklearn.linear_model._stochastic_gradient import DEFAULT_EPSILON
 from sklearn.utils import check_random_state
 from sklearn.utils._testing import (
     assert_almost_equal,
-    assert_array_almost_equal,
     assert_array_equal,
 )
 from sklearn.utils.fixes import CSR_CONTAINERS
@@ -24,7 +27,7 @@ class MyPassiveAggressive(ClassifierMixin):
     def __init__(
         self,
         C=1.0,
-        epsilon=0.01,
+        epsilon=DEFAULT_EPSILON,
         loss="hinge",
         fit_intercept=True,
         n_iter=1,
@@ -41,6 +44,12 @@ def fit(self, X, y):
         self.w = np.zeros(n_features, dtype=np.float64)
         self.b = 0.0
 
+        # Mimic SGD's behavior for intercept
+        intercept_decay = 1.0
+        if issparse(X):
+            intercept_decay = SPARSE_INTERCEPT_DECAY
+            X = X.toarray()
+
         for t in range(self.n_iter):
             for i in range(n_samples):
                 p = self.project(X[i])
@@ -63,7 +72,7 @@ def fit(self, X, y):
 
                 self.w += step * X[i]
                 if self.fit_intercept:
-                    self.b += step
+                    self.b += intercept_decay * step
 
     def project(self, X):
         return np.dot(X, self.w) + self.b
@@ -123,15 +132,15 @@ def test_classifier_refit():
 def test_classifier_correctness(loss, csr_container):
     y_bin = y.copy()
     y_bin[y != 1] = -1
+    data = csr_container(X) if csr_container is not None else X
 
-    clf1 = MyPassiveAggressive(loss=loss, n_iter=2)
-    clf1.fit(X, y_bin)
+    clf1 = MyPassiveAggressive(loss=loss, n_iter=4)
+    clf1.fit(data, y_bin)
 
-    data = csr_container(X) if csr_container is not None else X
-    clf2 = PassiveAggressiveClassifier(loss=loss, max_iter=2, shuffle=False, tol=None)
+    clf2 = PassiveAggressiveClassifier(loss=loss, max_iter=4, shuffle=False, tol=None)
     clf2.fit(data, y_bin)
 
-    assert_array_almost_equal(clf1.w, clf2.coef_.ravel(), decimal=2)
+    assert_allclose(clf1.w, clf2.coef_.ravel())
 
 
 @pytest.mark.parametrize(
@@ -251,15 +260,15 @@ def test_regressor_partial_fit(csr_container, average):
 def test_regressor_correctness(loss, csr_container):
     y_bin = y.copy()
     y_bin[y != 1] = -1
+    data = csr_container(X) if csr_container is not None else X
 
-    reg1 = MyPassiveAggressive(loss=loss, n_iter=2)
-    reg1.fit(X, y_bin)
+    reg1 = MyPassiveAggressive(loss=loss, n_iter=4)
+    reg1.fit(data, y_bin)
 
-    data = csr_container(X) if csr_container is not None else X
-    reg2 = PassiveAggressiveRegressor(tol=None, loss=loss, max_iter=2, shuffle=False)
+    reg2 = PassiveAggressiveRegressor(loss=loss, max_iter=4, shuffle=False, tol=None)
     reg2.fit(data, y_bin)
 
-    assert_array_almost_equal(reg1.w, reg2.coef_.ravel(), decimal=2)
+    assert_allclose(reg1.w, reg2.coef_.ravel())
 
 
 def test_regressor_undefined_methods():