cp-algorithms
diff --git a/‎cp-algo/linalg/frobenius.hpp
Lines changed: 11 additions & 8 deletions b/‎cp-algo/linalg/frobenius.hpp
Lines changed: 11 additions & 8 deletions
diff --git a/‎cp-algo/linalg/matrix.hpp
Lines changed: 42 additions & 22 deletions b/‎cp-algo/linalg/matrix.hpp
Lines changed: 42 additions & 22 deletions
diff --git a/‎cp-algo/linalg/vector.hpp
Lines changed: 53 additions & 55 deletions b/‎cp-algo/linalg/vector.hpp
Lines changed: 53 additions & 55 deletions
diff --git a/‎cp-algo/number_theory/modint.hpp
Lines changed: 1 addition & 1 deletion b/‎cp-algo/number_theory/modint.hpp
Lines changed: 1 addition & 1 deletion
diff --git a/‎cp-algo/util/simd.hpp
Lines changed: 7 additions & 7 deletions b/‎cp-algo/util/simd.hpp
Lines changed: 7 additions & 7 deletions
diff --git a/‎verify/linalg/adj.test.cpp
Lines changed: 3 additions & 2 deletions b/‎verify/linalg/adj.test.cpp
Lines changed: 3 additions & 2 deletions
@@ -4,27 +4,30 @@
 #include "matrix.hpp"
 #include <algorithm>
 #include <vector>
+#include <ranges>
 namespace cp_algo::linalg {
     enum frobenius_mode {blocks, full};
     template<frobenius_mode mode = blocks>
     auto frobenius_form(auto const& A) {
         using matrix = std::decay_t<decltype(A)>;
+        using vec_t = matrix::vec_t;
+        using base = typename matrix::base;
         using base = matrix::base;
         using polyn = math::poly_t<base>;
         assert(A.n() == A.m());
         size_t n = A.n();
         std::vector<polyn> charps;
-        std::vector<vec<base>> basis, basis_init;
+        std::vector<vec_t> basis, basis_init;
         while(size(basis) < n) {
             size_t start = size(basis);
             auto generate_block = [&](auto x) {
                 while(true) {
-                    vec<base> y = x | vec<base>::ei(n + 1, size(basis));
+                    vec_t y = x | vec_t::ei(n + 1, size(basis));
                     for(auto &it: basis) {
                         y.reduce_by(it);
                     }
                     y.normalize();
-                    if(vec<base>(y[std::slice(0, n, 1)]) == vec<base>(n)) {
+                    if(std::ranges::count(y | std::views::take(n), base(0)) == int(n)) {
                         return polyn(typename polyn::Vector(begin(y) + n, end(y)));
                     } else {
                         basis_init.push_back(x);
@@ -33,7 +36,7 @@ namespace cp_algo::linalg {
                     }
                 }
             };
-            auto full_rec = generate_block(vec<base>::random(n));
+            auto full_rec = generate_block(vec_t::random(n));
             // Extra trimming to make it block-diagonal (expensive)
             if constexpr (mode == full) {
                 if(full_rec.mod_xk(start) != polyn()) {
@@ -58,12 +61,12 @@ namespace cp_algo::linalg {
                 }
                 basis[i].normalize();
             }
-            auto T = matrix::from_range(basis_init);
-            auto Tinv = matrix::from_range(basis);
+            auto T = matrix(basis_init);
+            auto Tinv = matrix(basis);
             std::ignore = Tinv.sort_classify(n);
             for(size_t i = 0; i < n; i++) {
-                Tinv[i] = vec<base>(
-                    Tinv[i][std::slice(n, n, 1)]
+                Tinv[i] = vec_t(
+                    Tinv[i] | std::views::drop(n) | std::views::take(n)
                 ) * (base(1) / Tinv[i][i]);
             }
             return std::tuple{T, Tinv, charps};
 
@@ -10,14 +10,26 @@
 #include <array>
 namespace cp_algo::linalg {
     enum gauss_mode {normal, reverse};
-    template<typename base_t>
-    struct matrix: valarray_base<matrix<base_t>, vec<base_t>> {
+
+    template<typename base_t, class _vec_t = std::conditional_t<
+        math::modint_type<base_t>,
+        modint_vec<base_t>,
+        vec<base_t>>>
+    struct matrix: std::vector<_vec_t> {
+        using vec_t = _vec_t;
         using base = base_t;
-        using Base = valarray_base<matrix<base>, vec<base>>;
+        using Base = std::vector<vec_t>;
         using Base::Base;
 
-        matrix(size_t n): Base(vec<base>(n), n) {}
-        matrix(size_t n, size_t m): Base(vec<base>(m), n) {}
+        matrix(size_t n): Base(n, vec_t(n)) {}
+        matrix(size_t n, size_t m): Base(n, vec_t(m)) {}
+
+        matrix(Base const& t): Base(t) {}
+        matrix(Base &&t): Base(std::move(t)) {}
+
+        static matrix from(auto &&r) {
+            return std::ranges::to<Base>(r);
+        }
 
         size_t n() const {return size(*this);}
         size_t m() const {return n() ? size(row(0)) : 0;}
@@ -26,6 +38,10 @@ namespace cp_algo::linalg {
         auto& row(size_t i) {return (*this)[i];}
         auto const& row(size_t i) const {return (*this)[i];}
 
+
+        auto operator-() const {
+            return from(*this | std::views::transform([](auto x) {return vec_t(-x);}));
+        }
         matrix& operator *=(base t) {for(auto &it: *this) it *= t; return *this;}
         matrix operator *(base t) const {return matrix(*this) *= t;}
         matrix& operator /=(base t) {return *this *= base(1) / t;}
@@ -34,6 +50,13 @@ namespace cp_algo::linalg {
         // Make sure the result is matrix, not Base
         matrix& operator *=(matrix const& t) {return *this = *this * t;}
 
+        void read_transposed() {
+            for(size_t j = 0; j < m(); j++) {
+                for(size_t i = 0; i < n(); i++) {
+                    std::cin >> (*this)[i][j];
+                }
+            }
+        }
         void read() {
             for(auto &it: *this) {
                 it.read();
@@ -55,15 +78,15 @@ namespace cp_algo::linalg {
             n = 0;
             for(auto &it: blocks) {
                 for(size_t i = 0; i < it.n(); i++) {
-                    res[n + i][std::slice(n, it.n(), 1)] = it[i];
+                    std::ranges::copy(it[i], begin(res[n + i]) + n);
                 }
                 n += it.n();
             }
             return res;
         }
         static matrix random(size_t n, size_t m) {
             matrix res(n, m);
-            std::ranges::generate(res, std::bind(vec<base>::random, m));
+            std::ranges::generate(res, std::bind(vec_t::random, m));
             return res;
         }
         static matrix random(size_t n) {
@@ -86,12 +109,9 @@ namespace cp_algo::linalg {
             }
             return res;
         }
-        matrix submatrix(auto slicex, auto slicey) const {
-            matrix res = (*this)[slicex];
-            for(auto &row: res) {
-                row = vec<base>(row[slicey]);
-            }
-            return res;
+        matrix submatrix(auto viewx, auto viewy) const {
+            return from(*this | viewx | std::views::transform(
+                [&](auto const& y) {return vec_t(y | viewy);}));
         }
 
         matrix T() const {
@@ -115,8 +135,8 @@ namespace cp_algo::linalg {
             return res.normalize();
         }
 
-        vec<base> apply(vec<base> const& x) const {
-            return (matrix(x) * *this)[0];
+        vec_t apply(vec_t const& x) const {
+            return (matrix(1, x) * *this)[0];
         }
 
         matrix pow(uint64_t k) const {
@@ -193,7 +213,7 @@ namespace cp_algo::linalg {
                 det *= b[i][i];
                 b[i] *= base(1) / b[i][i];
             }
-            return {det, b.submatrix(std::slice(0, n(), 1), std::slice(n(), n(), 1))};
+            return {det, b.submatrix(std::views::take(n()), std::views::drop(n()) | std::views::take(n()))};
         }
 
         // Can also just run gauss on T() | eye(m)
@@ -218,16 +238,16 @@ namespace cp_algo::linalg {
         std::optional<std::array<matrix, 2>> solve(matrix t) const {
             matrix sols = (*this | t).kernel();
             if(sols.n() < t.m() || sols.submatrix(
-                std::slice(sols.n() - t.m(), t.m(), 1),
-                std::slice(m(), t.m(), 1)
+                std::views::drop(sols.n() - t.m()),
+                std::views::drop(m())
             ) != -eye(t.m())) {
                 return std::nullopt;
             } else {
                 return std::array{
-                    sols.submatrix(std::slice(sols.n() - t.m(), t.m(), 1),
-                                   std::slice(0, m(), 1)),
-                    sols.submatrix(std::slice(0, sols.n() - t.m(), 1),
-                                   std::slice(0, m(), 1))
+                    sols.submatrix(std::views::drop(sols.n() - t.m()),
+                                   std::views::take(m())),
+                    sols.submatrix(std::views::take(sols.n() - t.m()),
+                                   std::views::take(m()))
                 };
             }
         }
 
@@ -2,59 +2,46 @@
 #define CP_ALGO_LINALG_VECTOR_HPP
 #include "../random/rng.hpp"
 #include "../number_theory/modint.hpp"
+#include "../util/big_alloc.hpp"
+#include "../util/simd.hpp"
+#include "../util/checkpoint.hpp"
 #include <functional>
 #include <algorithm>
 #include <valarray>
 #include <iostream>
 #include <iterator>
 #include <cassert>
+#include <ranges>
 namespace cp_algo::linalg {
-    template<class vec, typename base>
-    struct valarray_base: std::valarray<base> {
-        using Base = std::valarray<base>;
+    template<typename base, class Alloc = big_alloc<base>>
+    struct vec: std::basic_string<base, std::char_traits<base>, Alloc> {
+        using Base = std::basic_string<base, std::char_traits<base>, Alloc>;
         using Base::Base;
 
-        valarray_base(base const& t): Base(t, 1) {}
-
-        auto begin() {return std::begin(to_valarray());}
-        auto begin() const {return std::begin(to_valarray());}
-        auto end() {return std::end(to_valarray());}
-        auto end() const {return std::end(to_valarray());}
-
-        bool operator == (vec const& t) const {return std::ranges::equal(*this, t);}
-        bool operator != (vec const& t) const {return !(*this == t);}
-
-        vec operator-() const {return Base::operator-();}
-
-        static vec from_range(auto const& R) {
-            vec res(std::ranges::distance(R));
-            std::ranges::copy(R, res.begin());
-            return res;
-        }
-        Base& to_valarray() {return static_cast<Base&>(*this);}
-        Base const& to_valarray() const {return static_cast<Base const&>(*this);}
-    };
-
-    template<class vec, typename base>
-    vec operator+(valarray_base<vec, base> const& a, valarray_base<vec, base> const& b) {
-        return a.to_valarray() + b.to_valarray();
-    }
-    template<class vec, typename base>
-    vec operator-(valarray_base<vec, base> const& a, valarray_base<vec, base> const& b) {
-        return a.to_valarray() - b.to_valarray();
-    }
-
-    template<class vec, typename base>
-    struct vec_base: valarray_base<vec, base> {
-        using Base = valarray_base<vec, base>;
-        using Base::Base;
+        vec(Base const& t): Base(t) {}
+        vec(Base &&t): Base(std::move(t)) {}
+        vec(size_t n): Base(n, base()) {}
+        vec(auto &&r): Base(std::ranges::to<Base>(r)) {}
 
         static vec ei(size_t n, size_t i) {
             vec res(n);
             res[i] = 1;
             return res;
         }
 
+        auto operator-() const {
+            return *this | std::views::transform([](auto x) {return -x;});
+        }
+        auto operator *(base t) const {
+            return *this | std::views::transform([t](auto x) {return x * t;});
+        }
+        auto operator *=(base t) {
+            for(auto &it: *this) {
+                it *= t;
+            }
+            return *this;
+        }
+
         virtual void add_scaled(vec const& b, base scale, size_t i = 0) {
             if(scale != base(0)) {
                 for(; i < size(*this); i++) {
@@ -74,7 +61,9 @@ namespace cp_algo::linalg {
             }
         }
         void print() const {
-            std::ranges::copy(*this, std::ostream_iterator<base>(std::cout, " "));
+            for(auto &it: *this) {
+                std::cout << it << " ";
+            }
             std::cout << "\n";
         }
         static vec random(size_t n) {
@@ -84,10 +73,10 @@ namespace cp_algo::linalg {
         }
         // Concatenate vectors
         vec operator |(vec const& t) const {
-            vec res(size(*this) + size(t));
-            res[std::slice(0, size(*this), 1)] = *this;
-            res[std::slice(size(*this), size(t), 1)] = t;
-            return res;
+            return std::views::join(std::array{
+                std::views::all(*this),
+                std::views::all(t)
+            });
         }
 
         // Generally, vec shouldn't be modified
@@ -115,23 +104,32 @@ namespace cp_algo::linalg {
         base pivot_inv;
     };
 
-    template<typename base>
-    struct vec: vec_base<vec<base>, base> {
-        using Base = vec_base<vec<base>, base>;
+    template<math::modint_type base, class Alloc = big_alloc<base>>
+    struct modint_vec: vec<base, Alloc> {
+        using Base = vec<base, Alloc>;
         using Base::Base;
-    };
 
-    template<math::modint_type base>
-    struct vec<base>: vec_base<vec<base>, base> {
-        using Base = vec_base<vec<base>, base>;
-        using Base::Base;
+        modint_vec(Base const& t): Base(t) {}
+        modint_vec(Base &&t): Base(std::move(t)) {}
 
-        void add_scaled(vec const& b, base scale, size_t i = 0) override {
+        void add_scaled(Base const& b, base scale, size_t i = 0) override {
             static_assert(base::bits >= 64, "Only wide modint types for linalg");
-            uint64_t scaler = scale.getr();
             if(scale != base(0)) {
-                for(; i < size(*this); i++) {
-                    (*this)[i].add_unsafe(scaler * b[i].getr_direct());
+                assert(Base::size() == b.size());
+                size_t n = size(*this);
+                u64x4 scaler = u64x4() + scale.getr();
+                if (is_aligned(this) && is_aligned(&b[0])) // verify we're not in SSO
+                for(i -= i % 4; i < n - 3; i += 4) {
+                    auto &ai = vector_cast<u64x4>((*this)[i]);
+                    auto bi = vector_cast<u64x4 const>(b[i]);
+#ifdef __AVX2__
+                    ai += u64x4(_mm256_mul_epu32(__m256i(scaler), __m256i(bi)));
+#else
+                    ai += scaler * bi;
+#endif
+                }
+                for(; i < n; i++) {
+                    (*this)[i].add_unsafe(b[i].getr_direct() * scale.getr());
                 }
                 if(++counter == 4) {
                     for(auto &it: *this) {
@@ -141,7 +139,7 @@ namespace cp_algo::linalg {
                 }
             }
         }
-        vec const& normalize() override {
+        Base const& normalize() override {
             for(auto &it: *this) {
                 it.normalize();
             }
 
@@ -21,7 +21,7 @@ namespace cp_algo::math {
         static UInt2 modmod() {
             return UInt2(mod()) * mod();
         }
-        modint_base(): r(0) {}
+        modint_base() = default;
         modint_base(Int2 rr) {
             to_modint().setr(UInt((rr + modmod()) % mod()));
         }
 
@@ -60,13 +60,13 @@ namespace cp_algo {
     }
 
     template<std::size_t Align = 32>
-    constexpr std::size_t aligned_idx(auto const& c, std::size_t i = 0) {
-        auto const* p = std::data(c) + i;
-        using value_type = std::remove_pointer_t<decltype(p)>;
-        constexpr auto mask = Align - 1;
-        std::uintptr_t addr = reinterpret_cast<std::uintptr_t>(p);
-        std::size_t bytes_to_next = (-addr) & mask;
-        return i + bytes_to_next / sizeof(value_type);
+    [[gnu::always_inline]] inline bool is_aligned(const void* p) noexcept {
+        return (reinterpret_cast<std::uintptr_t>(p) % Align) == 0;
+    }
+
+    template<class Target>
+    [[gnu::always_inline]] inline Target& vector_cast(auto &&p) {
+        return *reinterpret_cast<Target*>(std::assume_aligned<alignof(Target)>(&p));
     }
 }
 #endif // CP_ALGO_UTIL_SIMD_HPP
@@ -1,8 +1,9 @@
 // @brief Adjugate Matrix
-// competitive-verifier: PROBLEM https://judge.yosupo.jp/problem/adjugate_matrix
+#define PROBLEM "https://judge.yosupo.jp/problem/adjugate_matrix"
 #pragma GCC optimize("Ofast,unroll-loops")
-#include "cp-algo/linalg/matrix.hpp"
 #include <bits/stdc++.h>
+#include "blazingio/blazingio.min.hpp"
+#include "cp-algo/linalg/matrix.hpp"
 
 const int64_t mod = 998244353;
Original file line number	Diff line number	Diff line change
`@@ -21,7 +21,7 @@ namespace cp_algo::math {`
`21`	`21`	`static UInt2 modmod() {`
`22`	`22`	`return UInt2(mod()) * mod();`
`23`	`23`	`}`
`24`		`- modint_base(): r(0) {}`
	`24`	`+ modint_base() = default;`
`25`	`25`	`modint_base(Int2 rr) {`
`26`	`26`	`to_modint().setr(UInt((rr + modmod()) % mod()));`
`27`	`27`	`}`