zlahef_aa function

void zlahef_aa(
String UPLO,
int J1,
int M,
int NB,
Matrix<Complex> A_,
int LDA,
Array<int> IPIV_,
Matrix<Complex> H_,
int LDH,
Array<Complex> WORK_,
)
Implementation

void zlahef_aa(
  final String UPLO,
  final int J1,
  final int M,
  final int NB,
  final Matrix<Complex> A_,
  final int LDA,
  final Array<int> IPIV_,
  final Matrix<Complex> H_,
  final int LDH,
  final Array<Complex> WORK_,
) {
  final A = A_.having(ld: LDA);
  final IPIV = IPIV_.having();
  final H = H_.having(ld: LDH);
  final WORK = WORK_.having();
  int J, K, K1, I1, I2, MJ;
  Complex PIV, ALPHA;

  J = 1;

  // K1 is the first column of the panel to be factorized
  // i.e.,  K1 is 2 for the first block column, and 1 for the rest of the blocks
  K1 = (2 - J1) + 1;

  if (lsame(UPLO, 'U')) {
    // Factorize A as U**T*D*U using the upper triangle of A
    while (J <= min(M, NB)) {
      // K is the column to be factorized
      //  when being called from ZHETRF_AA,
      //  > for the first block column, J1 is 1, hence J1+J-1 is J,
      //  > for the rest of the columns, J1 is 2, and J1+J-1 is J+1,
      K = J1 + J - 1;
      if (J == M) {
        // Only need to compute T(J, J)
        MJ = 1;
      } else {
        MJ = M - J + 1;
      }

      // H(J:N, J) := A(J, J:N) - H(J:N, 1:(J-1)) * L(J1:(J-1), J),
      //  where H(J:N, J) has been initialized to be A(J, J:N)
      if (K > 2) {
        // K is the column to be factorized
        //  > for the first block column, K is J, skipping the first two
        //    columns
        //  > for the rest of the columns, K is J+1, skipping only the
        //    first column
        zlacgv(J - K1, A(1, J).asArray(), 1);
        zgemv('No transpose', MJ, J - K1, -Complex.one, H(J, K1), LDH,
            A(1, J).asArray(), 1, Complex.one, H(J, J).asArray(), 1);
        zlacgv(J - K1, A(1, J).asArray(), 1);
      }

      // Copy H(i:n, i) into WORK
      zcopy(MJ, H(J, J).asArray(), 1, WORK(1), 1);

      if (J > K1) {
        // Compute WORK := WORK - L(J-1, J:N) * T(J-1,J),
        //  where A(J-1, J) stores T(J-1, J) and A(J-2, J:N) stores U(J-1, J:N)
        ALPHA = -A[K - 1][J].conjugate();
        zaxpy(MJ, ALPHA, A(K - 2, J).asArray(), LDA, WORK(1), 1);
      }

      // Set A(J, J) = T(J, J)
      A[K][J] = WORK[1].real.toComplex();

      if (J < M) {
        // Compute WORK(2:N) = T(J, J) L(J, (J+1):N)
        //  where A(J, J) stores T(J, J) and A(J-1, (J+1):N) stores U(J, (J+1):N)
        if (K > 1) {
          ALPHA = -A[K][J];
          zaxpy(M - J, ALPHA, A(K - 1, J + 1).asArray(), LDA, WORK(2), 1);
        }

        // Find max(|WORK(2:n)|)
        I2 = izamax(M - J, WORK(2), 1) + 1;
        PIV = WORK[I2];

        // Apply hermitian pivot
        if ((I2 != 2) && (PIV != Complex.zero)) {
          // Swap WORK(I1) and WORK(I2)

          I1 = 2;
          WORK[I2] = WORK[I1];
          WORK[I1] = PIV;

          // Swap A(I1, I1+1:N) with A(I1+1:N, I2)
          I1 += J - 1;
          I2 += J - 1;
          zswap(I2 - I1 - 1, A(J1 + I1 - 1, I1 + 1).asArray(), LDA,
              A(J1 + I1, I2).asArray(), 1);
          zlacgv(I2 - I1, A(J1 + I1 - 1, I1 + 1).asArray(), LDA);
          zlacgv(I2 - I1 - 1, A(J1 + I1, I2).asArray(), 1);

          // Swap A(I1, I2+1:N) with A(I2, I2+1:N)
          if (I2 < M) {
            zswap(M - I2, A(J1 + I1 - 1, I2 + 1).asArray(), LDA,
                A(J1 + I2 - 1, I2 + 1).asArray(), LDA);
          }

          // Swap A(I1, I1) with A(I2,I2)
          PIV = A[I1 + J1 - 1][I1];
          A[J1 + I1 - 1][I1] = A[J1 + I2 - 1][I2];
          A[J1 + I2 - 1][I2] = PIV;

          // Swap H(I1, 1:J1) with H(I2, 1:J1)
          zswap(I1 - 1, H(I1, 1).asArray(), LDH, H(I2, 1).asArray(), LDH);
          IPIV[I1] = I2;

          if (I1 > (K1 - 1)) {
            // Swap L(1:I1-1, I1) with L(1:I1-1, I2),
            //  skipping the first column
            zswap(I1 - K1 + 1, A(1, I1).asArray(), 1, A(1, I2).asArray(), 1);
          }
        } else {
          IPIV[J + 1] = J + 1;
        }

        // Set A(J, J+1) = T(J, J+1)
        A[K][J + 1] = WORK[2];

        if (J < NB) {
          // Copy A(J+1:N, J+1) into H(J:N, J),
          zcopy(M - J, A(K + 1, J + 1).asArray(), LDA,
              H(J + 1, J + 1).asArray(), 1);
        }

        // Compute L(J+2, J+1) = WORK( 3:N ) / T(J, J+1),
        //  where A(J, J+1) = T(J, J+1) and A(J+2:N, J) = L(J+2:N, J+1)
        if (J < (M - 1)) {
          if (A[K][J + 1] != Complex.zero) {
            ALPHA = Complex.one / A[K][J + 1];
            zcopy(M - J - 1, WORK(3), 1, A(K, J + 2).asArray(), LDA);
            zscal(M - J - 1, ALPHA, A(K, J + 2).asArray(), LDA);
          } else {
            zlaset('Full', 1, M - J - 1, Complex.zero, Complex.zero,
                A(K, J + 2), LDA);
          }
        }
      }
      J++;
    }
  } else {
    // Factorize A as L*D*L**T using the lower triangle of A
    while (J <= min(M, NB)) {
      // K is the column to be factorized
      //  when being called from ZHETRF_AA,
      //  > for the first block column, J1 is 1, hence J1+J-1 is J,
      //  > for the rest of the columns, J1 is 2, and J1+J-1 is J+1,
      K = J1 + J - 1;
      if (J == M) {
        // Only need to compute T(J, J)
        MJ = 1;
      } else {
        MJ = M - J + 1;
      }

      // H(J:N, J) := A(J:N, J) - H(J:N, 1:(J-1)) * L(J, J1:(J-1))^T,
      //  where H(J:N, J) has been initialized to be A(J:N, J)
      if (K > 2) {
        // K is the column to be factorized
        //  > for the first block column, K is J, skipping the first two
        //    columns
        //  > for the rest of the columns, K is J+1, skipping only the
        //    first column
        zlacgv(J - K1, A(J, 1).asArray(), LDA);
        zgemv('No transpose', MJ, J - K1, -Complex.one, H(J, K1), LDH,
            A(J, 1).asArray(), LDA, Complex.one, H(J, J).asArray(), 1);
        zlacgv(J - K1, A(J, 1).asArray(), LDA);
      }

      // Copy H(J:N, J) into WORK
      zcopy(MJ, H(J, J).asArray(), 1, WORK(1), 1);

      if (J > K1) {
        // Compute WORK := WORK - L(J:N, J-1) * T(J-1,J),
        //  where A(J-1, J) = T(J-1, J) and A(J, J-2) = L(J, J-1)
        ALPHA = -A[J][K - 1].conjugate();
        zaxpy(MJ, ALPHA, A(J, K - 2).asArray(), 1, WORK(1), 1);
      }

      // Set A(J, J) = T(J, J)
      A[J][K] = WORK[1].real.toComplex();

      if (J < M) {
        // Compute WORK(2:N) = T(J, J) L((J+1):N, J)
        //  where A(J, J) = T(J, J) and A((J+1):N, J-1) = L((J+1):N, J)
        if (K > 1) {
          ALPHA = -A[J][K];
          zaxpy(M - J, ALPHA, A(J + 1, K - 1).asArray(), 1, WORK(2), 1);
        }

        // Find max(|WORK(2:n)|)
        I2 = izamax(M - J, WORK(2), 1) + 1;
        PIV = WORK[I2];

        // Apply hermitian pivot
        if ((I2 != 2) && (PIV != Complex.zero)) {
          // Swap WORK(I1) and WORK(I2)
          I1 = 2;
          WORK[I2] = WORK[I1];
          WORK[I1] = PIV;

          // Swap A(I1+1:N, I1) with A(I2, I1+1:N)
          I1 += J - 1;
          I2 += J - 1;
          zswap(I2 - I1 - 1, A(I1 + 1, J1 + I1 - 1).asArray(), 1,
              A(I2, J1 + I1).asArray(), LDA);
          zlacgv(I2 - I1, A(I1 + 1, J1 + I1 - 1).asArray(), 1);
          zlacgv(I2 - I1 - 1, A(I2, J1 + I1).asArray(), LDA);

          // Swap A(I2+1:N, I1) with A(I2+1:N, I2)
          if (I2 < M) {
            zswap(M - I2, A(I2 + 1, J1 + I1 - 1).asArray(), 1,
                A(I2 + 1, J1 + I2 - 1).asArray(), 1);
          }

          // Swap A(I1, I1) with A(I2, I2)
          PIV = A[I1][J1 + I1 - 1];
          A[I1][J1 + I1 - 1] = A[I2][J1 + I2 - 1];
          A[I2][J1 + I2 - 1] = PIV;

          // Swap H(I1, I1:J1) with H(I2, I2:J1)
          zswap(I1 - 1, H(I1, 1).asArray(), LDH, H(I2, 1).asArray(), LDH);
          IPIV[I1] = I2;

          if (I1 > (K1 - 1)) {
            // Swap L(1:I1-1, I1) with L(1:I1-1, I2),
            //  skipping the first column
            zswap(
                I1 - K1 + 1, A(I1, 1).asArray(), LDA, A(I2, 1).asArray(), LDA);
          }
        } else {
          IPIV[J + 1] = J + 1;
        }

        // Set A(J+1, J) = T(J+1, J)
        A[J + 1][K] = WORK[2];

        if (J < NB) {
          // Copy A(J+1:N, J+1) into H(J+1:N, J),
          zcopy(M - J, A(J + 1, K + 1).asArray(), 1, H(J + 1, J + 1).asArray(),
              1);
        }

        // Compute L(J+2, J+1) = WORK( 3:N ) / T(J, J+1),
        //  where A(J, J+1) = T(J, J+1) and A(J+2:N, J) = L(J+2:N, J+1)
        if (J < (M - 1)) {
          if (A[J + 1][K] != Complex.zero) {
            ALPHA = Complex.one / A[J + 1][K];
            zcopy(M - J - 1, WORK(3), 1, A(J + 2, K).asArray(), 1);
            zscal(M - J - 1, ALPHA, A(J + 2, K).asArray(), 1);
          } else {
            zlaset('Full', M - J - 1, 1, Complex.zero, Complex.zero,
                A(J + 2, K), LDA);
          }
        }
      }
      J++;
    }
  }
}
zlahef_aa function

Implementation

lapack library