HPhi/doxygen/_calc_by_l_o_b_p_c_g_8c_source.html

 /* HPhi  -  Quantum Lattice Model Simulator */
 /* Copyright (C) 2015 The University of Tokyo */

 /* This program is free software: you can redistribute it and/or modify */
 /* it under the terms of the GNU General Public License as published by */
 /* the Free Software Foundation, either version 3 of the License, or */
 /* (at your option) any later version. */

 /* This program is distributed in the hope that it will be useful, */
 /* but WITHOUT ANY WARRANTY; without even the implied warranty of */
 /* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the */
 /* GNU General Public License for more details. */

 /* You should have received a copy of the GNU General Public License */
 /* along with this program.  If not, see <http://www.gnu.org/licenses/>. */
 #include "Common.h"
 #include "xsetmem.h"
 #include "mltply.h"
 #include "FileIO.h"
 #include "wrapperMPI.h"
 #include "expec_cisajs.h"
 #include "expec_cisajscktaltdc.h"
 #include "expec_totalspin.h"
 #include "expec_energy_flct.h"
 #include "phys.h"
 #include <math.h>
 #include "./common/setmemory.h"

 void zheevd_(char *jobz, char *uplo, int *n, double complex *a, int *lda, double *w, double complex *work, int *lwork, double *rwork, int * lrwork, int *iwork, int *liwork, int *info);
 void zgemm_(char *transa, char *transb, int *m, int *n, int *k, double complex *alpha, double complex *a, int *lda, double complex *b, int *ldb, double complex *beta, double complex *c, int *ldc);
 static int diag_ovrp(
   int nsub,
   double complex *hsub,
   double complex *ovlp,
   double *eig
 )
 {
   int *iwork, info, isub, jsub, nsub2;
   char jobz = 'V', uplo = 'U', transa = 'N', transb = 'N';
   double *rwork;
   double complex *work, *mat;
   int liwork, lwork, lrwork;
   double complex one = 1.0, zero = 0.0;

   liwork = 5 * nsub + 3;
   lwork = nsub*nsub + 2 * nsub;
   lrwork = 3 * nsub*nsub + (4 + (int)log2(nsub) + 1) * nsub + 1;

   iwork = (int*)malloc(liwork * sizeof(int));
   rwork = (double*)malloc(lrwork * sizeof(double));
   work = (double complex*)malloc(lwork * sizeof(double complex));
   mat = (double complex*)malloc(nsub*nsub * sizeof(double complex));
   for (isub = 0; isub < nsub*nsub; isub++)mat[isub] = 0.0;
   zheevd_(&jobz, &uplo, &nsub, ovlp, &nsub, eig, work, &lwork, rwork, &lrwork, iwork, &liwork, &info);
   nsub2 = 0;
   for (isub = 0; isub < nsub; isub++) {
     if (eig[isub] > 1.0e-14) {
       for (jsub = 0; jsub < nsub; jsub++)
         ovlp[jsub + nsub*nsub2] = ovlp[jsub + nsub*isub] / sqrt(eig[isub]);
       nsub2 += 1;
     }
   }
   for (isub = nsub2; isub < nsub; isub++)
     for (jsub = 0; jsub < nsub; jsub++)
       ovlp[jsub + nsub*isub] = 0.0;
   transa = 'N';
   zgemm_(&transa, &transb, &nsub, &nsub, &nsub, &one, hsub, &nsub, ovlp, &nsub, &zero, mat, &nsub);
   transa = 'C';
   zgemm_(&transa, &transb, &nsub, &nsub, &nsub, &one, ovlp, &nsub, mat, &nsub, &zero, hsub, &nsub);
   zheevd_(&jobz, &uplo, &nsub2, hsub, &nsub, eig, work, &lwork, rwork, &lrwork, iwork, &liwork, &info);
   transa = 'N';
   zgemm_(&transa, &transb, &nsub, &nsub, &nsub, &one, ovlp, &nsub, hsub, &nsub, &zero, mat, &nsub);
  // printf("%d %d %15.5f %15.5f %15.5f\n", info, nsub2, eig[0], eig[1], eig[2]);
   for (isub = 0; isub < nsub*nsub; isub++)hsub[isub] = mat[isub];

   free(mat);
   free(work);
   free(rwork);
   free(iwork);

   return(nsub2);
 }/*void diag_ovrp*/
 static double calc_preshift(
   double eig,
   double res,
   double eps_LOBPCG
 )
 {
   double k, i;
   double preshift;

   if (fabs(eig) > 10.0) k = trunc(log10(fabs(eig)));
   else k = 1.0;

   if (res < 1.0) {
     if (eps_LOBPCG > res) i = ceil(log10(eps_LOBPCG));
     else i = ceil(log10(res));

     preshift = trunc(eig / pow(10.0, k + i))*pow(10.0, k + i);
   }
   else preshift = 0.0;

   return(preshift);
 }/*void calc_preshift*/
 /*
 @brief Compute initial guess for LOBPCG.
 If this is resuterting run, read from files.
 */
 static void Initialize_wave(
   struct BindStruct *X,
   double complex **wave
 )
 {
   FILE *fp;
   char sdt[D_FileNameMax];
   size_t byte_size;

   int iproc, ie, ierr;
   long int idim, iv, i_max;
   unsigned long int i_max_tmp, sum_i_max;
   int mythread;
   double dnorm;
   /*
   For DSFMT
   */
   long unsigned int u_long_i;
   dsfmt_t dsfmt;
   if (X->Def.iReStart == RESTART_INOUT || X->Def.iReStart == RESTART_IN) {
     //StartTimer(3600);
     //TimeKeeperWithRandAndStep(&(X->Bind), cFileNameTPQStep, cOutputVecStart, "a", rand_i, step_i);
     fprintf(stdoutMPI, "%s", cLogInputVecStart);

     ierr = 0;
     for (ie = 0; ie < X->Def.k_exct; ie++) {

       sprintf(sdt, cFileNameInputVector, ie, myrank);
       childfopenALL(sdt, "rb", &fp);
       if (fp == NULL) {
         fprintf(stdout, "Restart file is not found.\n");
         fprintf(stdout, "Start from scratch.\n");
         ierr = 1;
         break;
       }
       else {
         byte_size = fread(&iproc, sizeof(int), 1, fp);
         byte_size = fread(&i_max, sizeof(unsigned long int), 1, fp);
         //fprintf(stdoutMPI, "Debug: i_max=%ld, step_i=%d\n", i_max, step_i);
         if (i_max != X->Check.idim_max) {
           fprintf(stderr, "Error: Invalid restart file.\n");
           exitMPI(-1);
         }
         byte_size = fread(wave[ie], sizeof(complex double), X->Check.idim_max + 1, fp);
         fclose(fp);
       }
     }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/

     if (ierr == 0) {
       //TimeKeeperWithRandAndStep(X, cFileNameTPQStep, cOutputVecFinish, "a", rand_i, step_i);
       fprintf(stdoutMPI, "%s", cLogInputVecFinish);
       //StopTimer(3600);
       if (byte_size == 0) printf("byte_size: %d \n", (int)byte_size);
       return;
     }/*if (ierr == 0)*/

   }/*X->Def.iReStart == RESTART_INOUT || X->Def.iReStart == RESTART_IN*/

   i_max = X->Check.idim_max;

   if (initial_mode == 0) {

     for (ie = 0; ie < X->Def.k_exct; ie++) {

       sum_i_max = SumMPI_li(X->Check.idim_max);
       X->Large.iv = (sum_i_max / 2 + X->Def.initial_iv + ie) % sum_i_max + 1;
       iv = X->Large.iv;
       fprintf(stdoutMPI, "  initial_mode=%d normal: iv = %ld i_max=%ld k_exct =%d\n\n",
         initial_mode, iv, i_max, X->Def.k_exct);
 #pragma omp parallel for default(none) private(idim) shared(wave,i_max,ie)
       for (idim = 1; idim <= i_max; idim++) wave[ie][idim] = 0.0;

       sum_i_max = 0;
       for (iproc = 0; iproc < nproc; iproc++) {

         i_max_tmp = BcastMPI_li(iproc, i_max);
         if (sum_i_max <= iv && iv < sum_i_max + i_max_tmp) {

           if (myrank == iproc) {
             wave[ie][iv - sum_i_max + 1] = 1.0;
             if (X->Def.iInitialVecType == 0) {
               wave[ie][iv - sum_i_max + 1] += 1.0*I;
               wave[ie][iv - sum_i_max + 1] /= sqrt(2.0);
             }
           }/*if (myrank == iproc)*/
         }/*if (sum_i_max <= iv && iv < sum_i_max + i_max_tmp)*/

         sum_i_max += i_max_tmp;

       }/*for (iproc = 0; iproc < nproc; iproc++)*/
     }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
   }/*if(initial_mode == 0)*/
   else if (initial_mode == 1) {
     iv = X->Def.initial_iv;
     fprintf(stdoutMPI, "  initial_mode=%d (random): iv = %ld i_max=%ld k_exct =%d\n\n",
       initial_mode, iv, i_max, X->Def.k_exct);
 #pragma omp parallel default(none) private(idim, u_long_i, mythread, dsfmt, ie) \
               shared(wave, iv, X, nthreads, myrank, i_max)
     {
       /*
        Initialise MT
        */
 #ifdef _OPENMP
       mythread = omp_get_thread_num();
 #else
       mythread = 0;
 #endif
       u_long_i = 123432 + labs(iv) + mythread + nthreads * myrank;
       dsfmt_init_gen_rand(&dsfmt, u_long_i);

       for (ie = 0; ie < X->Def.k_exct; ie++) {
         if (X->Def.iInitialVecType == 0) {
 #pragma omp for
           for (idim = 1; idim <= i_max; idim++)
             wave[ie][idim] = 2.0*(dsfmt_genrand_close_open(&dsfmt) - 0.5) + 2.0*(dsfmt_genrand_close_open(&dsfmt) - 0.5)*I;
         }
         else {
 #pragma omp for
           for (idim = 1; idim <= i_max; idim++)
             wave[ie][idim] = 2.0*(dsfmt_genrand_close_open(&dsfmt) - 0.5);
         }
       }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/

     }/*#pragma omp parallel*/

     for (ie = 0; ie < X->Def.k_exct; ie++) {
       dnorm = sqrt(creal(VecProdMPI(i_max, wave[ie], wave[ie])));
 #pragma omp parallel for default(none) shared(i_max,wave,dnorm,ie) private(idim)
       for (idim = 1; idim <= i_max; idim++) wave[ie][idim] /= dnorm;
     }
   }/*else if(initial_mode==1)*/
 }/*static void Initialize_wave*/
 static void Output_restart(
   struct BindStruct *X,
   double complex **wave
 )
 {
   FILE *fp;
   size_t byte_size;
   char sdt[D_FileNameMax];
   int ie;

   //TimeKeeperWithRandAndStep(&(X->Bind), cFileNameTPQStep, cOutputVecStart, "a", rand_i, step_i);
   fprintf(stdoutMPI, "%s", cLogOutputVecStart);

   for (ie = 0; ie < X->Def.k_exct; ie++) {
     sprintf(sdt, cFileNameOutputVector, ie, myrank);
     if (childfopenALL(sdt, "wb", &fp) != 0) exitMPI(-1);
     byte_size = fwrite(&X->Large.itr, sizeof(X->Large.itr), 1, fp);
     byte_size = fwrite(&X->Check.idim_max, sizeof(X->Check.idim_max), 1, fp);
     byte_size = fwrite(wave[ie], sizeof(complex double), X->Check.idim_max + 1, fp);
     fclose(fp);
   }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
   //TimeKeeperWithRandAndStep(&(X->Bind), cFileNameTPQStep, cOutputVecFinish, "a", rand_i, step_i);
   fprintf(stdoutMPI, "%s", cLogOutputVecFinish);
   if(byte_size == 0) printf("byte_size : %d\n", (int)byte_size);
 }/*static void Output_restart*/
 int LOBPCG_Main(
   struct BindStruct *X
 )
 {
   char sdt[D_FileNameMax], sdt_2[D_FileNameMax];
   FILE *fp;
   int iconv = -1;
   long int idim, i_max;
   int ii, jj, ie, je, nsub, stp, mythread, nsub_cut;
   double complex ***wxp/*[0] w, [1] x, [2] p of Ref.1*/,
     ***hwxp/*[0] h*w, [1] h*x, [2] h*p of Ref.1*/,
     *hsub, *ovlp /*Subspace Hamiltonian and Overlap*/,
     **work;
   double *eig, dnorm, eps_LOBPCG, eigabs_max, preshift, precon, dnormmax, *eigsub;
   int do_precon = 0;//If = 1, use preconditioning (experimental)

   nsub = 3 * X->Def.k_exct;

   eig = d_1d_allocate(X->Def.k_exct);
   eigsub = d_1d_allocate(nsub);
   hsub = cd_1d_allocate(nsub*nsub);
   ovlp = cd_1d_allocate(nsub*nsub);
   work = cd_2d_allocate(nthreads, nsub);

   i_max = X->Check.idim_max;

   free(v0);
   free(v1);
   free(vg);
   wxp = cd_3d_allocate(3, X->Def.k_exct, X->Check.idim_max + 1);
   hwxp = cd_3d_allocate(3, X->Def.k_exct, X->Check.idim_max + 1);
   Initialize_wave(X, wxp[1]);

   TimeKeeper(X, cFileNameTimeKeep, cLanczos_EigenValueStart, "a");

   for (ie = 0; ie < X->Def.k_exct; ie++)
     for (idim = 1; idim <= i_max; idim++) hwxp[1][ie][idim] = 0.0;
   for (ie = 0; ie < X->Def.k_exct; ie++)
     mltply(X, hwxp[1][ie], wxp[1][ie]);
   stp = 1;
   TimeKeeperWithStep(X, cFileNameTimeKeep, cLanczos_EigenValueStep, "a", 0);

   for (ie = 0; ie < X->Def.k_exct; ie++){
     for (idim = 1; idim <= i_max; idim++) wxp[2][ie][idim] = 0.0;
     for (idim = 1; idim <= i_max; idim++) hwxp[2][ie][idim] = 0.0;

     eig[ie] = creal(VecProdMPI(i_max, wxp[1][ie], hwxp[1][ie]));
   }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/

   sprintf(sdt_2, cFileNameLanczosStep, X->Def.CDataFileHead);
   childfopenMPI(sdt_2, "w", &fp);
   fprintf(stdoutMPI, "    Step   Residual-2-norm     Threshold      Energy\n");
   fprintf(fp, "    Step   Residual-2-norm     Threshold      Energy\n");
   fclose(fp);

   nsub_cut = nsub;
   for (stp = 1; stp <= X->Def.Lanczos_max; stp++) {
     eigabs_max = 0.0;
     for (ie = 0; ie < X->Def.k_exct; ie++)
       if (fabs(eig[ie]) > eigabs_max) eigabs_max = fabs(eig[ie]);
     eps_LOBPCG = pow(10, -0.5 *X->Def.LanczosEps);
     if (eigabs_max > 1.0) eps_LOBPCG *= eigabs_max;
     dnormmax = 0.0;
     for (ie = 0; ie < X->Def.k_exct; ie++) {
 #pragma omp parallel for default(none) shared(i_max,wxp,hwxp,eig,ie) private(idim)
       for (idim = 1; idim <= i_max; idim++)
         wxp[0][ie][idim] = hwxp[1][ie][idim] - eig[ie] * wxp[1][ie][idim];
       dnorm = sqrt(creal(VecProdMPI(i_max, wxp[0][ie], wxp[0][ie])));
       if (dnorm > dnormmax) dnormmax = dnorm;

       if (stp /= 1) {
         if (do_precon == 1) {
           preshift = calc_preshift(eig[ie], dnorm, eps_LOBPCG);
 #pragma omp parallel for default(none) shared(wxp,ie,list_Diagonal,preshift,i_max,eps_LOBPCG) private(idim,precon)
           for (idim = 1; idim <= i_max; idim++) {
             precon = list_Diagonal[idim] - preshift;
             if(fabs(precon) > eps_LOBPCG) wxp[0][ie][idim] /= precon;
           }
         }/*if(do_precon == 1)*/
         dnorm = sqrt(creal(VecProdMPI(i_max, wxp[0][ie], wxp[0][ie])));
 #pragma omp parallel for default(none) shared(i_max,wxp,dnorm,ie) private(idim)
         for (idim = 1; idim <= i_max; idim++) wxp[0][ie][idim] /= dnorm;
       }/*if (stp /= 1)*/

     }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
     childfopenMPI(sdt_2, "a", &fp);
     fprintf(stdoutMPI, "%9d %15.5e %15.5e      ", stp, dnormmax, eps_LOBPCG);
     fprintf(fp, "%9d %15.5e %15.5e      ", stp, dnormmax, eps_LOBPCG);
     for (ie = 0; ie < X->Def.k_exct; ie++) {
       fprintf(stdoutMPI, " %15.5e", eig[ie]);
       fprintf(fp, " %15.5e", eig[ie]);
     }
     if(nsub_cut == 0) printf("nsub_cut : %d", nsub_cut);
     fprintf(stdoutMPI, "\n");
     fprintf(fp, "\n");
     fclose(fp);

     if (dnormmax < eps_LOBPCG) {
       iconv = 0;
       break;
     }
 #pragma omp parallel default(none) shared(hwxp,i_max,X) private(idim,ie)
     {
 #pragma omp for nowait
       for (ie = 0; ie < X->Def.k_exct; ie++)
         for (idim = 1; idim <= i_max; idim++)  hwxp[0][ie][idim] = 0.0;
     }
     for (ie = 0; ie < X->Def.k_exct; ie++)
       mltply(X, hwxp[0][ie], wxp[0][ie]);

     TimeKeeperWithStep(X, cFileNameTimeKeep, cLanczos_EigenValueStep, "a", stp);
     for (ii = 0; ii < 3; ii++) {
       for (ie = 0; ie < X->Def.k_exct; ie++){
         for (jj = 0; jj < 3; jj++) {
           for (je = 0; je < X->Def.k_exct; je++){
             hsub[je + jj*X->Def.k_exct + ie * nsub + ii * nsub*X->Def.k_exct]
               = VecProdMPI(i_max, wxp[jj][je], hwxp[ii][ie]);
             ovlp[je + jj*X->Def.k_exct + ie * nsub + ii * nsub*X->Def.k_exct]
               = VecProdMPI(i_max, wxp[jj][je], wxp[ii][ie]);
           }/*for (je = 0; je < X->Def.k_exct; je++)*/
         }/*for (jj = 0; jj < 3; jj++)*/
       }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
     }/*for (ii = 0; ii < 3; ii++)*/
     for (ie = 0; ie < X->Def.k_exct; ie++)
       eig[ie] =
       creal(hsub[ie + 1 * X->Def.k_exct + ie * nsub + 1 * nsub*X->Def.k_exct]);
     nsub_cut = diag_ovrp(nsub, hsub, ovlp, eigsub);
     for (ie = 0; ie < X->Def.k_exct; ie++)
       eig[ie] = 0.5 * (eig[ie] + eigsub[ie]);

 #pragma omp parallel default(none) shared(i_max,X,wxp,hwxp,hsub,nsub,work) private(idim,ie,je,jj,mythread)
     {
 #if defined(_OPENMP)
       mythread = omp_get_thread_num();
 #else
       mythread = 0;
 #endif

 #pragma omp for
       for (idim = 1; idim <= i_max; idim++) {
         for (ie = 0; ie < X->Def.k_exct; ie++) {
           work[mythread][ie] = 0.0;
           for (jj = 0; jj < 3; jj++)
             for (je = 0; je < X->Def.k_exct; je++)
               work[mythread][ie] += wxp[jj][je][idim] * hsub[je + jj *X->Def.k_exct + nsub*ie];
         }
         for (ie = 0; ie < X->Def.k_exct; ie++) wxp[1][ie][idim] = work[mythread][ie];
         for (ie = 0; ie < X->Def.k_exct; ie++) {
           work[mythread][ie] = 0.0;
           for (jj = 0; jj < 3; jj++)
             for (je = 0; je < X->Def.k_exct; je++)
               work[mythread][ie] += hwxp[jj][je][idim] * hsub[je + jj *X->Def.k_exct + nsub*ie];
         }
         for (ie = 0; ie < X->Def.k_exct; ie++) hwxp[1][ie][idim] = work[mythread][ie];
         for (ie = 0; ie < X->Def.k_exct; ie++) {
           work[mythread][ie] = 0.0;
           for (jj = 0; jj < 3; jj += 2) {
             for (je = 0; je < X->Def.k_exct; je++)
               work[mythread][ie] += wxp[jj][je][idim] * hsub[je + jj *X->Def.k_exct + nsub*ie];
           }
         }
         for (ie = 0; ie < X->Def.k_exct; ie++) wxp[2][ie][idim] = work[mythread][ie];
         for (ie = 0; ie < X->Def.k_exct; ie++) {
           work[mythread][ie] = 0.0;
           for (jj = 0; jj < 3; jj += 2)
             for (je = 0; je < X->Def.k_exct; je++)
               work[mythread][ie] += hwxp[jj][je][idim] * hsub[je + jj *X->Def.k_exct + nsub*ie];
         }
         for (ie = 0; ie < X->Def.k_exct; ie++) hwxp[2][ie][idim] = work[mythread][ie];

       }/*for (idim = 1; idim <= i_max; idim++)*/
     }/*pragma omp parallel*/
     for (ii = 1; ii < 3; ii++) {
       for (ie = 0; ie < X->Def.k_exct; ie++) {
         dnorm = sqrt(creal(VecProdMPI(i_max, wxp[ii][ie], wxp[ii][ie])));
 #pragma omp parallel for default(none) shared(i_max,wxp,hwxp,dnorm,ie,ii) private(idim)
         for (idim = 1; idim <= i_max; idim++) {
           wxp[ii][ie][idim] /= dnorm;
           hwxp[ii][ie][idim] /= dnorm;
         }
       }/* for (ie = 0; ie < X->Def.k_exct; ie++)*/
     }/*for (ii = 1; ii < 3; ii++)*/

   }/*for (stp = 1; stp <= X->Def.Lanczos_max; stp++)*/
   //fclose(fp);

   X->Large.itr = stp;
   sprintf(sdt, cFileNameTimeKeep, X->Def.CDataFileHead);

   TimeKeeper(X, cFileNameTimeKeep, cLanczos_EigenValueFinish, "a");
   fprintf(stdoutMPI, "%s", cLogLanczos_EigenValueEnd);

   free_d_1d_allocate(eig);
   free_d_1d_allocate(eigsub);
   free_cd_1d_allocate(hsub);
   free_cd_1d_allocate(ovlp);
   free_cd_2d_allocate(work);
   free_cd_3d_allocate(hwxp);
   if (X->Def.iReStart == RESTART_OUT || X->Def.iReStart == RESTART_INOUT){
       Output_restart(X, wxp[1]);
       if(iconv != 0) {
           sprintf(sdt, "%s", cLogLanczos_EigenValueNotConverged);
           return 1;
       }
   }
   L_vec = cd_2d_allocate(X->Def.k_exct, X->Check.idim_max + 1);
 #pragma omp parallel default(none) shared(i_max,wxp,L_vec,X) private(idim,ie)
   {
     for (ie = 0; ie < X->Def.k_exct; ie++) {
 #pragma omp for nowait
       for (idim = 0; idim < i_max; idim++)
         L_vec[ie][idim] = wxp[1][ie][idim + 1];
     }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
   }/*X->Def.k_exct, X->Check.idim_max + 1);*/
   free_cd_3d_allocate(wxp);

   v0 = cd_1d_allocate(X->Check.idim_max + 1);
   v1 = cd_1d_allocate(X->Check.idim_max + 1);
   vg = cd_1d_allocate(X->Check.idim_max + 1);
   if (iconv != 0) {
     sprintf(sdt, "%s", cLogLanczos_EigenValueNotConverged);
     return -1;
   }
   else {
     return 0;
   }
 }/*int LOBPCG_Main*/
 int CalcByLOBPCG(
   struct EDMainCalStruct *X
 )
 {
   char sdt[D_FileNameMax];
   size_t byte_size;
   long int i_max = 0, ie, idim;
   FILE *fp;

   fprintf(stdoutMPI, "######  Eigenvalue with LOBPCG  #######\n\n");

   if (X->Bind.Def.iInputEigenVec == FALSE) {

     // this part will be modified
     switch (X->Bind.Def.iCalcModel) {
     case HubbardGC:
     case SpinGC:
     case KondoGC:
     case SpinlessFermionGC:
       initial_mode = 1; // 1 -> random initial vector
       break;
     case Hubbard:
     case Kondo:
     case Spin:
     case SpinlessFermion:

       if (X->Bind.Def.iFlgGeneralSpin == TRUE) {
         initial_mode = 1;
       }
       else {
         if (X->Bind.Def.initial_iv>0) {
           initial_mode = 0; // 0 -> only v[iv] = 1
         }
         else {
           initial_mode = 1; // 1 -> random initial vector
         }
       }
       break;
     default:
       //fclose(fp);
       exitMPI(-1);
     }

     int iret = LOBPCG_Main(&(X->Bind));
     if (iret != 0) {
       if(iret ==1) return (TRUE);
       else{
           fprintf(stdoutMPI, "  LOBPCG is not converged in this process.\n");
           return(FALSE);
       }
     }
   }/*if (X->Bind.Def.iInputEigenVec == FALSE)*/
   else {// X->Bind.Def.iInputEigenVec=true :input v1:
     fprintf(stdoutMPI, "An Eigenvector is inputted.\n");
     L_vec = cd_2d_allocate(X->Bind.Def.k_exct, X->Bind.Check.idim_max + 1);
     for (ie = 0; ie < X->Bind.Def.k_exct; ie++) {
       TimeKeeper(&(X->Bind), cFileNameTimeKeep, cReadEigenVecStart, "a");
       sprintf(sdt, cFileNameInputEigen, X->Bind.Def.CDataFileHead, ie, myrank);
       childfopenALL(sdt, "rb", &fp);
       if (fp == NULL) {
         fprintf(stderr, "Error: Inputvector file is not found.\n");
         exitMPI(-1);
       }
       byte_size = fread(&step_i, sizeof(int), 1, fp);
       byte_size = fread(&i_max, sizeof(long int), 1, fp);
       if (i_max != X->Bind.Check.idim_max) {
         fprintf(stderr, "Error: Invalid Inputvector file.\n");
         exitMPI(-1);
       }
       byte_size = fread(v1, sizeof(complex double), X->Bind.Check.idim_max + 1, fp);
 #pragma omp parallel for default(none) shared(L_vec, v1) firstprivate(i_max, ie), private(idim)
       for (idim = 0; idim < i_max; idim++) {
         L_vec[ie][idim] = v1[idim + 1];
       }
     }/*for (ie = 0; ie < X->Def.k_exct; ie++)*/
     fclose(fp);
     TimeKeeper(&(X->Bind), cFileNameTimeKeep, cReadEigenVecFinish, "a");

     if(byte_size == 0) printf("byte_size : %d\n", (int)byte_size);
   }/*X->Bind.Def.iInputEigenVec == TRUE*/

   fprintf(stdoutMPI, "%s", cLogLanczos_EigenVecEnd);
   phys(&(X->Bind), X->Bind.Def.k_exct);

   X->Bind.Def.St=1;
   if (X->Bind.Def.St == 0) {
     sprintf(sdt, cFileNameEnergy_Lanczos, X->Bind.Def.CDataFileHead);
   }
   else if (X->Bind.Def.St == 1) {
     sprintf(sdt, cFileNameEnergy_CG, X->Bind.Def.CDataFileHead);
   }

   if (childfopenMPI(sdt, "w", &fp) != 0) {
     exitMPI(-1);
   }
   for (ie = 0; ie < X->Bind.Def.k_exct; ie++) {
     //phys(&(X->Bind), ie);
     fprintf(fp, "State %ld\n", ie);
     fprintf(fp, "  Energy  %.16lf \n", X->Bind.Phys.all_energy[ie]);
     fprintf(fp, "  Doublon  %.16lf \n", X->Bind.Phys.all_doublon[ie]);
     fprintf(fp, "  Sz  %.16lf \n", X->Bind.Phys.all_sz[ie]);
     //fprintf(fp, "  S^2  %.16lf \n", X->Bind.Phys.all_s2[ie]);
     //fprintf(fp, "  N_up  %.16lf \n", X->Bind.Phys.all_num_up[ie]);
     //fprintf(fp, "  N_down  %.16lf \n", X->Bind.Phys.all_num_down[ie]);
     fprintf(fp, "\n");
   }
   fclose(fp);
   /*
    Output Eigenvector to a file
   */
   if (X->Bind.Def.iOutputEigenVec == TRUE) {
     TimeKeeper(&(X->Bind), cFileNameTimeKeep, cOutputEigenVecStart, "a");

     for (ie = 0; ie < X->Bind.Def.k_exct; ie++) {

 #pragma omp parallel for default(none) shared(X,v1,L_vec,ie) private(idim)
       for (idim = 0; idim < X->Bind.Check.idim_max; idim++)
         v1[idim + 1] = L_vec[ie][idim];

       sprintf(sdt, cFileNameOutputEigen, X->Bind.Def.CDataFileHead, ie, myrank);
       if (childfopenALL(sdt, "wb", &fp) != 0) exitMPI(-1);
       byte_size = fwrite(&X->Bind.Large.itr, sizeof(X->Bind.Large.itr), 1, fp);
       byte_size = fwrite(&X->Bind.Check.idim_max, sizeof(X->Bind.Check.idim_max), 1, fp);
       byte_size = fwrite(v1, sizeof(complex double), X->Bind.Check.idim_max + 1, fp);
       fclose(fp);
     }/*for (ie = 0; ie < X->Bind.Def.k_exct; ie++)*/

     TimeKeeper(&(X->Bind), cFileNameTimeKeep, cOutputEigenVecStart, "a");
   }/*if (X->Bind.Def.iOutputEigenVec == TRUE)*/

   return TRUE;

 }/*int CalcByLOBPCG*/
cFileNameEnergy_CG
const char * cFileNameEnergy_CG
Definition: global.c:42

childfopenALL
int childfopenALL(const char *_cPathChild, const char *_cmode, FILE **_fp)
All processes open file in output/ directory.
Definition: FileIO.c:50

DefineList::LanczosEps
int LanczosEps
log(10 base) of the convergence threshold. Read from Calcmod in readdef.h
Definition: struct.h:48

exitMPI
void exitMPI(int errorcode)
MPI Abortation wrapper.
Definition: wrapperMPI.c:86

BindStruct::Def
struct DefineList Def
Definision of system (Hamiltonian) etc.
Definition: struct.h:410

mltply
int mltply(struct BindStruct *X, double complex *tmp_v0, double complex *tmp_v1)
Parent function of multiplying the wavefunction by the Hamiltonian. . First, the calculation of diago...
Definition: mltply.c:56

DefineList::St
int St
0 or 1, but it affects nothing.
Definition: struct.h:80

cOutputEigenVecStart
const char * cOutputEigenVecStart
Definition: LogMessage.c:45

zgemm_
void zgemm_(char *transa, char *transb, int *m, int *n, int *k, double complex *alpha, double complex *a, int *lda, double complex *b, int *ldb, double complex *beta, double complex *c, int *ldc)

LargeList::itr
int itr
Iteration number.
Definition: struct.h:315

CheckList::idim_max
unsigned long int idim_max
The dimension of the Hilbert space of this process.
Definition: struct.h:303

DefineList::iReStart
int iReStart
Definition: struct.h:221

initial_mode
int initial_mode
Definition: global.h:60

cFileNameInputEigen
const char * cFileNameInputEigen
Definition: global.c:50

cLogLanczos_EigenValueNotConverged
const char * cLogLanczos_EigenValueNotConverged
Definition: LogMessage.c:89

cLogLanczos_EigenVecEnd
const char * cLogLanczos_EigenVecEnd
Definition: ProgressMessage.c:39

BcastMPI_li
unsigned long int BcastMPI_li(int root, unsigned long int idim)
MPI wrapper function to broadcast unsigned long integer across processes.
Definition: wrapperMPI.c:273

calc_preshift
static double calc_preshift(double eig, double res, double eps_LOBPCG)
Compute adaptively shifted preconditionar written in S. Yamada, et al., Transactions of JSCES...
Definition: CalcByLOBPCG.c:129

v1
double complex * v1
Definition: global.h:35

D_FileNameMax
#define D_FileNameMax
Definition: global.h:23

DefineList::iOutputEigenVec
int iOutputEigenVec
ASwitch for outputting an eigenvector. 0: no output, 1:output.
Definition: struct.h:202

phys
void phys(struct BindStruct *X, unsigned long int neig)
A main function to calculate physical quantities by full diagonalization method.
Definition: phys.c:48

BindStruct::Large
struct LargeList Large
Variables for Matrix-Vector product.
Definition: struct.h:412

childfopenMPI
int childfopenMPI(const char *_cPathChild, const char *_cmode, FILE **_fp)
Only the root process open file in output/ directory.
Definition: FileIO.c:27

cFileNameOutputEigen
const char * cFileNameOutputEigen
Definition: global.c:49

cLogInputVecFinish
const char * cLogInputVecFinish
Definition: LogMessage.c:150

cLanczos_EigenValueFinish
const char * cLanczos_EigenValueFinish
Definition: LogMessage.c:93

BindStruct::Phys
struct PhysList Phys
Physical quantities.
Definition: struct.h:413

Output_restart
static void Output_restart(struct BindStruct *X, double complex **wave)
Output eigenvectors for restart LOBPCG method.
Definition: CalcByLOBPCG.c:297

cFileNameLanczosStep
const char * cFileNameLanczosStep
Definition: global.c:39

CalcByLOBPCG
int CalcByLOBPCG(struct EDMainCalStruct *X)
Driver routine for LOB(P)CG method.
Definition: CalcByLOBPCG.c:638

TRUE
#define TRUE
Definition: global.h:26

EDMainCalStruct
Bind.
Definition: struct.h:419

nthreads
int nthreads
Number of Threads, defined in InitializeMPI()
Definition: global.h:164

cLogInputVecStart
const char * cLogInputVecStart
Definition: LogMessage.c:149

LargeList::iv
long int iv
Used for initializing vector.
Definition: struct.h:316

nproc
int nproc
Number of processors, defined in InitializeMPI()
Definition: global.h:162

BindStruct
Bind.
Definition: struct.h:409

zheevd_
void zheevd_(char *jobz, char *uplo, int *n, double complex *a, int *lda, double *w, double complex *work, int *lwork, double *rwork, int *lrwork, int *iwork, int *liwork, int *info)

cFileNameInputVector
const char * cFileNameInputVector
Definition: global.c:65

cLogLanczos_EigenValueEnd
const char * cLogLanczos_EigenValueEnd
Definition: ProgressMessage.c:37

cReadEigenVecFinish
const char * cReadEigenVecFinish
Definition: LogMessage.c:44

cLanczos_EigenValueStart
const char * cLanczos_EigenValueStart
Definition: LogMessage.c:91

PhysList::all_doublon
double * all_doublon
[CheckList::idim_max+1] Doublon for FullDiag and LOBPCG. malloc in setmem_large().
Definition: struct.h:373

L_vec
double complex ** L_vec
Definition: global.h:74

alpha
double * alpha
Definition: global.h:44

cLogOutputVecStart
const char * cLogOutputVecStart
Definition: LogMessage.c:151

DefineList::iFlgGeneralSpin
int iFlgGeneralSpin
Flag for the general (Sz/=1/2) spin.
Definition: struct.h:86

FALSE
#define FALSE
Definition: global.h:25

diag_ovrp
static int diag_ovrp(int nsub, double complex *hsub, double complex *ovlp, double *eig)
Solve the generalized eigenvalue problem  with the Lowdin&#39;s orthogonalization.
Definition: CalcByLOBPCG.c:43

cFileNameTimeKeep
const char * cFileNameTimeKeep
Definition: global.c:23

vg
double complex * vg
Definition: global.h:41

cReadEigenVecStart
const char * cReadEigenVecStart
Definition: LogMessage.c:43

VecProdMPI
double complex VecProdMPI(long unsigned int ndim, double complex *v1, double complex *v2)
Compute conjugate scaler product of process-distributed vector .
Definition: wrapperMPI.c:314

beta
double * beta
Definition: global.h:44

cLanczos_EigenValueStep
const char * cLanczos_EigenValueStep
Definition: LogMessage.c:92

cLogOutputVecFinish
const char * cLogOutputVecFinish
Definition: LogMessage.c:152

X
struct EDMainCalStruct X
Definition: struct.h:432

list_Diagonal
double * list_Diagonal
Definition: global.h:46

PhysList::all_sz
double * all_sz
[CheckList::idim_max+1]  for FullDiag and LOBPCG. malloc in setmem_large().
Definition: struct.h:375

DefineList::iCalcModel
int iCalcModel
Switch for model. 0:Hubbard, 1:Spin, 2:Kondo, 3:HubbardGC, 4:SpinGC, 5:KondoGC, 6:HubbardNConserved.
Definition: struct.h:198

DefineList::initial_iv
long int initial_iv
Seed of random number for initial guesss of wavefunctions.
Definition: struct.h:76

myrank
int myrank
Process ID, defined in InitializeMPI()
Definition: global.h:163

cFileNameOutputVector
const char * cFileNameOutputVector
Definition: global.c:64

DefineList::iInitialVecType
int iInitialVecType
Switch for type of inital vectors. 0:complex type, 1: real type. default value is set as 0 in readdef...
Definition: struct.h:195

LOBPCG_Main
int LOBPCG_Main(struct BindStruct *X)
Core routine for the LOBPCG method This method is introduced inS. Yamada, et al., Transactions of JSC...
Definition: CalcByLOBPCG.c:330

v0
double complex * v0
Definition: global.h:34

DefineList::iInputEigenVec
int iInputEigenVec
Switch for reading an eigenvector. 0: no input, 1:input.
Definition: struct.h:203

cFileNameEnergy_Lanczos
const char * cFileNameEnergy_Lanczos
Definition: global.c:40

BindStruct::Check
struct CheckList Check
Size of the Hilbert space.
Definition: struct.h:411

SumMPI_li
unsigned long int SumMPI_li(unsigned long int idim)
MPI wrapper function to obtain sum of unsigned long integer across processes.
Definition: wrapperMPI.c:239

step_i
int step_i
Definition: global.h:66

DefineList::CDataFileHead
char * CDataFileHead
Read from Calcmod in readdef.h. Header of output file such as Green&#39;s function.
Definition: struct.h:42

TimeKeeperWithStep
int TimeKeeperWithStep(struct BindStruct *X, const char *cFileName, const char *cTimeKeeper_Message, const char *cWriteType, const int istep)
Functions for writing a time log.
Definition: log.c:78

EDMainCalStruct::Bind
struct BindStruct Bind
Binded struct.
Definition: struct.h:420

Initialize_wave
static void Initialize_wave(struct BindStruct *X, double complex **wave)
Definition: CalcByLOBPCG.c:155

TimeKeeper
int TimeKeeper(struct BindStruct *X, const char *cFileName, const char *cTimeKeeper_Message, const char *cWriteType)
Functions for writing a time log.
Definition: log.c:42

DefineList::Lanczos_max
unsigned int Lanczos_max
Maximum number of iterations.
Definition: struct.h:74

stdoutMPI
FILE * stdoutMPI
File pointer to the standard output defined in InitializeMPI()
Definition: global.h:165

PhysList::all_energy
double * all_energy
[CheckList::idim_max+1] Energy for FullDiag and LOBPCG. malloc in setmem_large(). ...
Definition: struct.h:371

DefineList::k_exct
unsigned int k_exct
Read from Calcmod in readdef.h.
Definition: struct.h:47