Changes to remove warnings under icc; disambiguate AVX512 from IMCI correctly

and drop swizzles in AVX512. Don't know why these compiled.
2026-03-13 16:01:00 +00:00 · 2015-09-23 05:23:45 -07:00
parent 2f38ebc446
commit 5ef42add2d
22 changed files with 997 additions and 129 deletions
--- a/lib/algorithms/iterative/ImplicitlyRestartedLanczos.h
+++ b/lib/algorithms/iterative/ImplicitlyRestartedLanczos.h
@@ -0,0 +1,388 @@
+#ifndef GRID_IRL_H
+#define GRID_IRL_H
+
+namespace Grid {
+
+    /////////////////////////////////////////////////////////////
+    // Base classes for iterative processes based on operators
+    // single input vec, single output vec.
+    /////////////////////////////////////////////////////////////
+
+  template<class Field> 
+    class ImplicitlyRestartedLanczos {
+public:       
+
+    int Niter;
+    int Nk;
+    int Np;
+    RealD enorm;
+    RealD vthr;
+    
+    LinearOperatorBase<Field> &_Linop;
+    OperatorFunction<Field>   &_poly;
+
+    ImplicitlyRestartedLanczos(
+			       LinearOperatorBase<Field> &Linop,
+			       OperatorFunction<Field> & poly,
+			       int _Nk,
+			       int _Np,
+			       RealD _enorm,
+			       RealD _vthrs,
+			       int _Niter) :
+    _Linop(Linop),
+      _poly(poly),
+      Nk(_Nk),
+      Np(_Np),
+      enorm(_enorm),
+      vthr(_vthrs)
+    { 
+      vthr=_vthrs;
+      Niter=_Niter;
+    };
+
+
+    void step(Vector<RealD>& lmda,
+	      Vector<RealD>& lmdb, 
+	      Vector<Field>& evec,
+	      Field& f,int Nm,int k)
+    {
+
+      assert( k< Nm );
+      
+      w = opr_->mult(evec[k]);
+
+      if(k==0){  // Initial step
+    
+	RealD wnorm= w*w;
+	std::cout<<"wnorm="<<wnorm<<std::endl;
+
+	RealD alph = evec[k] * w;
+	w -= alph * evec[k];
+	lmd[k] = alph;
+
+	RealD beta = w * w;
+	beta = sqrt(beta);
+	RealD betar = 1.0/beta;
+
+	evec[k+1] = betar * w;
+	lme[k] = beta;
+
+      } else {   // Iteration step
+
+	w -= lme[k-1] * evec[k-1];
+	
+	RealD alph = evec[k] * w;
+	w -= alph * evec[k];
+
+	RealD beta = w * w;
+	beta = sqrt(beta);
+	RealD betar = 1.0/beta;
+	w *= betar;
+	
+	lmd[k] = alph;
+	lme[k] = beta;
+	orthogonalize(w,evec,k);
+	
+	if(k < Nm-1) evec[k+1] = w;
+      }
+    }
+
+    void qr_decomp(Vector<RealD>& lmda,
+		   Vector<RealD>& lmdb,
+		   int Nk,
+		   int Nm,
+		   Vector<RealD>& Qt,
+		   RealD Dsft, 
+		   int kmin,
+		   int kmax)
+    {
+      int k = kmin-1;
+      RealD x;
+
+      RealD Fden = 1.0/sqrt((lmd[k]-Dsh)*(lmd[k]-Dsh) +lme[k]*lme[k]);
+      RealD c = ( lmd[k] -Dsh) *Fden;
+      RealD s = -lme[k] *Fden;
+      
+      RealD tmpa1 = lmd[k];
+      RealD tmpa2 = lmd[k+1];
+      RealD tmpb  = lme[k];
+
+      lmd[k]   = c*c*tmpa1 +s*s*tmpa2 -2.0*c*s*tmpb;
+      lmd[k+1] = s*s*tmpa1 +c*c*tmpa2 +2.0*c*s*tmpb;
+      lme[k]   = c*s*(tmpa1-tmpa2) +(c*c-s*s)*tmpb;
+      x        = -s*lme[k+1];
+      lme[k+1] = c*lme[k+1];
+      
+      for(int i=0; i<Nk; ++i){
+	RealD Qtmp1 = Qt[i+Nm*k  ];
+	RealD Qtmp2 = Qt[i+Nm*(k+1)];
+	Qt[i+Nm*k    ] = c*Qtmp1 - s*Qtmp2;
+	Qt[i+Nm*(k+1)] = s*Qtmp1 + c*Qtmp2; 
+      }
+
+      // Givens transformations
+      for(int k = kmin; k < kmax-1; ++k){
+	RealD Fden = 1.0/sqrt( x*x +lme[k-1]*lme[k-1]);
+	RealD c = lme[k-1]*Fden;
+	RealD s = - x*Fden;
+	
+	RealD tmpa1 = lmd[k];
+	RealD tmpa2 = lmd[k+1];
+	RealD tmpb  = lme[k];
+
+	lmd[k]   = c*c*tmpa1 +s*s*tmpa2 -2.0*c*s*tmpb;
+	lmd[k+1] = s*s*tmpa1 +c*c*tmpa2 +2.0*c*s*tmpb;
+	lme[k]   = c*s*(tmpa1-tmpa2) +(c*c-s*s)*tmpb;
+	lme[k-1] = c*lme[k-1] -s*x;
+
+	if(k != kmax-2){
+	  x = -s*lme[k+1];
+	  lme[k+1] = c*lme[k+1];
+	}
+
+	for(int i=0; i<Nk; ++i){
+	  RealD Qtmp1 = Qt[i+Nm*k    ];
+	  RealD Qtmp2 = Qt[i+Nm*(k+1)];
+	  Qt[i+Nm*k    ] = c*Qtmp1 -s*Qtmp2;
+	  Qt[i+Nm*(k+1)] = s*Qtmp1 +c*Qtmp2;
+	}
+      }
+    }
+
+    void diagonalize(Vector<RealD>& lmda,
+		     Vector<RealD>& lmdb, 
+		     int Nm2,
+		     int Nm,
+		     Vector<RealD>& Qt)
+    {
+      int Niter = 100*Nm;
+      int kmin = 1;
+      int kmax = Nk;
+      // (this should be more sophisticated)
+
+      for(int iter=0; iter<Niter; ++iter){
+
+	// determination of 2x2 leading submatrix
+	RealD dsub = lmd[kmax-1]-lmd[kmax-2];
+	RealD dd = sqrt(dsub*dsub + 4.0*lme[kmax-2]*lme[kmax-2]);
+	RealD Dsh = 0.5*(lmd[kmax-2]+lmd[kmax-1] +dd*(dsub/fabs(dsub)));
+	// (Dsh: shift)
+	
+	// transformation
+	qr_decomp(lmd,lme,Nk,Nm,Qt,Dsh,kmin,kmax);
+	
+	// Convergence criterion (redef of kmin and kamx)
+	for(int j=kmax-1; j>= kmin; --j){
+	  RealD dds = fabs(lmd[j-1])+fabs(lmd[j]);
+	  if(fabs(lme[j-1])+dds > dds){
+	    kmax = j+1;
+	    goto continued;
+	  }
+	}
+	Niter = iter;
+	return;
+
+      continued:
+	for(int j=0; j<kmax-1; ++j){
+	  RealD dds = fabs(lmd[j])+fabs(lmd[j+1]);
+	  if(fabs(lme[j])+dds > dds){
+	    kmin = j+1;
+	    break;
+	  }
+	}
+      }
+      std::cout << "[QL method] Error - Too many iteration: "<<Niter<<"\n";
+      abort();
+    }
+
+    void orthogonalize(Field& w,
+		       const Vector<Field>& evec,
+		       int k)
+    {
+  // Schmidt orthogonalization                                   
+                                                
+      size_t size = w.size();
+      assert(size%2 ==0);
+
+      std::slice re(0,size/2,2);
+      std::slice im(1,size/2,2);
+
+      for(int j=0; j<k; ++j){
+	RealD prdr = evec[j]*w;
+	RealD prdi = evec[j].im_prod(w);
+	
+	valarray<RealD> evr(evec[j][re]);
+	valarray<RealD> evi(evec[j][im]);
+
+	w.add(re, -prdr*evr +prdi*evi);
+	w.add(im, -prdr*evi -prdi*evr);
+      }
+    }
+
+    void calc(Vector<RealD>& lmd,
+	      Vector<Field>& evec,
+	      const Field& b,
+	      int& Nsbt,
+	      int& Nconv)
+      {
+	const size_t fsize = evec[0].size();
+  
+	Nconv = -1;
+	Nsbt = 0;
+	int Nm = Nk_+Np_;
+
+	std::cout << " -- Nk = " << Nk_ << " Np = "<< Np_ << endl;
+	std::cout << " -- Nm = " << Nm << endl;
+	std::cout << " -- size of lmd   = " << lmd.size() << endl;
+	std::cout << " -- size of evec  = " << evec.size() << endl;
+	
+	assert(Nm < evec.size() && Nm < lmd.size());
+	
+	vector<RealD> lme(Nm);
+	vector<RealD> lmd2(Nm);
+	vector<RealD> lme2(Nm);
+	vector<RealD> Qt(Nm*Nm);
+	vector<int>    Iconv(Nm);
+	
+	vector<Field>  B(Nm);
+	for(int k=0; k<Nm; ++k) B[k].resize(fsize);
+	
+	Field f(fsize);
+	Field v(fsize);
+  
+	int k1 = 1;
+	int k2 = Nk_;
+	int kconv = 0;
+	
+	int Kdis  = 0;
+	int Kthrs = 0;
+	RealD beta_k;
+  
+	// Set initial vector
+	evec[0] = 1.0;
+	RealD vnorm = evec[0]*evec[0];
+	evec[0] = 1.0/sqrt(vnorm);
+	// (uniform vector)
+	
+	// Initial Nk steps
+	for(int k=0; k<k2; ++k) step(lmd,lme,evec,f,Nm,k);
+	
+	// Restarting loop begins
+	for(int iter = 0; iter<Niter_; ++iter){
+	  std::cout<<"\n iteration = "<< iter << endl;
+
+	  int Nm2 = Nm - kconv;
+	  for(int k=k2; k<Nm; ++k) step(lmd,lme,evec,f,Nm,k);
+	  f *= lme[Nm-1];
+	  
+	  // getting eigenvalues
+	  for(int k=0; k<Nm2; ++k){
+	    lmd2[k] = lmd[k+k1-1];
+	    lme2[k] = lme[k+k1-1];
+	  }
+	  setUnit_Qt(Nm,Qt);
+	  diagonalize(lmd2,lme2,Nm2,Nm,Qt);
+	  // sorting
+	  sort_->push(lmd2,Nm);
+	  
+	  // Implicitly shifted QR transformations
+	  setUnit_Qt(Nm,Qt);
+	  for(int ip=k2; ip<Nm; ++ip) 
+	    qr_decomp(lmd,lme,Nm,Nm,Qt,lmd2[ip],k1,Nm);
+    
+	  for(int i=0; i<(Nk_+1); ++i) B[i] = 0.0;
+	  
+	  for(int j=k1-1; j<k2+1; ++j){
+	    for(int k=0; k<Nm; ++k){
+	      B[j] += Qt[k+Nm*j] * evec[k];
+	    }
+	  }
+	  for(int j=k1-1; j<k2+1; ++j) evec[j] = B[j];
+
+	  // Compressed vector f and beta(k2)
+	  f *= Qt[Nm-1+Nm*(k2-1)];
+	  f += lme[k2-1] * evec[k2];
+	  beta_k = f * f;
+	  beta_k = sqrt(beta_k);
+	  std::cout<<" beta(k) = "<<beta_k<<endl;
+
+	  RealD betar = 1.0/beta_k;
+	  evec[k2] = betar * f;
+	  lme[k2-1] = beta_k;
+
+	  // Convergence test
+	  for(int k=0; k<Nm2; ++k){    
+	    lmd2[k] = lmd[k];
+	    lme2[k] = lme[k];
+	  }
+	  setUnit_Qt(Nm,Qt);
+	  diagonalize(lmd2,lme2,Nk_,Nm,Qt);
+	  
+	  for(int k = 0; k<Nk_; ++k) B[k]=0.0;
+	  
+	  for(int j = 0; j<Nk_; ++j){
+	    for(int k = 0; k<Nk_; ++k){
+	      B[j] += Qt[k+j*Nm] * evec[k];
+	    }
+	  }
+	  Kdis = 0;
+	  Kthrs = 0;
+
+	  std::cout << setiosflags(ios_base::scientific);
+	  for(int i=0; i<Nk_; ++i){
+	    v = opr_->mult(B[i]);
+	    //std::cout<<"vv="<<v*v<<std::endl;
+	    
+	    RealD vnum = B[i]*v;
+	    RealD vden = B[i]*B[i];
+	    lmd2[i] = vnum/vden;
+	    v -= lmd2[i]*B[i];
+	    RealD vv = v*v;
+	    
+	    std::cout << " [" << setw(3)<< setiosflags(ios_base::right) <<i<<"] ";
+	    std::cout << setw(25)<< setiosflags(ios_base::left)<< lmd2[i];
+	    std::cout <<"  "<< setw(25)<< setiosflags(ios_base::right)<< vv<< endl;
+	    
+	    if(vv<enorm_){
+	      Iconv[Kdis] = i;
+	      ++Kdis;
+	      if(sort_->saturated(lmd2[i],vthr)) ++Kthrs;
+	      std::cout<<"Kthrs="<<Kthrs<<endl;
+	    }
+	  }  // i-loop end
+	  std::cout << resetiosflags(ios_base::scientific);
+
+
+	  std::cout<<" #modes converged: "<<Kdis<<endl;
+
+	  if(Kthrs > 0){
+	    // (there is a converged eigenvalue larger than Vthrs.)
+	    Nconv = iter;
+	    goto converged;
+	  }
+	} // end of iter loop
+	
+	std::cout<<"\n NOT converged.\n";
+	abort();
+	
+      converged:
+	// Sorting
+	
+	lmd.clear();
+	evec.clear();
+	for(int i=0; i<Kdis; ++i){
+	  lmd.push_back(lmd2[Iconv[i]]);
+	  evec.push_back(B[Iconv[i]]);
+	}
+	sort_->push(lmd,evec,Kdis);
+	Nsbt = Kdis - Kthrs;
+	
+	std::cout << "\n Converged\n Summary :\n";
+	std::cout << " -- Iterations  = "<< Nconv  << "\n";
+	std::cout << " -- beta(k)     = "<< beta_k << "\n";
+	std::cout << " -- Kdis        = "<< Kdis   << "\n";
+	std::cout << " -- Nsbt        = "<< Nsbt   << "\n";
+      }
+  };
+}
+#endif
--- a/lib/algorithms/iterative/MatrixUtils.h
+++ b/lib/algorithms/iterative/MatrixUtils.h
@@ -0,0 +1,48 @@
+#ifndef GRID_MATRIX_UTILS_H
+#define GRID_MATRIX_UTILS_H
+
+namespace Grid {
+
+  namespace MatrixUtils { 
+
+    template<class T> inline void Size(Matrix<T>& A,int &N,int &M){
+      N=A.size(); assert(N>0);
+      M=A[0].size();
+      for(int i=0;i<N;i++){
+	assert(A[i].size()==M);
+      }
+    }
+
+    template<class T> inline void SizeSquare(Matrix<T>& A,int &N)
+    {
+      int M;
+      Size(A,N,M);
+      assert(N==M);
+    }
+
+    template<class T> inline void Fill(Matrix<T>& A,T & val)
+    { 
+      int N,M;
+      Size(A,N,M);
+      for(int i=0;i<N;i++){
+      for(int j=0;j<M;j++){
+	A[i][j]=val;
+      }}
+    }
+    template<class T> inline void Diagonal(Matrix<T>& A,T & val)
+    { 
+      int N;
+      SizeSquare(A,N);
+      for(int i=0;i<N;i++){
+	A[i][i]=val;
+      }
+    }
+    template<class T> inline void Identity(Matrix<T>& A)
+    {
+      Fill(A,0.0);
+      Diagonal(A,1.0);
+    }
+
+  };
+}
+#endif