Global edit with change to View usage. autoView() creates a wrapper object that closes the view when scope closes.

2026-05-06 18:24:31 +01:00 · 2020-06-05 18:52:35 -04:00
parent f39c2a240b
commit 1a4c8c3387
78 changed files with 773 additions and 778 deletions
@@ -29,9 +29,11 @@ Author: Peter Boyle <paboyle@ph.ed.ac.uk>
 #ifndef GRID_ALGORITHMS_H
 #define GRID_ALGORITHMS_H

+NAMESPACE_CHECK(algorithms);
 #include <Grid/algorithms/SparseMatrix.h>
 #include <Grid/algorithms/LinearOperator.h>
 #include <Grid/algorithms/Preconditioner.h>
+NAMESPACE_CHECK(SparseMatrix);

 #include <Grid/algorithms/approx/Zolotarev.h>
 #include <Grid/algorithms/approx/Chebyshev.h>
@@ -41,10 +43,12 @@ Author: Peter Boyle <paboyle@ph.ed.ac.uk>
 #include <Grid/algorithms/approx/Forecast.h>
 #include <Grid/algorithms/approx/RemezGeneral.h>
 #include <Grid/algorithms/approx/ZMobius.h>
-
+NAMESPACE_CHECK(approx);
 #include <Grid/algorithms/iterative/Deflation.h>
 #include <Grid/algorithms/iterative/ConjugateGradient.h>
+NAMESPACE_CHECK(ConjGrad);
 #include <Grid/algorithms/iterative/BiCGSTAB.h>
+NAMESPACE_CHECK(BiCGSTAB);
 #include <Grid/algorithms/iterative/ConjugateResidual.h>
 #include <Grid/algorithms/iterative/NormalEquations.h>
 #include <Grid/algorithms/iterative/SchurRedBlack.h>
@@ -62,7 +66,9 @@ Author: Peter Boyle <paboyle@ph.ed.ac.uk>
 #include <Grid/algorithms/iterative/ImplicitlyRestartedLanczos.h>
 #include <Grid/algorithms/iterative/PowerMethod.h>

+NAMESPACE_CHECK(PowerMethod);
 #include <Grid/algorithms/CoarsenedMatrix.h>
+NAMESPACE_CHECK(CoarsendMatrix);
 #include <Grid/algorithms/FFT.h>

 #endif
@@ -186,10 +186,10 @@ public:
 	
 	hermop.HermOp(*Tn,y);

-	auto y_v = y.View(AcceleratorWrite);
-	auto Tn_v = Tn->View(AcceleratorWrite);
-	auto Tnp_v = Tnp->View(AcceleratorWrite);
-	auto Tnm_v = Tnm->View(AcceleratorWrite);
+	autoView( y_v , y, AcceleratorWrite);
+	autoView( Tn_v , (*Tn), AcceleratorWrite);
+	autoView( Tnp_v , (*Tnp), AcceleratorWrite);
+	autoView( Tnm_v , (*Tnm), AcceleratorWrite);
 	const int Nsimd = CComplex::Nsimd();
 	accelerator_forNB(ss, FineGrid->oSites(), Nsimd, {
 	  coalescedWrite(y_v[ss],xscale*y_v(ss)+mscale*Tn_v(ss));
@@ -246,13 +246,14 @@ public:
  CartesianStencil<siteVector,siteVector,int> Stencil; 

  std::vector<CoarseMatrix> A;
-      
+    
  ///////////////////////
  // Interface
  ///////////////////////
  GridBase * Grid(void)         { return _grid; };   // this is all the linalg routines need to know

-  RealD M (const CoarseVector &in, CoarseVector &out){
+  RealD M (const CoarseVector &in, CoarseVector &out)
+  {

    conformable(_grid,in.Grid());
    conformable(in.Grid(),out.Grid());
@@ -263,12 +264,13 @@ public:
    double comms_usec = -usecond();
    Stencil.HaloExchange(in,compressor);
    comms_usec += usecond();
-
-    auto in_v = in.View(AcceleratorRead);
-    auto out_v = out.View(AcceleratorWrite);
+  
+    autoView( in_v , in, AcceleratorRead);
+    autoView( out_v , out, AcceleratorWrite);
    typedef LatticeView<Cobj> Aview;
-
+      
    Vector<Aview> AcceleratorViewContainer;
+  
    for(int p=0;p<geom.npoint;p++) AcceleratorViewContainer.push_back(A[p].View(AcceleratorRead));
    Aview *Aview_p = & AcceleratorViewContainer[0];

@@ -307,13 +309,15 @@ public:
 	}
      }
      coalescedWrite(out_v[ss](b),res);
-    });
+      });
    usecs +=usecond();

    double nrm_usec=-usecond();
    RealD Nout= norm2(out);
    nrm_usec+=usecond();

+    for(int p=0;p<geom.npoint;p++) AcceleratorViewContainer[p].ViewClose();
+
    return Nout;
  };

@@ -346,8 +350,8 @@ public:
    for(int p=0;p<geom.npoint;p++) AcceleratorViewContainer.push_back(A[p].View(AcceleratorRead));
    Aview *Aview_p = & AcceleratorViewContainer[0];

-    auto out_v = out.View(AcceleratorWrite);
-    auto in_v  = in.View(AcceleratorRead);
+    autoView( out_v , out, AcceleratorWrite);
+    autoView( in_v  , in, AcceleratorRead);

    const int Nsimd = CComplex::Nsimd();
    typedef decltype(coalescedRead(in_v[0])) calcVector;
@@ -375,6 +379,7 @@ public:
      }
      coalescedWrite(out_v[ss](b),res);
    });
+    for(int p=0;p<geom.npoint;p++) AcceleratorViewContainer[p].ViewClose();
  }
  void MdirAll(const CoarseVector &in,std::vector<CoarseVector> &out)
  {
@@ -542,10 +547,10 @@ public:
 	    
 	    blockMaskedInnerProduct(oZProj,omask,Subspace.subspace[j],Mphi);
 	    
-	    auto iZProj_v = iZProj.View(AcceleratorRead) ;
-	    auto oZProj_v = oZProj.View(AcceleratorRead) ;
-	    auto A_p     =  A[p].View(AcceleratorWrite);
-	    auto A_self  = A[self_stencil].View(AcceleratorWrite);
+	    autoView( iZProj_v , iZProj, AcceleratorRead) ;
+	    autoView( oZProj_v , oZProj, AcceleratorRead) ;
+	    autoView( A_p     ,  A[p], AcceleratorWrite);
+	    autoView( A_self  , A[self_stencil], AcceleratorWrite);

 	    accelerator_for(ss, Grid()->oSites(), Fobj::Nsimd(),{ coalescedWrite(A_p[ss](j,i),oZProj_v(ss)); });
 	    //      if( disp!= 0 ) { accelerator_for(ss, Grid()->oSites(), Fobj::Nsimd(),{ coalescedWrite(A_p[ss](j,i),oZProj_v(ss)); });}
@@ -563,11 +568,11 @@ public:
 	mult(tmp,phi,oddmask );  linop.Op(tmp,Mphio);

 	{
-	  auto tmp_      = tmp.View(AcceleratorWrite);
-	  auto evenmask_ = evenmask.View(AcceleratorRead);
-	  auto oddmask_  =  oddmask.View(AcceleratorRead);
-	  auto Mphie_    =  Mphie.View(AcceleratorRead);
-	  auto Mphio_    =  Mphio.View(AcceleratorRead);
+	  autoView( tmp_      , tmp, AcceleratorWrite);
+	  autoView( evenmask_ , evenmask, AcceleratorRead);
+	  autoView( oddmask_  ,  oddmask, AcceleratorRead);
+	  autoView( Mphie_    ,  Mphie, AcceleratorRead);
+	  autoView( Mphio_    ,  Mphio, AcceleratorRead);
 	  accelerator_for(ss, FineGrid->oSites(), Fobj::Nsimd(),{ 
 	      coalescedWrite(tmp_[ss],evenmask_(ss)*Mphie_(ss) + oddmask_(ss)*Mphio_(ss));
 	    });
@@ -575,8 +580,8 @@ public:

 	blockProject(SelfProj,tmp,Subspace.subspace);

-	auto SelfProj_ = SelfProj.View(AcceleratorRead);
-	auto A_self  = A[self_stencil].View(AcceleratorWrite);
+	autoView( SelfProj_ , SelfProj, AcceleratorRead);
+	autoView( A_self  , A[self_stencil], AcceleratorWrite);

 	accelerator_for(ss, Grid()->oSites(), Fobj::Nsimd(),{
 	  for(int j=0;j<nbasis;j++){
@@ -36,7 +36,6 @@ Author: Peter Boyle <paboyle@ph.ed.ac.uk>
 #endif
 #endif

-
 NAMESPACE_BEGIN(Grid);

 template<class scalar> struct FFTW { };
@@ -190,7 +189,7 @@ public:
    typedef typename sobj::scalar_type   scalar;
      
    Lattice<sobj> pgbuf(&pencil_g);
-    auto pgbuf_v = pgbuf.View(CpuWrite);
+    autoView(pgbuf_v , pgbuf, CpuWrite);

    typedef typename FFTW<scalar>::FFTW_scalar FFTW_scalar;
    typedef typename FFTW<scalar>::FFTW_plan   FFTW_plan;
@@ -122,12 +122,14 @@ class BiCGSTAB : public OperatorFunction<Field>

        LinearCombTimer.Start();
        bo = beta * omega;
-        auto p_v = p.View(AcceleratorWrite);
-        auto r_v = r.View(AcceleratorWrite);
-        auto v_v = v.View(AcceleratorWrite);
-        accelerator_for(ss, p_v.size(), Field::vector_object::Nsimd(),{
-          coalescedWrite(p_v[ss], beta*p_v(ss) - bo*v_v(ss) + r_v(ss));
-        });
+	{
+	  autoView( p_v , p, AcceleratorWrite);
+	  autoView( r_v , r, AcceleratorRead);
+	  autoView( v_v , v, AcceleratorRead);
+	  accelerator_for(ss, p_v.size(), Field::vector_object::Nsimd(),{
+	      coalescedWrite(p_v[ss], beta*p_v(ss) - bo*v_v(ss) + r_v(ss));
+	    });
+	}
        LinearCombTimer.Stop();
        LinalgTimer.Stop();

@@ -142,16 +144,20 @@ class BiCGSTAB : public OperatorFunction<Field>
        alpha = rho / Calpha.real();

        LinearCombTimer.Start();
-        auto h_v = h.View(AcceleratorWrite);
-        auto psi_v = psi.View(AcceleratorWrite);
-        accelerator_for(ss, h_v.size(), Field::vector_object::Nsimd(),{
-          coalescedWrite(h_v[ss], alpha*p_v(ss) + psi_v(ss));
-        });
-        
-        auto s_v = s.View(AcceleratorWrite);
-        accelerator_for(ss, s_v.size(), Field::vector_object::Nsimd(),{
-          coalescedWrite(s_v[ss], -alpha*v_v(ss) + r_v(ss));
-        });
+	{
+	  autoView( p_v , p, AcceleratorRead);
+	  autoView( r_v , r, AcceleratorRead);
+	  autoView( v_v , v, AcceleratorRead);
+	  autoView( psi_v,psi, AcceleratorRead);
+	  autoView( h_v  ,  h, AcceleratorWrite);
+	  autoView( s_v  ,  s, AcceleratorWrite);
+	  accelerator_for(ss, h_v.size(), Field::vector_object::Nsimd(),{
+	      coalescedWrite(h_v[ss], alpha*p_v(ss) + psi_v(ss));
+	    });
+	  accelerator_for(ss, s_v.size(), Field::vector_object::Nsimd(),{
+	      coalescedWrite(s_v[ss], -alpha*v_v(ss) + r_v(ss));
+ 	  });
+        }
        LinearCombTimer.Stop();
        LinalgTimer.Stop();

@@ -166,13 +172,19 @@ class BiCGSTAB : public OperatorFunction<Field>
        omega = Comega.real() / norm2(t);

        LinearCombTimer.Start();
-        auto t_v = t.View(AcceleratorWrite);
-        accelerator_for(ss, psi_v.size(), Field::vector_object::Nsimd(),{
-          coalescedWrite(psi_v[ss], h_v(ss) + omega * s_v(ss));
-          coalescedWrite(r_v[ss], -omega * t_v(ss) + s_v(ss));
-        });
+	{
+	  autoView( psi_v,psi, AcceleratorWrite);
+	  autoView( r_v , r, AcceleratorWrite);
+	  autoView( h_v , h, AcceleratorRead);
+	  autoView( s_v , s, AcceleratorRead);
+	  autoView( t_v , t, AcceleratorRead);
+	  accelerator_for(ss, psi_v.size(), Field::vector_object::Nsimd(),{
+	      coalescedWrite(psi_v[ss], h_v(ss) + omega * s_v(ss));
+	      coalescedWrite(r_v[ss], -omega * t_v(ss) + s_v(ss));
+	    });
+	}
        LinearCombTimer.Stop();
-
+	
        cp = norm2(r);
        LinalgTimer.Stop();

@@ -141,16 +141,16 @@ public:

      LinearCombTimer.Start();
      {
-	auto psi_v = psi.View(AcceleratorWrite);
-	auto p_v   = p.View(AcceleratorWrite);
-	auto r_v   = r.View(AcceleratorWrite);
+	autoView( psi_v , psi, AcceleratorWrite);
+	autoView( p_v   , p,   AcceleratorWrite);
+	autoView( r_v   , r,   AcceleratorWrite);
 	accelerator_for(ss,p_v.size(), Field::vector_object::Nsimd(),{
 	    coalescedWrite(psi_v[ss], a      *  p_v(ss) + psi_v(ss));
 	    coalescedWrite(p_v[ss]  , b      *  p_v(ss) + r_v  (ss));
-	  });
-	LinearCombTimer.Stop();
-	LinalgTimer.Stop();
+	});
      }
+      LinearCombTimer.Stop();
+      LinalgTimer.Stop();

      std::cout << GridLogIterative << "ConjugateGradient: Iteration " << k
                << " residual " << sqrt(cp/ssq) << " target " << Tolerance << std::endl;
@@ -57,16 +57,17 @@ void basisOrthogonalize(std::vector<Field> &basis,Field &w,int k)
 template<class Field>
 void basisRotate(std::vector<Field> &basis,Eigen::MatrixXd& Qt,int j0, int j1, int k0,int k1,int Nm) 
 {
-  typedef decltype(basis[0].View(CpuWrite)) View;
-  auto tmp_v = basis[0].View(CpuWrite);
-  Vector<View> basis_v(basis.size(),tmp_v);
-  View *basis_vp = &basis_v[0];
-  typedef typename Field::vector_object vobj;
  GridBase* grid = basis[0].Grid();

-  for(int k=0;k<basis.size();k++){
-    basis_v[k] = basis[k].View(CpuWrite);
-  }
+  typedef typename Field::vector_object vobj;
+  typedef decltype(basis[0].View(CpuWrite)) View;
+
+  Vector<View> basis_v; basis_v.reserve(basis.size());
+
+  for(int k=0;k<basis.size();k++) basis_v.push_back(basis[k].View(CpuWrite));
+
+  View *basis_vp = &basis_v[0];
+
 #if 1
  std::vector < vobj , commAllocator<vobj> > Bt(thread_max() * Nm); // Thread private
  thread_region
@@ -142,6 +143,7 @@ void basisRotate(std::vector<Field> &basis,Eigen::MatrixXd& Qt,int j0, int j1, i
      coalescedWrite(basis_vp[jj][sss],coalescedRead(Bp[ss*nrot+j]));
    });
  }
+  for(int k=0;k<basis.size();k++) basis_v[k].ViewClose();
 #endif
 }

@@ -149,20 +151,22 @@ void basisRotate(std::vector<Field> &basis,Eigen::MatrixXd& Qt,int j0, int j1, i
 template<class Field>
 void basisRotateJ(Field &result,std::vector<Field> &basis,Eigen::MatrixXd& Qt,int j, int k0,int k1,int Nm) 
 {
-  typedef decltype(basis[0].View(AcceleratorWrite)) View;
-  typedef typename Field::vector_object vobj;
  GridBase* grid = basis[0].Grid();
+  typedef typename Field::vector_object vobj;
+  typedef decltype(basis[0].View(AcceleratorWrite)) View;

  result.Checkerboard() = basis[0].Checkerboard();
-  auto result_v=result.View(AcceleratorWrite);
-  Vector<View> basis_v(basis.size(),result_v);
+
+  autoView(result_v,result, AcceleratorWrite);
+  Vector<View> basis_v; basis_v.reserve(basis.size());
  View * basis_vp = &basis_v[0];
-  for(int k=0;k<basis.size();k++){
-    basis_v[k] = basis[k].View(AcceleratorRead);
-  }
-  Vector<double> Qt_jv(Nm);
-  double * Qt_j = & Qt_jv[0];
+
+  for(int k=0;k<basis.size();k++) basis_v.push_back(basis[k].View(AcceleratorRead));
+
+  Vector<double> Qt_jv(Nm);  double * Qt_j = & Qt_jv[0];
+
  for(int k=0;k<Nm;++k) Qt_j[k]=Qt(j,k);
+
  accelerator_for(ss, grid->oSites(),vobj::Nsimd(),{
    auto B=coalescedRead(basis_vp[k0][ss]);
    B=Zero();
@@ -171,6 +175,7 @@ void basisRotateJ(Field &result,std::vector<Field> &basis,Eigen::MatrixXd& Qt,in
    }
    coalescedWrite(result_v[ss], B);
  });
+  for(int k=0;k<basis.size();k++) basis_v[k].ViewClose();
 }

 template<class Field>