Big updates with progress towards wilson matrix

2026-02-01 21:03:29 +00:00 · 2015-04-26 15:51:09 +01:00
parent 51f0da7b93
commit 94f728bee4
27 changed files with 1008 additions and 355 deletions
--- a/lib/lattice/Grid_lattice_arith.h
+++ b/lib/lattice/Grid_lattice_arith.h
@@ -79,18 +79,18 @@ namespace Grid {
    return ret;
  }
  template<class left,class right>
-    inline auto operator + (const Lattice<left> &lhs,const Lattice<right> &rhs)-> Lattice<decltype(lhs._odata[0]*rhs._odata[0])>
+    inline auto operator + (const Lattice<left> &lhs,const Lattice<right> &rhs)-> Lattice<decltype(lhs._odata[0]+rhs._odata[0])>
  {
    //NB mult performs conformable check. Do not reapply here for performance.
-    Lattice<decltype(lhs._odata[0]*rhs._odata[0])> ret(rhs._grid);
+    Lattice<decltype(lhs._odata[0]+rhs._odata[0])> ret(rhs._grid);
    add(ret,lhs,rhs);
    return ret;
  }
  template<class left,class right>
-    inline auto operator - (const Lattice<left> &lhs,const Lattice<right> &rhs)-> Lattice<decltype(lhs._odata[0]*rhs._odata[0])>
+    inline auto operator - (const Lattice<left> &lhs,const Lattice<right> &rhs)-> Lattice<decltype(lhs._odata[0]-rhs._odata[0])>
  {
    //NB mult performs conformable check. Do not reapply here for performance.
-    Lattice<decltype(lhs._odata[0]*rhs._odata[0])> ret(rhs._grid);
+    Lattice<decltype(lhs._odata[0]-rhs._odata[0])> ret(rhs._grid);
    sub(ret,lhs,rhs);
    return ret;
  }
@@ -107,9 +107,9 @@ namespace Grid {
        return ret;
  }
  template<class left,class right>
-    inline auto operator + (const left &lhs,const Lattice<right> &rhs) -> Lattice<decltype(lhs*rhs._odata[0])>
+    inline auto operator + (const left &lhs,const Lattice<right> &rhs) -> Lattice<decltype(lhs+rhs._odata[0])>
    {
-      Lattice<decltype(lhs*rhs._odata[0])> ret(rhs._grid);
+      Lattice<decltype(lhs+rhs._odata[0])> ret(rhs._grid);
 #pragma omp parallel for
      for(int ss=0;ss<rhs._grid->oSites(); ss++){
 	ret._odata[ss]=lhs+rhs._odata[ss];
@@ -117,9 +117,9 @@ namespace Grid {
        return ret;
    }
  template<class left,class right>
-    inline auto operator - (const left &lhs,const Lattice<right> &rhs) -> Lattice<decltype(lhs*rhs._odata[0])>
+    inline auto operator - (const left &lhs,const Lattice<right> &rhs) -> Lattice<decltype(lhs-rhs._odata[0])>
  {
-    Lattice<decltype(lhs*rhs._odata[0])> ret(rhs._grid);
+    Lattice<decltype(lhs-rhs._odata[0])> ret(rhs._grid);
 #pragma omp parallel for
    for(int ss=0;ss<rhs._grid->oSites(); ss++){
      ret._odata[ss]=lhs-rhs._odata[ss];
@@ -137,9 +137,9 @@ namespace Grid {
      return ret;
    }
    template<class left,class right>
-      inline auto operator + (const Lattice<left> &lhs,const right &rhs) -> Lattice<decltype(lhs._odata[0]*rhs)>
+      inline auto operator + (const Lattice<left> &lhs,const right &rhs) -> Lattice<decltype(lhs._odata[0]+rhs)>
    {
-        Lattice<decltype(lhs._odata[0]*rhs)> ret(lhs._grid);
+        Lattice<decltype(lhs._odata[0]+rhs)> ret(lhs._grid);
 #pragma omp parallel for
        for(int ss=0;ss<rhs._grid->oSites(); ss++){
 	  ret._odata[ss]=lhs._odata[ss]+rhs;
@@ -147,9 +147,9 @@ namespace Grid {
        return ret;
    }
    template<class left,class right>
-      inline auto operator - (const Lattice<left> &lhs,const right &rhs) -> Lattice<decltype(lhs._odata[0]*rhs)>
+      inline auto operator - (const Lattice<left> &lhs,const right &rhs) -> Lattice<decltype(lhs._odata[0]-rhs)>
    {
-      Lattice<decltype(lhs._odata[0]*rhs)> ret(lhs._grid);
+      Lattice<decltype(lhs._odata[0]-rhs)> ret(lhs._grid);
 #pragma omp parallel for
      for(int ss=0;ss<rhs._grid->oSites(); ss++){
 	ret._odata[ss]=lhs._odata[ss]-rhs;
--- a/lib/lattice/Grid_lattice_reduction.h
+++ b/lib/lattice/Grid_lattice_reduction.h
@@ -14,7 +14,7 @@ namespace Grid {

      typedef typename vobj::scalar_type scalar;
      typedef typename vobj::vector_type vector;
-      decltype(innerProduct(arg._odata[0],arg._odata[0])) vnrm=zero;
+      decltype(innerProduct(arg._odata[0],arg._odata[0])) vnrm; 
      scalar nrm;
      //FIXME make this loop parallelisable
      vnrm=zero;
@@ -33,10 +33,11 @@ namespace Grid {
      //->decltype(innerProduct(left._odata[0],right._odata[0]))
    {
      typedef typename vobj::scalar_type scalar;
-      decltype(innerProduct(left._odata[0],right._odata[0])) vnrm=zero;
+      decltype(innerProduct(left._odata[0],right._odata[0])) vnrm; 

      scalar nrm;
      //FIXME make this loop parallelisable
+      vnrm=zero;
      for(int ss=0;ss<left._grid->oSites(); ss++){
 	vnrm = vnrm + innerProduct(left._odata[ss],right._odata[ss]);
      }
@@ -94,8 +95,10 @@ template<class vobj> inline void sliceSum(const Lattice<vobj> &Data,std::vector<
  int ld=grid->_ldimensions[orthogdim];
  int rd=grid->_rdimensions[orthogdim];

+  sobj szero; szero=zero;
+
  std::vector<vobj,alignedAllocator<vobj> > lvSum(rd); // will locally sum vectors first
-  std::vector<sobj> lsSum(ld,sobj(zero)); // sum across these down to scalars
+  std::vector<sobj> lsSum(ld,szero); // sum across these down to scalars
  std::vector<sobj> extracted(Nsimd);     // splitting the SIMD

  result.resize(fd); // And then global sum to return the same vector to every node for IO to file
--- a/lib/lattice/Grid_lattice_rng.h
+++ b/lib/lattice/Grid_lattice_rng.h
@@ -26,6 +26,8 @@ namespace Grid {
    }

  };
+  
+
  class GridRNGbase {

  public:
@@ -62,6 +64,21 @@ namespace Grid {
    }


+    // real scalars are one component
+    template<class scalar,class distribution> void fillScalar(scalar &s,distribution &dist)
+    {
+      s=dist(_generators[0]);
+    }
+    template<class distribution> void fillScalar(ComplexF &s,distribution &dist)
+    {
+      s=ComplexF(dist(_generators[0]),dist(_generators[0]));
+    }
+    template<class distribution> void fillScalar(ComplexD &s,distribution &dist)
+    {
+      s=ComplexD(dist(_generators[0]),dist(_generators[0]));
+    }
+
+
    template <class sobj,class distribution> inline void fill(sobj &l,distribution &dist){

      typedef typename sobj::scalar_type scalar_type;
@@ -71,13 +88,60 @@ namespace Grid {
      scalar_type *buf = (scalar_type *) & l;

      for(int idx=0;idx<words;idx++){
-	buf[idx] = dist(_generators[0]);
+	fillScalar(buf[idx],dist);
      }
      
      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));

    };

+    template <class distribution>  inline void fill(ComplexF &l,distribution &dist){
+      fillScalar(l,dist);
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(ComplexD &l,distribution &dist){
+      fillScalar(l,dist);
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(RealF &l,distribution &dist){
+      fillScalar(l,dist);
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(RealD &l,distribution &dist){
+      fillScalar(l,dist);
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    // vector fill
+    template <class distribution>  inline void fill(vComplexF &l,distribution &dist){
+      RealF *pointer=(RealF *)&l;
+      for(int i=0;i<2*vComplexF::Nsimd();i++){
+	fillScalar(pointer[i],dist);
+      }
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(vComplexD &l,distribution &dist){
+      RealD *pointer=(RealD *)&l;
+      for(int i=0;i<2*vComplexD::Nsimd();i++){
+	fillScalar(pointer[i],dist);
+      }
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(vRealF &l,distribution &dist){
+      RealF *pointer=(RealF *)&l;
+      for(int i=0;i<vRealF::Nsimd();i++){
+	fillScalar(pointer[i],dist);
+      }
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+    template <class distribution>  inline void fill(vRealD &l,distribution &dist){
+      RealD *pointer=(RealD *)&l;
+      for(int i=0;i<vRealD::Nsimd();i++){
+	fillScalar(pointer[i],dist);
+      }
+      CartesianCommunicator::BroadcastWorld(0,(void *)&l,sizeof(l));
+    }
+
+
    void SeedRandomDevice(void){
      std::random_device rd;
      Seed(rd);
@@ -186,7 +250,6 @@ namespace Grid {

  };

-
  template <class vobj> inline void random(GridParallelRNG &rng,Lattice<vobj> &l){
    rng.fill(l,rng._uniform);
  }