Context Navigation

← Previous Change
Next Change →

Changeset 1602 for XIOS

Timestamp:

11/19/18 16:28:03 (6 years ago)

Author:

yushan

Message:

branch_openmp merged with trunk r1597

Location:

XIOS/dev/dev_trunk_omp/extern/remap/src

Files:

: 16 edited

cputime.cpp (modified) (1 diff)
gridRemap.cpp (modified) (1 diff)
gridRemap.hpp (modified) (1 diff)
intersect.cpp (modified) (1 diff)
intersection_ym.cpp (modified) (1 diff)
libmapper.cpp (modified) (2 diffs)
mapper.cpp (modified) (5 diffs)
mapper.hpp (modified) (2 diffs)
mpi_cascade.cpp (modified) (1 diff)
mpi_cascade.hpp (modified) (2 diffs)
mpi_routing.cpp (modified) (3 diffs)
mpi_routing.hpp (modified) (3 diffs)
parallel_tree.cpp (modified) (2 diffs)
parallel_tree.hpp (modified) (1 diff)
timerRemap.cpp (modified) (3 diffs)
timerRemap.hpp (modified) (1 diff)

Legend:

: Unmodified
: Added
: Removed

XIOS/dev/dev_trunk_omp/extern/remap/src/cputime.cpp

r694	r1602
1	1	#include "mpi.hpp"
	2	using namespace ep_lib;
2	3
3	4	namespace sphereRemap {

XIOS/dev/dev_trunk_omp/extern/remap/src/gridRemap.cpp

-                      r688
+                      r1602
 CRemapGrid srcGrid;
+#pragma omp threadprivate(srcGrid)
 CRemapGrid tgtGrid;
+#pragma omp threadprivate(tgtGrid)
+}

XIOS/dev/dev_trunk_omp/extern/remap/src/gridRemap.hpp

-                      r688
+                      r1602
 Coord readPole(std::istream&);
 extern CRemapGrid srcGrid;
 extern CRemapGrid tgtGrid;
+//extern CRemapGrid srcGrid;
+//extern CRemapGrid tgtGrid;
+}

XIOS/dev/dev_trunk_omp/extern/remap/src/intersect.cpp

-                      r1158
+                      r1602
 namespace sphereRemap {
+extern CRemapGrid srcGrid;
+#pragma omp threadprivate(srcGrid)
+extern CRemapGrid tgtGrid;
+#pragma omp threadprivate(tgtGrid)
 using namespace std;

XIOS/dev/dev_trunk_omp/extern/remap/src/intersection_ym.cpp

-                      r1588
+                      r1602
 namespace sphereRemap {
+extern CRemapGrid srcGrid;
+#pragma omp threadprivate(srcGrid)
+extern CRemapGrid tgtGrid;
+#pragma omp threadprivate(tgtGrid)
 using namespace std;
 using namespace ClipperLib ;

XIOS/dev/dev_trunk_omp/extern/remap/src/libmapper.cpp

-                      r694
+                      r1602
 #include "cputime.hpp" // cputime
+using namespace ep_lib;
 using namespace sphereRemap ;
 …
    and deallocated during the second step (computing the weights) */
 Mapper *mapper;
+#pragma omp threadprivate(mapper)
 /** xxx_bounds_yyy is of length n_vert_per_cell_xxx*n_cell_xxx

XIOS/dev/dev_trunk_omp/extern/remap/src/mapper.cpp

-                      r1158
+                      r1602
 #include "mapper.hpp"
+using namespace ep_lib;
 namespace sphereRemap {
+extern CRemapGrid srcGrid;
+#pragma omp threadprivate(srcGrid)
+extern CRemapGrid tgtGrid;
+#pragma omp threadprivate(tgtGrid)
 /* A subdivition of an array into N sub-arays
 …
                         MPI_Issend(sendValue[rank],  nbRecvElement[rank], MPI_DOUBLE, rank, 0, communicator, &sendRequest[nbSendRequest]);
                         nbSendRequest++;
                         MPI_Issend(sendArea[rank],  nbRecvElement[rank], MPI_DOUBLE, rank, 0, communicator, &sendRequest[nbSendRequest]);
+                        MPI_Issend(sendArea[rank],  nbRecvElement[rank], MPI_DOUBLE, rank, 1, communicator, &sendRequest[nbSendRequest]);
                         nbSendRequest++;
                         if (order == 2)
+                        {
                                 MPI_Issend(sendGrad[rank], 3*nbRecvElement[rank]*(NMAX+1),
                                                                 MPI_DOUBLE, rank, 0, communicator, &sendRequest[nbSendRequest]);
+                                                                MPI_DOUBLE, rank, 2, communicator, &sendRequest[nbSendRequest]);
                                 nbSendRequest++;
                                 MPI_Issend(sendNeighIds[rank], 4*nbRecvElement[rank]*(NMAX+1), MPI_INT, rank, 0, communicator, &sendRequest[nbSendRequest]);
+                                MPI_Issend(sendNeighIds[rank], 4*nbRecvElement[rank]*(NMAX+1), MPI_INT, rank, 3, communicator, &sendRequest[nbSendRequest]);
 //ym  --> attention taille GloId
                                 nbSendRequest++;
 …
                         else
+                        {
                                 MPI_Issend(sendNeighIds[rank], 4*nbRecvElement[rank], MPI_INT, rank, 0, communicator, &sendRequest[nbSendRequest]);
+                                MPI_Issend(sendNeighIds[rank], 4*nbRecvElement[rank], MPI_INT, rank, 4, communicator, &sendRequest[nbSendRequest]);
 //ym  --> attention taille GloId
                                 nbSendRequest++;
 …
                         MPI_Irecv(recvValue[rank],  nbSendElement[rank], MPI_DOUBLE, rank, 0, communicator, &recvRequest[nbRecvRequest]);
                         nbRecvRequest++;
                         MPI_Irecv(recvArea[rank],  nbSendElement[rank], MPI_DOUBLE, rank, 0, communicator, &recvRequest[nbRecvRequest]);
+                        MPI_Irecv(recvArea[rank],  nbSendElement[rank], MPI_DOUBLE, rank, 1, communicator, &recvRequest[nbRecvRequest]);
                         nbRecvRequest++;
                         if (order == 2)
+                        {
                                 MPI_Irecv(recvGrad[rank], 3*nbSendElement[rank]*(NMAX+1),
                                                 MPI_DOUBLE, rank, 0, communicator, &recvRequest[nbRecvRequest]);
+                                                MPI_DOUBLE, rank, 2, communicator, &recvRequest[nbRecvRequest]);
                                 nbRecvRequest++;
                                 MPI_Irecv(recvNeighIds[rank], 4*nbSendElement[rank]*(NMAX+1), MPI_INT, rank, 0, communicator, &recvRequest[nbRecvRequest]);
+                                MPI_Irecv(recvNeighIds[rank], 4*nbSendElement[rank]*(NMAX+1), MPI_INT, rank, 3, communicator, &recvRequest[nbRecvRequest]);
 //ym  --> attention taille GloId
                                 nbRecvRequest++;
 …
                         else
+                        {
                                 MPI_Irecv(recvNeighIds[rank], 4*nbSendElement[rank], MPI_INT, rank, 0, communicator, &recvRequest[nbRecvRequest]);
+                                MPI_Irecv(recvNeighIds[rank], 4*nbSendElement[rank], MPI_INT, rank, 4, communicator, &recvRequest[nbRecvRequest]);
 //ym  --> attention taille GloId
                                 nbRecvRequest++;

XIOS/dev/dev_trunk_omp/extern/remap/src/mapper.hpp

-                      r1158
+                      r1602
+{
 public:
+       Mapper(MPI_Comm comm=MPI_COMM_WORLD) : communicator(comm), verbose(SILENT), neighbourElements(NULL), sstree(comm) {}
+       Mapper(ep_lib::MPI_Comm comm) : communicator(comm), verbose(SILENT), neighbourElements(NULL), sstree(comm) {}
        ~Mapper();
        void setVerbosity(verbosity v) {verbose=v ;}
 …
        CParallelTree sstree;
        MPI_Comm communicator ;
+       ep_lib::MPI_Comm communicator ;
        std::vector<Elt>  sourceElements ;
        std::vector<Node> sourceMesh ;

XIOS/dev/dev_trunk_omp/extern/remap/src/mpi_cascade.cpp

r688	r1602
1	1	#include "mpi_cascade.hpp"
2	2	#include <iostream>
	3	using namespace ep_lib;
3	4
4	5	namespace sphereRemap {

XIOS/dev/dev_trunk_omp/extern/remap/src/mpi_cascade.hpp

-                      r694
+                      r1602
+{
 public:
         CCascadeLevel(MPI_Comm comm) : comm(comm)
+        {
                 MPI_Comm_size(comm, &size);
                 MPI_Comm_rank(comm, &rank);
+        }
         int colour() const { return rank % group_size; };
         int key() const { return p_colour() + rank/(p_grp_size*group_size)*p_grp_size; }
+  CCascadeLevel(ep_lib::MPI_Comm comm) : comm(comm)
+  {
+    ep_lib::MPI_Comm_size(comm, &size);
+    ep_lib::MPI_Comm_rank(comm, &rank);
+  }
+  int colour() const { return rank % group_size; };
+  int key() const { return p_colour() + rank/(p_grp_size*group_size)*p_grp_size; }
         // perpendicular group
         int p_colour() const { return (rank%group_size + rank/group_size) % p_grp_size; }
         int p_key() const { return colour() + rank/(p_grp_size*group_size)*group_size; }
+  // perpendicular group
+  int p_colour() const { return (rank%group_size + rank/group_size) % p_grp_size; }
+  int p_key() const { return colour() + rank/(p_grp_size*group_size)*group_size; }
         MPI_Comm comm, pg_comm;
         int rank;
         int size;
         int group_size; // group_size and p_grp_size are interchanged?? FIXME
         int p_grp_size;
+  ep_lib::MPI_Comm comm, pg_comm;
+  int rank;
+  int size;
+  int group_size; // group_size and p_grp_size are interchanged?? FIXME
+  int p_grp_size;
 };
 …
+{
 public:
+        //
+        CMPICascade(int nodes_per_level, MPI_Comm comm);
+  CMPICascade(int nodes_per_level, ep_lib::MPI_Comm comm);
         int num_levels;
         std::vector<CCascadeLevel> level;
+  int num_levels;
+  std::vector<CCascadeLevel> level;
 };

XIOS/dev/dev_trunk_omp/extern/remap/src/mpi_routing.cpp

-                      r694
+                      r1602
 #include "timerRemap.hpp"
 #include <iostream>
+using namespace ep_lib;
 namespace sphereRemap {
 …
         for (int i = 0; i < nbSource; i++)
+        {
+                MPI_Irecv(&sourceRank[i], 1, MPI_INT, MPI_ANY_SOURCE, 0, communicator, &request[indexRequest]);
+                indexRequest++;
+        }
+        MPI_Barrier(communicator);
+        for (int i = 0; i < nbTarget; i++)
+        {
+                MPI_Isend(&mpiRank, 1, MPI_INT, targetRank[i], 0, communicator, &request[indexRequest]);
+                indexRequest++;
+                MPI_Irecv(&sourceRank[i], 1, MPI_INT, -2, 0, communicator, &request[indexRequest++]);
+        }
+        MPI_Barrier(communicator);
+        for (int i = 0; i < nbTarget; i++)
+        {
+                MPI_Isend(&mpiRank, 1, MPI_INT, targetRank[i], 0, communicator, &request[indexRequest++]);
+        }
         MPI_Waitall(indexRequest, request, status);
 …
         for (int i = 0; i < nbSource; i++)
+        {
                 MPI_Irecv(&sourceRank[i], 1, MPI_INT, MPI_ANY_SOURCE, 0, communicator, &request[indexRequest]);
+                MPI_Irecv(&sourceRank[i], 1, MPI_INT, -2, 0, communicator, &request[indexRequest]);
                 indexRequest++;
+        }

XIOS/dev/dev_trunk_omp/extern/remap/src/mpi_routing.hpp

-                      r694
+                      r1602
+{
         MPI_Comm communicator;
+        ep_lib::MPI_Comm communicator;
         int mpiRank;
         int mpiSize;
 …
 public:
         CMPIRouting(MPI_Comm comm);
+        CMPIRouting(ep_lib::MPI_Comm comm);
         ~CMPIRouting();
         template<typename T> void init(const std::vector<T>& route, CMPICascade *cascade = NULL);
 …
 template <typename T>
 void alltoalls_known(const std::vector<std::vector<T> >& send, std::vector<std::vector<T> >& recv,
                      const std::vector<int>& ranks, MPI_Comm communicator);
+                     const std::vector<int>& ranks, ep_lib::MPI_Comm communicator);
 template <typename T>
 void alltoalls_unknown(const std::vector<std::vector<T> >& send, std::vector<std::vector<T> >& recv,
                        const std::vector<int>& ranks, MPI_Comm communicator);
+                       const std::vector<int>& ranks, ep_lib::MPI_Comm communicator);
+}
 #endif

XIOS/dev/dev_trunk_omp/extern/remap/src/parallel_tree.cpp

-                      r923
+                      r1602
 #include "parallel_tree.hpp"
+using namespace ep_lib;
 namespace sphereRemap {
+extern CRemapGrid srcGrid;
+#pragma omp threadprivate(srcGrid)
+extern CRemapGrid tgtGrid;
+#pragma omp threadprivate(tgtGrid)
 static const int assignLevel = 2;
 …
+}
+//CParallelTree::CParallelTree(MPI_Comm comm) : communicator(comm), cascade(MIN_NODE_SZ*MIN_NODE_SZ, comm)
+CParallelTree::CParallelTree(MPI_Comm comm) : communicator(comm), cascade(MAX_NODE_SZ*MAX_NODE_SZ*2, comm)
+{
+        treeCascade.reserve(cascade.num_levels);
+        for (int lev = 0; lev < cascade.num_levels; lev++)
+                treeCascade.push_back(CSampleTree(cascade.level[lev].group_size, assignLevel));
+CParallelTree::CParallelTree(MPI_Comm comm) : communicator(comm), cascade(MIN_NODE_SZ*MIN_NODE_SZ*2, comm)
+{
+  treeCascade.reserve(cascade.num_levels);
+  for (int lev = 0; lev < cascade.num_levels; lev++)
+    treeCascade.push_back(CSampleTree(cascade.level[lev].group_size, assignLevel));
+}

XIOS/dev/dev_trunk_omp/extern/remap/src/parallel_tree.hpp

-                      r694
+                      r1602
+{
 public:
         CParallelTree(MPI_Comm comm);
         ~CParallelTree();
+  CParallelTree(ep_lib::MPI_Comm comm);
+  ~CParallelTree();
         void build(vector<Node>& node, vector<Node>& node2);
+  void build(vector<Node>& node, vector<Node>& node2);
         void routeNodes(vector<int>& route, vector<Node>& nodes, int level = 0);
         void routeIntersections(vector<vector<int> >& route, vector<Node>& nodes, int level = 0);
+  void routeNodes(vector<int>& route, vector<Node>& nodes, int level = 0);
+  void routeIntersections(vector<vector<int> >& route, vector<Node>& nodes, int level = 0);
         int nbLocalElements;
         Elt* localElements;
+  int nbLocalElements;
+  Elt* localElements;
         CTree localTree;
+  CTree localTree;
 private:
         void updateCirclesForRouting(Coord rootCentre, double rootRadius, int level = 0);
         void buildSampleTreeCascade(vector<Node>& sampleNodes, int level = 0);
         void buildLocalTree(const vector<Node>& node, const vector<int>& route);
         void buildRouteTree();
+  void updateCirclesForRouting(Coord rootCentre, double rootRadius, int level = 0);
+  void buildSampleTreeCascade(vector<Node>& sampleNodes, int level = 0);
+  void buildLocalTree(const vector<Node>& node, const vector<int>& route);
+  void buildRouteTree();
         //CSampleTree sampleTree;
         vector<CSampleTree> treeCascade; // first for sample tree, then for routing tree
         CMPICascade cascade;
   MPI_Comm communicator ;
+  //CSampleTree sampleTree;
+  vector<CSampleTree> treeCascade; // first for sample tree, then for routing tree
+  CMPICascade cascade;
+  ep_lib::MPI_Comm communicator ;
 };

XIOS/dev/dev_trunk_omp/extern/remap/src/timerRemap.cpp

-                      r694
+                      r1602
 #include <map>
 #include <iostream>
+using namespace ep_lib;
 namespace sphereRemap {
 …
 using namespace std;
+map<string,CTimer*> CTimer::allTimer;
+//map<string,CTimer*> CTimer::allTimer;
+map<string,CTimer*> *CTimer::allTimer_ptr = 0;
 CTimer::CTimer(const string& name_) : name(name_)
 …
+{
         map<string,CTimer*>::iterator it;
+        it=allTimer.find(name);
+        if (it==allTimer.end()) it=allTimer.insert(pair<string,CTimer*>(name,new CTimer(name))).first;
+        if(allTimer_ptr == 0) allTimer_ptr = new map<string,CTimer*>;
+        //it=allTimer.find(name);
+        it=allTimer_ptr->find(name);
+        //if (it==allTimer.end()) it=allTimer.insert(pair<string,CTimer*>(name,new CTimer(name))).first;
+        if (it==allTimer_ptr->end()) it=allTimer_ptr->insert(pair<string,CTimer*>(name,new CTimer(name))).first;
         return *(it->second);
+}

XIOS/dev/dev_trunk_omp/extern/remap/src/timerRemap.hpp

-                      r694
+                      r1602
     double getCumulatedTime(void);
     void print(void);
+    static map<string,CTimer*> allTimer;
+    //static map<string,CTimer*> allTimer;
+    static map<string,CTimer*> *allTimer_ptr;
+    #pragma omp threadprivate(allTimer_ptr)
     static double getTime(void);
     static CTimer& get(string name);

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 1602 for XIOS

Legend:

Download in other formats: