doxygen/Colour_8h_source.html

 /*  Copyright (C) 2010 Imperial College London and others.

  *

  *  Please see the AUTHORS file in the main source directory for a

  *  full list of copyright holders.

  *

  *  Gerard Gorman

  *  Applied Modelling and Computation Group

  *  Department of Earth Science and Engineering

  *  Imperial College London

  *

  *  g.gorman@imperial.ac.uk

  *

  *  Redistribution and use in source and binary forms, with or without

  *  modification, are permitted provided that the following conditions

  *  are met:

  *  1. Redistributions of source code must retain the above copyright

  *  notice, this list of conditions and the following disclaimer.

  *  2. Redistributions in binary form must reproduce the above

  *  copyright notice, this list of conditions and the following

  *  disclaimer in the documentation and/or other materials provided

  *  with the distribution.

  *

  *  THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND

  *  CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES,

  *  INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF

  *  MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE

  *  DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS

  *  BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,

  *  EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED

  *  TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,

  *  DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON

  *  ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR

  *  TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF

  *  THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF

  *  SUCH DAMAGE.

  */


 #ifndef COLOUR_H

 #define COLOUR_H


 #include <limits>

 #include <vector>

 #include <algorithm>

 #include <random>


 #include "HaloExchange.h"


 #include "PragmaticTypes.h"

 #include "PragmaticMinis.h"


 class Colour{

  public:

   static void greedy(size_t NNodes, const std::vector< std::vector<index_t> > &NNList, std::vector<char> &colour){

     char max_colour=64;


     // Colour first active node.

     size_t node;

     for(node=0;node<NNodes;node++){

       if(NNList[node].size()>0){

         colour[node] = 0;

         break;

       }

     }


     // Colour remaining active nodes.

     for(;node<NNodes;node++){

       if(NNList[node].size()==0)

         continue;


       std::vector<bool> used_colours(max_colour, false);;

       for(std::vector<index_t>::const_iterator it=NNList[node].begin();it!=NNList[node].end();++it){

         if(*it<(int)node){

           if(colour[*it]>=max_colour){

             max_colour*=2;

             used_colours.resize(max_colour, false);

           }


           used_colours[colour[*it]] = true;

         }

       }


       for(char i=0;;i++)

         if(!used_colours[i]){

           colour[node] = i;

           break;

         }

     }

   }


   static void GebremedhinManne(size_t NNodes, const std::vector< std::vector<index_t> > &NNList, std::vector<char> &colour){


     int max_iterations = 128;

     std::vector<bool> conflicts_exist(max_iterations, false);;

     std::vector<bool> conflict(NNodes);


 #pragma omp parallel firstprivate(NNodes)

     {

       // Initialize.

       std::default_random_engine generator;

       std::uniform_int_distribution<int> distribution(0,6);


 #pragma omp for

       for(size_t i=0;i<NNodes;i++){

         colour[i] = distribution(generator);

         conflict[i] = true;

       }


       for(int k=0;k<max_iterations;k++){

         // Phase 1: pseudo-colouring. Note - assuming graph can be colored with fewer than 64 colours.

 #pragma omp for schedule(guided)

         for(size_t i=0;i<NNodes;i++){

           if(!conflict[i])

             continue;


           // Reset

           conflict[i] = false;


           unsigned long colours = 0;

           char c;

           for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

          c = colour[*it];

              colours = colours | 1<<c;

           }

           colours = ~colours;


           for(size_t j=0;j<64;j++){

             if(colours&(1<<j)){

               colour[i] = j;

               break;

             }

           }

         }


         // Phase 2: find conflicts

 #pragma omp for

         for(size_t i=0;i<NNodes;i++){

           for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

             if(colour[i]==colour[*it] && i<(size_t)*it){

               conflict[i] = true;

               conflicts_exist[k] = true;

             }

           }

         }

         if(!conflicts_exist[k])

           break;

       }

     }

   }


   static void GebremedhinManne(MPI_Comm comm, size_t NNodes,

                    const std::vector< std::vector<index_t> > &NNList,

                    const std::vector< std::vector<index_t> > &send,

                    const std::vector< std::vector<index_t> > &recv,

                    const std::vector<int> &node_owner,

                    std::vector<char> &colour){

     int max_iterations = 4096;

     std::vector<int> conflicts_exist(max_iterations, 0);

     std::vector<bool> conflict(NNodes);


     int rank;

     MPI_Comm_rank(comm, &rank);


     char K=15; // Initialise guess at number


     assert(NNodes==colour.size());


     bool serialize=false;


 #pragma omp parallel firstprivate(NNodes)

     {

       // Initialize.

       std::default_random_engine generator;

       std::uniform_int_distribution<int> distribution(0,K);


 #pragma omp for

       for(size_t i=0;i<NNodes;i++){

     colour[i] = distribution(generator);

     conflict[i] = true;

       }


 #pragma omp single

       {

         halo_update<char, 1>(comm, send, recv, colour);

       }


       for(int k=0;k<max_iterations;k++){

         if(K==64){

           serialize = true;

           break;

         }


     std::vector<char> colour_deck;

     for(int i=0;i<K;i++)

       colour_deck.push_back(i);

     std::random_shuffle(colour_deck.begin(), colour_deck.end());


         // Phase 1: pseudo-colouring. Note - assuming graph can be colored with fewer than 64 colours.

 #pragma omp for schedule(static)

         for(size_t i=0;i<NNodes;i++){

           if(i%1000 == 0)

             std::random_shuffle(colour_deck.begin(), colour_deck.end());


           if(!conflict[i] || node_owner[i]!=rank)

             continue;


           // Reset

           conflict[i] = false;


       char c;

           unsigned long colours = 0;

           for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

         c = colour[*it];

         colours = colours | 1<<c;

           }

           colours = ~colours;


       bool exhausted=true;

       for(std::vector<char>::const_iterator it=colour_deck.begin();it!=colour_deck.end();++it){

         if(colours&(1<<*it)){

           colour[i] = *it;

           exhausted=false;

           break;

         }

       }

       if(exhausted){

         for(size_t j=K;j<64;j++){

           if(colours&(1<<j)){

         colour[i] = j;

         break;

           }

         }

       }

         }

 #pragma omp single

     {

       halo_update<char, 1>(comm, send, recv, colour);

     }


         // Phase 2: find conflicts

 #pragma omp for schedule(static)

         for(index_t i=0;i<(index_t)NNodes;i++){

       if(node_owner[i]!=rank)

         continue;


           for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

             if(colour[i]==colour[*it] && i<*it){

               conflict[i] = true;

               conflicts_exist[k]++;

               break;

             }

           }

         }


 #pragma omp single

     {

       MPI_Allreduce(MPI_IN_PLACE, &(conflicts_exist[k]), 1, MPI_INT, MPI_SUM, comm);


       // If progress has stagnated then lift the limit on chromatic number.

       if(k>=K && conflicts_exist[k-K]==conflicts_exist[k]){

             for(int i=0;i<k;i++)

               conflicts_exist[i] = -1;

         K++;

       }

     }


     if(conflicts_exist[k]==0)

       break;

       }

     }


     //

     if(serialize){

       int nranks;

       MPI_Comm_size(comm, &nranks);


       halo_update<char, 1>(comm, send, recv, colour);


       for(int i=0;i<nranks;i++)

         repair(NNodes, NNList, colour);

     }

   }


   static void repair(size_t NNodes, const std::vector< std::vector<index_t> > &NNList, std::vector<char> &colour){

     // Phase 2: find conflicts

     std::vector<size_t> conflicts;

 #pragma omp for schedule(static, 64)

     for(size_t i=0;i<NNodes;i++){

       char c = colour[i];

       for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

         char k = colour[*it];

         if(c==k){

           conflicts.push_back(i);

           break;

         }

       }

     }


     // Phase 3: serial resolution of conflicts

     int tid = pragmatic_thread_id();

     int nthreads = pragmatic_nthreads();

     for(int i=0;i<nthreads;i++){

       if(tid==i){

         for(std::vector<size_t>::const_iterator it=conflicts.begin();it!=conflicts.end();++it){

           unsigned long colours = 0;

           for(std::vector<index_t>::const_iterator jt=NNList[*it].begin();jt!=NNList[*it].end();++jt){

             colours = colours | 1<<(colour[*jt]);

           }

           colours = ~colours;


           for(size_t j=0;j<64;j++){

             if(colours&(1<<j)){

               colour[*it] = j;

               break;

             }

           }

         }

       }

 #pragma omp barrier

     }

   }


   static void repair(size_t NNodes, std::vector< std::vector<index_t> > &NNList, std::vector< std::set<index_t> > &marked_edges, std::vector<char> &colour){

     // Phase 2: find conflicts

     std::vector<size_t> conflicts;

 #pragma omp for schedule(static, 64)

     for(size_t i=0;i<NNodes;i++){

       if(marked_edges[i].empty())

         continue;


       char c = colour[i];

       for(std::vector<index_t>::const_iterator it=NNList[i].begin();it!=NNList[i].end();++it){

         char k = colour[*it];

         if(c==k){

           conflicts.push_back(i);

           break;

         }

       }

     }


     // Phase 3: serial resolution of conflicts

     int tid = pragmatic_thread_id();

     int nthreads = pragmatic_nthreads();

     for(int i=0;i<nthreads;i++){

       if(tid==i){

         for(std::vector<size_t>::const_iterator it=conflicts.begin();it!=conflicts.end();++it){

           unsigned long colours = 0;

           for(std::vector<index_t>::const_iterator jt=NNList[*it].begin();jt!=NNList[*it].end();++jt){

             colours = colours | 1<<(colour[*jt]);

           }

           colours = ~colours;


           for(size_t j=0;j<64;j++){

             if(colours&(1<<j)){

               colour[*it] = j;

               break;

             }

           }

         }

       }

 #pragma omp barrier

     }

   }


   static void RokosGorman(std::vector< std::vector<index_t>* > NNList, size_t NNodes,

       int node_colour[], std::vector< std::vector< std::vector<index_t> > >& ind_sets,

       int max_colour, size_t* worklist[], size_t worklist_size[], int tid){

 #pragma omp single nowait

     {

       for(int i=0; i<3; ++i)

         worklist_size[i] = 0;

     }


     // Thread-private array of forbidden colours

     std::vector<index_t> forbiddenColours(max_colour, std::numeric_limits<index_t>::max());


     // Phase 1: pseudo-colouring.

 #pragma omp for schedule(guided)

     for(size_t i=0; i<NNodes; ++i){

       index_t n = *NNList[i]->begin();

       for(typename std::vector<index_t>::const_iterator it=NNList[i]->begin()+1; it!=NNList[i]->end(); ++it){

         int c = node_colour[*it];

         if(c>=0)

           forbiddenColours[c] = n;

       }


       for(size_t j=0; j<forbiddenColours.size(); ++j){

         if(forbiddenColours[j] != n){

           node_colour[n] = j;

           break;

         }

       }

     }


     // Phase 2: find conflicts and create new worklist

     std::vector<size_t> conflicts;


 #pragma omp for schedule(guided) nowait

     for(size_t i=0; i<NNodes; ++i){

       bool defective = false;

       index_t n = *NNList[i]->begin();

       for(typename std::vector<index_t>::const_iterator it=NNList[i]->begin()+1; it!=NNList[i]->end(); ++it){

         if(node_colour[n] == node_colour[*it]){

           // No need to mark both vertices as defectively coloured.

           // Just mark the one with the lesser ID.

           if(n < *it){

             defective = true;

             break;

           }

         }

       }


       if(defective){

         conflicts.push_back(i);


         for(typename std::vector<index_t>::const_iterator it=NNList[i]->begin()+1; it!=NNList[i]->end(); ++it){

           int c = node_colour[*it];

           forbiddenColours[c] = n;

         }


         for(size_t j=0; j<forbiddenColours.size(); j++){

           if(forbiddenColours[j] != n){

             node_colour[n] = j;

             break;

           }

         }

       }else{

         ind_sets[tid][node_colour[n]].push_back(n);

       }

     }


     size_t pos;

     pos = pragmatic_omp_atomic_capture(&worklist_size[0], conflicts.size());


     memcpy(&worklist[0][pos], &conflicts[0], conflicts.size() * sizeof(size_t));


     conflicts.clear();

 #pragma omp barrier


     // Private variable indicating which worklist we are currently using.

     int wl = 0;


     while(worklist_size[wl]){

 #pragma omp for schedule(guided) nowait

       for(size_t item=0; item<worklist_size[wl]; ++item){

         size_t i = worklist[wl][item];

         bool defective = false;

         index_t n = *NNList[i]->begin();

         for(typename std::vector<index_t>::const_iterator it=NNList[i]->begin()+1; it!=NNList[i]->end(); ++it){

           if(node_colour[n] == node_colour[*it]){

             // No need to mark both vertices as defectively coloured.

             // Just mark the one with the lesser ID.

             if(n < *it){

               defective = true;

               break;

             }

           }

         }


         if(defective){

           conflicts.push_back(i);


           for(typename std::vector<index_t>::const_iterator it=NNList[i]->begin()+1; it!=NNList[i]->end(); ++it){

             int c = node_colour[*it];

             forbiddenColours[c] = n;

           }


           for(size_t j=0; j<forbiddenColours.size(); j++){

             if(forbiddenColours[j] != n){

               node_colour[n] = j;

               break;

             }

           }

         }else{

           ind_sets[tid][node_colour[n]].push_back(n);

         }

       }


       // Switch worklist

       wl = (wl+1)%3;


       pos = pragmatic_omp_atomic_capture(&worklist_size[wl], conflicts.size());


       memcpy(&worklist[wl][pos], &conflicts[0], conflicts.size() * sizeof(size_t));


       conflicts.clear();


       // Clear the next worklist

 #pragma omp single

       {

         worklist_size[(wl+1)%3] = 0;

       }

     }

   }

 };

 #endif

Colour::GebremedhinManne
static void GebremedhinManne(MPI_Comm comm, size_t NNodes, const std::vector< std::vector< index_t > > &NNList, const std::vector< std::vector< index_t > > &send, const std::vector< std::vector< index_t > > &recv, const std::vector< int > &node_owner, std::vector< char > &colour)
Definition: Colour.h:162

Colour::repair
static void repair(size_t NNodes, const std::vector< std::vector< index_t > > &NNList, std::vector< char > &colour)
Definition: Colour.h:301

index_t
int index_t
Definition: PragmaticTypes.h:41

PragmaticMinis.h

pragmatic_nthreads
int pragmatic_nthreads()
Definition: PragmaticMinis.h:50

Colour::GebremedhinManne
static void GebremedhinManne(size_t NNodes, const std::vector< std::vector< index_t > > &NNList, std::vector< char > &colour)
Definition: Colour.h:102

PragmaticTypes.h

Colour
Performs a simple first breath greedy graph colouring of a local undirected graph.
Definition: Colour.h:53

HaloExchange.h

Colour::greedy
static void greedy(size_t NNodes, const std::vector< std::vector< index_t > > &NNList, std::vector< char > &colour)
Definition: Colour.h:59

Colour::RokosGorman
static void RokosGorman(std::vector< std::vector< index_t > * > NNList, size_t NNodes, int node_colour[], std::vector< std::vector< std::vector< index_t > > > &ind_sets, int max_colour, size_t *worklist[], size_t worklist_size[], int tid)
Definition: Colour.h:382

pragmatic_thread_id
int pragmatic_thread_id()
Definition: PragmaticMinis.h:58

Colour::repair
static void repair(size_t NNodes, std::vector< std::vector< index_t > > &NNList, std::vector< std::set< index_t > > &marked_edges, std::vector< char > &colour)
Definition: Colour.h:340

pragmatic_omp_atomic_capture
size_t pragmatic_omp_atomic_capture(size_t *shared, size_t inc)
Definition: PragmaticMinis.h:79