schedSim/gibbsActionSelection_8cpp_source.html

 #include "gibbsActionSelection.h"

 #include <cmath>
 #include <stdexcept>
 #include <iostream>
 #include <limits>

 using namespace Mdp;

 GibbsActionSelection::GibbsActionSelection(double t, double tDecaySpeed, double tStepSize)
     : temperature(t)
     , tempDecaySpeed(tDecaySpeed)
     , tempStepSize(tStepSize)
 {
 }

 std::vector<double> GibbsActionSelection::generatePolicy(const std::vector<double>& actionValues, action_t /*bestAction*/)
 {
     std::vector<double> policy = std::vector<double>(actionValues.size());
     double sum = 0.0;
     size_t maxCandidate = 0;
     double maxCandidateValue = -std::numeric_limits<double>::infinity();
     for (size_t i = 0; i < policy.size(); i++)
     {
         double var = actionValues[i]/temperature;

         policy[i] = exp(var);
         //std::cerr << "policy["<<i<<"] is "<<policy[i]<<" = exp("<<var<<")\n";
         sum += policy[i];
         if (var > maxCandidateValue)
         {
             maxCandidateValue = var;
             maxCandidate = i;
         }
     }
     //std::cerr << "sum is "<< sum <<"\n";
     for (size_t i = 0; i < policy.size(); i++)
     {
         if (sum <= 0.0 && sum >= 0.0) /*FIXME maybe we can compare the value of the max to the value of the secondmax*/
             policy[i] = (i == maxCandidate) ? 1.0 : 0.0;
         else
             policy[i] /= sum;
         //std::cerr << "policy[" << i << "] is "<< policy[i] <<"\n";
     }
     updateTemperature();
     return policy;
 }

 void GibbsActionSelection::updateTemperature()
 {
     static long long unsigned int counter = 0;
     if (counter ++>= tempStepSize)
     {
         temperature *= tempDecaySpeed;
         counter = 0;
     }
 }


generatePbs.i
i
Definition: generatePbs.py:6

temperature
Definition: temperature.py:1

Mdp::GibbsActionSelection::generatePolicy
std::vector< double > generatePolicy(const std::vector< double > &, action_t bestAction) override
Definition: gibbsActionSelection.cpp:26

gibbsActionSelection.h

Mdp::GibbsActionSelection::GibbsActionSelection
GibbsActionSelection(double temperature, double tempDecaySpeed, double tempStepSize)
Definition: gibbsActionSelection.cpp:19

Mdp::action_t
size_t action_t
Definition: action_impl.h:18

Mdp
Definition: action.h:18

getMissingFiles.counter
int counter
Definition: getMissingFiles.py:8