schedSim/testLinearProgrammingSolver_8cpp_source.html

 #include "learning/linearProgramming.h"

 #include <cassert>
 #include <iostream>
 #include <vector>

 #include "constraintList.h"
 #include "horizon.h"
 #include "mdpConfiguration.h"
 #include "policy.h"
 #include "rewards.h"
 #include "transitionMatrix.h"


 using namespace Mdp;

 Rewards *generateRewards();
 TransitionMatrix *generateTransitionMatrix();
 std::vector<Rewards*> generateEqualityConstraints();
 std::vector<double> generateEqualityValues();
 std::vector<Rewards*> generateInequalityConstraints();
 std::vector<double> generateInequalityValues();
 Horizon *generateHorizon();

 const size_t S = 9;
 const size_t A = 3;

 const double C1 = 1.0;
 const double C2 = 200.0;
 const double f1 = 5.0;
 const double f2 = 8.0;
 const double co = 0.0;
 const double cl = C1*f1*f1 + C2;
 const double ch = C1*f2*f2 + C2;
 const double f3 = 2.0;
 const double ctr = 0.0;

 const double pol = 0.5;
 const double plo = 0.5;
 const double poh = 0.5;
 const double pho = 0.5;
 const double phl = 0.5;
 const double plh = 0.5;


 int main()
 {
     Policy *policy = new Policy(S, A, nullptr);
     Rewards *rewards = generateRewards();
     ConstraintList *constraintList = new ConstraintList;
     constraintList->equalityConstraints = generateEqualityConstraints();
     constraintList->equalityValues = generateEqualityValues();
     constraintList->inequalityConstraints = generateInequalityConstraints();
     constraintList->inequalityValues = generateInequalityValues();
     TransitionMatrix *matrix = generateTransitionMatrix();
     Utils::Configuration *conf = new Utils::Configuration("configuration.conf");
     Horizon *horizon = generateHorizon();

     LinearProgramming solver(conf);
     solver.solve(policy, rewards, constraintList, matrix, horizon);

     policy->print(std::cout);
     //matrix->print(std::cout);

     return 0;
 }


 Horizon *generateHorizon()
 {
     Horizon *h = new Horizon;
     h->discountFactor = 1.0;
     h->finiteHorizon = false;
     std::vector<double> vect(S, 1.0/S);
     h->initialStateDistribution = vect;
     return h;
 }


 Rewards *generateRewards()
 {
     Rewards *rewards = new Rewards(S, A);

     rewards->setReward(0, 0, -co - 0.0001);
     rewards->setReward(0, 1, -co);
     rewards->setReward(0, 2, -co);

     rewards->setReward(1, 0, -ctr);
     rewards->setReward(1, 1, -ctr);
     rewards->setReward(1, 2, -ctr);

     rewards->setReward(2, 0, -ctr);
     rewards->setReward(2, 1, -ctr);
     rewards->setReward(2, 2, -ctr);

     rewards->setReward(3, 0, -cl );
     rewards->setReward(3, 1, -cl );
     rewards->setReward(3, 2, -cl );

     rewards->setReward(4, 0, -ctr);
     rewards->setReward(4, 1, -ctr);
     rewards->setReward(4, 2, -ctr);

     rewards->setReward(5, 0, -ctr);
     rewards->setReward(5, 1, -ctr);
     rewards->setReward(5, 2, -ctr);

     rewards->setReward(6, 0, -ch );
     rewards->setReward(6, 1, -ch );
     rewards->setReward(6, 2, -ch );

     rewards->setReward(7, 0, -ctr);
     rewards->setReward(7, 1, -ctr);
     rewards->setReward(7, 2, -ctr);

     rewards->setReward(8, 0, -ctr);
     rewards->setReward(8, 1, -ctr);
     rewards->setReward(8, 2, -ctr);

     return rewards;
 }


 TransitionMatrix *generateTransitionMatrix()
 {
     TransitionMatrix *matrix = new TransitionMatrix(S, A);

     for (state_t i = 0; i < S; i++)
     {
         for (state_t j = 0; j < S; j++)
         {
             for (action_t k = 0; k < A; k++)
             {
                 matrix->set(i, j, k, 0.0);
             }
         }
     }
     matrix->set(0, 0, 0, 1.0);
     matrix->set(0, 1, 1, 1.0);
     matrix->set(0, 4, 2, 1.0);
     matrix->set(1, 1, 0, pol);
     matrix->set(1, 3, 0, 1.0-pol);
     matrix->set(1, 1, 1, pol);
     matrix->set(1, 3, 1, 1.0-pol);
     matrix->set(1, 1, 2, pol);
     matrix->set(1, 3, 2, 1.0-pol);
     matrix->set(2, 0, 0, 1.0-plo);
     matrix->set(2, 2, 0, plo);
     matrix->set(2, 0, 1, 1.0-plo);
     matrix->set(2, 2, 1, plo);
     matrix->set(2, 0, 2, 1.0-plo);
     matrix->set(2, 2, 2, plo);
     matrix->set(3, 2, 0, 1.0);
     matrix->set(3, 3, 1, 1.0);
     matrix->set(3, 8, 2, 1.0);
     matrix->set(4, 4, 0, poh);
     matrix->set(4, 6, 0, 1.0-poh);
     matrix->set(4, 4, 1, poh);
     matrix->set(4, 6, 1, 1.0-poh);
     matrix->set(4, 4, 2, poh);
     matrix->set(4, 6, 2, 1.0-poh);
     matrix->set(5, 0, 0, 1.0-pho);
     matrix->set(5, 5, 0, pho);
     matrix->set(5, 0, 1, 1.0-pho);
     matrix->set(5, 5, 1, pho);
     matrix->set(5, 0, 2, 1.0-pho);
     matrix->set(5, 5, 2, pho);
     matrix->set(6, 5, 0, 1.0);
     matrix->set(6, 7, 1, 1.0);
     matrix->set(6, 6, 2, 1.0);
     matrix->set(7, 3, 0, 1.0-phl);
     matrix->set(7, 7, 0, phl);
     matrix->set(7, 3, 1, 1.0-phl);
     matrix->set(7, 7, 1, phl);
     matrix->set(7, 3, 2, 1.0-phl);
     matrix->set(7, 7, 2, phl);
     matrix->set(8, 6, 0, 1.0-plh);
     matrix->set(8, 8, 0, plh);
     matrix->set(8, 6, 1, 1.0-plh);
     matrix->set(8, 8, 1, plh);
     matrix->set(8, 6, 2, 1.0-plh);
     matrix->set(8, 8, 2, plh);

     return matrix;
 }


 std::vector<Rewards*> generateEqualityConstraints()
 {
     std::vector<Rewards*> v;
     return v;
 }


 std::vector<double> generateEqualityValues()
 {
     std::vector<double> v;
     return v;
 }


 std::vector<Rewards*> generateInequalityConstraints()
 {
     std::vector<Rewards*> constraint(1);
     constraint[0] = new Rewards(S, A);
     for (state_t i = 0; i < S; i++)
     {
         for (action_t j = 0; j < A; j++)
         {
             constraint[0]->setReward(i, j, 0.0);
             if (i == 3)
                 constraint[0]->setReward(i, j, f1);
             if (i == 6)
                 constraint[0]->setReward(i, j, f2);
         }
     }

     for (state_t i = 0; i < S; i++)
     {
         for (action_t j = 0; j<A; j++)
         {
             constraint[0]->setReward(i, j, -constraint[0]->getReward(i, j));
         }
     }


     return constraint;
 }


 std::vector<double> generateInequalityValues()
 {
     std::vector<double> value(1, f3);
     value[0] = -value[0];
     return value;
 }


Mdp::ConstraintList::equalityConstraints
std::vector< Rewards * > equalityConstraints
Definition: constraintList.h:21

linearProgramming.h

generatePbs.i
i
Definition: generatePbs.py:6

Mdp::LinearProgramming
Definition: linearProgramming.h:29

plo
const double plo
Definition: testLinearProgrammingSolver.cpp:48

rewards.h

A
const size_t A
Definition: testLinearProgrammingSolver.cpp:35

S
const size_t S
Definition: testLinearProgrammingSolver.cpp:34

constraintList.h

Mdp::TransitionMatrix::set
void set(state_t from, state_t to, action_t action, double proba)
Definition: transitionMatrix.cpp:49

Mdp::ConstraintList::equalityValues
std::vector< double > equalityValues
Definition: constraintList.h:22

generateHorizon
Horizon * generateHorizon()
Definition: testLinearProgrammingSolver.cpp:85

Mdp::Rewards
Definition: rewards.h:23

Mdp::ConstraintList::inequalityValues
std::vector< double > inequalityValues
Definition: constraintList.h:24

Mdp::ConstraintList
Definition: constraintList.h:19

phl
const double phl
Definition: testLinearProgrammingSolver.cpp:51

C2
const double C2
Definition: testLinearProgrammingSolver.cpp:38

cl
const double cl
Definition: testLinearProgrammingSolver.cpp:42

f1
const double f1
Definition: testLinearProgrammingSolver.cpp:39

generateInequalityConstraints
std::vector< Rewards * > generateInequalityConstraints()
Definition: testLinearProgrammingSolver.cpp:235

Mdp::Horizon::finiteHorizon
bool finiteHorizon
Definition: horizon.h:19

Mdp::Rewards::setReward
void setReward(state_t state, action_t action, double reward)
Definition: rewards.cpp:28

ch
const double ch
Definition: testLinearProgrammingSolver.cpp:43

generateEqualityValues
std::vector< double > generateEqualityValues()
Definition: testLinearProgrammingSolver.cpp:225

pho
const double pho
Definition: testLinearProgrammingSolver.cpp:50

policy.h

Mdp::action_t
size_t action_t
Definition: action_impl.h:18

C1
const double C1
Definition: testLinearProgrammingSolver.cpp:37

Mdp
Definition: action.h:18

poh
const double poh
Definition: testLinearProgrammingSolver.cpp:49

co
const double co
Definition: testLinearProgrammingSolver.cpp:41

Mdp::Policy
Definition: policy.h:26

main
int main()
Definition: testLinearProgrammingSolver.cpp:61

plh
const double plh
Definition: testLinearProgrammingSolver.cpp:52

generateRewards
Rewards * generateRewards()
Definition: testLinearProgrammingSolver.cpp:97

pol
const double pol
Definition: testLinearProgrammingSolver.cpp:47

mdpConfiguration.h

generateTransitionMatrix
TransitionMatrix * generateTransitionMatrix()
Definition: testLinearProgrammingSolver.cpp:147

generateEqualityConstraints
std::vector< Rewards * > generateEqualityConstraints()
Definition: testLinearProgrammingSolver.cpp:214

Mdp::Horizon::initialStateDistribution
std::vector< double > initialStateDistribution
Definition: horizon.h:21

transitionMatrix.h

f2
const double f2
Definition: testLinearProgrammingSolver.cpp:40

Mdp::Horizon::discountFactor
double discountFactor
Definition: horizon.h:20

Mdp::state_t
size_t state_t
Definition: state.h:19

ctr
const double ctr
Definition: testLinearProgrammingSolver.cpp:45

Mdp::Horizon
Definition: horizon.h:17

Mdp::TransitionMatrix
Definition: transitionMatrix.h:25

Mdp::ConstraintList::inequalityConstraints
std::vector< Rewards * > inequalityConstraints
Definition: constraintList.h:23

Mdp::Policy::print
void print(std::ostream &stream)
Definition: policy.cpp:132

generateInequalityValues
std::vector< double > generateInequalityValues()
Definition: testLinearProgrammingSolver.cpp:266

Mdp::LinearProgramming::solve
void solve(Policy *policy, Rewards *rewards, ConstraintList *constraintList, TransitionMatrix *matrix, Horizon *horizon)
Definition: linearProgramming.cpp:28

horizon.h

Utils::Configuration
Definition: configuration.h:22

f3
const double f3
Definition: testLinearProgrammingSolver.cpp:44