schedSim/eligibilityTraceAlgo_8cpp_source.html

 #include "eligibilityTraceAlgo.h"


 #include <mdp/context.h>
 #include <mdp/stateSpace.h>
 #include <mdp/actionSpace.h>
 #include <mdp/mdpConfiguration.h>


 using namespace Mdp;

 void EligibilityTraceAlgo::init()
 {
     e = std::vector<std::vector<double>>(context->stateSpace->size(),
                                          std::vector<double>(context->actionSpace->size(), 0.0));
     discountFactor = context->conf->getDoubleValue("mdp","discountFactor");
     lambda = context->conf->getDoubleValue("reinforcementLearning","lambda");
     stateSize = context->stateSpace->size();
     actionSize = context->actionSpace->size();
     initAlpha();
 }

 void EligibilityTraceAlgo::end()
 {
 }

 void EligibilityTraceAlgo::updateState(state_t previousState, action_t previousAction, double reward)
 {
     previousPreviousState = previousState;
     previousPreviousAction = previousAction;
     previousReward = reward;
     updateAlpha();
 }

context.h

Mdp::EligibilityTraceAlgo::updateState
void updateState(state_t previousState, action_t previousAction, double reward)
Definition: eligibilityTraceAlgo.cpp:36

Mdp::RlBackupAlgorithm::updateAlpha
virtual void updateAlpha()
Definition: rlBackupAlgorithm.cpp:113

Mdp::EligibilityTraceAlgo::init
virtual void init()
Definition: eligibilityTraceAlgo.cpp:21

Mdp::EligibilityTraceAlgo::previousReward
double previousReward
Definition: eligibilityTraceAlgo.h:34

Mdp::EligibilityTraceAlgo::end
virtual void end()
Definition: eligibilityTraceAlgo.cpp:32

Mdp::EligibilityTraceAlgo::actionSize
size_t actionSize
Definition: eligibilityTraceAlgo.h:39

Mdp::EligibilityTraceAlgo::e
std::vector< std::vector< double > > e
Definition: eligibilityTraceAlgo.h:35

Mdp::EligibilityTraceAlgo::lambda
double lambda
Definition: eligibilityTraceAlgo.h:36

Mdp::action_t
size_t action_t
Definition: action_impl.h:18

Mdp::RlBackupAlgorithm::initAlpha
virtual void initAlpha()
Definition: rlBackupAlgorithm.cpp:97

Mdp
Definition: action.h:18

Mdp::EligibilityTraceAlgo::previousPreviousState
state_t previousPreviousState
Definition: eligibilityTraceAlgo.h:32

Mdp::EligibilityTraceAlgo::discountFactor
double discountFactor
Definition: eligibilityTraceAlgo.h:37

stateSpace.h

mdpConfiguration.h

Mdp::state_t
size_t state_t
Definition: state.h:19

Mdp::RlBackupAlgorithm::context
std::shared_ptr< Context > context
Definition: rlBackupAlgorithm.h:52

Mdp::EligibilityTraceAlgo::previousPreviousAction
action_t previousPreviousAction
Definition: eligibilityTraceAlgo.h:33

actionSpace.h

reward
Definition: reward.py:1

Mdp::EligibilityTraceAlgo::stateSize
size_t stateSize
Definition: eligibilityTraceAlgo.h:38

eligibilityTraceAlgo.h