Pei

Menu

Reinforcement Learning
Posts
Resources

Email Address:

[email protected]

[email protected]

Blog Stats

127,867 hits

State Action/Control

blogs.cuit.columbia.edu/p

Meta

Log in
Entries feed
Comments feed
WordPress.org

Protected: Policy Gradient Methods for Reinforcement Learning with Function Approximation

This content is password protected. To view it please enter your password below:

Password:

Author: Z Pei on February 17, 2019

Categories: AI, Function Approximation, Policy Gradient Methods, Reinforcement Learning, RL, Stationary Distribution

Tags: AI, Function Approximation, Policy Gradient Methods, Reinforcement Learning, RL, Stationary Distribution

Other posts

Metric spaces «» Actor-Critic Algorithms

Last posts

Finite-Sample Convergence Rates for Q-Learning and Indirect Algorithms
Solving H-horizon, Stationary Markov Decision Problems In Time Proportional To Log(H)
Randomized Linear Programming Solves the Discounted Markov Decision Problem In Nearly-Linear (Sometimes Sublinear) Run Time
KL Divergence
The Asymptotic Convergence-Rate of Q-learning
Hierarchical Apprenticeship Learning, with Application to Quadruped Locomotion
Policy Gradient Methods
Actor-Critic Algorithms for Hierarchical Markov Decision Processes
Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation
Meta Learning Shared Hierarchies

Sidebar

Protected: Policy Gradient Methods for Reinforcement Learning with Function Approximation

Last update on June 21, 2019

Published February 17, 2019

Author: Z Pei

Categories: AI, Function Approximation, Policy Gradient Methods, Reinforcement Learning, RL, Stationary Distribution

Tags: AI, Function Approximation, Policy Gradient Methods, Reinforcement Learning, RL, Stationary Distribution

Related Posts

Finite-Sample Convergence Rates for Q-Learning and Indirect Algorithms
Solving H-horizon, Stationary Markov Decision Problems In Time Proportional To Log(H)
Randomized Linear Programming Solves the Discounted Markov Decision Problem In Nearly-Linear (Sometimes Sublinear) Run Time
KL Divergence
The Asymptotic Convergence-Rate of Q-learning

This slideshow requires JavaScript.

Tag Cloud

Activation Function AI Algorithm APR Backpropagation C++ CAD Check Clock Computational Complexity Constraint Control Convergence Rate CTS Deep Learning Design Dot Product Engine Electronic FEA FEM Hierarchical RL Library Linux Machine Learning MATLAB Memristor crossbar arrays (MCAs) Modeling Nano Netlist Neural Network OpenFOAM Optimal Control Physical Place Policy Gradient Methods PuTTY Q-learning Reinforcement Learning RL Route STA SystemC Timing Unix Xming

Spam Blocked

10,724 spam blocked by Akismet

© Pei | powered by the WikiWP theme and WordPress. | RSS