DeepRL2.2B, Deep Deterministic Policy Gradient for Continuous Control.

views comments

Deep Deterministic Policy Gradient is an efficient algorithm for Continuous Control combining Policy Gradient with Q-learning in an actor-critic architecture