Lieck, R., & Toussaint, M. (2016). Temporally Extended Features in Model-Based Reinforcement Learning with Partial Observability. Neurocomputing, 192, 49-60. https://doi.org/10.1016/j.neucom.2015.12.107