Kein Bild

Q-Learning Teil 2

11.01.2020 sinan 0

In https://blog.tuncer.net/q-learning-teil-1 ging es bereits um die Q-Matrix. In einem relativ einfachen Beispiel mit wenigen States wurde gezeigt, wie eine Policy gelernt werden kann, indem […]