Hier wird ein Problem des Gradientenverfahrens anhand einer Funktion mit zwei Buckeln und zwei Tälern (4 Extremwerte) untersucht. (x,y) → (x∙sin(y))∙exp(-x²-y² -0.4x) Die Funktion ist […]
In https://blog.tuncer.net/q-learning-teil-1 ging es bereits um die Q-Matrix. In einem relativ einfachen Beispiel mit wenigen States wurde gezeigt, wie eine Policy gelernt werden kann, indem […]
Wir wollen einen Unique-Index in einer Tabelle anlegen, in der es Duplikate gibt. Bevor der Index angelegt werden kann, müssen die Duplikate identifiziert und gelöscht […]
Die folgende Liste zeigt meine Favoriten der Top Anwendungen für Linux und diverse Entwickler-Aufgaben. Sie ist gerade bei solchen Anwendungen hilfreich, die nur sehr selten […]
Im folgenden wird es um Q-Learning gehen. Dabei ist q eine Art Mass für die Qualität einer Aktion hinsichtlich der daraufhin zu erwartenden, zukünftigen Belohnungen. […]
Ja, das wäre wirklich schön ‚Die Perfekte WordPress Installation‘. Es ist ungewiss, ob es so etwas überhaupt gibt, denn neben den vielen Fragen des Geschmacks […]