Autonome Autos (Maschinelles Lernen)

Mit gedrückter Maustaste können Sie eine geschlossene Kurve zeichnen, die ein Hindernis darstellt, welches die Autos vermeiden sollen. Die autonomen Autos benötigen etwa 15 Minuten um fahren zu lernen. Aktivieren Sie während der Lernphase die Schaltfläche "Lernmodus". Um die Trainingsphase zu überspringen, können Sie auch ein bereits trainiertes Auto laden. Speichern Sie folgende Datei auf dem PC und laden Sie diese mit der Schaltfläche "Trainingsdatei laden" in das Programm: pretrained.bin

Sie können auch einen fertigen Parcours laden. Speichern Sie dazu eine der folgenden Dateien auf dem PC und laden Sie diese mit der Schaltfläche "Parcours laden" in das Programm: basic-01.track, medium-01.track
Lernmodus
Pause

Lebenszeit der autonomen Agenten: 0s

VERLUST BELOHNUNG BELOHNUNG [Durchschnitt]

Das Lernziel der virtuellen Autos ist es, ihre Geschwindigkeit zu vergrößern und dabei den Hindernissen auszuweichen. Der Daten-Input des neuronalen Netzwerks sind die Sensor-Daten: Geschwindigkeit in x- und y-Richtung, Abstand + Entitätstyp (Eigenschaften der Autoobjekte) + Normalenvektor (2D) der Autosensoren (19 pro Auto). Zusätzlich zum aktuellen Zeit-Schritt wird das letzte Aktions-Zustands-Paar übergeben. Jeder Zustand hat 19x4 + 2 = 78 Dimensionen. Der Aktions-Raum ist 2-dimensional, so dass der Daten-Input für ein neuronales Netz des Autos 78x2 + 2 = 158 dimensional ist.

Das neuronale Netz verwendet den DDPG-Algorithmus (deep deterministic policy gradient algorithm).

Made by Jan Hünermann, 2017
Github: A JavaScript deep learning and reinforcement learning library.

Bearbeitung: 2020 Matthias Perenthaler