A proof of convergence for the gradient descent optimization method with random initializations in the training of neural networks with ReLU activation for piecewise linear target functions

Jentzen, Arnulf; Riekert, Adrian

Forschungsartikel (Zeitschrift) | Peer reviewed

Details zur Publikation

Fachzeitschrift: Journal of Machine Learning Research

Jahrgang / Bandnr. / Volume: 23

Ausgabe / Heftnr. / Issue: 260

Seitenbereich: 1-50

Status: Veröffentlicht

Veröffentlichungsjahr: 2022

Sprache, in der die Publikation verfasst ist: Englisch

Stichwörter: Gradient descent; Artificial neural networks; Non-convex optimization

Jentzen, Arnulf	Institut für Analysis und Numerik
Riekert, Adrian	Mathematisches Institut