A proof of convergence for the gradient descent optimization method with random initializations in the training of neural networks with ReLU activation for piecewise linear target functions

Jentzen, Arnulf; Riekert, Adrian

Forschungsartikel (Zeitschrift) | Peer reviewed

Details zur Publikation

FachzeitschriftJournal of Machine Learning Research
Jahrgang / Bandnr. / Volume23
Ausgabe / Heftnr. / Issue260
Seitenbereich1-50
StatusVeröffentlicht
Veröffentlichungsjahr2022
Sprache, in der die Publikation verfasst istEnglisch
Link zum Volltexthttps://jmlr.org/papers/v23/21-0962.html
StichwörterGradient descent; Artificial neural networks; Non-convex optimization

Autor*innen der Universität Münster

Jentzen, Arnulf
Institut für Analysis und Numerik
Riekert, Adrian
Mathematisches Institut