Convergence to good non-optimal critical points in the training of neural networks: Gradient descent optimization with one random initialization overcomes all bad non-global local minima with high probability

Ibragimov, S.; Jentzen, A.; Riekert, A.

Forschungsartikel in Online-Sammlung | Preprint | Peer reviewed

Details zur Publikation

Name des RepositoriumsarXiv.org
Artikelnummer2212.13111
Statuseingereicht / in Begutachtung
Veröffentlichungsjahr2022
Link zum Volltexthttps://arxiv.org/abs/2212.13111

Autor*innen der Universität Münster

Ibragimov, Shokhrukh
Professur für Angewandte Mathematik (Prof. Jentzen)
Jentzen, Arnulf
Institut für Analysis und Numerik
Riekert, Adrian
Mathematisches Institut