Convergence to good non-optimal critical points in the training of neural networks: Gradient descent optimization with one random initialization overcomes all bad non-global local minima with high probability

Ibragimov, S.; Jentzen, A.; Riekert, A.

Forschungsartikel in Online-Sammlung | Preprint

Details zur Publikation

Name des Repositoriums: arXiv.org

Artikelnummer: 2212.13111

Status: eingereicht / in Begutachtung

Veröffentlichungsjahr: 2022

Ibragimov, Shokhrukh	Professur für Angewandte Mathematik (Prof. Jentzen)
Jentzen, Arnulf	Institut für Analysis und Numerik
Riekert, Adrian	Mathematisches Institut