Now showing items 1-2 of 2

  • Deep networks training and generalization: insights from linearization 

    George, Thomas (2023-06-19)
    Bien qu'ils soient capables de représenter des fonctions très complexes, les réseaux de neurones profonds sont entraînés à l'aide de variations autour de la descente de gradient, un algorithme qui est basé sur une simple linéarisation de la fonction ...
  • Factorized second order methods in neural networks 

    George, Thomas (2018-03-21)
    Les méthodes d'optimisation de premier ordre (descente de gradient) ont permis d'obtenir des succès impressionnants pour entrainer des réseaux de neurones artificiels. Les méthodes de second ordre permettent en théorie d'accélérer l'optimisation d'une ...