Now reading: Les réseaux de tenseurs sont de puissants outils. Si seulement les meilleurs fonctionnaient en 3 dimensions!
Menu
Fermer
Fermer

Les réseaux de tenseurs sont de puissants outils. Si seulement les meilleurs fonctionnaient en 3 dimensions!

Voici l’histoire de 3 doctorants et de leur désir de faire tomber la barrière qui empêche les meilleurs outils de réseau de tenseurs de fonctionner en 3 dimensions.

Les réseaux de tenseurs constituent l’un des sujets de l’heure en physique. Ils ont d’abord été mis au point dans les années 1990 comme outil de recherche en physique de la matière condensée. Le domaine a ensuite explosé dans les années 2000, grâce aux idées issues de l’information quantique, et les réseaux de tenseurs sont maintenant présents dans bien des domaines, de la théorie des champs à la chimie quantique, en passant par l’holographie, l’apprentissage automatique, etc.

Leur utilité vient du fait qu’ils fournissent un langage visuel ainsi que des outils mathématiques, qui simplifient des calculs diaboliquement difficiles. Mais il y a un problème : à l’heure actuelle, les algorithmes de réseau de tenseurs ne fonctionnent vraiment bien que pour des modèles classiques bidimensionnels et, par extension, des modèles quantiques unidimensionnels.

Le principal problème en est un de calcul. Pour amener les meilleurs algorithmes de réseau de tenseurs à fonctionner dans une dimension supplémentaire, il faudrait une puissance de calcul qui n’existe pas à l’heure actuelle. Mais cela n’a pas découragé 3 doctorants à l’Institut Périmètre de tenter la chose.

Depuis 2 ans, Markus Hauru, Clément Delcamp et Sebastian Mizera s’attaquent à ce problème. Lorsqu’il est paru dans la revue Physical Review B plus tôt cette année, leur article, intitulé Renormalization of tensor networks using graph-independent local truncations (Renormalisation de réseaux de tenseurs à l’aide de troncatures locales indépendantes du graphe), a été choisi comme suggestion du rédacteur en chef.

La méthode qu’ils ont mise au point est plus facile à apprendre et à utiliser que les principaux algorithmes bidimensionnels existants, et pourrait donc être plus facilement adoptée par les chercheurs à qui les réseaux de tenseurs ne sont pas familiers. Les auteurs n’ont cependant pas réussi à passer à 3 dimensions.

Ce n’est toutefois pas un échec, selon Guifre Vidal, chercheur à l’Institut Périmètre et pionnier de la recherche sur les réseaux de tenseurs. « C’est plutôt un signe de courage, de leadership et de persévérance de la part de 3 remarquables jeunes chercheurs » [traduction], a-t-il affirmé.

Et ces étudiants ne sont pas encore prêts à abandonner. Leur nouvelle méthode est devenue l’une des principales candidates en tant qu’algorithme bidimensionnel qui pourrait préparer la voie à de meilleurs algorithmes tridimensionnels. Et ils veulent être ceux qui parviendront à ce résultat.

Qu’est-ce qu’un réseau de tenseurs?

Un réseau de tenseurs est un outil mathématique qui sert à étudier les manières dont plusieurs petits objets d’un système, par exemple ses particules, se combinent et se comportent en grand nombre. Cette « émergence » d’un comportement collectif n’est pas propre à la physique : on la trouve aussi dans des domaines aussi divers que l’écologie et l’économie. (On la constate dans les gouttes d’eau qui forment une vague, ou encore dans les comportements contre-intuitifs des isolants topologiques.)

Dans les modèles classiques, le comportement collectif d’un système est décrit par sa distribution des probabilités. Dans les systèmes quantiques, il est décrit par sa fonction d’onde. Ce sont là de véritables clés : si l’on connaît la distribution des probabilités ou la fonction d’onde d’un système, on peut tout connaître de ce système.

Le problème vient de ce que les distributions des probabilités et les fonctions d’onde peuvent être incroyablement complexes. Dans le cas de systèmes très petits, leur complexité mathématique est raisonnable. Mais à mesure qu’un système devient plus gros, l’effort nécessaire pour calculer sa distribution des probabilités ou sa fonction d’onde augmente de manière exponentielle. Il n’est pas nécessaire qu’un système soit très gros pour que ces calculs soient hors de portée des ordinateurs actuels.

Markus Hauru, Clément Delcamp et Sebastian Mizera à l’Institut Périmètre

C’est là qu’interviennent les réseaux de tenseurs. Ils permettent d’extraire d’un modèle réduit l’information pertinente et de faire un « zoom arrière » pour l’étendre au comportement collectif ou « émergent ». Cela constitue un moyen efficace de codifier des structures complexes.

L’intérêt pour les réseaux de tenseurs est monté en flèche autour de 2005, surtout de la part de chercheurs dans les domaines de l’information quantique, de la matière condensée et de la physique statistique. Cela a mené à la création de certains outils mathématiques puissants.

En 2006, Michael Levin, de l’Université Harvard, et Cody Nave, du MIT, ont créé l’algorithme de groupe de renormalisation tensoriel (TRG pour tensor renormalization group), qui fonctionne dans le cas de systèmes de physique statistique classique.

En 2015, Glen Evenbly et Guifre Vidal ont développé le TRG en y ajoutant des éléments qui fonctionnent pour des systèmes quantiques (ansatz de renormalisation pour intrication multi-échelle, ou MERA pour multiscale entanglement renormalization ansatz). L’algorithme résultant, dit de renormalisation de réseau de tenseurs (TNR pour tensor network renormalization), pouvait traiter des scénarios beaucoup plus complexes tels qu’une transition d’état d’un système.

« La TNR ressemble beaucoup au TRG, et fonctionne elle aussi pour des systèmes de physique statistique classique, explique M. Hauru, à ceci près qu’elle ajoute quelques-uns des ingrédients qui font en sorte que le MERA fonctionne si bien. » [traduction]

La TNR permet de comprendre l’émergence en rendant flous juste assez de petits détails pour qu’une image d’ensemble puisse ressortir. C’est cette démarche qui a attiré l’attention des doctorants.

Clément Delcamp et Sebastian Mizera travaillaient en gravitation quantique, étudiant la géométrie de l’espace-temps à l’échelle quantique. Ils utilisaient des réseaux de tenseurs dans leurs travaux, mais souhaitaient explorer des techniques plus avancées.

Ils sont allés voir Guifre Vidal et son étudiant au doctorat Markus Hauru, pour leur demander comment ils pourraient appliquer les algorithmes de TNR bidimensionnels les plus fructueux à leurs travaux en 3 dimensions. Pour toute réponse ils ont eu droit à un silence, car il n’y avait pas d’autre réponse.

« Nous avons effectivement des algorithmes tridimensionnels, mais ils ne fonctionnent pas aussi bien que les algorithmes bidimensionnels, a déclaré plus tard M. Vidal. Nous avons vraiment besoin d’obtenir pour les réseaux de tenseurs à plus de dimensions les succès que nous avons en 2D. » [traduction]

C’est ce à quoi les étudiants se sont attaqués.

Le début de la quête

Pendant 6 mois, MM. Hauru, Delcamp et Mizera ont tenté d’étendre à 3 dimensions les meilleurs algorithmes de réseaux de tenseurs bidimensionnels. Toutes leurs tentatives ont échoué.

Ils ont alors fait une pause et examiné la situation. Ils se sont rendu compte que la TNR avait quelque chose de mystérieux. La renormalisation de réseau de tenseurs fonctionne un peu comme la fonction de zoom d’un logiciel d’imagerie, en commençant par le détail de pixels individuels puis en faisant un zoom arrière pour montrer une image plus générale. Au cours de ce processus, la TNR rend flous les pixels individuels, de sorte qu’une grille de pixels blancs et noirs devient une tache grise.

Des recherches avaient montré que la TNR était clairement efficace, mais on ne savait pas trop comment elle rendait flous les détails individuels. Le trio a eu un éclair de génie. Au lieu d’essayer de généraliser une méthode mal connue, il fallait d’abord mieux comprendre ce qui se passait au sein de chaque étape. Les doctorants sont retournés à la table à dessin et ont élaboré leur propre méthode.

Le processus résultant se déroule en 2 étapes distinctes. « On commence par enlever l’information qui n’est pas pertinente, puis on fait le zoom arrière, résume M. Delcamp. La difficulté est de s’assurer que l’on n’accumule pas d’information sur des pixels individuels pendant l’étape de zoom arrière. » [traduction]

Le fait de subdiviser le processus donne aux chercheurs une meilleure idée du rôle particulier de chaque tenseur. Certains objets suppriment des corrélations à courte portée, alors que d’autres font le zoom arrière. En ayant chacun une tâche plus réduite et plus précise, les tenseurs sont plus faciles à calculer, et le réseau n’exige plus une puissance de calcul aussi grande.

Une itération du processus de Gilt-TNR. À l’étape (i), 4 matrices sont insérées entre des tenseurs voisins. Ces matrices sont factorisées à l’étape (ii), et les facteurs sont absorbés dans les tenseurs voisins à l’étape (iii). Il en résulte un réseau en damier formé de 2 types de tenseurs, qui subit ensuite une itération de TRG ordinaire — étapes (iv) et (v). La partie du schéma ombrée en rouge représente des corrélations à courte portée qui se comportent comme des boucles de tenseurs à 2 traits en coin. À la fin de l’étape de zoom arrière, toutes ces corrélations ont été supprimées.

« Auparavant, c’était difficile de bien savoir ce que chaque tenseur du système fait en réalité » [traduction], explique M. Delcamp, en dessinant un réseau de tenseurs sur un tableau de l’Institut Périmètre.

Il commence par le plan d’un système, dont les différents éléments sont reliés par des traits. Puis il superpose des boîtes et des fragments recouvrant les liens entre plusieurs nœuds. Il explique que cela représente l’ancienne méthode.

À côté, il dessine une représentation de leur nouvelle méthode : les boîtes et les fragments disparaissent, et sont remplacés par de petits tenseurs placés directement dans les traits qui relient les éléments individuels. (Markus Hauru fait remarquer avec plaisir que les talents artistiques de Clément Delcamp ont été les bienvenus au cours de leurs travaux.)

En secouant la poussière de ses mains, M. Delcamp affirme : « Avec notre technique, nous croyons comprendre plus clairement ce qui se passe, et nous pouvons donc connaître précisément l’action des tenseurs que nous ajoutons. » [traduction]

Il en résulte un algorithme plus simple, plus net et plus général utilisant ce qu’ils appellent des Gilt (graph-independent local truncations – troncatures locales indépendantes du graphe). Cet algorithme est aussi exact que ses prédécesseurs complexes, mais il exige une charge de calcul beaucoup moindre. L’équipe a ramené l’algorithme à 100 lignes de code, qu’elle a mises en ligne à la disposition de tous.

Avec un enthousiasme renouvelé, l’équipe a tenté d’étendre le nouvel algorithme à 3 dimensions, encore une fois sans succès.

Il ne faut jamais dire jamais

La méthode Gilt-TNR élaborée par les doctorants met de plus petits tenseurs aux endroits précis où ils sont nécessaires. Cela signifie que cette méthode n’altère pas la géométrie d’ensemble du système étudié, et qu’elle peut donc s’appliquer à des systèmes à la géométrie plus complexe que dans le cas des algorithmes de TNR actuels. « Le nombre de dimensions a beaucoup moins d’importance » [traduction], affirment les chercheurs.

Selon M. Hauru, la méthode Gilt-TNR pourrait aussi avoir des applications autres que le simple processus de renormalisation de « zoom arrière ». « J’ai l’impression, dit-il, qu’elle pourrait être utile pour d’autres méthodes de réseaux de tenseurs, complètement différentes de ces algorithmes de groupe de renormalisation. » [traduction]

Selon Guifre Vidal, la simplicité de la méthode Gilt-TNR en fait une candidate sérieuse à la généralisation de la TNR à une 3e dimension. D’après lui, ce progrès est particulièrement remarquable du fait que les 3 étudiants l’ont réalisé pratiquement seuls.

« C’est spectaculaire, dit-il. Cela montre jusqu’à quel point des doctorants peuvent être brillants. » Après une pause, il ajoute avec un petit sourire : « Et, je suppose, jusqu’à quel point les directeurs de recherche ne sont pas toujours nécessaires. » [traduction]

Les améliorations techniques sont souvent passées sous silence, mais, plus souvent qu’autrement, ce sont elles qui favorisent une prochaine grande percée. La plus grande facilité d’utilisation d’un outil très efficace est le genre de progrès dont les dividendes peuvent rester sous-estimés pendant des années. Et entre-temps, la TNR en 3D demeure insaisissable.

Après avoir consacré 2 ans à ce défi, les jeunes chercheurs prennent une pause bien méritée. Clément Delcamp vient d’obtenir son doctorat et ira bientôt à l’Institut Max-Planck d’optique quantique. Markus Hauru soutiendra sa thèse ce vendredi, puis ira à l’Université de Gand. Sebastian Mizera poursuit ses études de doctorat à l’Institut Périmètre, et ses recherches s’orientent maintenant sur la théorie quantique des champs et la théorie des cordes.

Ils n’ont pas perdu espoir de réussir à relever le défi et à rendre leur algorithme tridimensionnel. M. Hauru est prêt à y revenir lorsqu’il en aura le loisir. MM. Delcamp et Mizera disent qu’ils seront heureux de faire de même.

« Je crois que les gens apprécient la simplicité de cet algorithme, dit M. Hauru. Avec un peu de chance, c’est une étape importante vers un plus grand nombre de dimensions, mais nous n’avons pas atteint ce but ultime. » [traduction]

« Pas tout à fait », ajoute M. Delcamp.

« Pas encore », conclut M. Hauru.

Contenu connexe

Depuis une décennie, les physiciens posent une question captivante : est-ce qu’un outil mathématique issu de la physique de la matière condensée pourrait constituer la clé improbable d’une meilleure compréhension de l’holographie? La réponse est maintenant à portée de la main — et différente de ce que tout le monde attendait.

/26 Apr 2019

Non seulement les techniques d’apprentissage automatique pourraient être bénéfiques pour la physique quantique, mais elles pourraient la refaçonner, selon Roger Melko professeur associé à l’Institut Périmètre

/29 Nov 2016